close Đăng nhập

Alibaba ra mắt mô hình AI chuyên về toán học, tuyên bố vượt mặt OpenAI, Google

VietTimes – Gã khổng lồ thương mại điện tử này tuyên bố rằng hệ thống AI mới có thể vượt trội hơn khả năng của GPT-4o của OpenAI trong lĩnh vực toán học.

Alibaba ra mắt mô hình AI chuyên về toán học, tuyên bố vượt mặt OpenAI, Google. Ảnh: SCMP
Alibaba ra mắt mô hình AI chuyên về toán học, tuyên bố vượt mặt OpenAI, Google. Ảnh: SCMP

Alibaba Group Holding đang đặt mục tiêu nâng cao tiêu chuẩn trong việc phát triển trí tuệ nhân tạo (AI) bằng cách ra mắt một nhóm các mô hình ngôn ngữ lớn (LLM) chuyên về toán học có tên là Qwen2-Math. Gã khổng lồ thương mại điện tử này tuyên bố rằng hệ thống này có thể vượt trội hơn khả năng của GPT-4o của OpenAI trong lĩnh vực toán học.

“Trong năm qua, chúng tôi đã dành nhiều nỗ lực đáng kể để nghiên cứu và nâng cao khả năng lý luận của các mô hình ngôn ngữ lớn, đặc biệt tập trung vào khả năng giải quyết các bài toán số học”, nhóm Qwen, một bộ phận của đơn vị điện toán đám mây Alibaba, cho biết trong một bài đăng được công bố trên nền tảng dành cho nhà phát triển GitHub vào hôm 9/8.

Được biết các LLM mới nhất (công nghệ hỗ trợ các dịch vụ AI tạo sinh như ChatGPT) được xây dựng trên các LLM Qwen2 do Alibaba phát hành vào tháng 6.

Theo bài đăng của nhóm Qwen, mô hình có số lượng tham số lớn nhất, Qwen2-Math-72B-Instruct, đã vượt trội hơn các LLM độc quyền do Hoa Kỳ phát triển trong các chuẩn mực toán học. Những chuẩn mực đó bao gồm GPT-4o, Claude 3.5 Sonnet của Anthropic, Gemini 1.5 Pro của Google và Llama -3.1-405B của Meta Platforms.

Bài đăng cho biết: "Chúng tôi hy vọng Qwen2-Math có thể đóng góp cho cộng đồng trong việc giải quyết các bài toán phức tạp".

Theo bài đăng, các mô hình AI Qwen2-Math đã được thử nghiệm trên cả chuẩn toán tiếng Anh và tiếng Trung. Trong đó bao gồm GSM8K, một tập dữ liệu gồm 8.500 bài toán tiểu học đa dạng về mặt ngôn ngữ chất lượng cao; OlympiadBench, một chuẩn khoa học đa phương thức song ngữ cấp cao và gaokao, kỳ thi tuyển sinh đại học khó khăn của Trung Quốc đại lục.

Nhóm Qwen cho biết các mô hình mới vẫn còn một số hạn chế do "chỉ hỗ trợ tiếng Anh". Theo nhóm, kế hoạch là sớm phát hành các mô hình song ngữ, với các LLM đa ngôn ngữ cũng đang trong quá trình phát triển.

Các mô hình toán học cụ thể của Alibaba càng củng cố thêm uy tín về AI của công ty có trụ sở tại Hàng Châu này sau khi chương trình LLM Qwen-72B-Instruct của công ty gần đây đã dẫn đầu bảng xếp hạng 10 mô hình nguồn mở hàng đầu thế giới.

Được biết, Tongyi Qianwen đã mở cửa cho các nhà phát triển bên thứ ba trong hơn một năm. Mã nguồn mở cung cấp quyền truy cập công khai vào mã nguồn của chương trình, cho phép các nhà phát triển phần mềm bên thứ ba sửa đổi hoặc chia sẻ thiết kế và mở rộng khả năng của chương trình.

Vào tháng 7, Qwen2-72B-Instruct xếp ngay sau GPT-4o và Claude 3.5 Sonnet trong bảng xếp hạng LLM của SuperClue, một nền tảng đánh giá các mô hình dựa trên các số liệu như tính toán, suy luận logic, mã hóa và khả năng đọc hiểu văn bản, cùng nhiều số liệu khác.

Theo SuperClue, khoảng cách giữa các mô hình AI của Trung Quốc và Hoa Kỳ dường như đang thu hẹp lại khi Trung Quốc đại lục đã đạt được tiến bộ đáng kể trong việc thúc đẩy các chương trình LLM trong nước trong nửa đầu năm nay.

Một bài kiểm tra riêng biệt được công bố vào tháng 7 bởi LMSYS - một tổ chức nghiên cứu mô hình AI được Đại học California, Berkeley hỗ trợ - cho thấy Qwen2-72B được xếp hạng 20, trong khi các mô hình độc quyền từ OpenAI, Anthropic và Google chiếm hầu hết các vị trí trong top 10.

Theo SCMP

https://www.scmp.com/tech/big-tech/article/3273940/alibaba-launches-maths-specific-ai-models-said-outperform-llms-openai-google?campaign=45979c58-577c-11ef-a26f-725d336290b7&module=AI_Recommended_for_you_In-house&pgtype=section

Chuyển đổi số

Đạo luật đầu tiên về AI được Quốc hội thông qua

Đạo luật đầu tiên về AI được Quốc hội thông qua

Luật AI phân loại hệ thống theo mức độ rủi ro để áp dụng nghĩa vụ phù hợp, đặc biệt siết chặt với các ứng dụng liên quan tài chính, y tế, tư pháp, giáo dục,... Cách tiếp cận này giúp AI phát triển nhanh nhưng vẫn trong khuôn khổ an toàn.

Danh sách tên miền “.vn”giải phóng về trạng thái tự do được công bố trên website tenmien.vn

Tin vui cho người săn tên miền đẹp

Lần đầu tiên, VNNIC công bố dữ liệu tên miền .vn hết hạn theo thời gian thực, mở ra cơ hội cho doanh nghiệp tiếp cận những tên miền tái sinh hiệu quả hơn, phục vụ xây dựng thương hiệu và mở rộng hiện diện số.

Bộ GDĐT yêu cầu giao diện SGK điện tử phải tối ưu cho từng thiết bị, bảo đảm yếu tố thị giác.

SGK điện tử không được chèn quảng cáo, gợi ý mua sắm

Dự thảo Thông tư về sách giáo khoa điện tử quy định giao diện sách phải được hiển thị tối ưu trên mọi loại thiết bị, tuyệt đối không chèn quảng cáo, không có nội dung kinh doanh, gợi ý mua sắm hay giới thiệu tài liệu bên ngoài.

Đại biểu Nguyễn Tâm Hùng, Đoàn ĐBQH TP Hồ Chí Minh.

ĐBQH: Dữ liệu công phải là tài sản quốc gia

Đại biểu quốc hội Nguyễn Tâm Hùng đề nghị bổ sung điều khoản xác định rằng dữ liệu công là tài sản quốc gia và thúc đẩy việc mở, chia sẻ dữ liệu không thuộc danh mục bí mật Nhà nước. Dữ liệu cá nhân phải bảo mật.

4 “điểm nghẽn” cần gỡ ngay để kinh tế số tăng tốc

4 “điểm nghẽn” cần gỡ ngay để kinh tế số tăng tốc

Kinh tế số bứt phá nhưng cũng đối mặt nhiều điểm nghẽn do thiếu nhân lực chất lượng cao, hạ tầng chưa theo kịp, doanh nghiệp nhỏ khó chuyển đổi số, phụ thuộc vào nền tảng ngoại. Gỡ được các nút thắt này, kinh tế số sẽ giữ đà tăng tốc.