close Đăng nhập

Alibaba ra mắt mô hình AI chuyên về toán học, tuyên bố vượt mặt OpenAI, Google

VietTimes – Gã khổng lồ thương mại điện tử này tuyên bố rằng hệ thống AI mới có thể vượt trội hơn khả năng của GPT-4o của OpenAI trong lĩnh vực toán học.

Alibaba ra mắt mô hình AI chuyên về toán học, tuyên bố vượt mặt OpenAI, Google. Ảnh: SCMP
Alibaba ra mắt mô hình AI chuyên về toán học, tuyên bố vượt mặt OpenAI, Google. Ảnh: SCMP

Alibaba Group Holding đang đặt mục tiêu nâng cao tiêu chuẩn trong việc phát triển trí tuệ nhân tạo (AI) bằng cách ra mắt một nhóm các mô hình ngôn ngữ lớn (LLM) chuyên về toán học có tên là Qwen2-Math. Gã khổng lồ thương mại điện tử này tuyên bố rằng hệ thống này có thể vượt trội hơn khả năng của GPT-4o của OpenAI trong lĩnh vực toán học.

“Trong năm qua, chúng tôi đã dành nhiều nỗ lực đáng kể để nghiên cứu và nâng cao khả năng lý luận của các mô hình ngôn ngữ lớn, đặc biệt tập trung vào khả năng giải quyết các bài toán số học”, nhóm Qwen, một bộ phận của đơn vị điện toán đám mây Alibaba, cho biết trong một bài đăng được công bố trên nền tảng dành cho nhà phát triển GitHub vào hôm 9/8.

Được biết các LLM mới nhất (công nghệ hỗ trợ các dịch vụ AI tạo sinh như ChatGPT) được xây dựng trên các LLM Qwen2 do Alibaba phát hành vào tháng 6.

Theo bài đăng của nhóm Qwen, mô hình có số lượng tham số lớn nhất, Qwen2-Math-72B-Instruct, đã vượt trội hơn các LLM độc quyền do Hoa Kỳ phát triển trong các chuẩn mực toán học. Những chuẩn mực đó bao gồm GPT-4o, Claude 3.5 Sonnet của Anthropic, Gemini 1.5 Pro của Google và Llama -3.1-405B của Meta Platforms.

Bài đăng cho biết: "Chúng tôi hy vọng Qwen2-Math có thể đóng góp cho cộng đồng trong việc giải quyết các bài toán phức tạp".

Theo bài đăng, các mô hình AI Qwen2-Math đã được thử nghiệm trên cả chuẩn toán tiếng Anh và tiếng Trung. Trong đó bao gồm GSM8K, một tập dữ liệu gồm 8.500 bài toán tiểu học đa dạng về mặt ngôn ngữ chất lượng cao; OlympiadBench, một chuẩn khoa học đa phương thức song ngữ cấp cao và gaokao, kỳ thi tuyển sinh đại học khó khăn của Trung Quốc đại lục.

Nhóm Qwen cho biết các mô hình mới vẫn còn một số hạn chế do "chỉ hỗ trợ tiếng Anh". Theo nhóm, kế hoạch là sớm phát hành các mô hình song ngữ, với các LLM đa ngôn ngữ cũng đang trong quá trình phát triển.

Các mô hình toán học cụ thể của Alibaba càng củng cố thêm uy tín về AI của công ty có trụ sở tại Hàng Châu này sau khi chương trình LLM Qwen-72B-Instruct của công ty gần đây đã dẫn đầu bảng xếp hạng 10 mô hình nguồn mở hàng đầu thế giới.

Được biết, Tongyi Qianwen đã mở cửa cho các nhà phát triển bên thứ ba trong hơn một năm. Mã nguồn mở cung cấp quyền truy cập công khai vào mã nguồn của chương trình, cho phép các nhà phát triển phần mềm bên thứ ba sửa đổi hoặc chia sẻ thiết kế và mở rộng khả năng của chương trình.

Vào tháng 7, Qwen2-72B-Instruct xếp ngay sau GPT-4o và Claude 3.5 Sonnet trong bảng xếp hạng LLM của SuperClue, một nền tảng đánh giá các mô hình dựa trên các số liệu như tính toán, suy luận logic, mã hóa và khả năng đọc hiểu văn bản, cùng nhiều số liệu khác.

Theo SuperClue, khoảng cách giữa các mô hình AI của Trung Quốc và Hoa Kỳ dường như đang thu hẹp lại khi Trung Quốc đại lục đã đạt được tiến bộ đáng kể trong việc thúc đẩy các chương trình LLM trong nước trong nửa đầu năm nay.

Một bài kiểm tra riêng biệt được công bố vào tháng 7 bởi LMSYS - một tổ chức nghiên cứu mô hình AI được Đại học California, Berkeley hỗ trợ - cho thấy Qwen2-72B được xếp hạng 20, trong khi các mô hình độc quyền từ OpenAI, Anthropic và Google chiếm hầu hết các vị trí trong top 10.

Theo SCMP

https://www.scmp.com/tech/big-tech/article/3273940/alibaba-launches-maths-specific-ai-models-said-outperform-llms-openai-google?campaign=45979c58-577c-11ef-a26f-725d336290b7&module=AI_Recommended_for_you_In-house&pgtype=section

Chuyển đổi số

Ứng dụng Tuyên giáo và Dân vận giúp người dân nắm bắt thông tin và tương tác, phản ánh trực tiếp với cơ quan chức năng.

Lá chắn trước ma trận tin tức lề trái

Giữa ma trận tin tức lề trái về vấn đề Gaza, ứng dụng Tuyên giáo và Dân vận giúp người dân kiểm chứng thông tin, củng cố niềm tin vào chủ trương, chính sách của Đảng và Nhà nước.

Sáng kiến khoa học và ứng dụng (AI) vào khám sàng lọc ở Thái Nguyên (ảnh minh họa)

300 sáng kiến khoa học công nghệ được tài trợ kinh phí

Trong hơn 1.000 sáng kiến từ các tổ chức, cá nhân, doanh nghiệp và chuyên gia trong và ngoài nước được tiếp nhận qua Cổng Sáng kiến Khoa học, công nghệ, đổi mới sáng tạo và chuyển đổi số, có hơn 300 sáng kiến đã được tài trợ kinh phí.

"Vũ khí" mới ngăn tội phạm tài sản số

"Vũ khí" mới ngăn tội phạm tài sản số

Giống như các loại tội phạm khác, tội phạm tài sản số không mất đi, nó sẽ phát triển ngày càng tinh vi. Để ngăn loại tội phạm này, cần những loại “vũ khí” mới…

Anh Lăng Trường Chinh, Phó Phòng Kinh tế Xã Vân Nham

Khi AI thành “đồng nghiệp” của cán bộ xã

AI đã bước vào phòng làm việc của cán bộ, công chức xã miền núi. Từ những thao tác nhỏ hằng ngày, công nghệ mở lối đổi mới cách làm việc ở chính quyền cơ sở, giúp công chức giảm áp lực hành chính, dành nhiều thời gian để gần dân và phục vụ dân.