Alibaba ra mắt mô hình AI chuyên về toán học, tuyên bố vượt mặt OpenAI, Google

11/08/2024 12:34

VietTimes – Gã khổng lồ thương mại điện tử này tuyên bố rằng hệ thống AI mới có thể vượt trội hơn khả năng của GPT-4o của OpenAI trong lĩnh vực toán học.

Alibaba ra mắt mô hình AI chuyên về toán học, tuyên bố vượt mặt OpenAI, Google. Ảnh: SCMP

Alibaba Group Holding đang đặt mục tiêu nâng cao tiêu chuẩn trong việc phát triển trí tuệ nhân tạo (AI) bằng cách ra mắt một nhóm các mô hình ngôn ngữ lớn (LLM) chuyên về toán học có tên là Qwen2-Math. Gã khổng lồ thương mại điện tử này tuyên bố rằng hệ thống này có thể vượt trội hơn khả năng của GPT-4o của OpenAI trong lĩnh vực toán học.

“Trong năm qua, chúng tôi đã dành nhiều nỗ lực đáng kể để nghiên cứu và nâng cao khả năng lý luận của các mô hình ngôn ngữ lớn, đặc biệt tập trung vào khả năng giải quyết các bài toán số học”, nhóm Qwen, một bộ phận của đơn vị điện toán đám mây Alibaba, cho biết trong một bài đăng được công bố trên nền tảng dành cho nhà phát triển GitHub vào hôm 9/8.

Được biết các LLM mới nhất (công nghệ hỗ trợ các dịch vụ AI tạo sinh như ChatGPT) được xây dựng trên các LLM Qwen2 do Alibaba phát hành vào tháng 6.

Theo bài đăng của nhóm Qwen, mô hình có số lượng tham số lớn nhất, Qwen2-Math-72B-Instruct, đã vượt trội hơn các LLM độc quyền do Hoa Kỳ phát triển trong các chuẩn mực toán học. Những chuẩn mực đó bao gồm GPT-4o, Claude 3.5 Sonnet của Anthropic, Gemini 1.5 Pro của Google và Llama -3.1-405B của Meta Platforms.

Bài đăng cho biết: "Chúng tôi hy vọng Qwen2-Math có thể đóng góp cho cộng đồng trong việc giải quyết các bài toán phức tạp".

Theo bài đăng, các mô hình AI Qwen2-Math đã được thử nghiệm trên cả chuẩn toán tiếng Anh và tiếng Trung. Trong đó bao gồm GSM8K, một tập dữ liệu gồm 8.500 bài toán tiểu học đa dạng về mặt ngôn ngữ chất lượng cao; OlympiadBench, một chuẩn khoa học đa phương thức song ngữ cấp cao và gaokao, kỳ thi tuyển sinh đại học khó khăn của Trung Quốc đại lục.

Nhóm Qwen cho biết các mô hình mới vẫn còn một số hạn chế do "chỉ hỗ trợ tiếng Anh". Theo nhóm, kế hoạch là sớm phát hành các mô hình song ngữ, với các LLM đa ngôn ngữ cũng đang trong quá trình phát triển.

Các mô hình toán học cụ thể của Alibaba càng củng cố thêm uy tín về AI của công ty có trụ sở tại Hàng Châu này sau khi chương trình LLM Qwen-72B-Instruct của công ty gần đây đã dẫn đầu bảng xếp hạng 10 mô hình nguồn mở hàng đầu thế giới.

Được biết, Tongyi Qianwen đã mở cửa cho các nhà phát triển bên thứ ba trong hơn một năm. Mã nguồn mở cung cấp quyền truy cập công khai vào mã nguồn của chương trình, cho phép các nhà phát triển phần mềm bên thứ ba sửa đổi hoặc chia sẻ thiết kế và mở rộng khả năng của chương trình.

Vào tháng 7, Qwen2-72B-Instruct xếp ngay sau GPT-4o và Claude 3.5 Sonnet trong bảng xếp hạng LLM của SuperClue, một nền tảng đánh giá các mô hình dựa trên các số liệu như tính toán, suy luận logic, mã hóa và khả năng đọc hiểu văn bản, cùng nhiều số liệu khác.

Theo SuperClue, khoảng cách giữa các mô hình AI của Trung Quốc và Hoa Kỳ dường như đang thu hẹp lại khi Trung Quốc đại lục đã đạt được tiến bộ đáng kể trong việc thúc đẩy các chương trình LLM trong nước trong nửa đầu năm nay.

Một bài kiểm tra riêng biệt được công bố vào tháng 7 bởi LMSYS - một tổ chức nghiên cứu mô hình AI được Đại học California, Berkeley hỗ trợ - cho thấy Qwen2-72B được xếp hạng 20, trong khi các mô hình độc quyền từ OpenAI, Anthropic và Google chiếm hầu hết các vị trí trong top 10.

Theo SCMP

https://www.scmp.com/tech/big-tech/article/3273940/alibaba-launches-maths-specific-ai-models-said-outperform-llms-openai-google?campaign=45979c58-577c-11ef-a26f-725d336290b7&module=AI_Recommended_for_you_In-house&pgtype=section

Từ khóa:

#Alibaba #OpenAI #LLM #ChatGPT #AI tạo sinh

Nguy cơ điện toán lượng tử phá vỡ hệ thống mật mã hiện nay

Bà Tô Thị Thu Hương, Giám đốc Trung tâm Chứng thực điện tử quốc gia (NEAC), cho rằng những hệ thống vốn được coi là đáng tin cậy có thể bị phá vỡ trong tương lai nếu không có hành động kịp thời trước sự phát triển của điện toán lượng tử.

Thủ tướng yêu cầu tăng tốc giải ngân vốn cho khoa học, công nghệ và chuyển đổi số

Thủ tướng yêu cầu tăng tốc triển khai các nhiệm vụ KHCN, đổi mới sáng tạo và chuyển đổi số trong năm 2026, coi hiệu quả giải ngân là thước đo thực chất của đầu tư, đồng thời khẩn trương tháo gỡ các điểm nghẽn về cơ chế, chính sách.

Xóa tư duy "không quản được thì cấm" và các thủ tục biến tướng trong KHCN, viễn thông

Phó Chủ tịch Quốc hội Nguyễn Hồng Diên đề nghị quá trình sửa đổi 4 luật trong lĩnh vực khoa học công nghệ, viễn thông và giao dịch điện tử phải đẩy mạnh cắt giảm thủ tục hành chính, xóa bỏ tư duy "không quản được thì cấm".

Đề xuất hỗ trợ 50% lãi suất vay, thí điểm 20 doanh nghiệp đổi mới công nghệ

Bộ Khoa học và Công nghệ đề xuất hỗ trợ doanh nghiệp tới 50% lãi suất vay, tối đa 6%/năm trong 5 năm khi đầu tư đổi mới công nghệ. Chính sách sẽ thí điểm với 20 doanh nghiệp, kỳ vọng khơi thông vốn tín dụng và thúc đẩy đổi mới sáng tạo.

Dữ liệu phải là hạ tầng chiến lược của khu công nghiệp

TS Nguyễn Đức Hiển cho rằng khu công nghiệp thế hệ mới cần được quản trị trên nền tảng dữ liệu, trí tuệ nhân tạo và công nghệ số. Chuyển đổi số phải tạo ra phương thức quản trị minh bạch, thông minh, hiệu quả, coi dữ liệu là hạ tầng chiến lược.

Nghiên cứu AI, bán dẫn, robot, 5G-6G có thể nhận hỗ trợ tới 10 tỷ đồng từ NAFOSTED

Các nhiệm vụ nghiên cứu phát triển công nghệ thuộc lĩnh vực AI, bán dẫn, robot, 5G-6G, UAV cùng nhiều công nghệ chiến lược khác có cơ hội nhận hỗ trợ tối đa 10 tỷ đồng từ ngân sách nhà nước thông qua chương trình tài trợ năm 2026 của NAFOSTED.

Bên trong cuộc "đại tu" cơ chế phát triển công nghệ chiến lược

Danh mục công nghệ chiến lược được tinh gọn từ 11 xuống 10 nhóm. Tuy nhiên, điểm mới lớn nhất không nằm ở số lượng mà ở cách tiếp cận: Việt Nam chuyển từ tư duy lựa chọn công nghệ sang giải các bài toán lớn để xác định công nghệ ưu tiên đầu tư.

Cấm sử dụng AI giả mạo hình ảnh, video, giọng nói của người khác

Điểm nhấn quan trọng của Luật Chuyển đổi số có hiệu lực từ ngày 1/7 nằm ở nguyên tắc "khai báo một lần là mặc định", tăng cường kết nối, chia sẻ và sử dụng lại dữ liệu, giảm trùng lặp thủ tục, nâng cao hiệu quả quản lý và năng lực ra quyết định.

Alibaba ra mắt mô hình AI chuyên về toán học, tuyên bố vượt mặt OpenAI, Google

Tin liên quan

Từ khóa:

Đọc nhiều

Tin mới

Đừng bỏ lỡ