close Đăng nhập

Rộ tin DeepSeek âm thầm thử nghiệm mô hình AI thế hệ mới

Mô hình miễn phí này có tên gọi là Hunter Alpha, bắt đầu hiện diện trên cổng thông tin OpenRouter từ ngày 11 tháng 3 mà không kèm theo bất kỳ thông tin nào về đơn vị phát triển.

DeepSeek được cho là đang thử nghiệm mô hình mới. Ảnh: Reuters.
DeepSeek được cho là đang thử nghiệm mô hình mới. Ảnh: Reuters.

Sự xuất hiện ẩn danh của một mô hình trí tuệ nhân tạo (AI) đầy quyền năng trên nền tảng dành cho các nhà phát triển vào tuần trước đã làm dấy lên những đồn đoán về việc công ty khởi nghiệp DeepSeek của Trung Quốc đang âm thầm thử nghiệm hệ thống thế hệ mới trước khi chính thức ra mắt.

Mô hình miễn phí này có tên gọi là Hunter Alpha, bắt đầu hiện diện trên cổng thông tin OpenRouter từ ngày 11/3 mà không kèm theo bất kỳ thông tin nào về đơn vị phát triển. Nền tảng này sau đó đã mô tả đây là một mô hình thử nghiệm trong bóng tối nhằm thu thập phản hồi thực tế từ người dùng.

Trong các bài kiểm tra do Reuters thực hiện, chatbot Hunter Alpha tự nhận diện mình là một mô hình AI Trung Quốc được huấn luyện chủ yếu bằng tiếng Trung. Đáng chú ý, hệ thống này tiết lộ dữ liệu đào tạo của nó kéo dài đến tháng 5/2025, trùng khớp hoàn toàn với mốc thời gian cắt đứt kiến thức mà chatbot hiện tại của DeepSeek từng công bố. Tuy nhiên, khi được hỏi trực tiếp về người sáng tạo ra mình, hệ thống đã từ chối xác nhận danh tính đơn vị phát triển mà chỉ cho biết tên gọi cùng các thông số về quy mô tham số và cửa sổ ngữ cảnh.

Hồ sơ kỹ thuật của Hunter Alpha cho thấy đây là một mô hình khổng lồ với 1.000 tỷ tham số, đồng nghĩa với việc nó được huấn luyện dựa trên khoảng một nghìn tỷ giá trị có thể điều chỉnh để xác định cách hệ thống xử lý ngôn ngữ.

Điểm nổi bật giúp Hunter Alpha thu hút sự chú ý của giới chuyên gia chính là khả năng xử lý cửa sổ ngữ cảnh lên tới một triệu token, cho phép nó ghi nhớ và xử lý một lượng văn bản khổng lồ trong một lần tương tác duy nhất. Sự kết hợp giữa khả năng lập luận mạnh mẽ, dung lượng bộ nhớ lớn và việc cho phép truy cập miễn phí đã tạo nên một dấu ấn khác biệt so với các mô hình hàng đầu hiện nay vốn thường đi kèm chi phí vận hành rất lớn.

Các kỹ sư AI phân tích rằng phong cách lập luận và chuỗi suy nghĩ của Hunter Alpha mang những tín hiệu đặc trưng khó che giấu, phản ánh phương thức đào tạo tương đồng với các sản phẩm của DeepSeek. Những thông số này cũng tương thích với các dự đoán về dòng sản phẩm V4 tiếp theo của hãng, dự kiến có thể ra mắt sớm nhất vào tháng 4 tới.

Mặc dù vậy, một số chuyên gia độc lập vẫn đưa ra những cảnh báo thận trọng khi cho rằng các bằng chứng hiện tại chưa đủ để đưa ra kết luận cuối cùng do có sự khác biệt nhất định trong cấu trúc và hành vi xử lý token so với các hệ thống hiện có của DeepSeek.

Việc ra mắt các mô hình ẩn danh không phải là điều hiếm gặp trong ngành công nghiệp này, khi các nền tảng như OpenRouter thường xuyên được sử dụng làm bãi thử nghiệm để thu thập ý kiến phản hồi khách quan.

Kể từ khi xuất hiện, Hunter Alpha đã được tiếp nhận nhanh chóng và xử lý hơn 160 tỷ token chỉ trong vài ngày. Phần lớn hoạt động này đến từ các công cụ phát triển phần mềm và các khung tác vụ AI như OpenClaw, nơi các hệ thống có thể tự chủ lập kế hoạch nhiệm vụ và tương tác với các phần mềm bên ngoài. Điều này càng minh chứng cho năng lực thực tế đáng nể của mô hình bí ẩn này trong mắt cộng đồng công nghệ toàn cầu.

Theo Reuters

Khoa học - Công nghệ