Các công ty Trung Quốc bị tố sử dụng kỹ thuật 'chưng cất' để sao chép mô hình AI Mỹ, gây lo ngại về an ninh quốc gia và cạnh tranh không lành mạnh.

Công ty khởi nghiệp trí tuệ nhân tạo (AI) của Mỹ Anthropic cáo buộc 3 doanh nghiệp AI Trung Quốc đã lập hơn 24.000 tài khoản giả để sử dụng mô hình Claude, nhằm hỗ trợ hệ thống của họ bắt kịp các đối thủ Mỹ.

Trong bài viết đăng trên blog hôm 23/2, Anthropic cho biết ba công ty Trung Quốc gồm DeepSeek, Moonshot AI và MiniMax đã gửi hơn 16 triệu lượt yêu cầu (prompt) tới Claude, nhằm trích xuất thông tin từ hệ thống của Anthropic để huấn luyện và cải tiến sản phẩm riêng của họ.

Liên quan đến DeepSeek, Moonshot AI và MiniMax

Năm ngoái, DeepSeek Trung Quốc sau khi xuất hiện đã lần đầu thu hút sự chú ý của cộng đồng yêu thích AI. DeepSeek đã công bố một mô hình AI tạo sinh chi phí thấp, có hiệu năng tương đương với các mô hình AI hàng đầu của Mỹ như ChatGPT, qua đó phá vỡ nhận thức trước đây rằng Mỹ nắm giữ vị thế thống trị tuyệt đối trong lĩnh vực này. Công nghệ này khi đó từng trở thành tâm điểm truyền thông.

DeepSeek xuất hiện từng gây rúng động quốc tế bởi giá thành rẻ, hiệu năng tốt. Ảnh: Singtao.

Đối thủ trong nước của Anthropic là OpenAI trước đó cũng đã gửi thư tới Hạ viện Mỹ, cáo buộc DeepSeek sử dụng chiến lược tương tự gọi là “chưng cất” (distillation) để mô phỏng sản phẩm của OpenAI.

Anthropic cho biết kỹ thuật “chưng cất” vốn có những mục đích chính đáng, chẳng hạn doanh nghiệp có thể dùng để tạo ra phiên bản thu gọn của sản phẩm nội bộ. Tuy nhiên, kỹ thuật này cũng có thể bị lợi dụng để “tạo ra sản phẩm có sức cạnh tranh với chi phí và thời gian tối thiểu”.

Quy mô hoạt động “chưng cất” của các công ty Trung Quốc có sự khác nhau. Anthropic cho biết DeepSeek đã tương tác với Claude khoảng 150.000 lần, trong khi Moonshot hơn 3,4 triệu và MiniMax vượt 13 triệu lượt.

Trọng tâm hoạt động tập trung vào lập trình mã, suy luận tác tử (Agentic Reasoning) và sử dụng công cụ – đây đều là những thế mạnh của Claude.

Để vượt qua lệnh cấm truy cập của Anthropic đối với người dùng thương mại tại Trung Quốc, các phòng thí nghiệm này được cho là đã sử dụng dịch vụ proxy để định tuyến lưu lượng truy cập, qua đó quản lý một mạng lưới lớn các tài khoản giả.

Moonshot AI bị cáo buộc tấn công Claude hơn 3,4 triệu lượt. Ảnh: Singtao.

Anthropic kêu gọi ngành công nghiệp và chính phủ phối hợp đưa ra phản ứng thống nhất, cho rằng đây không phải là vấn đề mà một công ty riêng lẻ có thể tự mình giải quyết.

Theo Anthropic, điều này cho phép ba phòng thí nghiệm nói trên “đánh cắp” với chi phí cực thấp những năng lực mà họ không thể tự phát triển độc lập, đồng thời né tránh các biện pháp kiểm soát xuất khẩu công nghệ tiên tiến vốn nhằm duy trì vị thế dẫn đầu AI của Mỹ.

Đại diện của DeepSeek, Moonshot và MiniMax hiện chưa đưa ra phản hồi.

Gần đây, nhiều doanh nghiệp Trung Quốc – bao gồm Moonshot và MiniMax – đã công bố các mô hình AI mới, trong đó nhiều sản phẩm được tăng cường năng lực suy luận và lập trình. DeepSeek cũng đang chuẩn bị ra mắt thế hệ mô hình tiếp theo trong thời gian tới.

Khi DeepSeek lần đầu gây chú ý vào năm ngoái, đã xuất hiện lo ngại rằng Trung Quốc có thể nhanh chóng bắt kịp các công ty AI Mỹ, ngay cả khi không tiếp cận được những con chip AI mạnh nhất. Khi đó, giới quan sát đã suy đoán DeepSeek có thể sử dụng kỹ thuật “chưng cất”.

Mô hình Claude của Anthropic là đối tượng "chưng cất" của các công ty Trung Quốc. Ảnh: Orientaldaily.

Dấy lên lo ngại an ninh quốc gia của Mỹ

Trong một bài nghiên cứu được cập nhật tháng 9 năm ngoái, DeepSeek cho biết ở giai đoạn cuối của quá trình tiền huấn luyện mô hình chủ lực V3, họ chỉ sử dụng dữ liệu web thông thường và sách điện tử, không đưa vào bất kỳ dữ liệu tổng hợp (synthetic data) nào. Tuy nhiên, công ty thừa nhận một số trang web có chứa lượng lớn nội dung do mô hình của OpenAI tạo ra.

DeepSeek cho rằng mô hình nền tảng của họ có thể đã gián tiếp tiếp thu kiến thức từ các mô hình mạnh khác thông qua việc thu thập dữ liệu từ những trang web này. Trong một báo cáo kỹ thuật tháng 7 năm ngoái, Moonshot cũng cho biết họ đã sử dụng dữ liệu tổng hợp để huấn luyện mô hình Kimi K2.

Do các mô hình được xây dựng thông qua “chưng cất” bất hợp pháp có khả năng không giữ lại các cơ chế an toàn (safety guardrails) ban đầu, nên chúng có thể bị lạm dụng để hỗ trợ phát triển vũ khí sinh học hoặc tiến hành tấn công mạng.

Anthropic nhấn mạnh rằng các hoạt động nói trên của nhà phát triển AI Trung Quốc đã làm dấy lên quan ngại về an ninh quốc gia Mỹ, bởi “các phòng thí nghiệm nước ngoài ‘chưng cất’ mô hình của Mỹ, sau đó có thể tích hợp những năng lực chưa được bảo vệ này vào hệ thống quân sự, tình báo và giám sát”.

Theo Singtao, Orientaldaily