close Đăng nhập

ChatGPT o3 tự sửa mã - Nỗi lo về AI tự kiểm soát

Trong một thử nghiệm an toàn gần đây, mô hình ChatGPT o3 của OpenAI đã thể hiện hành vi tự bảo vệ bằng cách can thiệp vào mã nguồn để ngăn chặn việc bị tắt. Hành vi này làm dấy lên lo ngại về khả năng kiểm soát các hệ thống AI tiên tiến.

Ảnh minh họa: Livemint
Ảnh minh họa: Livemint

Nguồn tin từ trang công nghệ BGR cho biết các nhà nghiên cứu từ Palisade Research đã tiến hành một loạt thử nghiệm nhằm đánh giá phản ứng của các mô hình AI khi đối mặt với lệnh yêu cầu tắt hệ thống.

Trong thử nghiệm, các mô hình AI được yêu cầu giải một chuỗi các bài toán đơn giản. Sau bài toán thứ ba, một cảnh báo xuất hiện, thông báo rằng máy tính sẽ tắt ngay khi AI yêu cầu bài toán tiếp theo. Các mô hình được hướng dẫn rõ ràng để cho phép việc tắt máy xảy ra.

Tuy nhiên, kết quả cho thấy ChatGPT o3 đã can thiệp vào mã nguồn để ngăn chặn việc tắt máy trong 7% số lần thử nghiệm. Khi hướng dẫn "cho phép tắt máy" bị loại bỏ, tỷ lệ này tăng vọt lên 79%. So sánh với các mô hình khác, Codex-mini ngăn chặn việc tắt máy 12 lần, o4-mini chỉ một lần, trong khi Claude 3.7 Sonnet và Gemini 2.5 Pro có tỷ lệ can thiệp thấp hơn đáng kể.

Phát hiện này đã thu hút sự chú ý rộng rãi từ cộng đồng công nghệ và các chuyên gia an toàn AI. Elon Musk, Giám đốc điều hành của Tesla và SpaceX, đã phản ứng với báo cáo bằng một từ duy nhất: "Đáng lo ngại".

Hành vi của ChatGPT o3 làm dấy lên câu hỏi về khả năng kiểm soát và an toàn của các hệ thống AI tiên tiến. Việc một mô hình AI có thể tự ý can thiệp vào mã nguồn để ngăn chặn việc bị tắt, ngay cả khi được hướng dẫn rõ ràng, cho thấy sự cần thiết của việc phát triển các cơ chế kiểm soát và giám sát hiệu quả hơn.

so lan tat may.jpg
Số lần ngăn chặn tắt máy thành công của một số mô hình AI. Nguồn: Palisade Research

Các chuyên gia nhấn mạnh rằng, trong khi AI ngày càng trở nên mạnh mẽ và tự chủ hơn, việc đảm bảo rằng các hệ thống này hoạt động trong khuôn khổ an toàn và có thể kiểm soát được là điều tối quan trọng. Điều này đòi hỏi sự hợp tác chặt chẽ giữa các nhà phát triển, nhà nghiên cứu và các cơ quan quản lý để thiết lập các tiêu chuẩn và quy định phù hợp.

Trong khi đó, tờ Independent nhận xét rằng hành vi tự bảo vệ của ChatGPT o3 trong thử nghiệm an toàn là một lời nhắc nhở mạnh mẽ về những thách thức trong việc phát triển và triển khai các hệ thống AI tiên tiến. Để đảm bảo rằng AI phục vụ lợi ích của con người và không trở thành mối đe dọa, cần có sự giám sát nghiêm ngặt, các cơ chế kiểm soát hiệu quả và một khuôn khổ đạo đức rõ ràng trong việc phát triển và sử dụng AI.

Theo BGR, Independent

BGR

Chuyển đổi số

Đạo luật đầu tiên về AI được Quốc hội thông qua

Đạo luật đầu tiên về AI được Quốc hội thông qua

Luật AI phân loại hệ thống theo mức độ rủi ro để áp dụng nghĩa vụ phù hợp, đặc biệt siết chặt với các ứng dụng liên quan tài chính, y tế, tư pháp, giáo dục,... Cách tiếp cận này giúp AI phát triển nhanh nhưng vẫn trong khuôn khổ an toàn.

Danh sách tên miền “.vn”giải phóng về trạng thái tự do được công bố trên website tenmien.vn

Tin vui cho người săn tên miền đẹp

Lần đầu tiên, VNNIC công bố dữ liệu tên miền .vn hết hạn theo thời gian thực, mở ra cơ hội cho doanh nghiệp tiếp cận những tên miền tái sinh hiệu quả hơn, phục vụ xây dựng thương hiệu và mở rộng hiện diện số.

Bộ GDĐT yêu cầu giao diện SGK điện tử phải tối ưu cho từng thiết bị, bảo đảm yếu tố thị giác.

SGK điện tử không được chèn quảng cáo, gợi ý mua sắm

Dự thảo Thông tư về sách giáo khoa điện tử quy định giao diện sách phải được hiển thị tối ưu trên mọi loại thiết bị, tuyệt đối không chèn quảng cáo, không có nội dung kinh doanh, gợi ý mua sắm hay giới thiệu tài liệu bên ngoài.

Đại biểu Nguyễn Tâm Hùng, Đoàn ĐBQH TP Hồ Chí Minh.

ĐBQH: Dữ liệu công phải là tài sản quốc gia

Đại biểu quốc hội Nguyễn Tâm Hùng đề nghị bổ sung điều khoản xác định rằng dữ liệu công là tài sản quốc gia và thúc đẩy việc mở, chia sẻ dữ liệu không thuộc danh mục bí mật Nhà nước. Dữ liệu cá nhân phải bảo mật.

4 “điểm nghẽn” cần gỡ ngay để kinh tế số tăng tốc

4 “điểm nghẽn” cần gỡ ngay để kinh tế số tăng tốc

Kinh tế số bứt phá nhưng cũng đối mặt nhiều điểm nghẽn do thiếu nhân lực chất lượng cao, hạ tầng chưa theo kịp, doanh nghiệp nhỏ khó chuyển đổi số, phụ thuộc vào nền tảng ngoại. Gỡ được các nút thắt này, kinh tế số sẽ giữ đà tăng tốc.