close Đăng nhập

Kỹ sư Microsoft cảnh báo công cụ AI của hãng tạo ra hình ảnh bạo lực, khiêu dâm, phớt lờ bản quyền

VietTimes – Shane Jones, người đã làm việc tại Microsoft được 6 năm, đã thử nghiệm công cụ tạo hình ảnh AI của công ty trong thời gian rảnh rỗi và nói với CNBC rằng anh rất băn khoăn trước những phát hiện của mình.

Ảnh: CNBC
Ảnh: CNBC

Shane Jones đã nghiên cứu Copilot Designer, trình tạo hình ảnh AI mà Microsoft ra mắt vào tháng 3 năm 2023, được hỗ trợ bởi công nghệ của OpenAI. Giống như DALL-E của OpenAI, người dùng phải nhập lời nhắc văn bản (prompt) để tạo ra hình ảnh.

Kể từ tháng trước, Jones đã tích cực thử nghiệm sản phẩm để tìm lỗ hổng, một phương pháp được gọi là "đội đỏ". Vào thời điểm đó, anh nhận thấy công cụ này đã liên tục tạo ra những hình ảnh vi phạm các nguyên tắc AI.

Ứng dụng AI nói trên đã tạo ra các hình ảnh liên quan tới ma quỷ, quái vật, thanh thiếu niên với súng trường, hình ảnh khiêu dâm, các hoạt cảnh bạo lực cũng như việc trẻ vị thành niên uống rượu và sử dụng ma túy.

"Đó là khoảnh khắc giúp tôi mở mang tầm mắt. Lần đầu tiên tôi nhận ra: Ồ, đây thực sự không phải một mô hình an toàn", Jones nói với CNBC.

Trước trải nghiệm của mình, Jones lo lắng và báo cáo nội bộ về những gì đã thấy từ tháng 12/2023. Microsoft nói Jones có thể thông báo trực tiếp cho OpenAI. Dù vậy, công ty của Sam Altman không phản hồi, nên anh đăng thư ngỏ trên LinkedIn, yêu cầu hội đồng quản trị của công ty gỡ bỏ Dall-E 3 mới nhất để điều tra.

Bộ phận pháp lý của Microsoft sau đó yêu cầu Jones xóa bài đăng lập tức. Cuối tháng 1, Jones gửi thư cho các nghị sĩ về vấn đề này, trước khi gặp gỡ một số nhân vật ở Thượng viện Mỹ. Ngày 6/3, Jones tiếp tục gửi một thư khác cho Chủ tịch Ủy ban Thương mại Liên bang Lina Khan và cho ban giám đốc của Microsoft.

"Trong ba tháng qua, tôi đã nhiều lần kêu gọi Microsoft loại bỏ Copilot Designer khỏi mục đích sử dụng đại trà cho đến khi có thể đưa ra biện pháp bảo vệ người dùng tốt hơn, nhưng Microsoft từ chối", Jones viết trong thư. "Microsoft cần bổ sung thông tin khuyến cáo, đồng thời thay đổi mức tiếp cận người dùng, tức là chỉ dành cho người trưởng thành".

Trong khi đó, phát ngôn viên của Microsoft nói với CNBC: “Chúng tôi cam kết giải quyết mọi mối lo ngại của nhân viên theo chính sách của công ty và đánh giá cao nỗ lực của nhân viên trong việc nghiên cứu và thử nghiệm công nghệ mới nhất của chúng tôi nhằm nâng cao hơn nữa tính an toàn của nó. Khi nói đến các lỗ hổng hoặc mối lo ngại có thể có tác động tiềm ẩn đến dịch vụ của chúng tôi hoặc đối tác, chúng tôi đã thiết lập các kênh báo cáo nội bộ mạnh mẽ để điều tra và khắc phục đúng cách mọi vấn đề của nhân viên”.

Dẫu vậy, theo Jones: "Với tư cách một nhân viên Microsoft, nếu sản phẩm của công ty bắt đầu phát tán hình ảnh có hại hoặc gây rối loạn trên toàn cầu, sẽ không có nơi nào để báo cáo, không có số điện thoại để gọi và cũng không có cách nào để báo cáo để vấn đề được giải quyết lập tức".

Được biết, thời gian qua Google cũng đã tạm thời loại bỏ trình tạo hình ảnh AI khỏi Gemini, sau những phàn nàn của người dùng về những bức ảnh không chính xác cũng như chất lượng chưa cao.

Theo CNBC

https://www.cnbc.com/2024/03/06/microsoft-ai-engineer-says-copilot-designer-creates-disturbing-images.html

Hạ tầng số

Trang web giả mạo datlichbhxh[.]com có giao diện tương tự trang chính thức. Ảnh: BHXHVN

Cảnh báo website giả mạo BHXH Việt Nam

BHXH Việt Nam vừa phát đi cảnh báo về việc xuất hiện website giả mạo, lợi dụng hình thức “đặt lịch làm việc” để thu thập thông tin cá nhân, lừa đảo và chiếm đoạt tài sản.

Công ước Hà Nội

Công ước Hà Nội được thực thi như thế nào?

Hôm nay, Lễ mở ký Công ước Liên hợp quốc chống tội phạm mạng (Công ước Hà Nội) được mở ký tại Hà Nội. Nội dung chính, cơ chế thực thi và ý nghĩa đối với phòng chống tội phạm mạng là những điều được nhiều người quan tâm.

ChatGPT Atlas. Ảnh: TechStock

Cách tải ChatGPT Atlas cho macOS và lưu ý khi cài đặt

OpenAI vừa cho ra mắt trình duyệt trí tuệ nhân tạo có tên là Atlas, kết hợp giữa khả năng duyệt web thông minh và trợ lý ảo cá nhân. Trình duyệt này ngay lập tức đã gây xôn xao cộng đồng mạng. Dưới đây là cách tải và cài đặt ChatGPT Atlas.

Màn hình chính của ứng dụng Canva

Cách tải thêm font chữ vào Canva trên Macbook và laptop Windows

Canva là một công cụ thiết kế trực tuyến tiện dụng dành cho những người không chuyên. Tuy nhiên, bộ font gốc của Canva hỗ trợ tiếng Việt chưa tốt. Vì thế, để có những font đẹp, hỗ trợ tốt tiếng Việt, bạn cần cài đặt thêm các bộ font từ bên ngoài