close Đăng nhập

AI được đào tạo bằng dữ liệu từ chính AI tạo ra đem đến kết quả kỳ dị

VietTimes – Các nhà nghiên cứu từ Đại học Stanford và Đại học Rice đã phát hiện ra rằng các mô hình trí tuệ nhân tạo (AI) tạo sinh cần “dữ liệu thực mới”, nếu không chất lượng đầu ra sẽ giảm.

Ảnh: Peta Pixel
Ảnh: Peta Pixel

Một nghiên cứu mới đây đã phát hiện ra rằng việc đào tạo trình tạo hình ảnh AI bằng chính các sản phẩm do AI tạo ra sẽ đem đến những sản phẩm kém chất lượng, có phần kỳ dị, khó hiểu.

Các nhà nghiên cứu từ Đại học Stanford và Đại học Rice đã phát hiện ra rằng các mô hình trí tuệ nhân tạo (AI) tạo sinh cần “dữ liệu thực mới” nếu không chất lượng đầu ra sẽ giảm.

Nhóm cho biết hình ảnh do AI tạo ra sẽ phóng đại những bất thường trong hình ảnh, dẫn tới dữ liệu đào tạo sai lệch và khiến mô hình xuất bản những bức ảnh ngày càng không giống con người.

Nhóm nghiên cứu đã đặt tên cho tình trạng AI này là "Rối loạn mô hình tự thực", hay viết tắt là MAD. Tự thực là quá trình tế bào tự ăn các thành phần của chính nó, trong trường hợp này AI tạo ảnh tự dung nạp những nội dung do nó tạo ra.

Các nhà nghiên cứu viết trong nghiên cứu: “Nếu không có đủ dữ liệu thực mới trong mỗi thế hệ của vòng lặp tự thực, các mô hình tạo sinh trong tương lai chắc chắn sẽ giảm dần chất lượng (độ chính xác) hoặc tính đa dạng của đầu ra”.

Nếu nghiên cứu này là chính xác, điều này đồng nghĩa với việc AI sẽ không thể phát triển một nguồn dữ liệu một cách vô tận. Thay vì dựa vào đầu ra của chính nó, AI vẫn sẽ cần những hình ảnh thực, chất lượng cao để tiếp tục phát triển. Đây được coi là tin tốt với các nhiếp ảnh gia và người làm nội dung, khi AI tạo sinh không thể xóa bỏ vai trò của họ.

Hiện nay, lượng lớn tư liệu của các nhiếp ảnh gia đang được dùng để đào tạo AI. Vấn đề MAD có thể buộc các công ty AI mua bản quyền dữ liệu, từ đó duy trì sức sống cho giới nhiếp ảnh.

Kể từ khi những công cụ như DALL-E và MidjTHER bùng nổ cách đây một năm, các công ty đứng sau các công cụ mới đáng kinh ngạc này đã nhấn mạnh rằng họ sử dụng dữ liệu “có sẵn công khai” để huấn luyện các mô hình của mình. Tuy nhiên, nguồn dữ liệu này bao gồm cả những bức ảnh bản quyền.

Ngay cả khi họ không phải đối mặt với các hậu quả pháp lý từ việc xây dựng phiên bản đầu tiên của trình tạo hình ảnh AI, thì đối với các mô hình trong tương lai, rất có thể họ sẽ cần sự hợp tác của các chuyên gia hình ảnh.

Theo Peta Pixel

https://petapixel.com/2023/08/11/ai-trained-on-ai-images-produces-terrible-results-study-finds/#:~:text=A%20study%20has%20found%20that,quality%20of%20the%20output%20decreases

Chuyển đổi số

Thủ tướng Phạm Minh Chính phát biểu tại Diễn đàn Kinh tế Việt Nam 2025, triển vọng 2026.

Việt Nam xác định ổn định là pháo đài bất khả xâm phạm, phát triển nhanh, bền vững là động cơ vĩnh cửu

Phát biểu tại Diễn đàn Kinh tế Việt Nam 2025, Thủ tướng Phạm Minh Chính khẳng định Việt Nam xác định ổn định là pháo đài bất khả xâm phạm; phát triển nhanh và bền vững là động cơ vĩnh cửu, không có điểm dừng; giàu mạnh, tự do, ấm no, hạnh phúc của người dân là mục tiêu tối thượng. 

Đạo luật đầu tiên về AI được Quốc hội thông qua

Đạo luật đầu tiên về AI được Quốc hội thông qua

Luật AI phân loại hệ thống theo mức độ rủi ro để áp dụng nghĩa vụ phù hợp, đặc biệt siết chặt với các ứng dụng liên quan tài chính, y tế, tư pháp, giáo dục,... Cách tiếp cận này giúp AI phát triển nhanh nhưng vẫn trong khuôn khổ an toàn.

Danh sách tên miền “.vn”giải phóng về trạng thái tự do được công bố trên website tenmien.vn

Tin vui cho người săn tên miền đẹp

Lần đầu tiên, VNNIC công bố dữ liệu tên miền .vn hết hạn theo thời gian thực, mở ra cơ hội cho doanh nghiệp tiếp cận những tên miền tái sinh hiệu quả hơn, phục vụ xây dựng thương hiệu và mở rộng hiện diện số.

Bộ GDĐT yêu cầu giao diện SGK điện tử phải tối ưu cho từng thiết bị, bảo đảm yếu tố thị giác.

SGK điện tử không được chèn quảng cáo, gợi ý mua sắm

Dự thảo Thông tư về sách giáo khoa điện tử quy định giao diện sách phải được hiển thị tối ưu trên mọi loại thiết bị, tuyệt đối không chèn quảng cáo, không có nội dung kinh doanh, gợi ý mua sắm hay giới thiệu tài liệu bên ngoài.

Đại biểu Nguyễn Tâm Hùng, Đoàn ĐBQH TP Hồ Chí Minh.

ĐBQH: Dữ liệu công phải là tài sản quốc gia

Đại biểu quốc hội Nguyễn Tâm Hùng đề nghị bổ sung điều khoản xác định rằng dữ liệu công là tài sản quốc gia và thúc đẩy việc mở, chia sẻ dữ liệu không thuộc danh mục bí mật Nhà nước. Dữ liệu cá nhân phải bảo mật.

4 “điểm nghẽn” cần gỡ ngay để kinh tế số tăng tốc

4 “điểm nghẽn” cần gỡ ngay để kinh tế số tăng tốc

Kinh tế số bứt phá nhưng cũng đối mặt nhiều điểm nghẽn do thiếu nhân lực chất lượng cao, hạ tầng chưa theo kịp, doanh nghiệp nhỏ khó chuyển đổi số, phụ thuộc vào nền tảng ngoại. Gỡ được các nút thắt này, kinh tế số sẽ giữ đà tăng tốc.