Công nghệ Deepfake AI của Samsung có thể khiến Mona Lisa nói chuyện như thật

VietTimes – Sẽ ra sao nếu ai đó dùng ảnh đại diện Facebook của bạn để tạo ra video giả mạo và phát tán? May mắn là Samsung đã tìm ra trước khi bất kỳ tổ chức tội phạm nào có công nghệ này trong tay.
Gương mặt Mona Lisa được tái tạo lại trong video bằng công nghệ deepfake AI
Gương mặt Mona Lisa được tái tạo lại trong video bằng công nghệ deepfake AI

Deepfake là thuật ngữ kết hợp giữa “deep learning” (học sâu) và “fake” (giả mạo), để mô tả công nghệ phát triển trên nền tảng machine learning mã nguồn mở của Google. Nó sẽ quét video, ảnh chân dung của đối tượng rồi hợp nhất vào video riêng biệt nhờ hệ thống trí tuệ nhân tạo (AI), đồng thời thay thế chi tiết trên gương mặt như mắt, miệng... Về cơ bản, deepfake có khả năng tạo ra video giả mạo người khác với độ chân thực gần như tuyệt đối.

Ban đầu, deepfake chỉ đơn giản là trò đùa vui nhộn trên mạng Internet với hàng loạt ảnh chế, ghép gương mặt Nicolas Cage vào nữ nhà báo Luis Lane trong phim “Superman”. Nhưng chỉ ít lâu sau, các đoạn phim deepfake nội dung người lớn với sự xuất hiện của Gal Gadot, Emma Watson hay Taylor Swift đã được phát tán tràn lan các trang khiêu dâm.

Công nghệ Deepfake ban đầu được phát triển để giải trí, tuy nhiên, theo nhà nghiên cứu Hany Farid (Dartmouth), công nghệ Deepfake cũng tiềm ẩn những rủi ro nếu được sử dụng sai mục đích như lừa đảo hay phát tán thông tin sai lệch (fakenews).

Kể từ cuối năm 2017, các video deepfake đã làm dấy lên lo ngại bởi sự tinh vi của công nghệ này khiến người xem rất khó phân biệt.

“Nhanh chóng trở thành xu hướng của năm 2018, Deepfake và các kỹ thuật liên quan ngày càng đòi hỏi ít dữ liệu hơn, trong khi tạo ra nội dung ngày càng tinh vi và hấp dẫn hơn”, ông Farid nói.

Nhà nghiên cứu của Darthmouth cho rằng mặc dù video deepfake của Samsung gặp đôi chút trục trặc về hình ảnh, nhưng “kết quả cho thấy bước tiến mới trong kỹ thuật… dẫn tới việc tạo ra nội dung đa phương tiện không thể phân biệt với thực tế”.

Giống như phần mềm Photoshop dành cho phim ảnh, deepfake thay thế các chi tiết, cử chỉ của đối tượng để tạo ra video giả mạo nhờ hệ thống học máy (machine learning).

Mặc dù các loại hệ thống tương tự đã được phát triển trong nhiều thập kỷ, nhưng công nghệ Deepfake vượt trội vì quy trình đơn giản và mức độ chân thực gần như tuyệt đối.

Trước đây, công nghệ deepfake thường yêu cầu lượng lớn dữ liệu hình ảnh để tạo ra những video giả mạo như thật. Tuy nhiên, các chuyên gia tại phòng thí nghiệm của Samsung ở Nga đã phát triển hệ thống trí tuệ nhân tạo (AI) mới với khả năng tạo ra video giả mạo chỉ bằng một bức ảnh.

Theo báo cáo nghiên cứu của phòng thí nghiệm của Samsung ở Nga, các chuyên gia tự mô tả hệ thống deepfake AI này là “hệ thống nơ-ron thần kinh tạo ra những cái đầu biết nói như thật”.

Công nghệ deepfake AI của Samsung tái tạo khuôn mặt trong video deepfake qua 1 bức ảnh duy nhất.
Công nghệ deepfake AI của Samsung tái tạo khuôn mặt trong video deepfake qua 1 bức ảnh duy nhất.

Các chuyên gia Samsung tin rằng đây là bước đột phá của công nghệ deepfake AI, có thể ứng dụng trong nhiều lĩnh vực khác nhau như trò chơi, phim ảnh và chương trình truyền hình.

Báo cáo viết: “Khả năng ứng dụng thực tế của hệ thống rất lớn, bao gồm chương trình truyền hình, trò chơi trực tuyến, cũng như tạo ra hiệu ứng đặc biệt cho ngành công nghiệp điện ảnh”.

Thông thường, hệ thống trí tuệ nhân tạo thường yêu cầu lượng lớn dữ liệu hình ảnh của đối tượng để tạo ra “cái đầu biết nói”. Bởi vậy, mục tiêu của công nghệ deepfake thường là những người của công chúng như người nổi tiếng hay các chính trị gia.

Tuy nhiên, các chuyên gia của Samsung đã sử dụng một mẹo nhỏ. Đó là nạp lượng lớn dữ liệu hình ảnh gương mặt con người trong “giai đoạn siêu học tập”, giúp hệ thống AI hiểu cách chi tiết thay đổi khi gương mặt di chuyển. Sau đó, AI sẽ áp dụng thuật toán này cho ảnh tĩnh để tạo ra những đoạn video giả mạo.

Do quy trình khác với công nghệ deepfake trước đây, các video deepfake do hệ thống AI của Samsung tạo ra sẽ bị mờ chi tiết nếu dữ liệu hình ảnh nạp vào quá ít. Cụ thể trong đoạn video phía trên, bạn có thể thấy hệ thống AI của Samsung đã bỏ quên nốt ruồi nổi tiếng của Marilyn Monroe.

Giáo sư khoa học máy tính Siwei Lyu (Đại học Albany, New York) cho rằng đây là yếu tố phân biệt giữa người thật và “con rối kỹ thuật số”. Nguyên nhân bởi dữ liệu hình ảnh đối tượng đầu vào đóng vai trò quan trọng để loại bỏ khiếm khuyết của video giả mạo.

Xét trên khía cạnh tích cực, Giáo sư Lyu nhận đỉnh rằng phương pháp này thực sự hiệu quả nếu muốn tạo ra lượng lớn video deepfake, quá trình này trước đây mất rất nhiều thời gian. Đồng thời, hệ thống AI cũng có khả năng thích như nhanh chóng với các đối tượng mới qua một vài ảnh tĩnh, mà không cần phải đào tạo lại.

Một chuyên gia tại phòng thí nghiệm Samsung tại Nga cảnh báo rằng sự tiến bộ nhanh chóng của công nghệ trí tuệ nhân tạo giúp việc tạo ra video giả mạo dễ dàng hơn trong tương lai. Khi đó, các tổ chức tội phạm có thể bắt chước, phát triển hệ thống AI riêng.

Theo CNET