Liệu AI có thể sớm viết tiểu thuyết, tạo ra các video dài hoặc soạn nhạc? Đó là những gì Google đang nghiên cứu và cố gắng tìm hiểu. Với dự án Wordcraft mới, chatbot LaMDA của Google hiện đang viết tiểu thuyết trên cơ sở dữ liệu đầu vào của các nhà văn.
LaMDA là AI đàm thoại của Google đã gây tranh cãi vào đầu năm 2022 sau khi một kỹ sư CNTT khẳng định, AI có tri giác và nhận thức. Google công bố tại sự kiện AI của công ty ở New York, doanh nghiệp đang “hợp tác với các nhà văn chuyên nghiệp, sử dụng trình chỉnh sửa Wordcraft để tạo ra một tập truyện ngắn”. Những câu chuyện này hiện đã có sẵn trực tuyến cho công chúng đọc.
Douglas Eck, Giám đốc Nghiên cứu Cấp cao tại Google Research, trong một cuộc họp báo trước sự kiện AI cho biết: “Tôi tin rằng chúng tôi sẽ thay đổi cách mọi người thể hiện bản thân một cách sáng tạo. Chúng tôi đã hợp tác với các nhà văn chuyên nghiệp, mời các tác giả viết tiểu thuyết thử nghiệm bằng cách sử dụng LaMDA như một công cụ chỉnh sửa. Chúng tôi cũng hiểu rằng điều đó không dễ dàng. LaMDA cũng không thực hiện tất cả các công đoạn của một truyện ngắn. Đó là những nhà văn đang làm việc”.
Google có nhìn thấy một tương lai mà một chương trình AI như LaMDA có thể thay thế các nhà văn con người không? Hiện thì không thể, theo Eck. Ông thừa nhận rằng nếu một ai đó yêu cầu LaMDA viết toàn bộ câu chuyện, kết quả sẽ không tốt hoặc hoặc không thú vị.
Douglas Eck giải thích: “Điều thú vị là sử dụng công nghệ như một thứ gia vị, một sự bổ sung cho những gì tác giả đang cố gắng thực hiện. Chúng tôi sẽ tiếp tục phát triển những khả năng mà các công cụ công nghệ AI có thể làm. Nhưng những công cụ này sẽ vẫn là một sự bổ sung có lựa chọn, một cách tùy chọn để cho phép các nhà văn kể những câu chuyện theo những cách khác nhau”.
Mặc dù Google xác định, LaMDA hoặc những công cụ AI khác chỉ là những công cụ hỗ trợ người sáng tác, nhưng rõ ràng với sự phát triển của Máy học, sẽ xuất hiện những nguy cơ mới, những sản phẩm giả mạo phong cách của các tác giả trong văn học, hội họa hoặc âm nhạc và đó hoàn toàn không phải là vấn đề nhỏ.
Douglas Eck cũng thừa nhận, các mô hình AI này tiềm ẩn những rủi ro nghiêm trọng, mục đích không phải là làm mờ sự phân biệt giữa những gì là thực và những gì là dựa trên AI. Ông lưu ý: “Chúng ta cũng phải xem xét những ý kiến, nhận thức về việc phát triển các mô hình AI, giao thoa với tài sản trí tuệ.
Viết tiểu thuyết không phải là con đường sáng tạo duy nhất mà Google đang khám phá với sự trợ giúp của những mô hình AI. Google cũng đang nghiên cứu các mô hình AI, có thể được sử dụng để tạo ra video và âm nhạc.
Trong lĩnh vực sản xuất video từ văn bản đầu vào trên cơ sở AI, Google giới thiệu 2 mô hình mới có tên là Imagen và Phenaki. Trình Imagen Video sử dụng tính năng khuếch tán để tạo ra những hình ảnh riêng lẻ chất lượng cao. Google tuyên bố công nghệ này phù hợp với các video ngắn. Phenaki sử dụng “kỹ thuật Máy học trình tự, tạo ra một loạt mã thông báo theo thời gian” để tạo ra video dài. Google cho biết, kết hợp hai mô hình sẽ đảm bảo độ siêu phân giải ở cấp độ khung hình và sự liên kết theo thời gian.
Imagen Video, sử dụng văn bản và ảnh dữ liệu đầu vào để tạo video của Google. Video MattVidPro AI |
Google cũng giới thiệu video, được tạo bởi 2 mô hình AI. Khi được hỏi về những thách thức của việc sử dụng AI để tạo video, Eck thừa nhận, mặc dù nhóm nghiên cứu thấy được khả năng, nhưng vẫn là một nhiệm vụ khó khăn. Ông giải thích “Khó khăn nhất là đảm bảo sự liên kết mạch lạc giữa từng khung hình. Nếu dự đoán một khung hình từ khung trước đó, mô hình bắt đầu mất tính liên kết. Đây là một thách thức cơ bản trong quá trình tạo video mà Google cho biết, vẫn chưa giải quyết được vấn đề.
Cuối cùng, AudioLM là một khung làm việc mới để tạo ra giọng nói và âm nhạc thực tế, chỉ dựa trên một mẫu âm thanh ngắn. Hiện tại, dữ liệu âm nhạc đầu vào chỉ là mẫu nhạc piano. Google cho biết đây "là một mô hình âm thanh thuần túy mà AI cung cấp từ quá trình đào tạo, không có bất kỳ văn bản hoặc biểu tượng hiển thị âm nhạc nào."
Theo Indian Express