close Đăng nhập

Công nghệ tạo video AI của Google gây ấn tượng

VietTimes – Google Research đã phát hành một bài giới thiệu về Lumiere, một mô hình chuyển từ văn bản sang video.

Ảnh: ZD Net
Ảnh: ZD Net

Kể từ khi OpenAI phát hành DALL-E vào cuối năm 2022, các trình tạo văn bản thành hình ảnh đã trở nên bùng nổ với rất nhiều đối thủ cạnh tranh gia nhập thị trường. Giờ đây, hơn một năm sau, chúng ta đang ở những ngày đầu của một công nghệ mới: tạo video AI.

Mới đây, Google Research đã phát hành một bài giới thiệu về Lumiere, một mô hình chuyển từ văn bản sang video có thể tạo ra video sở hữu độ chân thực cao từ lời nhắc văn bản và các hình ảnh khác.

Theo bài viết, mô hình này được thiết kế để giải quyết một thách thức đáng kể trong việc tổng hợp video, đó là tạo ra "chuyển động chân thực, đa dạng và mạch lạc". Bạn có thể nhận thấy các mô hình tạo video thường hiển thị video bị giật nhưng cách tiếp cận của Google mang lại trải nghiệm xem liền mạch hơn. Lumiere làm được điều đó thông qua kiến trúc Space-Time U-Net, trong đó tạo ra video hoàn chỉnh từ đầu đến cuối chỉ trong một lần chạy.

Phương thức này khác với những mô hình trước đây, vốn chỉ tổng hợp những khoảnh khắc chính và cách xa nhau, khiến video cuối cùng khó đạt được sự đồng nhất.

Lumiere có thể xây dựng phong cách riêng cho video, dựa trên hình ảnh mẫu do người dùng cung cấp. Ngoài tạo nội dung mới, nó cũng được dùng để chỉnh sửa hoặc chữa những phần bị lỗi trong video sẵn có theo yêu cầu của người dùng.

Google Research so sánh hiệu năng của Lumiere với các AI tạo video từ văn bản hiện nay, như ImagenVideo, Pika, ZeroScope và Gen2, bằng cách đề nghị một nhóm thử nghiệm chọn ra video có chất lượng hình ảnh và chuyển động tốt nhất, nhưng không cho biết chúng được tạo ra bởi mô hình nào. Theo báo cáo, Lumiere vượt xa mọi đối thủ trong thử nghiệm.

Hiện tại, mô hình này vẫn chưa được ra mắt công chúng; tuy nhiên, nếu bạn muốn tìm hiểu thêm, bạn có thể truy cập trang web Lumiere, nơi có nhiều bản demo khi mô hình thực hiện các nhiệm vụ khác nhau.

Theo ZD Net

https://www.zdnet.com/article/googles-ai-video-generator-tech-is-pretty-amazing-see-for-yourself/

Hạ tầng số

Trang web giả mạo datlichbhxh[.]com có giao diện tương tự trang chính thức. Ảnh: BHXHVN

Cảnh báo website giả mạo BHXH Việt Nam

BHXH Việt Nam vừa phát đi cảnh báo về việc xuất hiện website giả mạo, lợi dụng hình thức “đặt lịch làm việc” để thu thập thông tin cá nhân, lừa đảo và chiếm đoạt tài sản.

Công ước Hà Nội

Công ước Hà Nội được thực thi như thế nào?

Hôm nay, Lễ mở ký Công ước Liên hợp quốc chống tội phạm mạng (Công ước Hà Nội) được mở ký tại Hà Nội. Nội dung chính, cơ chế thực thi và ý nghĩa đối với phòng chống tội phạm mạng là những điều được nhiều người quan tâm.

ChatGPT Atlas. Ảnh: TechStock

Cách tải ChatGPT Atlas cho macOS và lưu ý khi cài đặt

OpenAI vừa cho ra mắt trình duyệt trí tuệ nhân tạo có tên là Atlas, kết hợp giữa khả năng duyệt web thông minh và trợ lý ảo cá nhân. Trình duyệt này ngay lập tức đã gây xôn xao cộng đồng mạng. Dưới đây là cách tải và cài đặt ChatGPT Atlas.

Màn hình chính của ứng dụng Canva

Cách tải thêm font chữ vào Canva trên Macbook và laptop Windows

Canva là một công cụ thiết kế trực tuyến tiện dụng dành cho những người không chuyên. Tuy nhiên, bộ font gốc của Canva hỗ trợ tiếng Việt chưa tốt. Vì thế, để có những font đẹp, hỗ trợ tốt tiếng Việt, bạn cần cài đặt thêm các bộ font từ bên ngoài