"Imagine with Meta AI" là công cụ tạo hình ảnh dựa trên Trí thông minh nhân tạo mà Meta vừa ra mắt cách đây vài ngày. Công cụ này tương tự với hai ứng dụng Midjourney và DALL-E vốn khá nổi tiếng hiện nay.
Công cụ của Meta cho phép người dùng điện thoại di động hoặc PC có thể tạo hình ảnh theo yêu cầu. Người dùng sẽ dùng văn bản để mô tả về hình ảnh mình muốn. Tất nhiên, hình ảnh đầu ra có sát với mô tả của người dùng hay không tùy thuộc vào độ thông minh của AI do Meta đào tạo.
Được biết, Meta đã sử dụng 1,1 tỉ bức ảnh của người dùng trên Instagram và Facebook để huấn luyện AI tạo ảnh.
Hiện công cụ này mới chỉ cung cấp thử nghiệm cho người dùng Mỹ, vì thế, để sử dụng được bạn cần dùng phần mềm VPN để đổi IP sang Mỹ. Meta chia sẻ rằng người dùng ở các khu vực khác trên thế giới sẽ sớm được cập nhật công cụ này.
Lưu ý là để sử dụng công cụ này, người dùng cần đăng ký tài khoản Meta (không phải là tài khoản Facebook).
Phóng viên VietTimes đã thử nghiệm "Imagine with Meta AI" để xem độ thông minh của công cụ này tới đâu. Dưới đây là những tấm ảnh được tạo ra sau khi phóng viên viết các đoạn văn bản bằng tiếng Anh để mô tả.
Ở trong bức ảnh trên, VietTimes đã mô tả về một người đàn ông người Việt đứng trên địa danh Cầu Rồng ở Đà Nẵng. Tuy nhiên, địa danh này chưa có trong "bộ nhớ" của Meta AI. Mặc dù VietTimes đã nhập từ khóa Cầu Rồng theo cả tiếng Anh (Dragon Bridge) lẫn tiếng Việt nhưng nó vẫn sáng tạo ra một cây cầu hình chú rồng uốn lượn như trong ảnh.
Ở bức ảnh dưới, VietTimes đã thử nhập vào một địa danh khác nổi tiếng hơn ở Đà Nẵng là cây Cầu Vàng (Golden Bridge) trên Bà Nà Hill. Lúc này thì AI của Meta đã nhận ra và cho ra bức ảnh tương đối đúng với mô tả.
Có thể thấy chất lượng hình ảnh được tạo ra có độ phân giải không cao. Mỗi tấm ảnh dung lượng chỉ ở dung lượng 500 Kb, độ giải chỉ 720p. Có lẽ nó phù hợp để sử dụng làm avatar Facebook?
Tấm này này VietTimes đã yêu cầu Meta AI cho ra tấm ảnh có 2 phóng viên làm việc trong văn phòng của VietTimes. Kết quả đầu ra cũng tương đối tốt.
Còn bức ảnh này vẽ theo yêu cầu "một cô gái xinh đẹp đang ăn kem ở Hồ Gươm, Hà Nội. Công cụ tạo ảnh của Meta cho ra bức ảnh về cô gái khá chuẩn, nhưng lại không cho thấy bất kỳ đặc điểm nào quen thuộc nào của Hồ Gươm. Cũng giống như trên, VietTimes đã thử dùng từ khóa Hồ Gươm, Hồ Hoàn Kiếm bằng cả tiếng Anh lẫn tiếng Việt nhưng công cụ của Meta chỉ tạo ra một hồ nước xanh phía sau cô gái.
VietTimes cũng đã mô tả để công cụ này vẽ một số người nổi tiếng như Tổng thống Hoa Kỳ Joe Biden, cựu Thủ tướng Đức Angela Merkel... nhưng công cụ này không cho ra kết quả. Điều đó có nghĩa là nhiều địa danh cũng như người nổi tiếng vẫn chưa có trong "bộ nhớ" của công cụ này.
Tấm ảnh này về tương lai khi xe hơi có thể bay như máy bay. Nhìn chung kết quả đầu ra như vậy là tương đối ổn khi hình vẽ về những chiếc xe trong tương lai khá hiện đại, kiểu dáng khác hẳn với những mẫu xe hơi thông dụng ngày nay. Có lẽ do mô tả "bay được như máy bay" nên một số mẫu xe đã được công cụ này gắn thêm đôi cánh.
Với mô tả "Trạm gốc 5G ở một thành phố của Việt Nam", Meta đã cho ra tấm ảnh xuất sắc đáng ngạc nhiên khi đường phố đúng với đặc trưng ở Việt Nam là nhiều xe máy và các ngôi nhà nhỏ kiến trúc cổ kiểu Pháp.
Ở bức ảnh này, phóng viên muốn thử xem Meta AI có biết đến mẫu xe VF8 của VinFast hay không, khi mô tả "Phóng viên với máy ảnh trên tay, mặc áo thun và quần jean, đứng bên cạnh xe VinFast VF8". Tuy nhiên, tấm ảnh mà Meta đưa ra không phải xe VF8, nhưng cũng khá chuẩn so với mô tả.
Còn dưới đây là 2 tấm ảnh do một người dùng Việt Nam yêu cầu công cụ Meta AI tạo ảnh:
Lời mô tả của tấm ảnh trên là "Một cô gái Việt Nam mặc áo dài, uống trà sữa, đứng tại Sapa, đằng sau là ruộng bậc thang". Meta AI đã cho ra một tấm ảnh rất tốt, đúng hoàn toàn với mô tả.
Còn ở tấm ảnh này người dùng đã yêu cầu Meta AI cho ra một tấm áp phích minh họa kiểu thập niên 70, vẽ một cô gái uống Cocacola vào dịp Tết, xuất ảnh ra kích cỡ 16:9. Có thể thấy tấm ảnh đầu ra khá khớp với mô tả, ngoại trừ kích thước ảnh.
Kết luận:
- Để sử dụng công cụ này phải dùng IP Mỹ (dùng VPN chuyển địa chỉ IP sang Mỹ)
- Văn bản mô tả chỉ được tối đa 500 ký tự
- Ảnh xuất ra chỉ có định dạng vuông, không thay đổi được kích thước
- Độ phân giải ảnh thấp, chỉ được HD+, kém rất xa so với chất lượng ảnh của Midjourney hay DALL-E
- AI chưa hiểu/được học về nhiều địa danh nổi tiếng cũng như người nổi tiếng
Tuy nhiên, đây cũng là một công cụ khá thú vị để chúng ta tạo ra những tấm ảnh ngộ nghĩnh để trao đổi với bạn bè. Trong tương lai, khi AI của Meta được học, huấn luyện nhiều hơn, chắc chắn nó sẽ cho ra mắt những tấm ảnh đúng với mô tả của người dùng.