close Đăng nhập

Google ra mắt hàng loạt công cụ AI mới

Tại sự kiện Google I/O 2026 diễn ra tại Mỹ, Google đã giới thiệu hàng loạt cập nhật, công cụ AI mới trong bối cảnh nhu cầu sử dụng AI đang “bùng nổ”.

00:00
0:00
00:00
Tốc độ phát 1x

Tóm tắt bài viết

/
Tại sự kiện Google I/O 2026, CEO Sundar Pichai giới thiệu Gemini 3.5 Flash, mô hình AI mới có khả năng lập trình mạnh mẽ, chi phí rẻ hơn 50% so với đối thủ, giúp tiết kiệm 1 tỷ USD/năm.
Google ra mắt Docs Live, tính năng tạo tài liệu bằng giọng nói, cùng SynthID giúp phát hiện nội dung tạo bởi AI, đã đánh dấu mờ cho 100 tỷ ảnh, video và 60.000 năm âm thanh.
Antigravity 2.0 được giới thiệu là nền tảng quản lý nhóm tác nhân AI tự vận hành, có phiên bản Flash nhanh hơn 4-12 lần so với các mô hình khác, mở rộng từ môi trường lập trình.
Gemini Omni Flash, mô hình mới tạo dữ liệu ở nhiều định dạng đầu ra, sẽ có mặt trên Gemini, Google Flow, YouTube Shorts và cung cấp cho lập trình viên thông qua cổng API.
Google giới thiệu kính mắt thông minh hỗ trợ AI, Daily Brief tóm tắt thông tin cá nhân, Google Flow hỗ trợ lập kế hoạch dự án và Gemini for Science hỗ trợ tăng tốc nghiên cứu khoa học.

Ông Sundar Pichai, CEO Google và Alphabet, cho biết: “Chu kỳ công nghệ AI hiện đã bước sang giai đoạn mà người dùng kỳ vọng nhìn thấy rõ giá trị thực tế trong các sản phẩm họ sử dụng hằng ngày. Chúng tôi đã tập trung cao độ vào mục tiêu đó, và điều này sẽ được thể hiện rõ nét qua các sản phẩm cũng như tính năng được công bố tại sự kiện I/O hôm nay.

Điều tuyệt vời nhất chính là cách người dùng đang ứng dụng AI vào cuộc sống: từ những học sinh ôn luyện cho kỳ thi cuối kỳ bằng ứng dụng Gemini, các nhạc sĩ và nghệ sĩ đưa mô hình AI tạo sinh như Lyria và Veo vào quy trình sáng tạo, cho đến các lập trình viên đang viết mã và hiện thực hóa các ý tưởng của mình”.

photo-geminiapp-bento-hero-1.jpg
Google giới thiệu mô hình AI mới Gemini 3.5 Flash. Ảnh: Google.

CEO Google và Alphabet đã giới thiệu những cập nhật, thay đổi, tính năng mới trong các công cụ AI của Google cụ thể như:

Ask YouTube

Ask YouTube xuất hiện giúp việc tìm kiếm thông tin gãy gọn và nhanh chóng hơn. Tính năng này không chỉ hiển thị các video phù hợp với sở thích, mà còn chuyển hướng vào đúng phân đoạn liên quan đến câu hỏi của bạn.

Tạo tài liệu bằng giọng nói với Docs Live

Có rất nhiều lúc tôi muốn xử lý công việc nhanh như tốc độ nói của mình. Điều đó giờ đây đã khả thi hơn rất nhiều nhờ những bước nhảy vọt về công nghệ của các mô hình âm thanh, ông Sundar Pichai chia sẻ.

Tính năng mới mang tên Docs Live sẽ đưa trải nghiệm này lên một tầm cao mới. Trước đây, để tạo một tài liệu với Gemini, bạn phải gõ một câu lệnh thật chính xác. Với Docs Live, bạn chỉ cần nói ra toàn bộ những ý tưởng đang nảy số trong đầu và để Gemini lo phần còn lại.

Trong tương lai, bạn sẽ có thể khởi tạo các tài liệu mới và chỉnh sửa chúng trực tiếp hoàn toàn bằng giọng nói.

Các cập nhật và đối tác mới của SynthID

AI tạo sinh càng phát triển thì tính minh bạch càng trở nên cấp thiết. Theo nghiên cứu, tỷ lệ người dùng nhận biết chính xác các video Deepfake chất lượng cao chỉ chiếm 25%. Ba năm trước, chúng tôi đã ra mắt SynthID — dấu mờ kỹ thuật số vô hình với mắt thường. Kể từ khi ra mắt, SynthID đã đánh dấu mờ cho hơn 100 tỷ hình ảnh và video, cùng với 60.000 năm thời lượng âm thanh.

photo-provenance-hero-1.png
SynthID giúp người dùng phát hiện ra các sản phẩm tạo bởi AI. Ảnh: Google.

Hàng triệu người đang sử dụng công cụ phát hiện SynthID trong ứng dụng Gemini để xác thực các nội dung do AI tạo ra. Và giờ đây, chúng tôi tiến thêm một bước nữa khi tích hợp Chứng chỉ Nội dung (Content Credentials) trên toàn bộ sản phẩm. Tính năng này sẽ hiển thị rõ nguồn gốc của nội dung là từ AI hay máy ảnh, và liệu nó có bị chỉnh sửa bằng các công cụ AI tạo sinh hay không. Với mong muốn mang các giải pháp này đến gần hơn với người dùng, chúng tôi đang tích hợp Chứng chỉ Nội dung và SynthID lên Tìm kiếm và Chrome.

Gemini 3.5 Flash

"Hôm nay, chúng tôi chính thức giới thiệu Gemini 3.5 Flash — mô hình đầu tiên trong chuỗi các mô hình kết hợp giữa trí thông minh tiên phong và hành động thực tế", ông Sundar Pichai cho biết.

Khi so sánh với phiên bản 3.1 Pro, 3.5 Flash thể hiện sức mạnh trên hầu hết các tiêu chí. Mô hình đã đạt bước tiến khổng lồ trong mảng lập trình.

Điểm vượt trội nhất ở Flash là mang lại những năng lực hàng đầu nhưng với mức giá chưa bằng một nửa so với các mô hình đối thủ cùng phân khúc. Thực tế cho thấy, nhiều công ty đã tiêu tốn hết ngân sách token hằng năm của mình, dù chỉ mới bước sang tháng Năm. Nếu biết cách kết hợp linh hoạt giữa Flash và các mô hình cao cấp khác, doanh nghiệp có thể tiết kiệm được một khoản chi phí khổng lồ. Để dễ hình dung, các công ty lớn hiện đang xử lý khoảng 1 nghìn tỷ token mỗi ngày. Nếu chuyển dịch 80% khối lượng công việc đó sang 3.5 Flash, họ sẽ tiết kiệm được hơn 1 tỷ USD hằng năm — một nguồn vốn thực tế có thể tái đầu tư trực tiếp vào doanh nghiệp.

Antigravity 2.0

Google cũng đang đưa 3.5 Flash đến với các lập trình viên trên Antigravity.

Antigravity đang mở rộng quy mô vượt ra ngoài môi trường lập trình thuần túy, chuyển mình thành một nền tảng để phát triển và quản lý các nhóm tác nhân AI tự vận hành. Bản cập nhật này bao gồm Antigravity 2.0 — một ứng dụng độc lập mới dành cho máy tính để bàn, đóng vai trò là không gian trung tâm cho việc tương tác với các tác nhân AI, nơi người dùng có thể điều phối các tác nhân để xử lý mọi loại tác vụ. Và chúng tôi cũng đã phát triển một phiên bản Flash tối ưu hóa hơn: không chỉ nhanh gấp 4 lần mà nhanh gấp 12 lần so với các mô hình tiên phong khác.

Gemini Omni

Sự tiến bộ của các dòng chip TPU chính là nền tảng để chúng tôi tạo ra các bước tiến về điện toán trên các mô hình, lập trình và các tác nhân AI. Với các mô hình thế giới, AI đang dịch chuyển từ việc dự đoán văn bản sang mô phỏng thực tế.

Một sản phẩm do Gemini Omni tạo ra. Video: Google.

Gemini Omni là mô hình mới của chúng tôi với khả năng tạo ra dữ liệu ở bất kỳ định dạng đầu ra nào từ bất kỳ dữ liệu đầu vào nào. Chúng tôi đang bắt đầu với các định dạng video đầu ra, và theo thời gian sẽ mở rộng sang hình ảnh và văn bản. Mô hình mới này kết hợp trí thông minh của Gemini với các mô hình truyền thông đa phương tiện tạo sinh của chúng tôi — một bước nhảy vọt trong việc thấu hiểu thế giới. Chúng tôi chính thức ra mắt mô hình đầu tiên trong dòng Omni: Gemini Omni Flash.

Gemini Omni Flash sẽ được triển khai ngay hôm nay. Bạn có thể trải nghiệm trực tiếp trên ứng dụng Gemini, Google Flow và trên YouTube Shorts. Chúng tôi cũng sẽ triển khai tính năng này đến các lập trình viên và khách hàng doanh nghiệp thông qua các cổng API trong vài tuần tới, ông Sundar Pichai cho biết.

Gemini Spark: Trợ lý đắc lực hoạt động 24/7 của bạn

Gemini Spark — trợ lý AI cá nhân thế hệ mới ngay trong ứng dụng Gemini giúp bạn làm chủ cuộc sống số của mình bằng cách thực thi tác vụ theo định hướng của bạn.

Spark vận hành trên các máy ảo chuyên dụng trên Google Cloud. Nó hoạt động liên tục 24/7 nên bạn không cần phải mở máy tính của mình. Tính năng được thúc đẩy bởi Gemini 3.5 và bộ khung Google Antigravity, cho phép nó dễ dàng thực hiện các chuỗi tác vụ dài hạn chạy ngầm dưới hệ thống. Spark sẽ tích hợp với các công cụ bắt đầu từ hệ sinh thái của chính Google, và trong vài tuần tới sẽ mở rộng sang các công cụ của bên thứ ba thông qua MCP, ông Sundar Pichai chia sẻ.

Dòng chip AI mới

Lần đầu tiên, Google áp dụng phương pháp tiếp cận chip kép với các kiến trúc chuyên biệt cho quá trình huấn luyện và suy luận: TPU 8t và 8i.

Một sản phẩm khác do Gemini Omni tạo ra. Video: Google.

TPU 8t được tối ưu hóa cho các tác vụ tiền huấn luyện, sở hữu hiệu năng tính toán thô mạnh mẽ gấp gần 3 lần thế hệ tiền nhiệm. Chúng tôi đã tiếp cận hạ tầng huấn luyện theo một hướng hoàn toàn khác. Nhờ JAX và Pathways, việc huấn luyện không còn giới hạn ở một trung tâm dữ liệu đơn lẻ, mà có thể phân phối linh hoạt qua nhiều địa điểm, mở rộng quy mô lên hơn 1 triệu chip TPU toàn cầu. Điều này mang lại khả năng tạo ra cụm huấn luyện lớn nhất thế giới. Đối với các kỹ sư xây dựng mô hình, điều này đồng nghĩa với việc huấn luyện các mô hình lớn hơn, năng lực cao hơn trong vài tuần thay vì vài tháng.

TPU 8i được thiết kế riêng cho quá trình suy luận. Chúng tôi đã cải thiện đáng kể tốc độ ở mọi bước xử lý. Một bài học quan trọng mà chúng tôi rút ra được trong suốt 27 năm vận hành tìm kiếm chính là: tốc độ phản hồi là yếu tố quyết định mọi trải nghiệm.

Bên cạnh tốc độ, chúng tôi cũng chú trọng đến việc mở rộng quy mô một cách bền vững. Cả hai dòng chip này đều tiết kiệm năng lượng hơn, mang lại hiệu suất trên mỗi watt tốt hơn tới hai lần, ông Sundar Pichai chia sẻ.

Ngoài ra Google cũng thông tin một số cập nhật mới cho các sản phẩm AI của mình gồm có:

Daily Brief là một tác nhân AI cấp tiến tiếp theo sắp có mặt trong ứng dụng Gemini. Tính năng này mang đến một bản tóm tắt được cá nhân hóa, tự động tổng hợp thông tin từ hộp thư, lịch trình và danh sách công việc để lọc ra những điều quan trọng nhất bạn cần lưu ý.

Không dừng lại ở việc tóm tắt dữ liệu, Daily Brief còn giúp ưu tiên, sắp xếp công việc và gợi ý các bước xử lý tiếp theo, giúp bạn dễ dàng bắt tay vào hành động. Tất cả được gói gọn trong một bản tin buổi sáng súc tích, được thiết kế tối ưu cho việc đọc lướt.

3-io-glasses-product-warbyparker-final-1.jpg
Mắt kính thông minh mới của Google sẽ ra mắt vào mùa thu năm nay. Ảnh: Google.

Google Flow đang chính thức triển khai một tác nhân AI mới từ hôm nay cho tất cả người dùng để lên kế hoạch và lập luận qua các tác vụ phức tạp dựa trên các dữ liệu đầu vào của bạn, hoàn toàn dưới sự chỉ dẫn của bạn. Được xây dựng dựa trên các mô hình Gemini, nó mang lại kiến thức chuyên môn và sự thấu hiểu sâu sắc về dự án của bạn để hỗ trợ từ bước lên ý tưởng ban đầu cho đến khởi tạo và chỉnh sửa chi tiết. Bạn cũng có thể vibe code bất kỳ công cụ sáng tạo nào trực tiếp trong Flow — ví dụ như các công cụ thiết kế hiệu ứng video, hoạt hình vẽ tay hay xếp lớp văn bản.

Google Pics là công cụ tạo và chỉnh sửa hình ảnh bằng AI mới của chúng tôi, được xây dựng trên mô hình Nano Banana mới nhất, giúp bạn sáng tạo bất cứ điều gì với các quyền kiểm soát thiết kế theo đúng ý muốn. Dù bạn đang xây dựng một thiết kế từ một khung canvas trống hay chỉnh sửa một bức ảnh sẵn có, Pics đều xử lý mọi yếu tố như một đối tượng độc lập thay vì chỉ là một bức ảnh phẳng và tĩnh. Điều này cho phép bạn sáng tạo, thay thế hoặc hoàn thiện từng chi tiết cụ thể để hiện thực hóa chính xác ý tưởng của mình.

Google cho biết cũng đã chia sẻ nhiều thông tin hơn về kính mắt thông minh, vốn đã từng được hé lộ một phần vào năm ngoái, bao gồm kính âm thanh (audio glasses) hỗ trợ bằng giọng nói trực tiếp vào tai bạn và kính màn hình (display glasses) hiển thị trực quan những thông tin bạn cần ngay khi cần thiết. Cả hai đều giúp bạn hoàn toàn rảnh tay và thoải mái ngẩng cao đầu quan sát mà vẫn dễ dàng nhận trợ giúp từ Gemini chỉ bằng một câu lệnh. Dòng kính âm thanh sẽ được trình làng đầu tiên vào mùa thu này.

Gemini cho Khoa học (Gemini for Science) tập hợp hàng loạt công cụ AI nhằm hỗ trợ tăng tốc nghiên cứu khoa học. Được xây dựng dựa trên năng lực suy luận và nghiên cứu chuyên sâu của Gemini, kết hợp cùng các dự án Deep Think và Deep Research, giải pháp này bao gồm các thử nghiệm mới trên nền tảng Labs cũng như bộ Kỹ năng Khoa học (Science Skills) để kết nối các nền tảng dạng tác nhân như Google Antigravity tới hơn 30 cơ sở dữ liệu và công cụ lớn về khoa học đời sống.

Hai năm trước, chúng tôi xử lý 9,7 nghìn tỷ token mỗi tháng trên các nền tảng của mình — một con số khổng lồ. Tại sự kiện I/O năm ngoái, con số đó đã tăng lên khoảng 480 nghìn tỷ token. Và cho đến hôm nay, con số này đã tăng vọt gấp 7 lần, đạt hơn 3,2 triệu tỷ token mỗi tháng.

Hơn 8,5 triệu lập trình viên hiện đang xây dựng các ứng dụng và trải nghiệm mới dựa trên các mô hình của chúng tôi hằng tháng. Các mô hình API của chúng tôi hiện đang xử lý khoảng 19 tỷ token mỗi phút. Hiện tại, chúng tôi sở hữu 13 sản phẩm với hơn một tỷ người dùng mỗi tháng. Năm trong số các sản phẩm đó đã vượt mốc 3 tỷ người dùng. Tính năng AI Overviews hiện đã đạt hơn 2,5 tỷ người dùng hoạt động hằng tháng.

Sundar Pichai, CEO Google và Alphabet

AI

Meta, TikTok và Lazada siết nội dung do AI tạo ra

Meta, TikTok và Lazada siết nội dung do AI tạo ra

Trước nguy cơ lừa đảo bằng trí tuệ nhân tạo xuất hiện ngày càng nhiều, các nền tảng số như Facebook, TikTok, nền tảng TMĐT như Lazada… phải cung cấp các tính năng, giải pháp bảo vệ người dùng.

AI biến không gian mạng thành “mặt trận nóng”

AI biến không gian mạng thành “mặt trận nóng”

Các cuộc tấn công sử dụng AI được tự động hóa, cá nhân hóa, trong khi lừa đảo, deepfake và mã độc thích ứng ngày càng khó kiểm soát, đặt ra yêu cầu cấp thiết về năng lực phòng thủ và hợp tác an ninh mạng.