ChatGPT hiện có thể nói chuyện, vượt trội so với Alexa và Siri

0:00 / 0:00
0:00
  • Nam miền Bắc
  • Nữ miền Bắc
  • Nữ miền Nam
  • Nam miền Nam

VietTimes – OpenAI đang nhanh chóng tung ra các bản cập nhật cho chatbot Ai của mình để giúp nhiều người dùng dễ dàng sử dụng hơn.

Ảnh: Washington Post
Ảnh: Washington Post

OpenAI tuyên bố họ đang cung cấp cho chatbot ChatGPT khả năng nói chuyện với người dùng bằng giọng nói, đưa công ty trí tuệ nhân tạo này cạnh tranh trực tiếp với những gã khổng lồ công nghệ Google, Apple và Amazon trong cuộc chiến tạo ra trợ lý giọng nói thông minh.

ChatGPT có thể trả lời các truy vấn của người dùng bằng một trong năm “nhân vật”, với giọng nói có vẻ dễ chịu hơn so với các trợ lý ảo phổ biến như Alexa và Siri. OpenAI cho biết thêm giọng nói là cách quan trọng để thu hút nhiều người tương tác và sử dụng ChatGPT hơn.

“Đó là thách thức của chúng tôi” Peter Deng, Phó Chủ tịch sản phẩm tiêu dùng của OpenAI, cho biết trong một cuộc phỏng vấn. “Một trong những công việc khó khăn nhất là sử dụng công nghệ tuyệt vời đó và biến nó thành sự đơn giản mà 300-400 triệu người dùng có thể sử dụng”.

Các nhân vật mới của ChatGPT được đặt tên là Sky, Ember, Breeze, Juniper và Cove. Mỗi nhân vật có một giọng điệu khác nhau. Ông Peter Deng cho biết các giọng nói không giống bất kỳ người cụ thể nào.

“Với tính năng này, bạn chỉ cần nói chuyện”, ông Deng nói. “Bây giờ các con tôi yêu cầu kể chuyện trước khi đi ngủ bằng ChatGPT”.

OpenAI đã thử nghiệm các tính năng giọng nói và hình ảnh, đồng thời bổ sung các biện pháp bảo vệ để đảm bảo bot phản hồi phù hợp với các chủ đề nhạy cảm, chẳng hạn như gợi ý người dùng tham khảo ý kiến ​​​​chuyên gia nếu họ đặt câu hỏi liên quan đến sức khỏe tâm thần, Sandhini Agarwal, nhà nghiên cứu chính sách tại OpenAI, cho biết trong một cuộc phỏng vấn. Tuy nhiên, sẽ còn nhiều việc phải làm, cô nói. “Công việc vẫn còn dài”.

Amazon, một trong những công ty dẫn đầu về trợ lý giọng nói với Alexa, trong những tháng gần đây đã tụt lại phía sau trong việc tung ra các công cụ AI mới cho người dùng.

Đầu tuần này, Amazon cho biết họ đã ký thỏa thuận đầu tư tới 4 tỉ USD vào một công ty khởi nghiệp AI khác, Anthropic. Đây là thỏa thuận lớn nhất trong lĩnh vực AI kể từ khi Microsoft ký khoản đầu tư mang tính bước ngoặt vào OpenAI vào đầu năm và phản ánh cách các gã khổng lồ công nghệ đang đặt cược vào các công ty khởi nghiệp AI đang "hot". Khoản đầu tư của Microsoft vào OpenAI đã giúp Microsoft dẫn đầu trong cuộc đua AI.

Tuần trước, các công ty như Google, Amazon và OpenAI đã ra mắt hàng loạt công cụ AI mới cho thấy sự vội vàng của họ để đánh bại đối thủ. Các công ty đang thử nhiều cách tiếp cận khác nhau để thu hút người dùng sử dụng và trả tiền cho các bot, đồng thời đưa chúng vào các sản phẩm loa thông minh hiện có - một trong những hướng đi chính mà họ đang khám phá.

Amazon thông báo họ đang bổ sung tính năng “trò chuyện” chatbot cho loa gia đình Alexa, tính năng này đã được thiết lập ở hàng triệu gia đình. Vào mùa hè, Google đã nói với nhân viên rằng họ đang xem xét việc đưa công nghệ đằng sau chatbot Bard vào trợ lý giọng nói của riêng mình.

Cho đến nay, mọi người có thể đặt câu hỏi ChatGPT bằng cách trò chuyện trên ứng dụng di động của họ, nhưng bot vẫn sẽ trả lời bằng văn bản. OpenAI cũng cho biết giờ đây mọi người có thể tải hình ảnh lên bot như một phần câu hỏi của họ, chẳng hạn như tải hình ảnh các nguyên liệu trong tủ lạnh và yêu cầu ChatGPT đưa ra đề xuất công thức nấu ăn.

Việc bổ sung thêm khả năng thoại và hình ảnh cũng đưa ChatGPT tiến xa hơn trên con đường trở thành một mô hình “đa phương thức” thực sự - một chatbot có thể “nhìn” và “nghe” đồng thời phản hồi bằng giọng nói và hình ảnh, thay vì chỉ dừng lại ở văn bản. Các nhà nghiên cứu và phân tích AI cho biết các mô hình đa phương thức là giai đoạn cạnh tranh tiếp theo trong ngành và các công ty đang chạy đua để tạo ra mô hình tân tiến nhất.

Trợ lý giọng nói đã có mặt trên ô tô, điện thoại thông minh, TV và loa gia đình trong nhiều năm, hàng triệu người dùng đang sử dụng chúng hàng ngày. Tuy nhiên phần lớn, chúng chỉ giới hạn ở một số ít các tương tác thuộc lòng, chẳng hạn như được yêu cầu tắt đèn hoặc đưa ra dự báo thời tiết. Công nghệ “mô hình ngôn ngữ lớn” đằng sau chatbot mở ra khả năng trợ lý giọng nói có thể có nhiều khả năng hơn để thực hiện các cuộc trò chuyện dài hơn, tự nhiên hơn và trả lời các câu hỏi phức tạp hơn.

Các nhà đầu tư và nhà phân tích đã cáo buộc Amazon phản ứng chậm chạp trước sự cạnh tranh về AI sáng tạo như chatbot và máy tạo hình ảnh. Tuy nhiên, thỏa thuận với Anthropic có thể giúp gã khổng lồ vượt qua hoàn cảnh này.

Jim Hare, Phó Chủ tịch của công ty nghiên cứu công nghệ Gartner, cho biết: “Thông báo này là một cách khác mà Amazon đang chứng minh với thị trường rằng họ là người chơi đầy tiềm năng trong thị trường AI”.

OpenAI đã tạo ra sự bùng nổ về chatbot vào tháng 11 khi công khai ChatGPT. Kể từ đó, những gã khổng lồ công nghệ đã nỗ lực phát triển công nghệ của riêng mình, trong đó Microsoft hợp tác với OpenAI để sử dụng công nghệ của họ và Google cũng đã sớm công bố chatbot Bard của mình.

Các nhà nghiên cứu AI đã cảnh báo rằng mọi người có khả năng nhân cách hóa các chatbot, đặc biệt vì câu trả lời của họ thường giống con người. Điều đó có thể khiến người dùng có cảm giác tin tưởng sai lầm vào trí thông minh hoặc khả năng của bot. Tất cả các chatbot vẫn thường xuyên tạo ra thông tin và coi đó là thông tin thật, một vấn đề mà các nhà nghiên cứu AI gọi là “ảo giác”.

Theo Washington Post