Để bắt đầu chúng ta sẽ nói qua một chút về phép thử Turing. Đây là một bài kiểm tra trí tuệ nhân tạo được công bố năm 1950 bởi cha đẻ của máy tính hiện đại, người anh hùng thầm lặng trong Thế Chiến II, Alan Turing. Phép thử như sau: 1 người chơi thực hiện một cuộc thảo luận bằng ngôn ngữ tự nhiên với 1 con người và 1 máy tính. Cả hai bên đều cố gắng chứng tỏ mình là con người. Ba bên tham gia phép thử được cách ly với nhau và nếu người chơi không nhận phân biệt giữa người và máy thì máy tính đó đã vượt qua bài thử.
Tại hội nghị dành cho nhà phát triển I/O 2018 ngày 9/5, Google đã giới thiệu công nghệ Google Duplex ứng dụng trí thông minh nhân tạo (AI). Nhờ Google Duplex, trợ lý ảo Google Assistant có thể thực hiện cuộc gọi tới một số doanh nghiệp bao gồm tiệm là tóc và nhà hàng. Không một nhân viên ở đầu dây bên kia nghi ngờ về việc họ đang nói chuyện với máy móc. Trợ lý ảo của Google thậm chí còn thông minh đến mức có thể bắt chước con người thêm vào những thán từ ngẫu nhiên như “Mm-hmm” (xem video bên dưới phút 01:28).
Bước đột phá này là thành quả nghiên cứu nhiều năm công nghệ AI của Google. Xuất phát từ WaveNet, chương trình AI ứng dụng công nghệ Deep Learning tương tự như AlphaGo, Duplex… được thiết kế với mục tiêu thực hiện các cuộc giao tiếp tốt hơn bất cứ người nào qua những cuộc điện thoại.
Google cho biết công nghệ Google Duplex ban đầu sẽ được ứng dụng trong các trung tâm dịch vụ khách hàng tự động. Vì vậy, thay vì phản ánh rắc rối với nhân viên chăm sóc khách hàng thì chúng ta sẽ đối thoại với người máy trả lời tự động (chatbot). CEO Sundar Pichai nói: “Đối với những tác vụ như vậy, hệ thống sẽ khiến cuộc hội thoại trở nên tự nhiên nhất có thể, giống như cách chúng ta nói chuyện với nhau, chứ không phải với một cỗ máy”.
Nhưng bạn không thể mong đợi vị trợ lý ảo này có thể trả lời bất cứ thắc mắc nào. Theo Google, “Duplex chỉ giữ được cuộc hội thoại tự nhiên ở lĩnh vực đã được đào tạo (deep-training) và “không thể thực hiện tất cả các cuộc hội thoại”.
Các ngành dịch vụ khách hàng đang thúc đẩy khả năng tự động hóa, đưa người máy vào hoạt động để giảm bớt thời gian chờ đợi (của khách hàng) và chi phí đầu tư về lâu dài. Từ Microsoft, Facebook đến Kodak đang nỗ lực khai thác lợi thế của chatbot. Có thể khẳng định không khó để các công ty lớn trên tạo ra hệ thống AI trả lời tự động nhưng khó khăn lớn nhất là khả năng thích nghi với tôn chỉ đạo đức trong xã hội. Cách đây 2 năm, Microsoft đã bị chỉ trích dữ dội khi hai chatbot xây dựng trên công nghệ AI là Zo và Tay nói ra những lời mang tính phân biệt chủng tộc và phân biệt giới tính.
Tất nhiên, phân biệt chủng tộc chỉ là một trong những thách thức mà công nghệ mới nổi này phải đối mặt, bảo mật dữ liệu và quyền riêng tư mới là những vấn đề đáng quan tâm hơn. Google giải thích: “Để đảm bảo, chúng tôi đã xây dựng mạng nơ ron hồi quy (RNN - Recurrent Neural Network) của Duplex trên một kho dữ liệu các cuộc gọi ẩn danh”. Hệ thống AI của Duplex học cách giao tiếp qua không chỉ qua những cuộc trò chuyện với đội ngũ lập trình, mà còn là hàng trăm ngàn giờ đàm thoại với tình các nguyện viên tham gia dự án được Google ghi lại. Điều này, một lần nữa, đưa chúng ta quay lại với cuộc tranh luận về quyền riêng tư, khả năng bảo mật dữ liệu cá nhân song song với sự phát triển của công nghệ.
Gạt sang một bên những hiểm họa trong cộng đồng, sự xuất hiện của Google Duplex phơi bày những hiểm họa tồn tại khi máy móc có thể giao tiếp như con người. Như đã đề cập phía trên, Duplex được phát triển trên nền tảng WaveNet, chương trình tổng hợp giọng nói của Google. WaveNet không giống như công cụ chuyển ngữ thông thường, nó không yêu cầu đối tượng phải ngồi hàng trăm giờ trong phòng thu để đọc lại cả cuốn từ điển để xây dựng cơ sở dữ liệu. WaveNet tạo nên ngôn ngữ máy tính dựa trên tổ hợp sóng âm dạng thô. Bởi vậy, hệ thống tạo ra bản sao giọng nói trong thời gian ngắn, với âm vực rộng và tự nhiên. Bạn có thể thấy khả năng của WaveNet qua đoạn video trình chiếu về John Legend tại hội nghị I/O.
Trong một tương lai, nơi mà hình ảnh, video (deepfake), âm thanh đều có thể là giả mạo, điều gì sẽ ngăn chặn tổ chức khủng bố tạo ra bản sao bất hợp pháp của một nhà chính trị nổi tiếng rồi đưa nó ra công chúng? Những nhà cung cấp dịch vụ lớn như Google và Facebook sẽ phải làm gì để kiểm duyệt nội dung? Liệu chúng ta có phải nói mật khẩu trước khi bắt đầu đàm thoại với người khác?
Công nghệ AI của Google Duplex đã hàng trăm ngàn lần vượt qua ranh giới giữa con người và máy móc (dựa tên nguyên tắc của bài thử Turing). AI đã tạo ra cuộc cách mạng công nghệ, khiến những thứ như chuột và bàn phím trở nên lỗi thời. Khi công nghệ Google Duplex được ứng dụng rộng rãi, có lẽ bạn nên xác nhận danh tính bằng các câu hỏi bảo mật nếu nhận được cuộc gọi từ người thân để hỏi về những thông tin nhạy cảm như số chứng minh thư, mã số thẻ ATM…