Dưới đây là bài viết thể hiện quan điểm của tác giả Rana el Kaliouby, được đăng trên tạp chí Technology Review.
Tôi đang tập dượt một bài phát biểu cho hội nghị về AI và vô tình nhắc đến Amazon Alexa. Lúc này, Alexa phản ứng và thông báo "Chơi nhạc của Selena Gomez" Tôi đã phải thét lên "Alexa, dừng lại!" vài lần trước khi nó có thể nghe thấy.
Nhưng Alexa đã quên mất sự khó chịu của tôi. Cũng giống như phần lớn những trợ lý ảo và công nghệ hiện có, nó không biết về những gì chúng ta cảm nhận.
Chúng ta đang bị bao quanh bởi các thiết bị thông minh kết nối siêu tốc, tự động, giao tiếp với nhau nhưng chúng không có bất cứ khả năng nào để nhận thấy sự khó chịu hoặc hạnh phúc hoặc thất vọng của chúng ta. Và đó chính là vấn đề.
Chuyện gì sẽ xảy ra, nếu như những tất cả những công nghệ như loa thông minh, xe tự lái, bộ cài đặt TV, tủ lạnh có kết nối internet, điện thoại di động có thể nhận biết được cảm xúc của bạn. Chuyện gì sẽ xảy ra nếu chúng cảm nhận được những hành vi phi ngôn ngữ trong thực tế. Xe của bạn có thể nhận thấy bạn đang mệt mỏi và đề nghị quyền điều khiển. Tủ lạnh của bạn có thể hỗ trợ bạn với khẩu phần ăn lành mạnh. Thiết bị đeo theo dõi thể thao và TV phối hợp với nhau để kéo bạn ra khỏi ghế bành. Gương phòng tắm có thể cảm nhận được cơn stress của bạn và điều chỉnh lại ánh sáng, đồng thời bật một đoạn nhạc phù hợp với tâm trạng. Những công nghệ nhận biết được tâm trạng sẽ đưa ra những đề nghị cá nhân và khuyến khích con người làm việc khác đi, tốt hơn, hoặc nhanh hơn.
Ngày nay, loại AI mới, AI cảm xúc, tập trung vào phát triển các thuật toán có thể nhận diện được cảm xúc của con người, không chỉ là những cảm xúc cơ bản như hạnh phúc, buồn bã, giận dữ, mà còn cả những trạng thái phức tạp hơn như mệt mỏi, chú ý, hứng thú, mơ hồ, mất tập trung... và nhiều hơn nữa.
Công ty của tôi, Affectiva, là một trong những người đang phát triển hệ thống này. Chúng tôi đã soạn một bộ dữ liệu khổng lồ gồm sáu triệu video khuôn mặt từ 87 quốc gia, cho phép AI tập luyện với các biểu cảm cảm xúc thật trong tự nhiên và để cắt nghĩa sự khác biệt trong việc biểu hiện cảm xúc của các nền văn hóa khác biệt.
"Tôi mong rằng công nghệ quanh ta có thể nhận biết được cảm xúc trong vòng 5 năm tới".
Dựa vào máy tính thị giác, phân tích lời nói, và học tập sâu, chúng tôi phân loại khuôn mặt và giọng nói thể hiện cảm xúc. Một trong những thách thức mở là làm thế nào bạn huấn luyện hệ thống đa thể dạng này? Và làm thế nào để bạn thu thập dữ liệu của những cảm xúc ít phổ biến hơn, như tự hào và cảm hứng.
Tuy nhiên, lĩnh vực đang tiến triển nhanh đến mức tôi mong rằng công nghệ quanh ta có thể nhận biết được cảm xúc trong vòng 5 năm tới. Chúng sẽ đọc và phản ứng lại với nhận thức và trạng thái cảm xúc của con người. AI cảm xúc sẽ lấn sâu vào các công nghệ mà ta đang dùng hàng ngày, chạy ngầm, khiến cho tương tác của chúng ta với công nghệ trở nên cá nhân hóa, liên quan, chứng thực, và tương tác hơn. Nó thật khó để nhớ lại rằng mọi chuyện giống như thế nào trước khi chúng ta có giao diện chạm và nhận dạng giọng nói. Và hẳn là ta cũng sẽ cảm nhận như vậy về các thiết bị nhận diện cảm xúc.
Dưới đây là một số ứng dụng mà tôi cảm thấy phấn khích:
Ô tô: Một chiếc xe có ý thức, có thể nhận biết được người lái đang mệt mỏi, mất tập trung hoặc thất vọng. Ngoài mục đích an toàn, Xe của bạn cũng sẽ cá nhân hóa trải nghiệm trong xe, thay đổi nhạc hoặc các thiết lập ghế tựa tùy thuộc vào ai đang ngồi trong xe.
Giáo dục: Trong môi trường học tập online, khó có thể nhận thấy rằng liệu học viên nào đang gặp khó khăn hay không. Lúc mà điểm kiểm tra hạ xuống, thì thường đã quá trễ - học viên đã bỏ học. Nhưng nếu hệ thống học tập thông minh có thế cung cấp trải nghiệm học tập được cá nhân hóa thì sao? Những hệ thống này sẽ đưa ra những giải thích khác biệt khi học viên đang mệt mỏi, chậm lại khi đang mơ hồ, hoặc đơn giản là kể một chuyện cười khi đến lúc cần vui vẻ.
Chăm sóc sức khỏe: Giống như chúng ta theo dõi thể hình và sức khỏe vật lý, chúng ta cũng có thể theo dõi trạng thái tinh thần, gửi các cảnh báo đến bác sĩ nếu ta lựa chọn chia sẽ những thông tin này. Các nhà nghiên cứu đang hướng đến AI cảm xúc để chận đoán những dấu hiệu ban đầu của các chứng bệnh như Parkinson và động mạch vành, cũng như ngăn chặn tự sát và hỗ trợ người tự kỷ.
Giao tiếp: Có rất nhiều bằng chứng về việc chúng ta đối xử với thiết bị, đặc biệt là giao diện đàm thoại, giống như cách chúng ta đối xử người khác. Người ta đặt tên cho robot xã hội của mình, họ kể với Siri rằng họ bị lạm dụng về thể chất và yêu cầu một chatbot để hỗ trợ về mặt tinh thần khi họ hóa trị. Và đó là trước khi chúng ta thêm vào sự đồng cảm. Mặt khác, chúng ta biết rằng thế hệ trẻ đang mất đi khả năng đồng cảm vì họ lớn lên với giao diện kỹ thuật số, nơi thiếu đi cảm xúc - yếu tố chính khiến chúng ta là con người. Vậy nên AI cảm xúc có thể mang chúng ta lại gần với nhau hơn.
Cũng như các công nghệ mới khác, nó đều có khả năng có lợi hoặc bị lạm dụng. Rất khó để có thêm dữ liệu cá nhân về cảm xúc của bạn. Người ta cần phải được xin phép về bất kì việc chia sẻ dữ liệu nào và họ cũng cần được biết dữ liệu được dùng cho việc gì. Chúng ta cần tìm ra rằng liệu các ứng dụng hiện tại có vượt qua tiêu chuẩn đạo đức hay không. Chúng ta cần phải đề ra những luật lệ về riêng tư và đạo đức. Chúng ta phải làm việc để tránh việc xây dựng sự thiên vị trong các ứng dụng này. Nhưng tôi là người có niềm tin mạnh mẽ rằng lợi ích sẽ lớn hơn nhiều so với mặt hại.