Nhóm nghiên cứu AI của Baidu mới đây đã đạt được một cột mốc ấn tượng: dạy một nhân vật ảo “sống” trong môi trường 2D sử dụng các hiệu lệnh ngôn ngữ tự nhiên để điều khiển thế giới của chính nó. Họ thực hiện điều này bằng cách dạy cho nó ngôn ngữ qua các tác động tích cực và tiêu cực.
Điều đặc biệt là nhân vật ảo này còn phát triển được cả kỹ năng học zero-shot (biết cách giải quyết cả những thứ chưa từng được dạy qua ví dụ), cũng có nghĩa là trí tuệ nhân tạo này đã có những cảm quan cơ bản về ngữ pháp.
Bạn có thể thấy điều này cũng tương tự như việc một đứa trẻ được cha mẹ dạy dỗ: Bạn đưa cho nó một bức ảnh hay món đồ nào đó, nhắc lại từ chỉ thứ đó rồi thưởng nếu nó đọc và nhận diện được đúng đồ vật. Ở đây, nhân vật ảo cũng được dạy theo cách tương tự.
Đột phá trong nghiên cứu của Baidu còn nằm ở chỗ nhân vật ảo còn có thể ứng dụng những mệnh lệnh nó từng học vào những tình huống mới gặp. Dưới đây là giải thích chi tiết từ chính nhóm nghiên cứu của Baidu:
“Ứng dụng các kiến thức cũ vào một tình huống mới là thứ rất đơn giản với con người nhưng hiện vẫn còn khá khó khăn với máy tính. Máy tính có thể nhận diện được một quả thanh long, nhưng lại không thể thực hiện yêu cầu “cắt quả thanh long bằng một con dao”, trừ khi đã từng được huấn luyện bằng những chuỗi dữ liệu chứa mệnh lệnh này.
Ngược lại, nhân vật ảo của chúng tôi thể hiện khả năng chuyển đổi thành công những thứ nó học được về hình dáng quả thanh long cũng như tác vụ “cắt vật X bằng dao” mà không cần được huấn luyện cách thực hiện tác vụ này.”
Khả năng khái quát hóa cách sử dụng một kỹ năng nào đó từng dùng thực sự không phải năng lực dạng vừa đối với các hệ thống trí tuệ nhân tạo. Đây chính là mô hình cho thấy các hệ thống máy tính cũng có thể học và áp dụng kiến thức theo cách tương tự như con người, ngay cả trong môi trường tựa game như 2D.