Trong bản báo cáo khoa học, được đăng trên tạp chí Nature , nhóm nhà khoa học mô tả việc sử dụng phương pháp Máy học tăng cường để nâng cao khả năng viết các thuật toán trên cơ sở toán học. Một bản tóm tắt nghiên cứu cũng được xuất bản trên cùng một số tạp chí, đăng tải tóm tắt những công việc của nhóm ở London.
Toán học thường xuyên được sử dụng trong lập trình máy tính như một phương tiện để mô tả và sau đó thao tác biểu diễn các hiện tượng trong thế giới thực. Toán học được sử dụng để biểu diễn các pixel trên màn hình máy tính, điều kiện thời tiết hoặc các nút neuron thần kinh trong mạng nhân tạo.
Một trong những phương thức chính mà toán học được sử dụng trong những bài toán như vậy là thực hiện các phép tính trên ma trận. Ví dụ: khi lập trình trò chơi, ma trận mô tả các tùy chọn chuyển động có thể có. Để thực hiện các chuyển động như vậy, các ma trận thường được nhân hoặc cộng với nhau hoặc thực hiện cả 2 phép tính. Hoạt động này đòi hỏi rất nhiều công việc, đặc biệt khi các ma trận phát triển lớn hơn, đó là lý do tại sao các nhà khoa học máy tính phải dành nhiều thời gian và công sức để phát triển những thuật toán ngày càng hiệu quả hơn để hoàn thành công việc.
Ví dụ, năm 1969, nhà toán học Volker Strassen đã tìm ra một phương pháp nhân hai ma trận 2x2 chỉ bằng bảy phép nhân thay vì tám phép tính tiêu chuẩn.
Trong nghiên cứu mới, các kỹ sư máy tính tại DeepMind đặt câu hỏi, liệu có thể sử dụng hệ thống AI trên cơ sở học tập tăng cường để tạo ra các thuật toán mới với ít bước hơn những thuật toán đang được sử dụng hiện nay không?.
Để tìm hiểu, nhóm nghiên cứu đã tìm cảm hứng từ các hệ thống games, hầu hết đều dựa trên cơ sở Máy học tăng cường. Sau khi xây dựng một số hệ thống sơ bộ, nhóm nghiên cứu chuyển sang tập trung vào Cây tìm kiếm (cấu trúc dữ liệu dạng cây), được sử dụng trong lập trình games. Cấu trúc dữ liệu dạng cây là phương tiện để một hệ thống xem xét những kịch bản khác nhau phát sinh trong một tình huống cụ thể. Khi được áp dụng để nhân ma trận, các kỹ sư máy tính nhận thấy, phương pháp chuyển đổi một hệ thống AI thành một hệ thống games cho phép tìm kiếm cách hiệu quả nhất để đạt được kết quả mong muốn, một kết quả toán học.
Nhân ma trận. Ảnh minh họa của DeepMind |
Các nhà nghiên cứu thử nghiệm hệ thống AI thành Games, cho phép tìm kiếm, xem xét và sau đó sử dụng các thuật toán hiện có, dùng phần thưởng như một sự khuyến khích AI để có được lựa chọn một thuật toán hiệu quả nhất.
Thông qua quá trình Máy học tăng cường, hệ thống đã học được những yếu tố góp phần vào tăng hiệu quả của phép nhân ma trận. Tiếp theo, các nhà nghiên cứu cho phép hệ thống tạo ra thuật toán của riêng nó, một lần nữa tìm cách cải thiện hiệu quả.
Các nhà khoa học phát hiện được, trong nhiều trường hợp, các thuật toán do hệ thống AI lựa chọn hiệu quả hơn những thuật toán được con người tạo ra trước đây.
Nghiên cứu này đã mở ra một tương lai mới, trong đó AI và các kỹ sư công nghệ thông tin có thể phối hợp đưa ra các thuật toán máy tính mới, có hiệu quả cao trong lập trình.
Theo Tech Xplore