Máy học Machine Learning: Công nghệ hứa hẹn nhất của AI

05/05/2021 11:17

VietTimes – Dạng trí tuệ nhân tạo mạnh mẽ này đang thay đổi mọi ngành công nghiệp. Dưới đây là những điều bạn cần biết về tiềm năng và hạn chế của Machine Learning.

Machine Learning (Máy học) đứng sau các trợ lý ảo, ứng dụng dịch ngôn ngữ, các chương trình mà YouTube gợi ý và nội dung hiển thị trên mạng xã hội của bạn. Nó có thể điều khiển các loại xe tự lái và chẩn đoán tình trạng bệnh lý dựa trên hình ảnh.

Khi các công ty ngày nay triển khai các chương trình trí tuệ nhân tạo (AI), rất có thể họ đang sử dụng Machine Learning nhiều đến mức các thuật ngữ thường được sử dụng thay thế cho nhau và đôi khi không rõ ràng. Machine Learning là một hướng nghiên cứu chính của trí tuệ nhân tạo, cung cấp cho máy móc khả năng học hỏi, làm công việc nhất định.

"Chỉ trong 5 hoặc 10 năm qua, trong các công việc được thực hiện bởi AI, Machine Learning đã trở thành một cách làm quan trọng nhất. Đó là lý do tại sao một số người sử dụng thuật ngữ AI và ML gần như đồng nghĩa với nhau… hầu hết những tiến bộ hiện tại trong AI đều liên quan đến ML", theo giáo sư Thomas Malone của Trường Quản lý MIT Sloan.

Với sự phổ biến ngày càng tăng của Machine Learning, mọi người trong doanh nghiệp đều có thể tiếp xúc với Machine Learning và sẽ cần một số kiến thức làm việc về lĩnh vực này. Một cuộc khảo sát của Deloitte năm 2020 cho thấy 67% công ty đang sử dụng Machine Learning và 97% đang sử dụng hoặc có kế hoạch sử dụng nó trong năm tới.

Từ sản xuất đến bán lẻ và ngân hàng đến tiệm bánh, ngay cả các công ty pháp lý cũng đang sử dụng Machine Learning để tạo giá trị mới hoặc tăng hiệu suất công việc. Giáo sư khoa học máy tính Aleksander Madry của MIT Sloan cho biết: "Machine learning đang thay đổi, hoặc sẽ thay đổi mọi ngành và các nhà lãnh đạo cần hiểu các nguyên tắc cơ bản, tiềm năng và hạn chế của nó".

Mặc dù không phải ai cũng cần biết các chi tiết kỹ thuật, nhưng họ nên hiểu những gì công nghệ này làm được và những gì nó không thể làm. Điều đó bao gồm nhận thức về các tác động xã hội, và đạo đức của Machine Learning.

"Điều quan trọng là phải tham gia và bắt đầu hiểu những công cụ này, sau đó suy nghĩ về cách bạn sẽ sử dụng chúng. Chúng ta phải sử dụng những công cụ này vì lợi ích của mọi người," theo Tiến sĩ Joan LaRovere, đồng sáng lập tổ chức The Virtue Foundation.

1. Machine Learning là gì?

Ảnh: IMIC Technology

Machine Learning là một lĩnh vực con của trí tuệ nhân tạo, được định nghĩa rộng rãi là khả năng của một cỗ máy bắt chước hành vi thông minh của con người. Hệ thống trí tuệ nhân tạo của Machine Learning được sử dụng để thực hiện các nhiệm vụ phức tạp theo cách tương tự như cách con người giải quyết vấn đề.

Theo Boris Katz, nhà khoa học nghiên cứu chính tại InfoLab Group của Phòng thí nghiệm Khoa học Máy tính & Trí tuệ Nhân tạo MIT, mục tiêu của AI là tạo ra các mô hình máy tính thể hiện "các hành vi thông minh" giống như con người. Điều này có nghĩa là máy tính có thể nhận dạng cảnh vật trực quan, hiểu văn bản được viết bằng ngôn ngữ tự nhiên hoặc thực hiện một hành động trong thế giới vật chất.

Machine Learning là một cách để sử dụng AI. Vào những năm 1950, nhà tiên phong về AI Arthur Samuel đã định nghĩa Machine Learning là "lĩnh vực nghiên cứu mang lại cho máy tính khả năng học hỏi mà không cần được lập trình rõ ràng".

Trong một số trường hợp, việc viết chương trình để máy làm theo sẽ tốn nhiều thời gian hoặc không thể có kết quả, chẳng hạn như huấn luyện máy tính nhận dạng ảnh của những người khác nhau. Mặc dù con người có thể thực hiện công việc này một cách dễ dàng, nhưng rất khó để nói cho máy tính biết cách thực hiện nó. Machine Learning có cách tiếp cận là để máy tính học cách tự lập trình thông qua trải nghiệm.

Machine Learning bắt đầu với dữ liệu - số, ảnh hoặc văn bản, chẳng hạn như giao dịch ngân hàng, ảnh của con người hoặc báo cáo bán hàng. Dữ liệu được thu thập và chuẩn bị để sử dụng làm dữ liệu đào tạo cho mô hình Machine Learning. Càng nhiều dữ liệu, chương trình càng chính xác.

Từ đó, các lập trình viên chọn một mô hình Machine Learning để sử dụng, cung cấp dữ liệu và để mô hình Machine Learning tự đào tạo để tìm ra các mẫu hoặc đưa ra dự đoán. Theo thời gian, lập trình viên cũng có thể điều chỉnh mô hình, bao gồm cả việc thay đổi các tham số để cho ra kết quả chính xác hơn.

Các thuật toán Machine Learning thành công có thể làm nhiều việc khác nhau. Giáo sư Malone đã viết trong một nghiên cứu về AI và Machine Learning, "Chức năng của một hệ thống Machine Learning có thể được mô tả - sử dụng dữ liệu để giải thích những gì đã xảy ra; tiên đoán - sử dụng dữ liệu để dự đoán điều gì sẽ xảy ra; hoặc đưa chỉ thị - sử dụng dữ liệu để đưa ra đề xuất về hành động cần thực hiện."

2. Các nhóm của Machine Learning

Theo phương thức học, các thuật toán Machine Learning thường được chia làm 3 nhóm:

Mô hình máy học có giám sát (supervised learning) được đào tạo với các tập dữ liệu được gắn nhãn, cho phép các mô hình học hỏi và phát triển chính xác hơn theo thời gian. Một trong những bài toán sử dụng thuật toán này được Google thử nghiệm là cho máy tính xem hàng trăm ngàn video trên YouTube để xây dựng nên hình ảnh nhận dạng của con mèo. Máy học có giám sát là loại phổ biến nhất được sử dụng ngày nay.

Mô hình máy học không giám sát (unsupervised learning), một chương trình tìm kiếm các mẫu hoặc xu hướng trong dữ liệu không được gắn nhãn. Ví dụ: một chương trình máy học không được giám sát có thể xem qua dữ liệu bán hàng trực tuyến và xác định các loại khách hàng khác nhau mua hàng.

Máy học tăng cường huấn luyện máy thông qua quá trình thử và sai (trial-and-error) để thực hiện hành động tốt nhất bằng cách thiết lập hệ thống khen thưởng. Học tăng cường có thể huấn luyện các mô hình chơi trò chơi hoặc huấn luyện các phương tiện tự lái bằng cách cho máy biết khi nào máy đưa ra quyết định đúng, điều này giúp máy học theo thời gian những hành động cần thực hiện.

Giáo sư Malone lưu ý rằng Machine Learning phù hợp nhất với các tình huống có nhiều dữ liệu - hàng nghìn hoặc hàng triệu, ví dụ như bản ghi từ các cuộc trò chuyện trước đó với khách hàng, nhật ký cảm biến từ máy hoặc giao dịch ATM. Ví dụ: Google Dịch có thể thực hiện được vì nó đã "đào tạo" về lượng lớn thông tin trên web, bằng các ngôn ngữ khác nhau.

Trong một số trường hợp, Machine Learning có thể đạt được cái nhìn sâu sắc hoặc tự động hóa việc ra quyết định trong những trường hợp mà con người không thể làm được, giáo sư Madry nói. "Có thể không chỉ hiệu quả hơn và ít tốn kém hơn khi có một thuật toán làm điều này, mà đôi khi con người không thể làm được theo nghĩa đen."

Tìm kiếm của Google là một ví dụ về điều mà con người có thể làm, nhưng không bao giờ đạt được quy mô và tốc độ mà các mô hình của Google có thể hiển thị câu trả lời mỗi khi một người nhập một truy vấn.

3. Machine Learning liên kết với một số lĩnh vực khác của trí tuệ nhân tạo

Ảnh: Analytics Insight

Xử lý ngôn ngữ tự nhiên (Natural language processing: NLP)

Xử lý ngôn ngữ tự nhiên là một lĩnh vực của Machine Learning, trong đó máy móc học cách hiểu ngôn ngữ tự nhiên như con người nói và viết, thay vì dữ liệu và số thường được sử dụng để lập trình máy tính. Điều này cho phép máy móc nhận dạng ngôn ngữ, hiểu và phản hồi lại ngôn ngữ cũng như tạo văn bản mới và dịch giữa các ngôn ngữ. Xử lý ngôn ngữ tự nhiên cho phép sử dụng công nghệ quen thuộc như chatbot và trợ lý kỹ thuật số như Siri hoặc Alexa.

Mạng nơ-ron nhân tạo (Neural Network)

Mạng nơ-ron nhân tạo là một chuỗi các thuật toán được đưa ra để tìm kiếm các mối quan hệ cơ bản trong một tập hợp dữ liệu, thông qua quá trình bắt chước cách thức hoạt động của bộ não con người.

Trong một mạng nơ-ron nhân tạo, các ô hoặc nút (node) được kết nối với nhau, với mỗi đầu vào xử lý và tạo ra một đầu ra được gửi đến các nơ-ron khác. Dữ liệu được gắn nhãn di chuyển qua các nút hoặc ô, với mỗi ô thực hiện một chức năng khác nhau.

Học sâu (Deep Learning)

Deep Learning là mạng nơ-ron có nhiều lớp. Mạng phân lớp có thể xử lý một lượng lớn dữ liệu và xác định "trọng lượng" của từng liên kết trong mạng - ví dụ: trong hệ thống nhận dạng hình ảnh, một số lớp của mạng thần kinh có thể phát hiện các đặc điểm riêng lẻ của khuôn mặt, như mắt, mũi, hoặc miệng, trong khi một lớp khác có thể cho biết liệu những đặc điểm đó có xuất hiện theo cách chỉ ra một khuôn mặt hay không.

Giống như mạng nơ-ron nhân tạo, Deep Learning được mô phỏng theo cách bộ não con người hoạt động và cung cấp công cụ cho nhiều hoạt động sử dụng Machine Learning, như phương tiện tự lái, chatbot và chẩn đoán y tế.

"Bạn càng có nhiều lớp, bạn càng có nhiều tiềm năng để làm tốt những việc phức tạp," giáo sư Malone nói.

Tuy nhiên, Deep Learning tiêu tốn nhiều năng lượng, điều này làm dấy lên lo ngại về tính bền vững kinh tế và môi trường của nó.

4. Cách các doanh nghiệp sử dụng Machine Learning

Ảnh: Sogetilabs

Machine Learning là cốt lõi trong mô hình kinh doanh của một số công ty, như trong trường hợp thuật toán gợi ý của YouTube hoặc công cụ tìm kiếm của Google. Các công ty khác cũng đang tham gia sâu vào Machine Learning, mặc dù đó không phải mảng doanh chính của họ.

Machine Learning hiện được áp dụng vào những lĩnh vực sau:

Các thuật toán đề xuất. Các công cụ đề xuất đằng sau các đề xuất của Netflix và YouTube, nội dung hiển thị trên Facebook và các sản phẩm quảng cáo được thúc đẩy bởi Machine Learning.

Phân tích hình ảnh và phát hiện đối tượng. Machine Learning có thể phân tích hình ảnh cho các thông tin khác nhau, như học cách xác định đối tượng và phân biệt họ - mặc dù các thuật toán nhận dạng khuôn mặt đang gây tranh cãi. Giảng viên tại MIT Sloan - Mikey Shulman chỉ ra rằng các quỹ đầu cơ nổi tiếng sử dụng Machine Learning để phân tích số lượng ô tô trong các bãi đậu xe, giúp họ tìm hiểu cách các công ty đang hoạt động thế nào và đưa ra khoản đầu tư đúng đắn.

Phát hiện gian lận. Các thuật toán Machine Learning là công cụ để phát hiện các hoạt động gian lận như trộm cắp hoặc hồ sơ giả, truy cập bất hợp pháp…Các thuật toán này tìm hiểu hoạt động "bình thường" trông như thế nào để có thể phát hiện ra sự bất thường từ bộ dữ liệu khổng lồ, nhanh hơn nhiều so với các nhà phân tích. Chúng có thể cung cấp phản ứng gần với thời gian thực đối với các hoạt động cần được điều tra.

Đường dây trợ giúp tự động hoặc chatbot. Nhiều công ty đang triển khai chatbot trực tuyến, trong đó khách hàng không nói chuyện với con người mà thay vào đó tương tác với một máy. Các thuật toán này sử dụng Machine Learning và xử lý ngôn ngữ tự nhiên, với các bot học từ bản ghi của các cuộc trò chuyện trước đây để đưa ra các phản hồi thích hợp.

Xe ô tô tự lái. Phần lớn công nghệ đằng sau ô tô tự lái dựa trên Machine Learning, đặc biệt là Deep Learning.

Machine Learning và Deep Learning được ứng dụng mạnh mẽ trong lĩnh vực xe tự lái.

Chẩn đoán và hình ảnh y tế. Các chương trình máy học có thể được đào tạo để kiểm tra các hình ảnh y tế hoặc thông tin khác và tìm kiếm các dấu hiệu bệnh tật nhất định, giống như một công cụ có thể dự đoán nguy cơ ung thư dựa trên chụp X quang tuyến vú.

5. Cách hoạt động của Machine Learning: hứa hẹn và thách thức

Mặc dù Machine Learning đang thúc đẩy công nghệ và mở ra những khả năng mới cho doanh nghiệp, nhưng có một số điều mà các nhà lãnh đạo doanh nghiệp nên biết về khả năng và giới hạn của nó.

Khả năng giải thích

Một lĩnh vực đáng quan tâm là khả năng giải thích hay khả năng rõ ràng về những gì mà các mô hình máy học đang làm và cách chúng đưa ra quyết định. Giáo sư Madry nói: "Hiểu được cách thức hoạt động của một mô hình thực sự là một câu hỏi rất khó. Bạn đừng bao giờ coi nó như một chiếc hộp đen, hãy thử cảm nhận về những quy tắc hoạt động của chúng".

Điều này đặc biệt quan trọng bởi vì các hệ thống có thể bị đánh lừa và phá hoại. Ví dụ, việc điều chỉnh siêu dữ liệu trong hình ảnh có thể khiến máy tính nhầm lẫn - chỉ với một vài điều chỉnh, máy tính có thể xác định hình ảnh một con chó là một con đà điểu.

Giáo sư Madry chỉ ra một ví dụ khác trong đó thuật toán Machine Learning kiểm tra tia X quang dường như hoạt động tốt hơn các bác sĩ. Nhưng hóa ra thuật toán đang tương quan kết quả với các máy chụp ảnh, không nhất thiết là dựa vào ảnh. Bệnh lao phổ biến hơn ở các nước đang phát triển và những nước này thường có nhiều máy móc cũ hơn. Chương trình Machine Learning đã học được rằng nếu chụp X-quang trên một máy cũ, bệnh nhân có nhiều khả năng bị bệnh lao hơn. Machine Learning đã hoàn thành nhiệm vụ, nhưng không theo cách mà các lập trình viên mong muốn.

Tầm quan trọng của việc giải thích cách một mô hình hoạt động - và độ chính xác của nó - có thể khác nhau tùy thuộc vào cách nó được sử dụng. Mặc dù hầu hết các vấn đề đặt ra đều có thể được giải quyết thông qua Machine Learning, nhưng mọi người nên hiểu rằng các mô hình chỉ hoạt động với độ chính xác khoảng 95% của con người. Người lập trình và người dùng có thể cảm thấy bình thường nếu thuật toán đề xuất phim chính xác đến 95%, nhưng mức độ chính xác đó sẽ không đủ cho một chiếc xe tự lái hoặc một chương trình được thiết kế để tìm ra những sai sót nghiêm trọng trong máy móc.

Thành kiến và kết quả không mong muốn

Văn hóa của Machine Learning là một vấn đề đáng được quan tâm.

Máy móc được đào tạo bởi con người và thành kiến của con người có thể được đưa vào các thuật toán - nếu thông tin thiên vị hoặc dữ liệu phản ánh sự bất bình đẳng được đưa vào chương trình Machine Learning, chương trình sẽ học cách tái tạo nó và kéo dài các hình thức phân biệt đối xử. Ví dụ, Chatbot được đào tạo về cách mọi người trò chuyện trên Twitter có thể sử dụng ngôn ngữ xúc phạm và phân biệt chủng tộc.

Trong một số trường hợp, mô hình Machine Learning có thể làm trầm trọng thêm các vấn đề xã hội. Ví dụ: Facebook đã sử dụng Machine Learning như một công cụ để hiển thị cho người dùng những quảng cáo và nội dung sẽ thu hút họ - điều này đã dẫn đến các mô hình hiển thị cho mọi người nội dung cực đoan, lan truyền các thuyết âm mưu, kích động đảng phái hoặc nội dung không chính xác.

Để giảm tối đa sự thiên vị trong Machine Learning, chúng ta cần xem xét cẩn thận dữ liệu đào tạo và áp dụng AI lấy con người làm trung tâm, thực hành tìm kiếm ý kiến đóng góp từ những người có nền tảng, kinh nghiệm và lối sống khác nhau khi thiết kế hệ thống AI.

6. Đưa Machine Learning vào hoạt động

Giảng viên Shulman cho biết các giám đốc điều hành cần đưa ra quyết định đúng đắn với nguồn lực đổ vào Machine Learning.

Cách Amazon áp dụng Machine Learning có lẽ không nên áp dụng với các công ty xe hơi. Trong khi Amazon thành công với trợ lý giọng nói và loa thông minh điều khiển bằng giọng nói, điều đó không có nghĩa là các công ty ô tô nên ưu tiên thêm loa vào ô tô. Nhiều khả năng công ty xe hơi có thể tìm ra cách sử dụng Machine Learning trên dây chuyền sản xuất để tiết kiệm hoặc kiếm được nhiều tiền hơn.

Một số công ty cố gắng đưa Machine Learning vào mục đích kinh doanh. Tuy nhiên, thay vì tập trung vào công nghệ, các doanh nghiệp nên bắt đầu tập trung vào một vấn đề kinh doanh hoặc nhu cầu của khách hàng có thể được đáp ứng bằng Machine Learning.

Theo Trường Quản lý MIT Sloan

Mit Sloan