Phương pháp để quản lý và vận hành mô hình học máy một cách hiệu quả

VietTimes – Sau khi các mô hình học máy được đưa vào sản xuất, chúng vẫn cần cập nhật và theo dõi sự sai lệch.

Phương pháp để quản lý và vận hành mô hình học máy một cách hiệu quả (Ảnh: CIO)

Phương pháp để quản lý và vận hành mô hình học máy một cách hiệu quả (Ảnh: CIO)

Việc phát triển và quản lý các mô hình Học máy (Machine Learning) là một nhiệm vụ khó khăn của các nhà khoa học dữ liệu. Nhận biết sai lệch mô hình, thiết lập lại mô hình với cập nhật bộ dữ liệu, cải thiện hiệu suất và duy trì nền tảng công nghệ cơ bản là tất cả các phương pháp khoa học dữ liệu quan trọng. Nếu không có những nguyên tắc này, các mô hình có thể tạo ra kết quả sai lầm ảnh hướng đáng kể đến hoạt động kinh doanh của doanh nghiệp.

Phát triển các mô hình sẵn sàng ứng dụng cho sản xuất không phải là một nhiệm vụ dễ dàng. Theo một nghiên cứu về học máy, 55% công ty chưa triển khai mô hình vào sản xuất và 40% công ty yêu cầu hơn 30 ngày để có thể triển khai mô hình. Thành công mang đến những thách thức mới và 41% số người được hỏi thừa nhận khó khăn trong việc xác định phiên bản các mô hình học máy và khả năng tái tạo.

Bài học ở đây là những trở ngại mới xuất hiện khi các mô hình học máy được triển khai trong sản xuất và sử dụng trong các quy trình kinh doanh.

Quản lý và vận hành mô hình đã từng là thách thức đối với các nhóm khoa học dữ liệu. Giờ đây, các nhiệm vụ bao gồm giám sát các mô hình học máy, tự động hóa việc thiết lập lại các mô hình, cảnh báo khi có độ lệch đáng kể và nhận biết khi nào các mô hình cần được nâng cấp. Khi ngày càng có nhiều tổ chức đầu tư vào học máy, thì mục tiêu xây dựng quản lý và vận hành mô hình học máy ngày càng tăng cao.

Tin tốt là các nền tảng và thư viện như MLFlow và DVC mã nguồn mở, và các công cụ thương mại từ Alteryx, Databricks, Dataiku, SAS, DataRobot, ModelOp và các nền tảng khác đang giúp các nhóm khoa học dữ liệu quản lý và vận hành mô hình dễ dàng hơn. Các nhà cung cấp đám mây công cộng cũng đang chia sẻ các phương pháp như triển khai MLops (Machine Learning Operations) với Azure Machine Learning.

Hiểu về quản lý và vận hành mô hình

Để hiểu rõ hơn về quản lý và vận hành mô hình, hãy xem xét sự kết hợp của thực tiễn phát triển phần mềm với các phương pháp khoa học.

Là một nhà phát triển phần mềm, bạn biết rằng việc hoàn thành phiên bản của một ứng dụng và áp dụng nó vào quá trình sản xuất là không hề dễ dàng. Những thách thức lớn hơn bắt đầu xuất hiện khi ứng dụng được đưa vào trong quá trình sản xuất. Người dùng cuối mong đợi các cải tiến thường xuyên đi cùng với những yêu cầu vá lỗi và bảo trì.

Các nhà khoa học dữ liệu thử nghiệm mô hình học máy phải kết hợp kiến thức từ việc phát triển phần mềm với các kiến thức nghiên cứu khoa học. Mô hình học máy là mã phần mềm được phát triển bằng các ngôn ngữ như Python và R, được xây dựng bằng TensorFlow, PyTorch hoặc các thư viện học máy khác, chạy trên các nền tảng như Apache Spark và được triển khai tới cơ sở hạ tầng đám mây. Việc phát triển và hỗ trợ các mô hình học máy đòi hỏi những thử nghiệm và tối ưu hóa đáng kể, và các nhà khoa học dữ liệu phải chứng minh tính chính xác của các mô hình mà họ tạo ra.

Giống như phát triển phần mềm, các mô hình học máy cần được bảo trì và cải tiến liên tục. Một số điều đó đến từ việc duy trì mã, thư viện, nền tảng và cơ sở hạ tầng, nhưng các nhà khoa học dữ liệu cũng phải lo lắng về sự sai lệch mô hình. Nói một cách dễ hiểu, sai lệch mô hình xảy ra khi dữ liệu mới có sẵn và các dự đoán, cụm, phân đoạn và đề xuất được cung cấp bởi các mô hình học máy khác với kết quả mong đợi.

Quản lý mô hình thành công bắt đầu bằng việc phát triển các mô hình tối ưu

Alan Jacobson, giám đốc dữ liệu và phân tích tại Alteryx chia sẻ về cách các doanh nghiệp thành công trong việc phát triển và mở rộng mô hình học máy. Ông nói: "Để đơn giản hóa việc phát triển mô hình, thách thức đầu tiên đối với hầu hết các nhà khoa học dữ liệu là đảm bảo xây dựng các công thức giải quyết vấn đề một cách chặt chẽ. Nhiều vấn đề kinh doanh phức tạp có thể được giải quyết bằng các phép phân tích rất đơn giản, nhưng điều này trước hết đòi hỏi phải cấu trúc vấn đề theo cách mà phân tích dữ liệu có thể trả lời các câu hỏi đó. Ngay cả khi các mô hình phức tạp được tận dụng, phần khó nhất của quy trình thường là cấu trúc dữ liệu và đảm bảo các đầu vào phù hợp đang được sử dụng ở mức chất lượng phù hợp'.

Việc đảm bảo chất lượng dữ liệu là rất quan trọng. Trước tiên, các tổ chức phải bắt đầu bằng việc đặt các câu hỏi thông minh về Big Data, đầu tư vào Dataops, sau đó sử dụng các phương pháp linh hoạt trong khoa học dữ liệu để tìm ra các giải pháp.

Giám sát các mô hình học máy đối với sự sai lệch mô hình

Có được định nghĩa chính xác về các vấn đề là rất quan trọng trong việc quản lý và giám sát liên tục các mô hình trong sản xuất. Jacobson giải thích: "Theo dõi các mô hình là một quá trình quan trọng, nhưng để thực hiện đúng thì cần phải hiểu rõ về các mục tiêu và các tác động bất lợi tiềm ẩn để đảm bảo việc theo dõi. Điều quan trọng và thách thức hơn trong lĩnh vực này là phân tích các hậu quả không mong muốn”.

Một cách dễ hiểu về sự sai lệch mô hình và hậu quả không mong muốn là xem xét tác động của COVID-19 đối với các mô hình học máy được phát triển với dữ liệu đào tạo từ trước đại dịch. Các mô hình học máy dựa trên hành vi của con người, xử lý ngôn ngữ tự nhiên, mô hình nhu cầu của người tiêu dùng đều bị ảnh hưởng bởi sự thay đổi hành vi trong đại dịch đang gây ra sự rối loạn đối với các mô hình AI.

Các nhà cung cấp công nghệ đang phát hành các khả năng MLops mới khi ngày càng có nhiều tổ chức nhận được giá trị và hoàn thiện các chương trình khoa học dữ liệu của họ. Ví dụ, SAS đã giới thiệu một số tính năng giúp các nhà khoa học dữ liệu đánh giá các mô hình không có biến mục tiêu. Cloudera gần đây đã công bố Dịch vụ Giám sát ML để nắm bắt các số liệu hiệu suất kỹ thuật và các dự đoán mô hình theo dõi.

MLops cũng giải quyết các vấn đề về tự động hóa

Việc phát triển một mô hình học máy và giám sát nó trong quá trình sản xuất cần các công cụ, quy trình, sự kết hợp và khả năng bổ sung cho phép thực hành khoa học dữ liệu mở rộng quy mô. Một số thực hành tự động hóa và cơ sở hạ tầng tương tự như devops, bao gồm cơ sở hạ tầng dưới dạng mã và CI/CD (tích hợp liên tục / triển khai liên tục) cho các mô hình học máy.

Các khía cạnh thú vị hơn của MLops mang lại những lợi ích đáng kể cho các nhóm khoa học dữ liệu. Ví dụ: DataRobot cho phép chạy nhiều mô hình thử nghiệm song song để kiểm tra độ chính xác của các phiên bản. SAS muốn giúp các nhà khoa học dữ liệu cải thiện tốc độ và chất lượng dữ liệu. Alteryx gần đây đã giới thiệu Analytics Hub giúp các nhóm khoa học dữ liệu có thể trao đổi và chia sẻ kinh nghiệm với nhau.

Theo CIO

Lưu tin
Tin liên quan
Có thể bạn quan tâm