Đã có chuyên gia ngôn ngữ bắt tay với CNTT
Trong một số lượng rất ít các chuyên gia ngôn ngữ đã tham gia vào các dự án của ngành CNTT, GS TS Vũ Kim Bảng – nguyên Phó Viện trưởng Viện Ngôn ngữ học là một người điển hình. Ông đến với công việc này từ năm 1997 với các dự án của Viện CNTT thuộc Viện Hàn lâm Khoa học Công nghệ Việt Nam. Dự án điển hình với ông trong sự hợp tác này là về nhận dạng tiếng nói thành văn bản. Việc này khó hơn so với chuyển đổi văn bản thành giọng nói. Tuy nhiên, những kết quả nghiên cứu của dự án này mới chỉ làm được với giọng Hà Nội song cũng chỉ thực hiện tốt với giọng đọc chậm. Để làm được việc này, hai bên đối tác đã phải cập nhật một khối lượng khổng lồ dữ liệu lời nói và vai trò của các nhà ngôn ngữ là tìm ra các quy luật để các chuyên gia tin học có thể lập trình quản lý dữ liệu.
Một dự án điển hình khác mà GS TS Vũ Kim Bảng đã tham gia là về dịch máy giữa tiếng Kinh và tiếng Mường tại Viện Nghiên cứu Quốc tế về Thông tin Đa phương tiện, Truyền thông và Ứng dụng (MICA) của Đại học Bách khoa Hà Nội. Theo ông, trong chiến lược về CNTT với lĩnh vực ngôn ngữ, không thể bỏ quên quyền bình đẳng của các dân tộc thiểu số. Những sản phẩm trong lĩnh vực này chắc chắn rất cần cho phát thanh, truyền hình. Khi đó, việc dịch các thông tin từ tiếng Kinh ra tiếng các dân tộc thiểu số sẽ được thực hiện một cách nhanh chóng và nhờ đó, mọi chủ trương, chính sách của Đảng và Nhà nước sẽ nhanh chóng đến được với đồng bào. Tất nhiên, là con người không thể phó mặc mọi việc cho máy tính mà vẫn phải tham gia vào để hiệu đính lại cho chính xác.
GS TS Vũ Kim Bảng cũng cho biết thêm là ngoài 2 dự án trên, ông còn được Viện Khoa học Hình sự của Bộ Công an mời tham gia một dự án nữa để xác định chính xác các đối tượng được hỏi cung bằng lời nói. Điều này là rất cần với ngành công an. Vì tư liệu về hỏi cung với các nghi phạm, can phạm sau khi được số hóa phải có sự đồng nhất và đối chiếu được.
Vậy sẽ còn những công việc nào mà ngành ngôn ngữ học có thể tham gia? Theo GS TS Vũ Kim Bảng, chắc chắn đó là nhu cầu của báo chí, phát thanh, truyền hình… cùng các cơ quan nghiên cứu với những cơ sở dữ liệu lớn của họ. Cũng phải kể thêm là nhu cầu dịch thuật mang tính chuyên ngành của các ngành như hàng hải, hàng không, ngân hàng, giao thông, xây dựng… Khi đó, các chuyên gia tin học và ngôn ngữ sẽ cùng nhau đưa ra được những giải pháp tốt nhất cho các khách hàng này. Ông cũng mong muốn, các doanh nghiệp lớn như VNPT, Viettel… nên đầu tư vào lĩnh vực này vì chắc chắn đó là nhu cầu của xã hội và không thể nói là không có lợi nhuận.
Phải là khoa học liên ngành
Theo TS Đào Hồng Thu – chuyên gia về ngôn ngữ học khối liệu, nguyên giảng viên ngoại ngữ của Đại học Bách khoa Hà Nội, cao hơn sự hợp tác giữa 2 ngành tin học và ngôn ngữ học thì phải coi đây là khoa học liên ngành trên nền tảng ngôn ngữ học. Tuy nhiên, theo GS VS Châu Văn Minh – Chủ tịch Viện Hàn lâm Khoa học Công nghệ Việt Nam thì khoa học liên ngành là vấn đề của nhận thức. Và một khi nhận thức chưa thay đổi thì không thể bắt ép được nhau bất cứ cái gì.
Cũng cần phải đề cập là trong Chiến lược Quốc gia về CNTT-TT do Bộ Bưu chính Viễn thông (nay là Bộ Thông tin và Truyền thông) xây dựng trình Chính phủ ban hành năm 2004 đã thiếu mất định hướng hết sức quan trọng này. Nguyên nhân cũng dễ hiểu vì đây là “bóng tối dưới chân cột đèn” và ngay cả những chuyên gia tin học trong lĩnh vực này cũng không biết đường lên tiếng với cơ quan soạn thảo. Tuy nhiên với quá trình xây dựng "Đề án đưa Việt Nam trở thành nước mạnh về CNTT-TT vào năm 20120" được Bộ Thông tin và Truyền thông triển khai năm 2009 thì tình hình cũng đã khác. Hội Trí thức Khoa học và Công nghệ Trẻ Việt Nam đã đặt ra yêu cầu với cơ quan soạn thảo là phải trả lời bằng được xem đòi hỏi tối thiểu với mỗi quốc gia, mỗi dân tộc trong CNTT là cái gì? Đó chính là những bài toán cho lĩnh vực ngôn ngữ. Và kết quả là trong nội dung của Đề án này được Thủ tướng Chính phủ ký ban hành cuối năm 2010 đã có được 4 chữ “xử lý tiếng Việt” trong nhiệm vụ thứ 6 về phát triển sản phẩm, công nghệ mới. Thậm chí Bộ trưởng khi đó là ông Lê Doãn Hợp trước đó còn khẳng định, “xử lý tiếng Việt” là vấn đề quan trọng nhất của Đề án nhân chuyến thăm một doanh nghiệp trong lĩnh vực này.
Nói như vậy thì về cơ bản là chủ trương của Nhà nước cho hoạt động ứng dụng CNTT với ngôn ngữ học cũng đã có. Tuy nhiên, vấn đề còn lại là phải xây dựng chính sách cụ thể. Song thực tế là từ khi Đề án đưa Việt Nam sớm trở thành nước mạnh về CNTT-TT, vẫn chưa có một diễn đàn nào được tổ chức để bàn đến việc xây dựng chính sách này. Có lẽ rằng Chính phủ cùng Bộ Thông tin và Truyền thông vẫn đang chờ chính những người trong cuộc có đề xuất về chính sách nhằm cụ thể hóa cho 4 chữ “xử lý tiếng Việt”. Có lẽ, đây không thể là công việc nội bộ của các chuyên gia tin học như tiềm thức xã hội vẫn quan niệm về CNTT mà cần phải là công việc của chính ngành ngôn ngữ.
Trong thời đại cách mạng công nghiệp 4.0, đương nhiên các ngành khoa học xã hội trong đó có ngôn ngữ học không thể đứng ngoài cuộc. Ngành ngôn ngữ học sẽ làm gì trong cách mạng công nghiệp 4.0 và chủ động hợp tác như thế nào với ngành CNTT và cách lĩnh vực khác cho sự nghiệp này? Câu trả lời xin dành cho Viện Ngôn ngữ học nhất là nhân dịp cơ quan này tổ chức kỷ niệm 50 năm thành lập vào ngày 14/5/2018.