GS TS Nguyễn Văn Hiệp: Sự hợp tác giữa ngôn ngữ học và tin học là vì tương lai đất nước trong thời đại 4.0

VietTimes – Ngay từ khi những chiếc máy vi tính đầu tiên xuất hiện tại Việt Nam thì một trong những công việc phải làm chính là những bài toán về ngôn ngữ. Từ đó đến nay, đã có rất nhiều sản phẩm như các hệ soạn thảo, bộ gõ, kiểm lỗi chính tả… đến công nghệ dịch thuật, hỏi đáp thông minh… Ngành ngôn ngữ học Việt Nam đã và sẽ chủ động làm gì trong bối cảnh đó? GS TS Nguyễn Văn Hiệp – Viện trưởng Viện Ngôn ngữ học đã chính thức trả lời phỏng vấn với VietTimes.
GS TS Nguyễn Văn Hiệp - Viện trưởng Viện Ngôn ngữ học
GS TS Nguyễn Văn Hiệp - Viện trưởng Viện Ngôn ngữ học

Trước hết xin ông cho biết một số thực tế liên quan đến CNTT ở Viện Ngôn ngữ học?

-Trước hết, cá nhân tôi rất quan tâm đến CNTT và tin tưởng rằng CNTT là công cụ rất quan trọng với ngôn ngữ học. Trong lĩnh vực ngôn ngữ có một chuyên ngành gọi là ngữ học điện toán (computational linguistics). Trước đây, viện chúng tôi từng có một bộ phận như vậy. Lúc đó, tôi còn ở Khoa Ngôn ngữ học của Đại học Khoa học Xã hội và Nhân văn Hà Nội. Viện Ngôn ngữ học đã từng ứng dụng CNTT để nghiên cứu về ngữ âm học, bệnh học, ngôn ngữ các dân tộc thiểu số và xử lý ngôn ngữ tự nhiên. Tuy nhiên, sau đó có sự chia tách do việc thành lập Viện Từ điển học và Bách khoa thư do đó đã có sự gián đoạn.

Trong những chuyến công tác ra nước ngoài, tôi thấy lĩnh vực ngữ học điện toán của họ phát triển rất mạnh. Cụ thể như lần đến Posdam (Đức), thăm Khoa Ngôn ngữ học của họ tôi thấy có rất nhiều nhà ngữ học là những chuyên gia rất giỏi về xử lý ngôn ngữ tự nhiên. Trong khi đó, ở Việt Nam chúng ta thì về cơ bản vẫn còn tương đối cổ điển vì chủ yếu mới chỉ nghiên cứu về ngữ âm, từ vựng, ngữ nghĩa… và mới chỉ mang phong cách truyền thống. Song đã đến lúc ngành ngôn ngữ học Việt Nam phải đi vào mũi nhọn này.

Những năm vừa rồi, chúng tôi đã có một số hợp tác. Cá nhân tôi đã cùng với các chuyên gia CNTT như Phương Thái, Lê Anh Cường, Hồ Tú Bảo viết bài về chung về vấn đề này cho tiếng Việt và đã được đăng trên một tạp chí khoa học quốc tế. Những năm gần đây, Viện Ngôn ngữ học đã có hợp tác chính thức với Viện Nghiên cứu Quốc tế về Thông tin Đa phương tiện, Truyền thông và Ứng dụng (MICA) của Đại học Bách khoa Hà Nội về dịch thuật giữa tiếng Kinh và tiếng Mường.

Trước đó nữa, chúng tôi có hợp tác với Viện CNTT thuộc Viện Hàn lâm Khoa học Công nghệ Việt Nam về nhận dạng tiếng nói với tiếng Việt. Và mới đây, cá nhân tôi có tham gia một đề tài với nhóm Socbay về mạng từ. Ngoài ra, tôi cũng tham gia hướng dẫn một số luận án của ngành CNTT về xử lý ngôn ngữ tự nhiên.  

Tuy nhiên, muốn phát triển lĩnh vực này thì cần phải được đầu tư. Vừa rồi, có một Nghị định của Chính phủ thì rất là khó khăn cho các viện nghiên cứu của Nhà nước. Nghị định này bắt sáp nhập các phòng lại, bắt buộc mỗi phòng phải có đủ tối thiểu 5 người. Do đó, muốn xây dựng một phòng riêng về ngôn ngữ học điện toán thì rất khó vì không đủ người. Vì thế, chức năng này đành giao trách nhiệm cho Phòng Ngôn ngữ học Ứng dụng. Có 2 phương án tốt nhất là nhận người bên toán-tin về làm ngôn ngữ hoặc là gửi người về ngôn ngữ đi đào tạo về CNTT.

Như ông đã biết, với sự đóng góp tích cực của Hội Trí thức Khoa học và Công nghệ Trẻ Việt Nam thì Đề án đưa Việt Nam sớm trở thành nước mạnh về CNTT được Chính phủ ban hành cuối năm 2010 đã có ghi 4 chữ “xử lý tiếng Việt” trong nhiệm vụ thứ 6 về nghiên cứu, chế tạo và ứng dụng sản phẩm mới. Tuy nhiên, có thể nói rằng đó mới chỉ là chủ trương chứ đến nay vẫn chưa hề có một chính sách nào của Nhà nước để cụ thể hóa việc đó. Ông nghĩ gì về vấn đề này?

GS TS Nguyễn Văn Hiệp: Sự hợp tác giữa ngôn ngữ học và tin học là vì tương lai đất nước trong thời đại 4.0 ảnh 1 GS TS Nguyễn Văn Hiệp và TS Đặng Minh Tuấn - Trưởng nhóm phần mềm Vietkey, Trưởng ban Hành động vì Ngôn ngữ học, Hội Trí thức Khoa học và Công nghệ Trẻ Việt Nam

-Dù sao chúng ta cũng phải mừng vì trong định hướng phát triển CNTT của đất nước thì Chính phủ đã quan tâm đến ngôn ngữ học. Tuy nhiên, vấn đề này phải được quan tâm một cách toàn diện không chỉ với tiếng Việt mà còn cả các nhu cầu về dịch thuật, Hán Nôm và ngôn ngữ các dân tộc thiểu số. Chúng ta đang nói nhiều đến việc phải quan tâm đến quyền bình đẳng của các dân tộc thiểu số song sẽ là thiếu sót rất lớn nếu không quan tâm, đầu tư cho ngôn ngữ của họ trong môi trường CNTT và Internet. Đây chính là quyền bình đẳng của các dân tộc thiểu số trong thời đại 4.0.

Cũng cần nói thêm, vai trò của Nhà nước ở đây là rất quan trọng vì để xây dựng và ban hành chính sách thì đó là việc của Nhà nước. Tiêu chuẩn cũng phải do Nhà nước ban hành và sản phẩm mẫu muốn có thì cũng phải được Nhà nước đặt hàng.

Việc chưa có được chính sách cụ thể của Nhà nước cho vấn đề này cũng là thực tế không đơn giản bởi các cơ quan có trách nhiệm của Nhà nước muốn làm được thì cũng phải có sự tham gia tư vấn của các chuyên gia ngôn ngữ học và tin học. Vì vậy, chính các chuyên gia của hai lĩnh vực cùng đội ngũ trí thức trẻ có cùng mối quan tâm cần sớm ngồi lại với nhau để giúp Nhà nước xây dựng chính sách cho vấn đề hết sức quan trọng này.

Ông kỳ vọng gì về sự hợp tác giữa của các chuyên gia tin học cho lĩnh vực ngôn ngữ học?

-Bản thân tôi rất kỳ vọng cho sự hợp tác này. Và cũng cần nói thêm là nhân dịp kỷ niệm 50 năm thành lập Viện Ngôn ngữ học mới đây, rất nhiều chuyên gia ngôn ngữ học đầu ngành đã chia sẻ với tôi về việc ngành ngôn ngữ học đã và sẽ phải làm gì trong thời đại cách mạng công nghiệp 4.0. Thậm chí, một chuyên gia ngôn ngữ nay đã rất cao tuổi là GS Hồ Hải Thụy còn nói với tôi rằng, không thể có 4.0 nếu không có sự tham gia của ngôn ngữ học.

Trong thời đại ngày nay, tại các nước phát triển thì rất nhiều trí thức lớn của họ đều dành mối quan tâm lớn đến ngôn ngữ học và CNTT.  Đối với Việt Nam, chúng ta cũng phải đặt vấn đề như vậy. Như tôi đã từng biết, ngay cả một số công ty tin học có tên tuổi có làm những sản phẩm liên quan đến ngôn ngữ song lại sử dụng những lý thuyết ngôn ngữ học đã cũ.

Nguyên nhân vì họ chưa có sự hợp tác chính thức với ngành ngôn ngữ học. Do vậy, sản phẩm do họ nghiên cứu chưa thể thực sự thích ứng với thực tiễn. Chính vì vậy, bản thân ngành ngôn ngữ học mà trong đó có Viện Ngôn ngữ học chúng tôi rất sẵn sàng hợp tác với các đối tác CNTT. Chúng tôi mong muốn có sự quan tâm đầu tư không chỉ của Nhà nước cho những đề tài mang tính liên ngành giữa ngôn ngữ học và CNTT. Ngôn ngữ học và CNTT là những công cụ hữu ích không phải của riêng ai và ai cũng phải sử dụng. Sự hợp tác giữa các chuyên gia ngôn ngữ học và tin học là vì tương lai đất nước này trong thời đại 4.0.

Xin cám ơn ông!