Ngành CNTT còn coi thường yếu tố ngôn ngữ học
Đối với đào tạo CNTT ở bậc đại học tại Việt Nam, nói đến ngôn ngữ thì chỉ có yếu là các thuật ngữ chuyên môn như ngôn ngữ lập trình, ngôn ngữ hình thức. Cũng có một bộ môn thực sự liên quan đến ngôn ngữ học được gọi tên là “xử lý ngôn ngữ tự nhiên” nhưng về cơ bản, đây là nội dung của chương trình sau đại học. Tại các trường đại học phía Bắc, mới chỉ có duy nhất Đại học Bách khoa Hà Nội đã đưa môn “xử lý ngôn ngữ tự nhiên” vào chương trình đại học cách đây cỡ 5 năm. Tuy nhiên, môn học này cũng chỉ mang tính giới thiệu sơ lược về những việc có thể làm chứ còn vào chuyên sâu thì vẫn phải là chương trình sau đại học.
Hẳn nhiều người còn nhớ, vào cuối năm 2002 tại Việt Nam đã nổ ra một cuộc chiến trên công luận giữa mã tổ hợp và mã dựng sẵn cho phông chữ tiếng Việt trên môi trường Unicode 16 bit nhằm thay thế các bộ phông chữ cũ theo tiêu chuẩn 8 bit vốn không thể thống nhất (Trong khuôn khổ bài viết này, chúng tôi chỉ có thể giải thích một cách sơ lược mã dựng sẵn là loại mã mà mỗi phông chữ là toàn bộ hình hài với các ký tự có dấu. Còn mã tổ hợp là tập hợp riêng rẽ của chữ riêng và dấu riêng được ghép vào nhau). Vậy nhưng, trong những điều tra không chính thức tại những trường đại học hàng đầu về CNTT như Đại học Bách khoa Hà Nội, Đại học Quốc gia Hà Nội thì có đến không dưới 50% sinh viên năm cuối ngành CNTT không hề biết gì về mã tổ hợp và mã dựng sẵn của tiếng Việt trên môi trường Unicode mặc dù hàng ngày họ vẫn phải sử dụng để soạn thảo văn bản cho mình. Thậm chí, có em còn không ngần ngại nói rằng không muốn mất thời gian quan tâm đến tiếng Việt vì sau này nếu làm gia công phần mềm cho nước ngoài thì chỉ cần giỏi ngoại ngữ (!).
Không chỉ với sinh viên mà ngay cả với không ít giảng viên đại học của ngành CNTT thì hiểu biết của họ về mối quan hệ với ngôn ngữ học cũng rất hạn chế. Theo TS Ngô Trung Việt – nguyên chuyên viên Viện CNTT thuộc Viện Hàn lâm Khoa học Công nghệ Việt Nam, đây chính là “bóng tối dưới chân cột đèn” không được ai nhìn thấy của ngành CNTT Việt Nam. Trong tiềm thức của các bậc thầy suốt nhiều thế hệ, với họ chỉ nổi lên những bài toán về quản lý, lập trình, phân tích mổ xẻ cấu trúc máy tính… còn yếu tố ngôn ngữ học thì bị xem thường. Có chăng, người ta cũng chỉ dạy lướt qua rất nhanh các kiến thức về các bộ gõ tiếng Việt như Vietkey, Unikey… trong chương trình nhập môn. Với cách dạy và học như vậy, nếu như không có các đối tác bên ngoài đưa vào những buổi hổi thảo chuyên đề về vấn đề này thì không chỉ sinh viên ngành CNTT không biết gì về những việc có thể làm với ngôn ngữ cũng là dễ hiểu cho dù chính họ cũng đang dùng công cụ của Google để dịch tài liệu.
Ngành ngôn ngữ chưa qua ngưỡng
Xuất phát từ đòi hỏi đó, cuối năm 2003 tại Đại học Khoa học Xã hội và Nhân văn Hà Nội lần đầu tiên đã có một hội thảo để đặt vấn đề cho mối quan hệ giữa CNTT và ngôn ngữ học. Hội thảo này được tổ chức theo đề xuất của Ban vận động Thành lập Hội Tin học Trẻ Việt Nam và nhận được sự quan tâm rất lớn của báo chí. Tại diễn đàn này, TS Nguyễn Chí Công – Trưởng ban Khoa học Công nghệ của Hội Tin học Việt Nam khi đó đã nhận định, "còn rất nhiều việc phải làm và tôi hy vọng chính các bạn trẻ sẽ tạo ra bản sắc của CNTT Việt Nam".
Tuy nhiên, cũng rất tiếc là sau cuộc hội thảo nói trên đã không có thêm một diễn đàn nào nữa về vấn đề này cho sinh viên ngành ngôn ngữ học. Còn việc phải có thêm môn học “Ngôn ngữ học Máy tính” trong chương trình đào tạo của ngành ngôn ngữ học thì cũng phải tới 2008 mới được thực hiện với sự tham gia của các giảng viên CNTT đã từng có những nghiên cứu về lĩnh vực này. Sau này, kể từ năm 2014 có một chuyên gia của Viện Ngôn ngữ học là TS Phạm Hiển sau khi tu nghiệp ở nước ngoài đảm nhận môn học này. Tuy nhiên, với chỉ có 2 đơn vị học trình (30 tiết) thì rất khó có thể “thắp lửa” cho sinh viên để đào sâu kiến thức về lĩnh vực hoàn toàn mới mẻ này.
Dẫu vậy, đến năm 2009 ở Khoa Ngôn ngữ học cũng có được duy nhất 1 sinh viên làm tốt nghiệp về định hướng này với sự giúp đỡ của các chuyên gia tin học. Tuy nhiên, không hiểu vì lý do gì mà các bậc thầy ở đây đã không chính thức thừa nhận TS Quách Tuấn Ngọc – Cục trưởng Cục CNTT Bộ Giáo dục và Đào tạo khi đó là thầy hướng dẫn mà chỉ coi là đề tài này là do sinh viên tự nghiên cứu (?). Kết quả là sinh viên này chỉ được hội đồng chấm thi tốt nghiệp cho điểm 8 trong khi bản thân em phải nỗ lực hơn rất nhiều so với các bạn bè cùng trang lứa vốn chỉ thực hiện các đề tài có sẵn. Tuy nhiên, sau đó sinh viên này đã được tuyển dụng vào làm việc tại Viện Ngôn ngữ học song cũng không tiếp tục nghiên cứu về CNTT mà chỉ chuyên tâm vào ngôn ngữ ký hiệu.
TS Phạm Hiển cho biết, dù sao CNTT cũng là một định hướng quá khó với sinh viên ngành ngôn ngữ. Vì thế, mỗi năm và thậm chí vài ba năm mà có được dù chỉ 1 sinh viên theo đuổi định hướng này thì cũng là rất thành công rồi.
Đôi điều về tương lai
Dẫu sao thì điều đáng mừng là Đại học Bách khoa Hà Nội đã đi đầu trong việc đưa môn học “xử lý ngôn ngữ tự nhiên” vào chương trình đào tạo chính thức hơn 5 năm và hy vọng các trường khác cũng ý thức được điều này để chính thức cập nhật. Tuy nhiên, theo TS Quách Tuấn Ngọc, vấn đề tồn tại duy nhất với ngành giáo dục chứ không chỉ ở bậc đại học chính là thiếu người lãnh đạo đủ tầm. Còn mọi thứ khác như cơ sở vật chất, đường truyền Internet cao tốc thì không cần phải bàn.
Cũng cần nói thêm là chúng ta đang bước vào Cách mạng Công nghiệp 4.0 và trong cuộc cách mạng này thì chắc chắn là không ai đợi ai. Chính các khoa CNTT cũng phải định hướng cho sinh viên về những định hướng liên quan đến ngôn ngữ vì có rất nhiều việc phải làm như nhận dạng tiếng nói, hỏi đáp thông minh, công nghệ dịch thuật, tổng hợp văn bản… Nếu định hướng này, chính các sinh viên ngành CNTT sẽ góp phần “truyền lửa” cho sinh viên ngành ngôn ngữ bởi chắc chắn, họ sẽ phải cần đến nhau cho những công việc chung.