Phát triển CNTT: Không thể coi thường những điều tưởng như đơn giản

VietTimes -- Việt Nam đang đặt ra không ít mục tiêu cho phát triển CNTT. Tuy nhiên, không ít thực tế tưởng chừng đơn giản lại dường như bị coi thường. Khi Việt Nam bắt đầu hội nhập quốc tế với việc sử dụng bảng mã Unicode mà font chữ tiếng Việt được chứa đựng trong đó thì phân nửa sinh viên của các trường đại học hàng đầu về CNTT lại dường như không trả lời được về mã dựng sẵn và mã tổ hợp của tiếng Việt trong Unicode. 

Một hội thảo về CNTT và tiếng Việt. Ảnh: PC World Vietnam

Một hội thảo về CNTT và tiếng Việt. Ảnh: PC World Vietnam

Giống như nhiều quốc gia khác, ngay từ khi máy vi tính mới xuất hiện thì một trong những công việc đầu tiên của các chuyên gia tin học trong nước cùng cộng đồng tin học ở hải ngoại là phải đưa được tiếng Việt vào máy tính. Lúc đầu là lợi dụng bảng mã ASCII tiêu chuẩn 8 bit với các font chữ riêng được đưa vào phần mã mở rộng của bảng mã này. Và thực tế nảy sinh là có đến trên 40 bộ mã khác nhau với tiếng Việt do nhiều nhóm chuyên gia xây dựng dẫn đến thực tế khó chuyển đổi khi hoán đổi dữ liệu với nhau. 

Vào những năm 2000, quốc tế chuyển sang dùng mã Unicode với độ rộng 16 bit cho phép nhiều ngôn ngữ cùng có chỗ đứng bình đẳng. Với tiếng Việt, có 2 giải pháp là mã dựng sẵn với một mã tương ứng với một ký tự có dấu hoặc không có dấu, hoặc là mã tổ hợp với 1 byte cho ký tự cơ bản và 1 byte còn lại cho dấu. Nhiều cuộc tranh luận sôi nổi giữa 2 loại mã này vì thế đã diễn ra sôi nổi khiến báo chí tốn nhiều giấy mực. Tuy nhiên, theo một cuộc điều tra không chính thức tại 2 trường đại học hàng đầu về CNTT ở Hà Nội thì có đến không dưới 50% sinh viên không biết gì về chuyện này. 

Theo TS Ngô Trung Việt - nguyên chuyên viên Viện CNTT thuộc Viện Hàn lâm KHCN Việt Nam, mối quan hệ giữa CNTT và ngôn ngữ chính là "bóng tối dưới chân cột đèn" không được ai nhìn vào. Không nên trách sinh viên không biết gì về chuyện đó mà lỗi ở đây thuộc về chính các bậc thầy của họ bởi trong tiềm thức của không ít người chỉ nổi lên những bài toán về quản lý và coi thường những thực tế tưởng chừng đơn giản. 

Tuy nhiên, thực trạng này cần phải được cải thiện bởi rộng ra với tiếng Việt trên máy không chỉ là các hệ soạn thảo mà còn cả nhận dạng văn bản, nhận dạng tiếng nói, hỏi đáp thông minh, hỗ trợ dịch thuật... Đã có ý kiến đề nghị ngành CNTT nên nhìn vào ngành âm nhạc bởi nhạc jazz rất buồn tẻ vì chỉ chơi trong đúng 7 nốt nhạc cơ bản nhưng những người trong ngành âm nhạc, dường như không có ai dám coi thường nhạc jazz. Vì thế, trước hết là các bậc thầy của ngành CNTT phải nhìn nhận lại chính mình trong những giảng dạy, nghiên cứu cho đòi hỏi tối thiểu này.