Hợp tác tin học và ngôn ngữ học: Những bước đi đầu tiên (Bài 1)

VietTimes – Ngày nay ở Việt Nam đã xuất hiện rất nhiều sản phẩm CNTT cho tiếng Việt của các chuyên gia tin học. Tuy nhiên, theo TS Nguyễn Chí Công – nguyên Trưởng ban Khoa học Công nghệ của Hội Tin học Việt Nam, để có thể có được những sản phẩm hoàn chỉnh thì phải có sự hợp tác toàn diện giữa hai ngành tin học và ngôn ngữ học. 
Rất ít hội thảo có sự tham gia của cả hai giới tin học và ngôn ngữ học trong suốt nhiều năm qua
Rất ít hội thảo có sự tham gia của cả hai giới tin học và ngôn ngữ học trong suốt nhiều năm qua

Những bước đi đầu tiên

Ngay khi máy vi tính xuất hiện ở Việt Nam, một trong những công việc đầu tiên mà các chuyên gia tin học lao vào làm là xây dựng các hệ soạn thảo cùng phông chữ tiếng Việt để đưa vào máy tính. Theo nhận xét của cố giáo sư Hoàng Phê – Chủ tịch đầu tiên của Hội Ngôn ngữ học Việt Nam, trong lĩnh vực này thì đầu tiên các chuyên gia tin học phải nghiên cứu ngôn ngữ để hoàn thiện sản phẩm của mình. Sau đó, đến lượt các nhà ngôn ngữ phải lao vào nghiên cứu CNTT để có thể cùng hợp tác cho các sản phẩm cao cấp hơn. Tuy nhiên theo ông, suốt nhiều năm qua dường như thiếu một chủ trương, chính sách của Nhà nước cho vấn đề hết sức quan trọng này. Vì thế, mọi việc mới chỉ dừng ở thực tế là tôi có việc này cần anh hoặc anh có việc kia để tôi có thể tham gia.

Theo TS Quách Tuấn Ngọc – tác giả hệ soạn thảo BKED, khi xây dựng sản phẩm này, ông đã chủ động gặp gỡ các chuyên gia ngôn ngữ và các lĩnh vực khác có liên quan. Còn với các nhà ngôn ngữ học, bản thân họ cũng nhận thấy sự cần thiết phải sử dụng CNTT cho những nghiên cứu của mình. Đơn cử như việc biên soạn từ điển, bớt đi một từ thì không có vấn đề gì nhưng thêm vào một từ thì quả là không đơn giản vì đã là từ điển thì các từ trong đó phải luôn được sắp xếp theo đúng thứ tự bảng chữ cái. Chính vì lý do đó, GS Hoàng Phê đã hợp tác với TS Quách Tuấn Ngọc để ứng dụng CNTT cho cuốn từ điển vần tiếng Việt của ông. Sau khi hoàn thành công trình, nhận thấy CNTT đóng một vai trò quá lớn nên GS Hoàng Phê đã đề nghị TS Quách Tuấn Ngọc cùng đứng tên nhưng ông Ngọc đã từ chối vì sự hợp tác này đã trở nên quá giá trị cho không chỉ sản phẩm BKED mà ông theo đuổi hồi đó. Tuy nhiên, do quá bận công việc phụ trách CNTT của Bộ Giáo dục và Đào tạo theo lời mời của Bộ trưởng Trần Hồng Quân nên BKED chỉ dừng lại ở soát lỗi chính tả đơn âm.

Hợp tác tin học và ngôn ngữ học: Những bước đi đầu tiên (Bài 1) ảnh 1
Phải có sự hợp tác toàn diện giữa hai ngành tin học và ngôn ngữ học. 

Còn với TS Phạm Hồng Quang, việc lao vào lĩnh vực này cũng chỉ vì một lời thách đố của các đồng nghiệp, ông đã đặt mục tiêu là phải xử lý được việc soát lỗi chính tả đa âm tiết. Để làm được việc đó, đương nhiên việc phải làm là đưa vào máy tính một bộ từ điển chính tả chuẩn để có thể đối chiếu tự động. Và đó chính là bộ từ điển của GS Hoàng Phê. Tuy nhiên, chỉ như thế thì chưa đủ vì vấn đề quan trọng hơn là phải tìm ra được quy luật cho việc soát lỗi chính tả đa âm tiết. Cũng qua những trao đổi với GS Hoàng Phê, ông Quang nhận ra điểm mấu chốt với tiếng Việt là nói ngọng thì người nghe vẫn hiểu. Vì thế, việc soát lỗi chính tả phải thực hiện từ đuôi lên đầu. Không dừng lại ở đó, sản phẩm CadPro Office của ông Quang còn phát triển đến cả việc Việt hóa giao diện với các phần mềm nước ngoài. Cách làm của CadPro Office là đọc các thuật ngữ trên giao diện rồi chuyển đổi sang tiếng Việt với những từ đã có trong từ điển. Còn những từ chưa có trong từ điển thì người sử dụng phải chủ động cập nhật vào. Như thế, với CadPro Office chỉ cần một cái click chuột thì toàn bộ giao diện từ tiếng Anh sẽ chuyển sang tiếng Việt và ngược lại. Về cách làm này của mình, ông Quang cho biết là hoàn toàn không vi phạm bản quyền với hệ điều hành Windows và bộ phần mềm văn phòng Office của Microsoft. Tuy nhiên, theo nhiều ý kiến thì tuy CadPro không vi phạm nhưng người sử dụng CadPro Office thì chắc chắn đã gián tiếp vi phạm bản quyền với Microsoft.

Nhận xét về sự vào cuộc của các chuyên gia tin học với tiếng Việt, TS Tạ Quang Nghĩa – nguyên Phó Cục trưởng Cục Tin học hóa, Bộ Thông tin và Truyền thông khẳng định, lịch sử ngành ngôn ngữ học Việt Nam phải ghi công các chuyên gia tin học. Chính họ đã làm ra một bước chuyển ngoạn mục của ngành ngôn ngữ trong thời đại CNTT.

Như hai mặt của một tờ giấy

Theo Luật Công nghệ Thông tin chính thức có hiệu lực năm 2005, bản quyền nội dung phải được tách khỏi bản quyền phần mềm. Tuy nhiên, việc này bước đầu chỉ có thể làm được với từ điển điện tử. Và có thể nói, với sản phẩm từ điển của Lạc Việt thì tuy công ty này vẫn lớn tiếng nói rằng họ bị vi phạm bản quyền nhưng cũng cần phải nhìn nhận lại là bản quyền nội dung chắc chắn không phải là của họ. Nhận xét về chuyện này, TS Dương Kỳ Đức – nguyên Tổng thư ký Hội Ngôn ngữ học Việt Nam cho biết, trong lĩnh vực xuất bản thì từ điển chính là loại sách bị “đạo” nhiều nhất, thậm chí “đạo” luôn cả các chỗ sai. Vì thế, việc các công ty tin học coi bản quyền từ điển điện tử mà họ làm ra là của riêng mình cũng là điều dễ hiểu.

Cũng theo TS Dương Kỳ Đức, trong thời đại CNTT thì với bất cứ quốc gia nào, CNTT và ngôn ngữ học là không thể tách rời như hai mặt của một tờ giấy. Song ông cũng không khỏi buồn vì trong suốt nhiều năm qua, số lượng các chuyên gia ngôn ngữ chủ động hợp tác với ngành CNTT là hết sức ít ỏi. Ngành ngôn ngữ học ở Việt Nam đã lâm vào thế gần như đứng ngoài cuộc trước những sự vận động của CNTT và gần như không có tiếng nói chính thức trong rất nhiều năm.

Còn theo GS TS Trần Trí Dõi – nguyên Chủ nhiệm Khoa Ngôn ngữ học của Trường Đại học Khoa học Xã hội và Nhân văn Hà Nội, thực tế mà ông được biết ở một số nước trong khu vực như Thái Lan, Malaysia… các chuyên gia ngôn ngữ học được mời làm việc chung trong một môi trường với tin học. CNTT là người ra yêu cầu, còn ngôn ngữ học phải trả lời cho những yêu cầu đó. Thế nhưng ở Việt Nam thì đâu phải cứ muốn ra là ra, muốn vào là vào, nhất là hoạt động khoa học này về cơ bản là tiêu tiền của Nhà nước. Tuy nhiên, theo một số ý kiến của các chuyên gia tin học, tại sao trong suốt nhiều năm dù biết điều bất cập đó mà những người như ông Dõi không lên thẳng Ban chỉ đạo Quốc gia về CNTT cùng Bộ Khoa học và Công nghệ mà chất vấn, yêu cầu với các nhà quản lý? 

Xem tiếp: