Theo TS Nguyễn Ái Việt - nguyên Viện trưởng Viện CNTT ĐHQG Hà Nội, so với các lĩnh vực khác về CNTT, số lượng các chuyên gia về xử lý ngôn ngữ tự nhiên dường như khiêm tốn hơn rất nhiều, song công việc của họ là rất cần thiết cho đất nước. Đáng mừng là trong Đề án đưa Việt Nam sớm trở thành nước mạnh về CNTT được Chính phủ ban hành cuối năm 2010 đã ghi rõ một tiểu nhiệm vụ là "xử lý tiếng Việt". Nhiệm vụ này cần được hiểu theo nghĩa rộng là đã bao gồm cả với công nghệ dịch thuật, Hán - Nôm, ngôn ngữ của các dân tộc thiểu số... chứ không riêng gì với tiếng Việt.
Còn theo TS Đặng Minh Tuấn - trưởng nhóm phần mềm VietKey, những công việc còn phải làm là rất nhiều và chỉ riêng với ngôn ngữ các dân tộc thiểu số thì rất cần một đề tài cấp nhà nước để số hóa tất cả các ngôn ngữ và đăng ký chữ cái của các dân tộc vào bảng mã Unicode quốc tế vì đó là quyền bình đẳng của các dân tộc thiểu số trong thời đại CNTT. Được biết, Vietkey và Viện Ngôn ngữ học thuộc Viện Hàn lâm Khoa học Xã hội Việt Nam đang xúc tiến triển khai định hướng này và những nghiên cứu trước đó của các chuyên gia ngôn ngữ học sẽ là những tiền đề hết sức quan trọng.
Tại kỳ họp mới đây của Quốc hội, công nghệ nhận dạng tiếng nói đã được ứng dụng thử nghiệm. Nhờ có công nghệ này, phát biểu của các đại biểu được máy tính chuyển ngay thành văn bản và giảm thiểu được rất nhiều công sức cho đội ngũ thư ký của các phiên họp - ông Trịnh Thái Anh, chuyên viên Trung tâm Thông tin Văn phòng Quốc hội cho biết.
Chính vì những thực tế đó, việc tập hợp các chuyên gia về xử lý ngôn ngữ tự nhiên trong toàn quốc để thực hiện một sứ mạng chung là hết sức cần thiết. TS Nguyễn Ái Việt cho biết, vẫn còn quá sớm để bàn đến việc thành lập một hiệp hội riêng cho lĩnh vực này bởi số lượng chuyên gia và các đơn vị nghiên cứu triển khai về xử lý ngôn ngữ tự nhiên là không nhiều. Chính vì vậy, trước mắt thì cộng đồng này chỉ nên hoạt động dưới hình thức câu lạc bộ và mong muốn chung của những người trong cuộc là tổ chức của họ sẽ là hội viên tập thể của Hội Truyền thông Số Việt Nam.