Đến máy tính cũng gặp khó khăn khi học tiếng Trung Quốc

Bạch Đằng

29/07/2017 14:45

Các nhà nghiên cứu thường gọi 2017 là năm máy tính đàm thoại ở Trung Quốc. Gã khổng lồ thương mại điện tử Alibaba và công ty tìm kiếm Baidu vừa phát triển công nghệ để tạo ra sự đột phá trong giao tiếp bằng giọng nói. Các sản phẩm với công nghệ thoại đặc biệt của Baidu và Alibaba phát triển hiện đang có mặt tại thị trường Trung Quốc.

Trợ lý giọng nói của Alibaba – AliGenie – được phát triển tương tự như Alexa trên Amazon Echo. Nó có thể đặt hàng trực tuyến, kiểm tra thời tiết, chơi nhạc yêu thích và điều khiển các thiết bị thông minh khác trong nhà thông qua các lệnh thoại.

Nền tảng đàm thoại DuerOS của Baidu đã được thêm vào như là một tính năng trong các sản phẩm như robot trợ lí, một hộp set-top box và một điện thoại thông minh HTC. Nó có các chức năng tương tự như AliGenie và các trợ lý giọng nói khác, cũng như khả thực hiện cuộc trò chuyện ngẫu nhiên (dù còn khá thô sơ). Công ty cho biết họ đã nhận được nhiều đơn đặt hàng cho bộ công cụ DuerOS.

Kun Jing, tổng giám đốc đơn vị kinh doanh Duer của Baidu, hy vọng sẽ có thêm nhiều công ty tham gia vào lĩnh vực này trong năm nay. Niềm tin này một phần xuất phát từ sự thành công của các sản phẩm như Echo ở thị trường Mỹ (chính điều này đã thu hút sự quan tâm của các công ty công nghệ Trung Quốc).

Công ty nghiên cứu IDC dự đoán rằng đến năm 2020, 51% ngành công nghiệp lái xe thông minh và 68% ngành công nghiệp điện thoại di động, thiết bị đeo ở Trung Quốc sẽ có một hệ thống trò chuyện dựa trên AI. Các giao diện thoại sẽ tương tác một cách tự nhiên hơn và thu hút nhiều người hơn vào thế giới kết nối (theo Jing, người giám sát sự phát triển của DuerOS).

Máy tính dựa trên giọng nói là một lựa chọn tốt cho Trung Quốc. Ngày nay, việc gõ tiếng Trung trên một bàn phím QWERTY điển hình dựa vào một hệ thống được gọi là "pinyin" – nó được phát triển dựa trên các phát âm của các chữ cái nhưng vì có 4 tông giọng theo tiếng Quan Thoại và mỗi chữ có ý nghĩa khác nhau nên người dùng phải lựa chọn đúng chữ mình cần (theo cách phát âm). Một âm tiết phổ biến như "yi" có thể tương ứng với 60 hoặc nhiều hơn các ký tự được sử dụng phổ biến tại Trung Quốc.

Một số phương pháp nhập liệu có thể ưu tiên cho chữ có nhiều khả năng nhất theo ngữ cảnh, nhưng chúng không phải lúc nào cũng chính xác. Không quá ngạc nhiên khi người dùng các công nghệ di động (ví dụ như ứng dụng WeChat) lại có xu hướng để lại tin nhắn thoại, chứ không phải bằng văn bản được gõ như ở Mỹ.

Máy tính cũng gặp khó khăn khi học tiếng Trung Quốc

Ở Trung Quốc ngày nay, công nghệ trợ lý giọng nói hoạt động bằng cách chuyển lệnh thoại của người dùng sang văn bản và tạo ra một phản hồi dựa trên ý nghĩa của văn bản. Quá trình này hoạt động khá tốt đối với các lệnh dựa trên nhiệm vụ, ví dụ như kiểm tra tiếng Anh hay tìm bản dịch sang tiếng Anh của một từ tiếng Trung cụ thể. Tuy nhiên, điều này khó lòng duy trì liên tục qua các cuộc trò chuyện được thay đổi chủ đề liên tục.

Giải quyết vấn đề đàm thoại cho máy tính đòi hỏi phải vượt qua một số thử thách đầy phức tạp của ngôn ngữ Trung Quốc. Ví dụ, ở Trung Quốc, các chữ giống nhau được sắp xếp theo thứ tự khác nhau sẽ có nghĩa khác nhau. Tuy nhiên, vẫn có những trường hợp sắp xếp theo cùng một thứ tự lại có ý nghĩa khác nhau phù hợp với chữ trước hoặc sau nó. Ngoài ra, văn bản Trung Quốc không có khoảng trống phân chia từ như tiếng Anh.

Vì vậy, các nhà nghiên cứu ngôn ngữ tự nhiên của Trung Quốc phải tạo ra các thuật toán để chèn vào các khoảng trống nhằm tạo ra ý nghĩa đúng đắn khi kết hợp các chữ với nhau. Trong tiếng Trung Quốc cũng không có hình thức phân chia đặc biệt như thì hiện tại, tương lai hay quá khứ, điều này làm cho máy móc khó khăn trong việc giải mã thời gian của một chuỗi sự kiện.

Các nhà nghiên cứu cũng đang phải đối phó với những thách thức khác như: có nhiều tiếng địa phương tồn tại, một số trong đó không thể hiểu được lẫn nhau và cùng một biểu hiện có thể có nghĩa là những thứ khác nhau trong các ngữ cảnh khác nhau.

Zhiyong Wu, giáo sư tại Đại học Tsinghua, người đã có nhiều kinh nghiệm nghiên cứu về ngôn ngữ tự nhiên của Trung Quốc nói rằng để máy tính thực sự hiểu ý định của một người nói và giao tiếp một cách thích hợp thì nó cần tiếp nhận những thông tin tinh vi như ngữ điệu. Chúng cũng sẽ phải hiểu những cảm xúc bởi vì việc đưa ra quyết định của con người không chỉ dựa trên logic.

Theo Technologyreview, để làm cho hệ thống của mình trở nên thông minh hơn, Baidu giới thiệu mô hình "huấn luyện viên" (trainer) trên nền tảng của họ trong năm nay để cho phép các nhà phát triển phần mềm đóng góp dữ liệu ngôn ngữ theo thời gian thực thông qua một bot chú thích gắn liền. Bot này nhận được thông tin phản hồi của nhà phát triển (như lời giải thích của một truy vấn hệ thống mà lần đầu tiên nó không hiểu), học hỏi từ đó và sau đó sửa chữa hệ thống.

Một lợi thế mà các nhà nghiên cứu Trung Quốc khi họ cố gắng giải quyết những vấn đề này là một lượng lớn dữ liệu. Mạng thần kinh nhân tạo (Neural Networks) làm nền tảng cho sự hiểu biết ngôn ngữ của các máy tính ngày nay đòi hỏi số lượng lớn dữ liệu để đào tạo. Dữ liệu càng nhiều thì hệ thống thần kinh nhân tạo càng nhanh chóng trưởng thành, bởi vậy những công ty như Alibaba hay Baidu có lợi thế khi sở hữu một cơ sở người dùng rộng lớn. Tính đến cuối năm 2016, Baidu cho biết họ có 665 triệu người dùng di động hàng tháng và vào tháng 3 năm nay, Alibaba đã có 507 triệu người dùng di động hàng tháng.

Nhưng Gang Wang, một nhà khoa học thuộc Phòng thí nghiệm của Alibaba Lab cho biết các nhà nghiên cứu sẽ phải thiết kế mạng thần kinh nhân tạo không cần nhiều dữ liệu nhưng lại hiệu quả hơn trong việc học tập ngôn ngữ. Ông lưu ý rằng, trong thế giới thực, mọi người thể hiện ý nghĩa tương tự theo những cách khác nhau, và không thể dạy cho máy tính mọi biểu hiện khả dĩ.

Với vai trò là nhà nghiên cứu học thuật, ông và các đồng nghiệp đã đưa ra phương pháp giảng dạy cho máy tính hiểu một chủ đề khi có rất ít dữ liệu, đó là sử dụng dữ liệu từ các chủ đề có liên quan. Ví dụ, để đào tạo một mạng lưới thần kinh hiểu các vấn đề trong y học thể thao, bạn có thể rút ra dữ liệu từ thể thao và dữ liệu từ y học. Cách tiếp cận này không tốt bằng cách sử dụng các dữ liệu hữu cơ nhưng có cũng có thể giúp hệ thống hiểu rõ được một chủ đề với lượng dữ liệu ít mà nó được cung cấp.

Theo Chenfeng Song, người sáng lập ra Ainemo, điều tạo ra một trợ lí AI thành công tại Trung Quốc là nội dung và dịch vụ của. Đây chính là khởi điểm để công ty bán ra robot trợ giúp bằng giọng nói được gọi là Little Fish vào đầu tháng Sáu vừa qua. Song có kế hoạch để dần dần xây dựng các chương trình giáo dục và chăm sóc sức khỏe dựa vào trợ lí của công ty ông. Little Fish sử dụng nền tảng đàm thoại DuerOS. Lệnh thoại (Voice) là một cách rất tốt để phân phối nội dung cho những người không thể truy cập Internet thông qua máy tính để bàn và điện thoại thông minh, đặc biệt là trẻ em và người lớn tuổi.

Theo Tạp chí Diễn đàn đầu tư

http://vnreview.vn/tin-tuc-khoa-hoc-cong-nghe/-/view_content/content/2229387/den-may-tinh-cung-gap-kho-khan-khi-hoc-tieng-trung-quoc

Từ khoá:

phần mềm công nghệ máy tính online người dùng ứng dụng di động thiết bị

Tin nổi bật

Thu hút, trọng dụng nhân tài trong kỷ nguyên vươn mình của dân tộc E-magazine

Thu hút, trọng dụng nhân tài trong kỷ nguyên vươn mình của dân tộc: “Cứ thực tâm trọng dụng, nhân tài khắc sẽ xuất hiện” E-magazine

Nhiều người gặp khó khi xác thực sinh trắc học, chuyên gia và ngân hàng nói gì?

Có thể bạn quan tâm

Liệu Apple có bỏ lỡ thị trường điện thoại gập?

VietTimes – Cho đến nay, Apple dường như không mấy quan tâm đến việc tham gia xu hướng thị trường điện thoại gập đầy béo bở này.

Google ra mắt máy tính bảng Pixel đi kèm với dock sạc không dây độc đáo

VietTimes – Chiếc máy tính bảng của Google có cấu hình rất mạnh mẽ và mức giá hợp lý.

Google Pixel Fold ra mắt với thiết kế nhỏ gọn, chip Tensor G2

VietTimes – Thông tin về mẫu smartphone gập của Google đã rò rỉ một thời gian và hôm nay nó đã chính thức ra mắt công chúng.

Lệnh trừng phạt chip của Hoa Kỳ khiến các doanh nghiệp Trung Quốc tìm đến các kỹ thuật sáng tạo

VietTimes – Các công ty Trung Quốc bao gồm Alibaba, Baidu và Huawei đang nghiên cứu các kỹ thuật để đạt được mức độ hiệu quả của AI mà không cần sử dụng chip tiên tiến.

Sản xuất bảng mạch tại Ấn Độ. Ảnh Tech Wire Asia

Ấn Độ thực hiện kế hoạch trở thành trung tâm cung cấp linh kiện bán dẫn hàng đầu thế giới

VietTimes – Ấn Độ đang hiện thực hóa tham vọng trở thành một trong những quốc gia dẫn đầu toàn cầu trong ngành công nghiệp bán dẫn bằng giải pháp hỗ trợ đầu tư, xây dựng các nhà máy sản xuất chip ở đất nước này.

Nhập khẩu chip của Trung Quốc giảm mạnh trong 3 tháng đầu năm

VietTimes – Trong ba tháng đầu năm, Trung Quốc đã nhập khẩu chip với tổng giá trị lần lượt là 14,6 tỉ USD và 30,6 tỉ USD từ Hàn Quốc và Đài Loan, giảm 35,1% và 23,6% so với cùng kỳ năm ngoái.

Trung Quốc bắt giữ người đàn ông bị cáo buộc dùng ChatGPT để lan truyền tin giả

VietTimes – Nghi phạm được cho là đã sử dụng ChatGPT để tạo một báo cáo không có thật về một vụ tai nạn tàu hỏa, sau đó anh ta đăng lên mạng để kiếm lời.

Thứ trưởng Bộ KHCN Trần Văn Tùng phát biểu tại diễn đàn

Xây dựng hệ sinh thái khởi nghiệp đổi mới sáng tạo vùng đồng bằng sông Hồng

VietTimes – Ngày 11/5, Diễn đàn cao cấp về xây dựng hệ sinh thái khởi nghiệp đổi mới sáng tạo vùng đồng bằng sông Hồng đã được Liên đoàn Thương mại và Công nghiệp Việt Nam, Bộ Khoa học và Công nghệ và UBND tỉnh Nam Định tổ chức.

Các diễn giả tham gia buổi tọa đàm và sự kiện công bố chương trình tặng giải pháp văn phòng số cho 10.000 doanh nghiệp

10.000 doanh nghiệp sẽ được tặng bộ giải pháp văn phòng số MISA AMIS để tối ưu hóa vận hành

VietTimes – Đây là chương trình do Công ty cổ phần MISA thực hiện nhằm hỗ trợ các doanh nghiệp chuyển đổi số, thay đổi phương thức vận hành để tối ưu chi phí, gia tăng năng suất.

Thượng tá Đào Xuân Vũ chính thức giữ vị trí Chủ tịch Hội đồng quản trị Viettel Global từ ngày 5/5

Tân Chủ tịch Hội đồng quản trị Viettel Global là ai?

VietTimes – Ông Đào Xuân Vũ vừa được bổ nhiệm vào vị trí Chủ tịch Hội đồng quản trị Viettel Global thay cho bà Nguyễn Thị Hải Lý.

Người dùng dần mất niềm tin vào iPhone

VietTimes – PerfectRec đã phân tích 669.000 đánh giá của người dùng và nhận thấy xếp hạng hài lòng của iPhone 14 thấp hơn 8 điểm phần trăm so với iPhone 13.

Dòng máy iPhone 16 sẽ được nâng cấp kích thước màn hình

VietTimes – Các mẫu iPhone 16 Pro và iPhone 16 Pro Max ra mắt vào năm 2024 sẽ có kích thước màn hình lần lượt là 6,3 inch và 6,9 inch.

Máy tính bảng Samsung thất thế trước Apple (Ảnh: Gizmochina)

Samsung thất thế trước Apple trong cuộc đua máy tính bảng

VietTimes – Sự cạnh tranh trong lĩnh vực máy tính bảng đang diễn ra với thắng lợi áp đảo của Apple.

Samsung Galaxy Watch 6 ra mắt tính năng theo dõi nhịp tim được FDA chấp thuận

VietTimes – Samsung đã thông báo rằng dòng Galaxy Watch 6 sắp ra mắt của họ sẽ có tính năng theo dõi nhịp tim được FDA phê chuẩn.

Sử dụng Internet thường xuyên có thể làm giảm nguy cơ mất trí nhớ

VietTimes – Một nghiên cứu được công bố trên Tạp chí của Hiệp hội Lão khoa Hoa Kỳ cho thấy những người lớn tuổi thường xuyên sử dụng internet sẽ có tỷ lệ mắc chứng mất trí nhớ thấp hơn đáng kể.

Do Kwon đối mặt với bản án 40 năm tù

VietTimes – Do Kwon, người đồng sáng lập Terraform Labs, là kẻ chủ mưu đằng sau các loại tiền kỹ thuật số TerraUSD và Luna đã gây thiệt hại 40 tỉ USD cho rất nhiều nhà đầu tư.

Google và Samsung hợp tác để giải quyết một trong những vấn đề khó chịu nhất của Android (Ảnh: Gizmochina)

Google hợp tác với Samsung giải quyết một trong những vấn đề khó chịu nhất của Android

VietTimes – Mặc dù Android được phát triển bởi Google nhưng nó thường được tùy chỉnh bởi các nhà sản xuất điện thoại thông minh.

Google có kế hoạch nâng cấp công cụ tìm kiếm bằng AI Chat

VietTimes – Google được cho là đang lên kế hoạch nâng cấp đáng kể cho công cụ tìm kiếm nổi tiếng của mình.

Ông Adrian Hia - Giám đốc Điều hành (phải) và ông Ernest Chai - Giám đốc kênh phân phối của Kaspersky APAC.

2 sếp mới của Kaspersky khu vực châu Á – Thái Bình Dương là ai?

VietTimes – Công ty An ninh mạng và Quyền riêng tư số Kaspersky vừa bổ nhiệm hai vị trí quan trọng cho hoạt động tại khu vực châu Á – Thái Bình Dương (APAC): ông Adrian Hia - Giám đốc Điều hành và ông Ernest Chai - Giám đốc kênh phân phối.

Thể thao điện tử Việt Nam nhận huy chương vàng đầu tiên tại SEA Games 32.

Thể thao điện tử Việt Nam có huy chương vàng đầu tiên tại SEA Games 32

VietTimes – Chiều ngày 9/5, đội tuyển Thể thao điện tử Quốc gia Việt Nam đã vượt qua đội tuyển Thể thao điện tử Quốc gia Indonesia để đoạt ngôi quán quân tại nội dung đồng đội nam bộ môn Crossfire (Đột kích). Đây là huy chương vàng đầu tiên của thể thao điện tử Việt Nam tại SEA Games 32.