Thời đại của trí tuệ nhân tạo (P.2): Nghiên cứu tiếng Việt vì người Việt

(VOH) - Phòng thí nghiệm Trí tuệ nhân tạo thực hiện các nghiên cứu tiên phong về trí tuệ nhân tạo gắn với tiếng Việt, phục vụ người Việt, đưa Cuộc cách mạng công nghiệp 4.0 đến gần hơn với mọi người.

Ra đời từ năm 2008, Phòng thí nghiệm Trí tuệ nhân tạo (AILAB), thuộc trường Đại học Khoa học tự nhiên - Đại học Quốc gia thành phố Hồ Chí Minh kiên trì theo đuổi sứ mệnh duy nhất, đó là thực hiện các nghiên cứu tiên phong về trí tuệ nhân tạo gắn với tiếng Việt, phục vụ người Việt, đưa Cuộc cách mạng công nghiệp 4.0 đến gần hơn với mọi người.

Nghe bài viết:

Trí tuệ nhân tạo, công nghiệp 4.0,  Đại học Khoa học tự nhiên, Đại học Quốc gia thành phố Hồ Chí Minh

Phòng thí nghiệm Trí tuệ Nhân tạo, Trường ĐH Khoa học Tự nhiên TP.HCM (Ảnh: Ailab)

Phòng thí nghiệm trí tuệ nhân tạo, với kinh phí đầu tư ban đầu khoảng gần 7 tỷ đồng từ ngân sách Đại học Quốc gia thành phố Hồ Chí Minh, đang nghiên cứu các lĩnh vực bao gồm: các phương pháp học máy tiên tiến; xử lý ngôn ngữ nói tiếng việt; giao tiếp người – máy; Robotics và IoT; công nghệ giáo dục và y tế. “Đứa con tinh thần” trẻ nhất vừa mới ra mắt, đó chính là trang tìm kiếm Gia sư trực tuyến. Vnu Tutor là website chính thức của Đại học Quốc gia thành phố Hồ Chí Minh dành cho sinh viên tìm việc dạy thêm, hoàn toàn miễn phí.

Với quy mô đào tạo hơn 60.000 sinh viên đại học chính quy, trang web hy vọng có thể hỗ trợ sinh viên trong tìm kiếm công việc gia sư hoàn toàn miễn phí. Ngoài ra, trang web còn giúp các phụ huynh có thể tìm được các gia sư chất lượng từ nguồn gia sư của Vnu Tutor.

Sinh viên Huỳnh Lương Phương Trúc, năm 3 ngành công nghệ thông tin, phụ trách thiết kế trang web cho hay: “Hiện tại trang web gần như đã hoàn thiện. Có một số thứ đang chỉnh sửa để nhìn cho đẹp mắt hơn, thu hút người vào xem hơn. Bên cạnh đó, nhóm cũng sẽ thiết kế lại mức lương theo giờ, xác nhận phụ huynh đã liên lạc với gia sư hay chưa…. ”

Tham gia phòng thí nghiệm trí tuệ nhân tạo từ những năm sinh viên, Huỳnh Hanh Thông, hiện là kỹ sư phần mềm Công ty KMS Technology, cùng tham gia nhóm nghiên cứu dự án này. Với vai trò là mentor (người hướng dẫn) cho nhóm nghiên cứu Trang web Gia sư trực tuyến, Huỳnh Hanh Thông cho biết: “Có rất nhiều trung tâm về gia sư, nhưng vấn đề ở chỗ là họ đều tính phí đối với sinh viên, thấp nhất là 10% cho đến 30% lương tháng đầu tiên. Nói chung sinh viên rất khó khăn. Do đó, trang web dành cho sinh viên đăng ký, phụ huynh liên kết trực tiếp với gia sư dễ hơn. Trong giai đoạn đầu, trang web không tính phí cho mọi người. Trong tương lai, dự kiến sẽ tính phí ở phía phụ huynh chứ không liên quan đến sinh viên ”

Trang web Gia sư trực tuyến chỉ là một trong rất nhiều dự án, đề tài mà các nhóm nghiên cứu tại AILab đang thực hiện. Cụ thể, AILab chuyên nghiên cứu về lĩnh vực xử lý tiếng nói, với hai hướng nghiên cứu chính: Text-to-Speech (chuyển văn bản thành tiếng nói) và Speech-to-Text (chuyển đổi giọng nói thành văn bản). Trong quá trình nghiên cứu hơn 10 năm qua, nhóm nghiên cứu đã cho ra nhiều phiên bản khác nhau, với nhiều ứng dụng khác nhau.

Đỗ Trí Nhân, sinh viên năm 2 ngành công nghệ thông tin, tham gia nghiên cứu về hệ thống chuyển đổi Text-to-Speech chia sẻ thêm, riêng mảng tiếng Việt, vấn đề về xử lý âm thanh, văn bản tiếng Việt còn hạn chế, vì vậy nhóm tập trung nghiên cứu vấn đề này để tương lai ứng dụng cho người Việt nhiều hơn: “Ở mảng nghiên cứu chuyển đổi văn bản thành giọng nói, quy mô ứng dụng của nó vào trong các doanh nghiệp như máy tự động của xe buýt chẳng hạn. Nhiệm vụ của nhóm mình là làm cho giọng nói trở nên thân thuộc với người Việt của mình hơn, giống thật hơn, để ứng dụng vào thực tế nhiều hơn”

Còn sinh viên Nguyễn Thụ Hồng Ân, ngành công nghệ thông tin, những kiến thức chuyên sâu về trí tuệ nhân tạo đã thu hút đến với AILab: “Hiện Trí tuệ nhân tạo là ngành học bắt buộc, ở lớp hướng đi theo về lĩnh vực Trí tuệ nhân tạo nên em cũng biết sơ trước khi tham gia ở Phòng Thí nghiệm. Em tham gia vào AILab nhờ một sinh viên khóa trên giới thiệu. Lúc mới vào, em cũng không nghĩ là sẽ được học về trí tuệ nhân tạo chuyên sâu đến như vậy, khi vào thì em học được thêm nhiều kiến thức lĩnh vực khác”

Đáng chú ý, VNVoice – là ý tưởng của AILab hướng đến xây dựng bộ dữ liệu tiếng việt, chung tay cùng cộng đồng trong cuộc cách mạng khoa học kỹ thuật 4.0. Đây cũng là dự án tâm huyết mà Phó Giáo sư Tiến sĩ Vũ Hải Quân, Phó Giám đốc Đại học Quốc gia thành phố Hồ Chí Minh, đồng thời là Trưởng phòng Phòng thí nghiệm Trí tuệ nhân tạo này, đã theo đuổi trong suốt sự nghiệp nghiên cứu khoa học của mình.

Chia sẻ về dự án VNVoice, Phó Giáo sư Tiến sĩ Vũ Hải Quân cho hay, nghiên cứu về trí tuệ nhân tạo nói chung, nhất là trong lĩnh vực xử lý tiếng nói phải cần nhiều dữ liệu. Như vậy, mấu chốt chính là làm sao để có thể có nhiều dữ liệu phục vụ cho nghiên cứu về trí tuệ nhân tạo, cụ thể là xử lý tiếng nói.

Vì vậy, AILab đã xây dựng Dự án tạo ra 1.000 giờ nói tiếng Việt cho hầu hết các vùng miền ở Việt Nam, để phục vụ cho việc nghiên cứu về nhận dạng và tổng hợp tiếng nói: “VNVoice là một dự án để cho cộng đồng đóng góp tiếng nói, ai cũng có thể vào để đóng góp được. Có hai hình thức: hình thức miễn phí, ai cũng có thể vào và đọc câu có sẵn trên màn hình hoặc sửa câu đó. Hình thức thứ hai, tiến hành cho toàn bộ sinh viên ở Ký túc xá Đại học Quốc gia thành phố Hồ Chí Minh. Cụ thể, các em đọc khoảng 200 câu, sẽ trả cho các em qua điện thoại phí là 50.000 đồng. Chúng tôi hy vọng, với khoảng 30.000 sinh viên ở ký túc xá, nếu có khoảng vài nghìn sinh viên tham gia vào dự án thì sẽ có được một lượng dữ liệu rất quý, các giọng đều là đối tượng trẻ và đến từ nhiều vùng miền khác nhau”

Phó Giáo sư Tiến sĩ Vũ Hải Quân cho biết thêm, một phương pháp tiếp cận mới nhất, đó là dựa trên phương pháp học sâu – Deep Learning. Để làm được phương pháp này, cần có nhiều tiếng nói. Để có được nhiều tiếng nói,  chính nhờ Dự án VNVoice hy vọng sẽ thu thập được 1.000 giờ cho đến cuối năm nay để thực hiện mục tiêu này.

AILAB có thể được xem là phòng thí nghiệm về trí tuệ nhân tạo đầu tiên ở phía Nam. Thời điểm năm 2007, khi Phó Giáo sư Tiến sĩ Vũ Hải Quân mới về nước. Ngay sau đó, ông bắt tay viết dự án xin đầu tư Phòng thí nghiệm trí tuệ nhân tạo, dự án được Đại học Quốc gia thành phố Hồ Chí Minh phê duyệt, cấp kinh phí gần 7 tỷ đồng. Một số kết quả nghiên cứu tiêu biểu của AILab có thể kể đến như: Hệ thống tổng hợp tiếng nói phương nam (VOS), hệ thống trả lời điện thoại tự động bằng giọng nói (Vis) đã được thương mại hóa và chuyển giao công nghệ…

Phó Giáo sư Tiến sĩ Vũ Hải Quân còn là người sáng lập Câu lạc bộ Robotics-IoT trực thuộc phòng thí nghiệm AILab. Hàng năm, Câu lạc bộ mở các lớp robot và lập trình sáng tạo dành cho học sinh, sinh viên để các em bước đầu làm quen với trí tuệ nhân tạo một cách dễ nhất. Thông qua các chương trình học như: kỹ sư nhí WEDO (lắp ráp, lập trình Robot LEGO); Kỹ sư nhí SCRATCH (lập trình tư duy trên máy vi tính); Lập trình Python căn bản (ngôn ngữ lập trình phổ biến hiện nay) và Lập trình sáng tạo Arduino (lập trình điều khiển thiết bị thông minh)./.