Google xây dựng mô hình AI dịch thuật 1.000 ngôn ngữ

(VOH) – Hệ thống mà Google đang nghiên cứu phát triển hiện đã có thể dịch được 100 ngôn ngữ khác nhau. Nhưng đây mới chỉ là bước đi đầu tiên.

ChatGPT đang là chủ đề nóng nhất nhưng thay vì chạy theo xu thế mà ChatGPT tạo ra, Google đã thực hiện việc đa dạng hóa hoạt động đầu tư vào nhiều mô hình AI khác nhau.

Một trong những dự án mà Google đang triển khai nhắm tới mục tiêu tạo ra một mô hình AI dịch thuật, khả năng hỗ trợ hơn 1.000 ngôn ngữ khác nhau.

Theo bản cập nhật mới nhất mà Google công bố, hiện mô hình đã hỗ trợ hơn 100 ngôn ngữ khác nhau nhưng đây chỉ là 10% con số mà Google dự tính.

Google xây dựng mô hình AI dịch thuật 1.000 ngôn ngữ 1
Ảnh minh họa - Internet 

Google đã công bố kế hoạch tạo ra mô hình AI ngôn ngữ, được đặt tên là “Mô hình Giọng nói Toàn diện” (USM) vào tháng 11.

USM được đánh giá là một hệ thống các mô hình giọng nói hiện đại" với 2 tỷ thông số, và được đào tạo trên các ghi âm giọng nói kéo dài tới 12 triệu giờ, cùng 28 tỷ câu văn bản thuộc hơn 300 ngôn ngữ khác nhau.

Các chức năng của mô hình bao gồm tự động nhận diện giọng nói, đặc biệt là những ngôn ngữ hiếm, không có nhiều nguồn dữ liệu để sử dụng.

Mô hình ngôn ngữ này hiện đã được sử dụng trên mạng xã hội video YouTube để tạo phụ đề cho các video (hiện khoảng 73 trong số 100 ngôn ngữ của USM được hỗ trợ hiển thị trên YouTube).

Google không phải là công ty duy nhất trong lĩnh vực dịch thuật dựa trên AI, nhưng triển vọng áp dụng công nghệ máy học vào dịch thuật là một hướng đi thú vị.

Hiện chưa rõ Google dự định sẽ làm điều gì với USM, nhưng khả năng ứng dụng của nó là vô tận.

Ngôn ngữ và AI luôn là trọng tâm trong các sản phẩm của Google, nhưng sự phát triển của các “mô hình ngôn ngữ lớn” mạnh mẽ, đa chức năng gần đây cho thấy gã tìm kiếm khổng lồ đã đặt trọng tâm mới vào các lĩnh vực này.

Một chặng đường dài trước khi USM đạt được mục tiêu ban đầu là 1.000 ngôn ngữ. 100 ngôn ngữ là một khởi đầu tuyệt vời, nhưng vẫn còn nhiều ngôn ngữ hơn thế đang tồn tại trên thế giới.

Bình luận