Hệ thống này lấy tiếng Việt làm trung tâm, có khả năng dịch thuật hai chiều giữa tiếng Việt và các ngôn ngữ của nhiều quốc gia trong khu vực Đông Nam Á với chất lượng tương đương với các sản phẩm thương mại nổi tiếng trên thế giới.
Hiện tại, hệ thống có khả năng dịch hai chiều giữa các cặp ngôn ngữ bao gồm Việt - Lào, Việt - Khmer, Việt - Thái Lan, Việt - Malaysia và Việt - Indonesia.

Dịch máy hay còn gọi là dịch tự động là việc dịch một văn bản từ một ngôn ngữ này (ngôn ngữ nguồn) sang một hoặc nhiều ngôn ngữ khác (ngôn ngữ đích) một cách tự động, không có sự can thiệp của con người trong quá trình dịch.
Hiện nay có nhiều sản phẩm dịch tự động được sử dụng phổ biến như: Google Translate, Bing Translator… với chất lượng dịch rất tốt cho các câu đơn. Với các hệ thống dịch này, cần các bộ dữ liệu song ngữ quy mô lớn, lên tới hàng triệu cặp câu để huấn luyện mô hình.
Tuy nhiên, rất nhiều ngôn ngữ trên thế giới không có đủ tài nguyên như vậy. Việc xây dựng mô hình dịch máy hiệu quả cho những ngôn ngữ nghèo tài nguyên, trong đó có các ngôn ngữ của khu vực Đông Nam Á là công việc hết sức cấp thiết và gặp nhiều thách thức.
Để giải quyết vấn đề này, chủ nhiệm đề tài - Tiến sĩ Nguyễn Việt Anh và các cộng sự đã nghiên cứu làm chủ công nghệ dịch máy tiên tiến nhất hiện nay, xây dựng thành công hệ thống dịch văn bản đa ngữ giữa tiếng Việt với các ngôn ngữ của khu vực bao gồm tiếng Lào, tiếng Khmer, tiếng Thái Lan, tiếng Malaysia và tiếng Indonesia.
Theo nhóm nghiên cứu, các ngôn ngữ như Lào, Thái và Khmer mang lại những thách thức rất lớn khi xây dựng mô hình dịch máy. Không chỉ vì sự khan hiếm của dữ liệu song ngữ mà còn vì những ngôn ngữ này rất phong phú về mặt hình thái, thiếu sự phân tách từ, phân tách câu và tính đa nghĩa.
Tính riêng tư và bảo mật: được cài đặt và chạy trên hệ thống máy chủ, cho phép đơn vị chủ quản toàn quyền kiểm soát dữ liệu và ứng dụng, đảm bảo tuyệt đối an toàn thông tin trong quá trình sử dụng.
Hệ thống sử dụng công nghệ hiện đại 4.0 gồm học máy (Machine learning), công nghệ xử lý ngôn ngữ tự nhiên (Natural Language Processing) hiện đại nhất tính đến thời điểm này để đạt được độ chính xác dịch thuật ở mức cao.
Khai thác thông qua giao diện web để người dùng trực tiếp dịch thuật hoặc sử dụng hình thức giao tiếp API cho phép các hệ thống khác kết nối thao tác.
Tự động dịch thuật với nhiều định dạng khác nhau, bao gồm dạng text (.txt), dạng file văn bản được số hóa (.rtf, .doc, .docx, .pdf, .html…): Giữ nguyên khuôn dạng (format) chính của các văn bản sau dịch.
Hệ thống dịch này hiện đang được nghiên cứu và phát triển thêm các tính năng mới như khả năng cập nhật ngôn ngữ mới bao gồm các ngôn ngữ dân tộc thiểu số tại Việt Nam; và các ngôn ngữ nước ngoài phổ biến như tiếng Trung, tiếng Pháp, tiếng Nga… khi cần.
Tin rằng khi được chính thức giới thiệu với người dùng, đây sẽ là một lựa chọn rất tốt thay thế cho các phần mềm dịch thuật thương mại hiện có trên thế giới. Đặc biệt, sử dụng tốt trong dịch thuật ngôn ngữ hiếm, nghèo tài nguyên mà chưa được các phần mềm thương mại hỗ trợ hoặc có chất lượng dịch chưa đảm bảo.