AI giúp tìm lại giọng nói

Một phụ nữ Anh mất khả năng nói suốt 25 năm do bệnh thần kinh vận động (MND) đã có thể giao tiếp trở lại bằng chính giọng thật của mình, nhờ công nghệ trí tuệ nhân tạo (AI)

Bà Sarah Ezekiel, nghệ sỹ sống ở phía Bắc London, được chẩn đoán mắc bệnh MND ở tuổi 34, khi đang mang thai lần thứ hai. Căn bệnh này gây tổn thương hệ thần kinh, làm suy yếu các cơ ở lưỡi, miệng và cổ họng, khiến nhiều bệnh nhân mất hoàn toàn khả năng nói.

Trong nhiều năm, bà Ezekiel phải dùng máy tính và giọng nói nhân tạo để giao tiếp. Tuy nhiên, giọng này hoàn toàn xa lạ, không giống với giọng London đặc trưng của bà. Hai con của bà, Aviva và Eric, lớn lên mà chưa từng được nghe giọng nói thật sự của mẹ.

Ai Giong noi
Ảnh: THX 

Ban đầu, công ty truyền thông y tế Smartbox của Anh đề nghị bà cung cấp một đoạn ghi âm dài 60 phút để làm dữ liệu huấn luyện AI. Nhưng bà chỉ tìm thấy một đoạn video gia đình từ thập niên 1990, dài vỏn vẹn 8 giây, lại bị méo tiếng và lẫn tiếng ồn từ tivi.

Ông Simon Poole, đại diện Smartbox, đã tìm đến công nghệ của ElevenLabs – công ty tạo giọng nói bằng AI đặt trụ sở tại New York (Mỹ). Công nghệ này có thể tái tạo giọng nói gần như thật chỉ từ dữ liệu rất ít.

Ông Poole trước tiên dùng một công cụ AI để tách giọng của bà Ezekiel khỏi đoạn ghi âm cũ, rồi sử dụng một công cụ khác đã được huấn luyện bằng dữ liệu giọng nói người thật để tái tạo. Kết quả vượt ngoài mong đợi: giọng nói nhân tạo nghe rất giống giọng thật của bà, giữ nguyên chất giọng London và thậm chí cả nét ngọng mà bà từng không thích.

Bà Ezekiel xúc động chia sẻ rằng nhờ AI, bà đã có thể nói chuyện với con cái bằng chính giọng của mình, sau hàng chục năm im lặng.

Theo Hiệp hội Bệnh MND Vương quốc Anh, cứ 10 người mắc bệnh này thì có tới 8 người gặp khó khăn về giọng nói. Hiện nay, bệnh nhân thường được khuyến khích ghi âm giọng nói từ sớm để lưu giữ bản sắc cá nhân cũng như phục vụ giao tiếp sau này.

Tuy nhiên, với những trường hợp không có đủ bản ghi âm, công nghệ mới mở ra cơ hội khôi phục giọng nói tưởng chừng đã mất vĩnh viễn. Ông Simon Poole cho biết, nhờ AI, giọng nói máy tính nay có thể trở nên giống con người hơn, có cảm xúc và nhịp điệu, giúp người dùng “lấy lại bản sắc cá nhân.”

Ông nhấn mạnh: “Việc cá nhân hóa giọng nói không chỉ giúp bệnh nhân giao tiếp, mà còn giúp họ giữ lại một phần con người mình.”

Trước khi điện thoại thông minh phổ biến, việc lưu giữ bản ghi âm giọng nói rất khó khăn. Do vậy, những ca như bà Ezekiel được xem là dấu mốc quan trọng, cho thấy tiềm năng của AI trong việc hỗ trợ con người vượt qua giới hạn y học truyền thống.

Bình luận