OpenAI tiết lộ chat GPT-4o mới có thể nhìn, nghe, nói và trả lời chưa đầy 1/3 giây

VOH - OpenAI, đã tiết lộ một mô hình AI mới có thể tương tác với thế giới thông qua âm thanh, hình ảnh và văn bản trong thời gian thực.

GPT-4o là sản phẩm chủ lực mới nhất của công ty OpenAI được Microsoft hậu thuẫn, nhằm mục đích mang đến cho người dùng “sự tương tác giữa người và máy tính tự nhiên hơn”.

chat GPT-4o mới có thể nhìn, nghe, nói trả lời chưa đến 1 3 giây
Chat GPT-4o mới có thể nhìn, nghe, nói và trả lời chưa đến 1/3 giây - Ảnh: Getty Images

OpenAI cho biết AI mới nhất của họ có thể trả lời các truy vấn trong chưa đầy 1/3 giây, tương tự như thời gian phản hồi của con người trong cuộc trò chuyện.

Sử dụng máy ảnh và micrô của điện thoại thông minh, GPT-4o có khả năng hiểu đầu vào âm thanh và hình ảnh, đồng thời sử dụng loa để phản hồi bằng giọng nói tự nhiên và được cá nhân hóa.

Giám đốc điều hành OpenAI Sam Altman cho biết công nghệ mới “giống như ma thuật”, viết trong một bài đăng trên blog rằng đó là “giao diện máy tính tốt nhất” mà anh từng sử dụng.

“Cảm giác giống như AI trong phim và tôi vẫn hơi ngạc nhiên vì điều đó là sự thật,” anh viết.

Không giống như các mô hình AI tiên tiến khác, OpenAI cho biết họ sẽ cung cấp GPT-4o miễn phí và sẽ có sẵn trong vòng vài tuần tới.

Trong nỗ lực ngăn chặn việc lạm dụng hoặc gây tổn hại tiềm ẩn, OpenAI cho biết họ đã tiến hành thử nghiệm rộng rãi bao gồm mọi thứ, từ an ninh mạng đến tâm lý học.

Công ty giải thích trong một bài đăng trên blog giới thiệu sản phẩm: “Chúng tôi đã thử nghiệm cả phiên bản trước giảm thiểu an toàn và sau giảm thiểu an toàn của mô hình, sử dụng lời nhắc và tinh chỉnh, tùy chỉnh để phát huy tốt hơn khả năng của mô hình” .

“GPT-4o cũng đã trải qua quá trình hợp tác mở rộng với hơn 70 chuyên gia bên ngoài trong các lĩnh vực như tâm lý xã hội, thành kiến ​​và công bằng cũng như thông tin sai lệch để xác định các rủi ro được đưa ra hoặc khuếch đại bởi các phương thức mới được thêm vào... Chúng tôi sẽ tiếp tục giảm thiểu những rủi ro mới khi chúng được phát hiện.”

OpenAI thừa nhận rằng mô hình AI mới nhất của họ có một số hạn chế mà họ hy vọng sẽ khắc phục được ở các phiên bản trong tương lai.

Các video về AI mắc lỗi cho thấy GPT-4o chuyển đổi giữa các ngôn ngữ mà không được nhắc, mắc lỗi dịch ngôn ngữ và phát âm sai tên của ai đó là “Nacho”.

Công bố này được đưa ra một ngày trước Google I/O, sự kiện lớn nhất trong năm của gã khổng lồ công nghệ dự kiến ​​sẽ tập trung nhiều vào trí tuệ nhân tạo.

Bình luận