Trong khi các ông lớn công nghệ khác như Google, Microsoft và Meta ồ ạt ra mắt các công cụ và tính năng AI, Apple lại khá im hơi lặng tiếng. Tuy nhiên, các nhà nghiên cứu của Apple vừa công bố mô hình mới có thể mang lại bản nâng cấp AI cho Siri, điều mà người hâm mộ Apple đang rất mong đợi.
Nghiên cứu tập trung vào vấn đề hiểu ngữ cảnh trong lời nói của người dùng. Ngôn ngữ thường chứa các từ mơ hồ như "nó" hay "ấy", ý nghĩa phụ thuộc vào ngữ cảnh xung quanh. Mô hình ReALM (Reference Resolution As Language Modeling - Giải quyết Tham chiếu trong Mô hình Ngôn ngữ) được đề xuất để giải quyết vấn đề này. Mục tiêu của ReALM là giúp Siri đạt được trải nghiệm rảnh tay thực sự, hiểu được các tham chiếu trên màn hình, trong cuộc hội thoại và nền tảng (ví dụ: những ứng dụng đang chạy nền).
Các nhà nghiên cứu cho biết ReALM vượt trội so với GPT-3.5 và GPT-4 của ChatGPT trên tất cả các bài kiểm tra ngữ cảnh. Điều này có thể mang lại 3 lợi thế cho Siri.
Hiểu ngữ cảnh trên màn hình
ReALM được huấn luyện trên dữ liệu "trên màn hình" từ các trang web, bao gồm thông tin liên lạc. Nhờ đó, ReALM có thể hiểu văn bản trong ảnh chụp màn hình (ví dụ: địa chỉ, thông tin tài khoản ngân hàng).
Hiểu ngữ cảnh trong cuộc hội thoại và nền tảng
ReALM có thể hiểu các tham chiếu trong cuộc hội thoại, ví dụ như "gọi cửa hàng dưới cùng" khi người dùng đang xem danh sách các hiệu thuốc gần đó trên màn hình. Ngoài ra, ReALM còn hiểu được các "thực thể nền" - thứ gì đó đang chạy nền thiết bị, chẳng hạn như nhạc đang phát hoặc báo thức đang kêu.
Hoạt động hoàn toàn trên thiết bị
Đây là một điểm mạnh lớn của ReALM. Các LLM thông thường đòi hỏi rất nhiều sức mạnh tính toán và thường chạy trên đám mây. Tuy nhiên, ReALM là một LLM nhỏ hơn, được tinh chỉnh chuyên biệt cho việc giải quyết tham chiếu. Điều này phù hợp với cam kết bảo mật của Apple và giúp Siri phiên bản AI hoạt động hoàn toàn trên thiết bị.
Apple vẫn chưa tiết lộ nhiều về kế hoạch AI của mình, nhưng CEO Tim Cook hứa hẹn một thông báo lớn về AI vào cuối năm nay. Rất có thể thông báo này sẽ diễn ra tại Hội nghị Nhà phát triển Thế giới của Apple (WWDC) vào ngày10/6.