Công ty AI này cho biết trong một bài đăng trên blog rằng, các mô hình này có khả năng suy luận thông qua các nhiệm vụ phức tạp và có thể giải quyết các vấn đề khó hơn so với các mô hình trước đây về khoa học, mã hóa và toán học.
OpenAI đã sử dụng tên mã Strawberry để chỉ dự án nội bộ, trong khi đặt tên cho các mô hình được công bố vào thứ năm là o1 và o1-mini. Công ty cho biết o1 sẽ có sẵn trong ChatGPT và API bắt đầu từ ngày 12/9.
Trong bài đăng trên blog của mình, OpenAI cho biết, mô hình o1 đạt 83% trong kỳ thi tuyển chọn cho Kỳ thi Olympic Toán quốc tế, so với 13% của mô hình trước đó là GPT-4o.
Mô hình này cũng cải thiện hiệu suất giải quyết các câu hỏi lập trình cạnh tranh và vượt qua độ chính xác ở cấp độ tiến sĩ của con người trong các vấn đề khoa học.
Các mô hình có thể đạt được điểm số bằng cách kết hợp một kỹ thuật được gọi là lý luận "chuỗi suy nghĩ", bao gồm việc chia nhỏ các vấn đề phức tạp thành các bước logic nhỏ hơn.
Các nhà nghiên cứu lưu ý rằng, hiệu suất của mô hình AI đối với các vấn đề phức tạp có xu hướng cải thiện khi phương pháp này được sử dụng như một kỹ thuật nhắc nhở.
OpenAI hiện đã tự động hóa khả năng này để các mô hình có thể tự phân tích các vấn đề mà không cần người dùng nhắc nhở, công ty tuyên bố trong bài đăng trên blog của mình.