AI Anthropic tuyên bố Chatbot AI Claude vượt qua GPT-4 của OpenAI về hiệu suất

VOH - Công ty khởi nghiệp AI Anthropic, được hậu thuẫn bởi Google và hàng trăm triệu đô la từ quỹ đầu tư rủi ro, công bố phiên bản mới nhất của công nghệ GenAI mang tên Claude.

AI Anthropic tuyên bố rằng chatbot AI này vượt qua GPT-4 của OpenAI về hiệu suất.

Claude 3, hay GenAI mới của Anthropic, là một mô hình gồm Claude 3 Haiku, Claude 3 Sonnet và Claude 3 Opus, trong đó Opus là mạnh mẽ nhất. Tất cả đều có "khả năng phân tích và dự đoán tăng cường," Anthropic tuyên bố hiệu suất GenAI được nâng cao hơn trên các tiêu chí cụ thể so với các mô hình như ChatGPT và GPT-4 cùng Gemini 1.0 Ultra của Google.

AI Anthropic tuyên bố Chatbot AI Claude vượt qua GPT-4 của OpenAI về hiệu suất 1
 AI Anthropic công bố phiên bản mới nhất của công nghệ GenAI mang tên Claude. Ảnh: Anthropic

Đáng chú ý, Claude 3 là GenAI đa phương tiện đầu tiên của Anthropic, nó có thể phân tích văn bản cũng như hình ảnh - tương tự như một số phiên bản của GPT-4 và Gemini. Claude 3 có thể xử lý ảnh, biểu đồ, đồ thị và sơ đồ kỹ thuật, lấy từ các tệp PDF, bài thuyết trình và các loại tài liệu khác.

Theo Anthropic một ưu điểm hơn của Claude 3 so với một số đối thủ GenAI khác là khả năng phân tích nhiều hình ảnh trong một yêu cầu duy nhất (tối đa 20 hình ảnh). Điều này cho phép nó so sánh và đối chiếu hình ảnh,

Tuy nhiên, có những hạn chế đối với việc xử lý hình ảnh của Claude 3. Anthropic đã vô hiệu hóa khả năng của các mô hình nhận diện người - do lo ngại về các vấn đề đạo đức và pháp lý. Công ty cũng thừa nhận rằng Claude 3 thường mắc phải lỗi với các hình ảnh "chất lượng thấp" (dưới 200 pixel) và gặp khó khăn trong các nhiệm vụ liên quan đến tư duy không gian (ví dụ: đọc mặt đồng hồ analog) và đếm đối tượng (Claude 3 không thể đưa ra số đếm chính xác của đối tượng trong hình ảnh).

Claude 3 cũng không tạo ra tác phẩm nghệ thuật. Các mô hình chỉ chuyên phân tích hình ảnh - ít nhất là cho đến thời điểm này.

Cho dù là văn bản hay hình ảnh, Anthropic cho biết khách hàng nên mong đợi Claude 3 sẽ tuân theo hướng dẫn đa bước tốt hơn, tạo ra đầu ra có cấu trúc theo định dạng như JSON và trò chuyện bằng nhiều ngôn ngữ khác ngoài tiếng Anh so với các phiên bản trước đó. Anthropic cho biết Claude 3 sẽ từ chối trả lời các câu hỏi ít hơn nhờ "sự hiểu biết tinh tế hơn về các yêu cầu." Các mô hình sẽ trích dẫn nguồn của câu trả lời để người dùng có thể xác minh chúng.

Theo Anthropic, Claude 3 sẽ hỗ trợ một cửa sổ ngữ cảnh có 200,000 token ban đầu, tương đương với khoảng 150,000 từ, và một số khách hàng sẽ nhận được cửa sổ ngữ cảnh lên đến 1 triệu token ( gần 700,000 từ). Điều này tương đương với GenAI mới nhất của Google, Gemini 1.5 Pro, cũng cung cấp lên đến 1 triệu token ngữ cảnh.

Anthropic thừa nhận rằng Claude 3 không tránh được những lỗi ảnh hưởng đến các mô hình GenAI khác, đặc biệt là độ chệch và hiện tượng tạo ra những điều không có thật. Khác với một số mô hình GenAI, Claude 3 không thể tìm kiếm trên web; các mô hình chỉ có thể trả lời các câu hỏi bằng dữ liệu trước tháng 8 năm 2023. Và mặc dù Claude là đa ngôn ngữ, nhưng nó không thành thạo trong một số ngôn ngữ khác so với tiếng Anh.

Tuy nhiên, Anthropic hứa hẹn sẽ thường xuyên cập nhật Claude 3 trong những tháng tới. "Chúng tôi không tin rằng trí tuệ của mô hình đang ở gần giới hạn của nó, và chúng tôi dự định sẽ phát hành [các cải tiến] cho gia đình mô hình Claude 3 trong vài tháng tới," 

Opus và Sonnet hiện đã có trên web và thông qua bảng điều khiển phát triển và API của Anthropic, nền tảng Bedrock của Amazon và Vertex AI của Google. Haiku sẽ ra mắt trong năm nay.

Bảng giá:

Opus: $15 cho mỗi triệu token đầu vào, $75 cho mỗi triệu token đầu ra

Sonnet: $3 cho mỗi triệu token đầu vào, $15 cho mỗi triệu token đầu ra

Haiku: $0.25 cho mỗi triệu token đầu vào, $1.25 cho mỗi triệu token đầu ra

Tiêu chí của Anthropic là tạo ra một thuật toán thế hệ tiếp theo cho "AI tự học." Một thuật toán như vậy có thể được sử dụng để xây dựng trợ lý ảo có thể trả lời email, thực hiện nghiên cứu và tạo nghệ thuật, sách và nhiều thứ khác - một số trong số đó chúng ta đã có cái nhìn qua GPT-4 và các mô hình ngôn ngữ lớn khác.

Anthropic gợi ý điều này trong bài đăng blog đã nói ở trên, cho biết họ dự định thêm các tính năng vào Claude 3 nhằm tăng cường khả năng thông minh ngay từ lúc bắt đầu bằng cách cho phép Claude tương tác với các hệ thống khác, mã hóa "tương tác" và cung cấp "các khả năng ủy quyền tiên tiến."

Anthropic đặt mục tiêu huy động tới 5 tỷ đô la trong vòng 12 tháng tới - một cơ sở để duy trì sự cạnh tranh với OpenAI. Hiện nay, với 2 tỷ và 4 tỷ đô la được cam kết từ Google và Amazon, hơn một tỷ đô la từ các nhà đầu tư khác nhau, Anthropic đang trên đà đạt được mục tiêu của mình.

Bình luận