Không thể đào tạo AI mà không sử dụng các tài liệu có bản quyền

VOH - The New York Times và các tác giả như George RR Martin, Sarah Silverman, Margaret Atwood... đã đưa đơn kiện OpenAI vì sử dụng văn bản, tác phẩm của họ để đào tạo AI mà không xin phép tác giả.

Trước việc New York Times đang kiện OpenAI và Microsoft về việc tuyên bố các công ty đã xây dựng mô hình AI bằng cách “sao chép và sử dụng hàng triệu” bài báo của ấn phẩm là nội dung của tờ báo.

OpenAI đã nói với một ủy ban quốc hội Anh rằng “không thể” đào tạo mô hình trí tuệ nhân tạo của mình mà không sử dụng dữ liệu đó.

Công ty OpenAI nói lhông thể đào tạo AI mà không sử dụng các tài liệu có bản quyền

Công ty ChatGPT OpenAI được cho là đã cầu xin quốc hội Anh cho phép họ sử dụng miễn phí các tác phẩm có bản quyền.

OpenAI cho biết: “Bởi vì bản quyền ngày nay bao trùm hầu như mọi loại biểu hiện của con người – bao gồm các bài đăng trên blog, ảnh, bài đăng trên diễn đàn, các đoạn mã phần mềm và tài liệu của chính phủ – nên sẽ không thể đào tạo các mô hình AI hàng đầu ngày nay nếu không sử dụng các tài liệu có bản quyền”. theo tờ Telegraph.

“Việc giới hạn dữ liệu đào tạo đối với các sách tên miền và bản vẽ công cộng được tạo ra cách đây hơn một thế kỷ có thể mang lại một thử nghiệm thú vị, nhưng sẽ không cung cấp cho hệ thống AI có thể đáp ứng nhu cầu của công dân ngày nay,” công ty cho biết trong bằng chứng gửi tới Ủy ban truyền thông và kỹ thuật số của Hạ viện Anh.

Công cụ AI ChatGPT của OpenAI đã trở nên phổ biến kể từ khi ra mắt vào tháng 11 năm 2022 dưới dạng mô hình ngôn ngữ có khả năng hiểu và tạo ra phản hồi giống con người đối trước nhiều truy vấn của người dùng.

Mô hình AI đã thể hiện những thành tựu lớn trong một khoảng thời gian ngắn như khả năng tóm tắt các nghiên cứu, trả lời các câu hỏi rất logic và thậm chí vượt qua các bài kiểm tra đầu vào các trường kinh doanh và đại học y khoa.

Tuy nhiên, kể từ khi ChatGPT ra mắt, The New York Times cũng như những người nổi tiếng và tác giả như Sarah Silverman, Margaret Atwood, John Grisham và George RR Martin đã đưa đơn kiện công ty AI vì đã sử dụng văn bản của họ khi không được phép của họ để đào tạo hệ thống AI.

The New York Times cáo buộc rằng “hàng triệu” bài báo của họ đã được sử dụng để huấn luyện ChatGPT có hành vi “vi phạm bản quyền quy mô lớn, khai thác thương mại và chiếm dụng” tài sản trí tuệ của tờ báo và công cụ AI hiện đang cạnh tranh với tờ báo như một nguồn thông tin.

“Nếu Microsoft và OpenAI muốn sử dụng sản phẩm của chúng tôi cho mục đích thương mại, luật pháp yêu cầu họ trước tiên phải xin phép chúng tôi. Họ đã không làm như vậy”, tờ New York Times cho biết.

Rachel Geman, luật sư trong vụ kiện do Hiệp hội Tác giả và 17 tác giả đệ trình chống lại OpenAI, cho biết nếu không sử dụng tác phẩm có bản quyền như vậy, OpenAI “sẽ có một sản phẩm thương mại rất khác”.

Bà Geman nói: “Quyết định sao chép tác phẩm của tác giả mà không đưa ra bất kỳ lựa chọn nào hoặc đưa ra bất kỳ khoản bồi thường nào, đe dọa đến vai trò và sinh kế của toàn bộ nhà văn”.

Trong khi đó, OpenAI cho biết họ đang cố gắng tạo mối quan hệ đối tác mới với các nhà xuất bản, đạt được các thỏa thuận với Associated Press và gã khổng lồ truyền thông Axel Springer để có quyền truy cập vào nội dung của họ.

“Chúng tôi tôn trọng quyền của người sáng tạo và chủ sở hữu nội dung, đồng thời cam kết hợp tác với họ để đảm bảo, họ được hưởng lợi từ công nghệ AI và các mô hình doanh thu mới”, người phát ngôn của OpenAI cho biết vào tháng trước.

Trong hồ sơ mới, OpenAI cho biết họ đã tuân thủ luật bản quyền và tin rằng “luật bản quyền hợp pháp không cấm đào tạo AI”.

OpenAI cung cấp cho các cơ quan truyền thông ít nhất 1 triệu USD để sử dụng các bài báo cho mô hình AI

New York Times kiện OpenAI và Microsoft vi phạm bản quyền

OpenAI và Axel Springer đạt được thỏa thuận để cung cấp dữ liệu cho ChatGPT