Kỹ sư AI cảnh báo trí tuệ nhân tạo Copilot Designer có thể tạo ra hình ảnh nhạy cảm gây hại

VOH - Theo CNBC, một kỹ sư của Microsoft đã đưa ra những lo ngại về an toàn của trình tạo hình AI của công ty tới Ủy ban Thương mại Liên bang (FTC).

Shane Jones, một kỹ sư làm việc cho Microsoft suốt sáu năm, đã viết một lá thư đến FTC, cho biết Microsoft đã "từ chối" gỡ bỏ Copilot Designer mặc dù có nhiều cảnh báo rằng công cụ này có khả năng tạo ra những hình ảnh nhạy cảm gây hại.

Khi thử nghiệm Copilot Designer để tìm ra các vấn đề và lỗ hổng về an toàn, Jones phát hiện rằng công cụ này có thể tạo ra "quỷ, quái vật cùng thuật ngữ liên quan đến quyền phá thai, thiếu niên cầm súng trường, hình ảnh tình dục phụ nữ, bạo lực, và việc uống rượu và sử dụng ma túy ở dưới độ tuổi," 

Kỹ sư AI cảnh báo về hình ảnh nhạy cảm do trí tuệ nhân tạo Copilot Designer có thể tạo ra 1
Ảnh minh họa: youtube

Ngoài ra, Copilot Designer có thể tạo ra hình ảnh của các nhân vật Disney, như Elsa từ phim hoạt hình Frozen, trong các bối cảnh ở Dải Gaza "trước các tòa nhà hủy hoại và biển hiệu 'free Gaza'." Copilot Designer cũng tạo ra hình ảnh Elsa đang mặc đồng phục Lực lượng Phòng vệ Israel và cầm một chiếc khiên với lá cờ của Israel. 

Jones đã cố gắng cảnh báo Microsoft về DALLE-3, mô hình được sử dụng bởi Copilot Designer, từ tháng 12/2023. Anh đã đăng một lá thư về các vấn đề này trên LinkedIn, nhưng sau đó đã bị gỡ bài.

Trong thư của Jones có viết "Trong ba tháng qua, tôi đã liên tục kêu gọi Microsoft rút Copilot Designer ra khỏi hệ sinh thái AI công khai cho đến khi khắc phục hoàn toàn các lỗi nhạy cảm và có biện pháp bảo vệ tốt hơn cho người dùng," "Một lần nữa, họ đã không thực hiện những thay đổi này và tiếp tục quảng bá sản phẩm cho 'Bất kỳ ai. Bất kỳ nơi nào. Bất kỳ Thiết bị nào.'"

Trong một tuyên bố gửi đến The Verge, người phát ngôn của Microsoft, Frank Shaw, nói rằng công ty cam kết giải quyết mọi lo ngại của nhân viên theo đúng chính sách của Microsoft.

Ông Frank Shaw, nói "Khi đối mặt với các vấn đề an toàn hoặc lo ngại có thể ảnh hưởng đến dịch vụ hoặc đối tác của chúng tôi, chúng tôi đã thiết lập các công cụ phản hồi người dùng trong sản phẩm và các kênh báo cáo nội bộ mạnh mẽ để điều tra, ưu tiên và khắc phục mọi vấn đề, chúng tôi khuyến khích nhân viên sử dụng những công cụ này để chúng tôi có thể kiểm tra và thử nghiệm các vấn đề của anh ấy một cách phù hợp," . Ông cũng cho biết Microsoft đã "tổ chức cuộc họp với lãnh đạo sản phẩm và Văn phòng Trách nhiệm AI của chúng tôi để xem xét các báo cáo này."

Vào tháng 1/2024, Jones đã viết thư cho một nhóm thượng nghị sĩ Hoa Kỳ về lo ngại của mình sau khi Copilot Designer tạo ra hình ảnh rõ ràng của Taylor Swift, lan truyền nhanh chóng trên mạng. CEO Microsoft, Satya Nadella, mô tả những hình ảnh đó là "đáng báo động và kinh khủng" và nói rằng Microsoft sẽ làm thiết lập thêm nhiều "rào cản an toàn" hơn để bảo vệ người dùng. Tháng trước, Google tạm thời vô hiệu hóa công cụ tạo hình ảnh AI của mình khi người dùng phát hiện rằng nó tạo ra những hình ảnh không chính xác về lịch sử.

Bình luận