Công cụ Sora tạo video của ChatGPT khiến mọi người lo lắng!

VOH - Hệ thống mới của OpenAI có tên là Sora đã khiến người dùng vừa vui mừng, vừa lo lắng về khả năng của nó, theo Independent.

Sora là một hệ thống trí tuệ nhân tạo tạo video, tạo ra các cảnh thực tế để đáp ứng các yêu cầu đơn giản. Giám đốc điều hành của OpenAI, Sam Altman, đã chia sẻ một loạt ví dụ về cách có thể đưa ra một lời yêu cầu đơn giản và sau đó tạo video từ những lời nhắc đó.

Mới ra đời nó ngay lập tức làm phấn khích về cách cho phép mọi người dễ dàng hiện thực hóa ý tưởng của mình, tạo video cho nhiều tình huống khác nhau. Tuy nhiên, nó cũng dẫn đến lo ngại về những gì hệ thống có thể làm được.

Công cụ Sora tạo video của ChatGPT khiến mọi người lo lắng! 1 — Hình minh họa (OpenAI)

Tại sao mọi người lại phấn khích?

Thú vị là nó cho phép mọi người tưởng tượng ra một kịch bản và sau đó sản xuất một video trình chiếu nó. Khả năng sử dụng công nghệ như vậy trong các tình huống sáng tạo là rõ ràng. Tuy nhiên, OpenAI gợi ý rằng nó cũng có thể được sử dụng trong nhiều tình huống ít rõ ràng hơn.

Đơn cử như Sora có thể chụp một hình ảnh hiện có và biến nó thành video, “làm sinh động nội dung của hình ảnh một cách chính xác và chú ý đến từng chi tiết nhỏ”. Điều đó có thể được sử dụng để làm sống động những bức ảnh tĩnh hiện có.

OpenAI cho biết nó cũng có thể “lấy một video hiện có và mở rộng nó hoặc lấp đầy các khung hình còn thiếu”. Điều đó có thể hữu ích trong việc khôi phục video khi một số phần của cảnh quay bị mất.

OpenAI cho biết Sora cũng đóng vai trò là nền tảng cho các mô hình có thể hiểu và mô phỏng thế giới thực, khả năng mà chúng tôi tin rằng sẽ là một cột mốc quan trọng để đạt được “siêu” trí tuệ nhân tạo AGI (Artificial General Intelligence). Nếu thế giới muốn tạo ra một hệ thống AI tương tự như trí thông minh của con người - Trí tuệ nhân tạo tổng hợp AGI - thì nó sẽ cần khả năng hiểu các hình ảnh trực quan cũng như thứ tạo ra chúng.

Tại sao mọi người lại lo lắng vì nó?

Ngay khi mới được công bố, người ta đã lo ngại về những nguy hiểm mà Sora có thể gây ra. Giống như mọi công nghệ AI mới, họ lo ngại rằng các công ty sẽ sử dụng nó để cố gắng tự động hóa các công việc và làm giảm chất lượng sáng tạo của họ cho đến việc nó có thể gây ra thông tin sai lệch.

Ngay cả OpenAI cũng rất rõ ràng công khai về những lo ngại, mặc dù công ty đôi khi bị cáo buộc lợi dụng những nỗi sợ hãi đó để tiếp thị các công nghệ mới của mình, bằng cách cho rằng chúng mạnh đến mức nguy hiểm.

Trong thông báo của mình, OpenAI nói rằng họ chưa thực sự phát hành sản phẩm này ra công chúng mà thay vào đó là cung cấp sản phẩm cho các nhà nghiên cứu và những người khác để tìm hiểu những rủi ro mà nó có thể gây ra.

Sau thông báo về Sora, phần lớn trọng tâm là khả năng tạo ra thông tin sai lệch, chẳng hạn như tạo video về những người nổi tiếng trong các tình huống hư cấu.

OpenAI cho biết họ sẽ nỗ lực giải quyết những lo ngại đó trước khi nó được phát hành rộng rãi. Điều đó sẽ là nhiệm vụ của “đội đỏ”, những người sẽ cố gắng phá vỡ mô hình mới này bằng cách sử dụng chuyên môn của họ về “thông tin sai lệch, nội dung thù địch và thành kiến”.

OpenAI cũng cho biết sẽ nỗ lực xây dựng các công cụ giúp cho việc tạo những video “có vấn đề” trở nên khó khăn hơn bằng cách đưa vào một hệ thống các lời nhắc vi phạm chính sách, chẳng hạn như những lời nhắc yêu cầu từ chối tạo các video “bạo lực cực đoan, nội dung khiêu dâm, hình ảnh thù hận, chân dung người nổi tiếng hoặc IP của người khác”.

Và họ nói rằng Sora sẽ hoạt động trên một công cụ có thể phát hiện các video do Sora đăng nhằm nỗ lực ngăn chặn việc lan truyền thông tin sai lệch.

Mặt khác, những người khác lại cho rằng mô hình này có thể không hoàn toàn sáng tạo như người ta tưởng. Nhà bình luận công nghệ Brian Merchant chỉ ra rằng một trong những video được OpenAI chia sẻ để công bố công cụ mới dường như rất giống với video có thể đã được sử dụng để đào tạo nó.

Tuy nhiên, các video khác được ông Altman chia sẻ có vẻ mới lạ hơn, dựa trên lời nhắc gửi cho ông trên X và có lẽ sẽ ít lặp lại các clip hiện có.

Video dưới do Sam Altman, đã chia sẻ trên X (Hai chú chó đang tập podcast trên đỉnh núi)

OpenAI cũng lưu ý rằng mô hình hiện tại còn có “điểm yếu”. Nó có thể gặp khó khăn trong việc mô phỏng chính xác tính chất vật lý của một khung cảnh phức tạp và có thể không hiểu được các trường hợp cụ thể về nguyên nhân và kết quả. Ví dụ, một người có thể cắn một miếng bánh quy, nhưng sau đó, chiếc bánh quy có thể không có vết cắn.

OpenAI cho biết, nó cũng có thể bị nhầm lẫn về không gian, “trộn lẫn giữa trái và phải” và “có thể gặp khó khăn với những mô tả chính xác về các sự kiện diễn ra theo thời gian”.

Ngay cả trong một số video được chia sẻ bởi OpenAI, có lẽ đã được chọn để trình diễn hệ thống một cách tốt nhất vẫn có lỗi. Ví dụ: trong một số video, tay chân của mọi người sẽ xuất hiện và biến mất.

Video dưới được tạo bởi Sora. Đó là mô hình mới của OpenAI. Công cụ chuyển văn bản thành video tiên tiến nhất được tạo ra cho đến nay:

Cận cảnh một con chim bồ câu vương miện Victoria cho thấy bộ lông màu xanh nổi bật và bộ ngực màu đỏ của nó. Mào của nó được làm bằng những chiếc lông ren mỏng manh, trong khi mắt của nó có màu đỏ nổi bật. Đầu chim hơi nghiêng sang một bên tạo cảm giác vương giả và uy nghiêm. Hậu cảnh được làm mờ, thu hút sự chú ý vào vẻ ngoài nổi bật của chú chim.

Phần mềm mới của OpenAI có thể tạo ra video đáng kinh ngạc

Công ty AI của Elon Musk đang huy động vốn để cạnh tranh với OpenAI

New York Times kiện OpenAI và Microsoft vi phạm bản quyền