Phần mềm mới của OpenAI có thể tạo ra video đáng kinh ngạc

VOH - OpenAI đã tiết lộ phần mềm mới tên là Sora, mang tính cách mạng có thể tạo ra video chất lượng cao để đáp ứng một số truy vấn văn bản đơn giản.

Đây được xem là một bước đột phá đáng kinh ngạc từ nhà sản xuất ChatGPT và cũng nâng mối lo ngại về hành vi giả mạo sâu và gian lận nội dung được cấp phép lên một tầm cao mới.

Công nghệ Sora này sử dụng sự hiểu biết sâu sắc về ngôn ngữ để tạo ra các clip dài tới một phút bao gồm các nhân vật hấp dẫn và nhiều cảnh quay siêu thực.

OpenAI cho biết: “Sora có thể tạo ra những cảnh phức tạp với nhiều nhân vật, các kiểu chuyển động cụ thể và các chi tiết chính xác về chủ đề và phông nền. Mô hình không chỉ hiểu những gì người dùng yêu cầu trong lời nhắc mà còn hiểu những thứ đó tồn tại như thế nào trong thế giới vật chất”.

Theo hãng công nghệ Wired, công ty do Sam Altman lãnh đạo đã cung cấp một số ví dụ tuyệt vời từ những lời nhắc dường như được viết cho một kịch bản Hollywood, trong đó có một cái nhìn sơ lược về khả năng của Sora.

Phần mềm mới của OpenAI có thể tạo ra video đáng kinh ngạc 1
Phần mềm mới của OpenAI có thể tạo ra video đáng kinh ngạc 

“Thành phố Tokyo xinh đẹp đầy tuyết đang nhộn nhịp. Máy ảnh di chuyển qua con phố nhộn nhịp của thành phố, theo chân một số người đang tận hưởng thời tiết tuyết rơi tuyệt đẹp và mua sắm tại các quầy hàng gần đó. Những cánh hoa anh đào tuyệt đẹp đang bay trong gió cùng với những bông tuyết”, lời nhắc viết.

Sora đã biến ba câu này thành một video sống động dài 17 giây, rất ngắn so với giới hạn một phút,  trong đó có một cặp đôi khó tả đang nắm tay nhau khi đi dọc theo con đường phủ đầy tuyết với những dãy cửa hàng trên đỉnh chùa với đường chân trời Tokyo ở phía xa.

Wired viết: Có một số lỗi, chẳng hạn như vỉa hè đi vào ngõ cụt, nhưng nhìn chung, đó là một bài tập đáng kinh ngạc trong việc xây dựng thế giới”. “Tuy mô hình hiện tại có điểm yếu. Nó có thể gặp khó khăn trong việc mô phỏng chính xác tính chất vật lý của một cảnh phức tạp và có thể không hiểu các trường hợp cụ thể về nguyên nhân và kết quả nhưng có thể ra được một sản phẩm nhìn chung là có tiềm năng,” OpenAI cho biết.

Hiện vẫn chưa rõ khi nào Sora sẽ có sẵn cho công chúng hoặc liệu nó có miễn phí cho người dùng hay không. Sức mạnh tổng hợp của Sora không chỉ đe dọa lật đổ Hollywood trong tương lai mà trong thời gian tới, các video dạng ngắn có nguy cơ lan truyền thông tin sai lệch, thành kiến ​​​​và lời nói căm thù trên các nền tảng truyền thông xã hội phổ biến như Reels và TikTok.

Công ty đã tuyên bố sẽ ngăn phần mềm hiển thị những cảnh bạo lực hoặc nội dung khiêu dâm giả mạo sâu, chẳng hạn như những hình ảnh đồ họa về Taylor Swift khỏa thân đã lan truyền vào tháng trước.

Phần mềm mới của OpenAI có thể tạo ra video đáng kinh ngạc 2
Theo hãng công nghệ Wired, công ty do Sam Altman lãnh đạo đã cung cấp một số ví dụ tuyệt vời từ những lời nhắc dường như được viết cho một kịch bản Hollywood.

Sora cũng sẽ không chiếm đoạt người thật hoặc phong cách của một nghệ sĩ có tên tuổi, nhưng việc sử dụng nội dung có sẵn công khai để đào tạo AI có thể dẫn đến những vấn đề pháp lý mà OpenAI phải đau đầu đang phải đối mặt với các công ty truyền thông, diễn viên và tác giả về vi phạm bản quyền.

Công ty cho biết: “Dữ liệu đào tạo là từ nội dung chúng tôi đã cấp phép và cả nội dung có sẵn công khai”. Tin tức về việc triển khai sắp tới của Sora theo sau động thái của đối thủ Meta nhằm tăng cường mô hình tạo hình ảnh Emu vào năm ngoái, khi hãng bổ sung hai tính năng dựa trên AI có thể chỉnh sửa và tạo video từ lời nhắc văn bản.

Google và các công ty khởi nghiệp như Runway cũng đã triển khai các dự án AI chuyển văn bản thành video.

Bình luận