Previous Next

北京時間2月16日凌晨,OpenAI再次扔出一枚「深水炸彈」,發布了首個文生視頻模型Sora。據介紹,Sora可以直接輸出長達60秒的視頻,並且包含高度細致的背景、復雜的多角度鏡頭,以及富有情感的多個角色。

目前官網上已經更新了48個視頻demo,在這些demo中,Sora不僅能准確呈現細節,還能理解物體在物理世界中的存在,並生成具有豐富情感的角色。該模型還可以根據提示、靜止圖像甚至填補現有視頻中的缺失幀來生成視頻。

用一句文字生成一段視頻

最受關注的個視頻,用家僅輸入一個Prompt(大語言模型中的提示詞),描述是:在東京街頭,一位時髦的女士穿梭在充滿溫暖霓虹燈光和動感城市標志的街道上。在Sora生成的視頻裡,一名架著墨鏡的「型」女,身著黑色皮衣、紅色裙子在霓虹街頭行走,不僅主體連貫穩定,還有多鏡頭,包括從大街景慢慢切入到對女士的臉部表情的特寫,以及潮濕的街道地面反射霓虹燈的光影效果。

人工智能生成的型女視頻。
人工智能生成的型女視頻。
OpenAI發布文字直接生成視頻工具。
OpenAI發布文字直接生成視頻工具。
人工智能生成的電影宣傳片。
人工智能生成的電影宣傳片。
人工智能生成的中國龍年賀歲視頻。
人工智能生成的中國龍年賀歲視頻。
網友說:將要失業了。
網友說:將要失業了。
網友對這個人工智能的關注。
網友對這個人工智能的關注。

另外公開的視頻,包括一部電影預告片,講述了30歲太空人戴著紅色羊毛針織摩托車頭盔的冒險經歷。畫面中,藍天、鹽漠,電影風格,如35毫米膠片拍攝,色彩鮮艷。

AI也生成了一段中國龍年春節視頻,紅旗招展人山人海。有緊跟舞龍隊伍抬頭好奇觀望的兒童,還有不少人掏出手機邊跟邊拍,海量人物角色各有各的行為。

對於這些由AI僅由文字就能生成的視頻,網友直呼「game over」、「工作要丟了」,甚至有人已經開始「悼念」一整個行業。還有網友表示,電影業要徹底顛覆了。

一位YouTube博主Paddy Galloway發表了對Sora的感想,他表示內容創作行業已經永遠的改變了,並且毫不誇張。「我進入YouTube世界已經15年時間,但OpenAI剛剛的展示讓我無言…動畫師/3D藝術家們有麻煩了,素材網站將變得無關緊要,任何人都可以無壁壘獲得難以置信的產品,內容背後的『想法』和故事將變得更加重要。」

這個人工智能影片出現「穿幫」,籃球「穿」過了鐵籃筐。
這個人工智能影片出現「穿幫」,籃球「穿」過了鐵籃筐。

對於Sora當前存在的弱點,OpenAI也不避諱,指出它目前可能難以准確模擬復雜場景的物理原理,並且可能無法理解因果關係。

周鴻祎:AGI或在一兩年內就可以實現

內地的科技公司360集團創始人、董事長周鴻祎在微博發文談OpenAI視頻生成模型Sora。他表示,OpenAI訓練這個模型應該會閱讀大量視頻,大模型加上Diffusion技術需要對這個世界進行進一步了解,學習樣本就會以視頻和攝像頭捕捉到的畫面為主。一旦人工智能接上攝像頭,把所有的電影都看一遍,把YouTube上和TikTok的視頻都看一遍,對世界的理解將遠遠超過文字學習,一幅圖勝過千言萬語,而視頻傳遞的信息量又遠遠超過一幅圖,這就離AGI(通用型人工智能)真的就不遠了,不是10年20年的問題,可能一兩年很快就可以實現。

---
《星島頭條》APP經已推出最新版本,請立即更新,瀏覽更精彩內容:https://bit.ly/3yLrgYZ