Previous Next

美國人工智能(AI)公司OpenAI上周四宣布推出由文本轉為影片的生成式AI模型Sora,可讓用戶透過簡單的文字指令立即創造出逼真的影片,隨即震撼中外高科技界,連日引發熱議。Sora可根據文本指令創建近似現實且富有想像力的場景,生成多種風格的高清影片,最長為一分鐘,恐顛覆影視產業。

創造聊天機械人ChatGPT和圖像生成器DALL-E的OpenAI稱,Sora(名字源於日文的天空)使用Transformer架構,可根據文字指令生成逼真影片,還能夠根據靜態圖像生成影片,或對現有影片進行擴展或填充缺失的幀。現時Sora未向公眾開放,僅主要給一些設計師和電影製作人等特定人群試用。但其橫空出世已經在中外互聯網和科技圈掀起熱議。沒有導演、演員的參與,Sora卻能快速生成出高度細緻的影片。有中國網民驚歎,就算失業也無話可說。

OpenAI官網的其中一段示範影片,顯示一名穿深藍色外套和紅色連身裙的女子,走在東京繁華的街道上。除了商店文字有瑕疵外,女人的動作、四周環境都高度逼真,難以找出破綻。

相關新聞:
AI時代︱Sora生成影片效果震撼 內地業界預言或被「打爛飯碗」
OpenAI發布文字直接生成視頻 網友:顛覆了電影業我將失業︱有片

Sora按文字提示生成的短片,可見一名時尚女性在霓虹燈光四射的東京街道行走,穿黑皮外套和連衣紅裙。 網上圖片
Sora按文字提示生成的短片,可見一名時尚女性在霓虹燈光四射的東京街道行走,穿黑皮外套和連衣紅裙。 網上圖片
短片中女子的痘斑和頸紋也明顯可見。
短片中女子的痘斑和頸紋也明顯可見。
Sora生成的影片顯示不同動物在海洋上參加單車比賽。
Sora生成的影片顯示不同動物在海洋上參加單車比賽。
有業界人士形容,未來不是寫劇本,而是寫影像。(openai.com)
有業界人士形容,未來不是寫劇本,而是寫影像。(openai.com)
有人認為,Sora對廣告等短片製作影響較大。(openai.com)
有人認為,Sora對廣告等短片製作影響較大。(openai.com)
雖然部分生成的影片仍有瑕疵,但效果仍是足以震撼業界。(openai.com)
雖然部分生成的影片仍有瑕疵,但效果仍是足以震撼業界。(openai.com)
Sora生成的影片效果讓不少人驚嘆。(openai.com)
Sora生成的影片效果讓不少人驚嘆。(openai.com)
內地業界有人認為,Sora或讓部份影視製作人工作崗位重新分配。(openai.com)
內地業界有人認為,Sora或讓部份影視製作人工作崗位重新分配。(openai.com)

AI在影片生成領域的巨大發展前景,為塑造影視產業新業態打開大門的同時,恐將顛覆現存影視產業。荷里活去年遭遇63年來首次編劇和演員全行業罷工,原因之一便是擔憂該行業的部分工作被AI取代。Sora面世讓這一威脅變得更逼近和真切。

業界:為深偽技術推波助瀾

雖不是第一間涉足文本轉影片領域的公司,但Sora的推出使OpenAI在這一賽道取得領先。OpenAI稱,Sora對語言有深刻的理解,不僅了解用戶文本提示,還了解所述事物在物理世界中的存在方式。「我們正在教授AI理解和模擬運動中的物理世界,目標是訓練模型幫助人們解決需要與現實世界交互的問題。」

OpenAI行政總裁奧爾特曼邀請用戶在社交平台X提出指令建議,幾分鐘後在這個平台上張貼頗具說服力的影片生成結果,其中包括兩隻黃金獵犬在山上開串流Podcast、老奶奶在廚房教烹飪、動物在海上騎腳踏車,以及珠光寶氣的動物園等。還有另一段影片顯示「半鴨半龍的生物飛馳在美麗的暮色中,背上騎着一隻身着探險裝備的倉鼠」。

不過,OpenAI警告,「目前的模型存有弱點」,影片中可能包含不合邏輯的圖像,混淆左右等空間細節,難以準確模擬複雜場景的物理原理和因果關係實例等。例如,一個人咬了一口餅乾,餅乾上卻沒有咬痕。不過,隨着模型改進,人們可能會在短期內獲得更加完善的影片生成功能。

不少業內人士擔心,Sora將為「深偽」技術推波助瀾。加州大學栢克萊分校訊息學院副院長法里德就表示:「當新聞、圖像、音頻、視頻——任何事情都可以偽造時,那麼在那個世界里,就沒有甚麼是真實的。」針對造假顧慮,OpenAI稱在真正面向公眾推出產品時,將確保生成影片包含來源元數據,並推出檢測視頻真偽的工具。

---
《星島頭條》APP經已推出最新版本,請立即更新,瀏覽更精彩內容:https://bit.ly/3yLrgYZ