官網(wǎng)介紹,OpenAI對外發(fā)布其首個(gè)人工智能文生視頻大模型Sora,能根據(jù)文字說明創(chuàng)造出逼真而富有想象力的場景,連馬斯克都感嘆“人類愿賭服輸”,360創(chuàng)始人周鴻祎更是預(yù)言“AGI實(shí)現(xiàn)將從十年縮短到兩三年。”
2月16日凌晨,OpenAI發(fā)布了文生視頻大模型Sora。Sora能夠根據(jù)文本提示創(chuàng)建詳細(xì)的視頻、擴(kuò)展現(xiàn)有視頻中的敘述以及從靜態(tài)圖像生成視頻場景。
在一個(gè)OpenAI提供的例子中,輸入提示語句“動畫場景的特寫鏡頭,一個(gè)毛茸茸的小怪物跪在一根融化的紅蠟燭旁邊。藝術(shù)風(fēng)格3D、逼真,重點(diǎn)是照明和紋理,情緒包括驚奇和好奇……”時(shí),Sora創(chuàng)造出了一個(gè)類似皮克斯和夢工廠電影中的動畫小怪物鏡頭。
雖然這類應(yīng)用早就出現(xiàn),但Sora的呈現(xiàn)仍然驚艷,視頻可實(shí)現(xiàn)多角度切換,保持視頻中出現(xiàn)的人物、景色的連貫性,甚至即便切換鏡頭,人物依然能夠保持一致,時(shí)長方面也有所突破,最長能生成60秒視頻。
OpenAI首席執(zhí)行官薩姆?奧特曼(Sam Altman)在社交平臺下場,對網(wǎng)友放言“留下想看什么的評論,我為你生成視頻”,并在兩小時(shí)內(nèi)“現(xiàn)點(diǎn)現(xiàn)做”放出了十多條視頻。這立刻引發(fā)了科技圈和影視圈的雙重“震撼”,油管粉絲高達(dá)2.39億的頂流網(wǎng)紅“野獸先生”直接在薩姆?奧特曼的社交賬號下哀求“求求你了薩姆,不要讓我沒有工作?!?/p>
Sora雖然是人工智能文生視頻大模型,但OpenAI并沒有單純的將其視為視頻模型,而是作為“世界模擬器”。
OpenAI表示,正在教AI理解和模擬運(yùn)動中的物理世界,目標(biāo)是訓(xùn)練模型來幫助人們解決需要現(xiàn)實(shí)世界交互的問題,根據(jù)文本提示生成視頻,僅僅只是整個(gè)計(jì)劃中的一步。
目前Sora已經(jīng)能夠生成具有多個(gè)角色、特定類型動作的復(fù)雜場景,不僅能理解用戶在提示中提出的要求,還了解這些物體在物理世界中的存在方式。比如一大群紙飛機(jī)在樹林中飛過,Sora知道碰撞后會發(fā)生什么,并表現(xiàn)其中的光影變化,它還可以在單個(gè)視頻中創(chuàng)建多個(gè)鏡頭。
當(dāng)然,Sora也存在著一定的弱點(diǎn),它可能難以準(zhǔn)確模擬復(fù)雜場景的物理原理,并且可能無法理解因果關(guān)系,混淆提示的空間細(xì)節(jié),難以精確描述隨著時(shí)間推移發(fā)生的事件。例如“五只灰狼幼崽在一條偏僻的碎石路上互相嬉戲、追逐”的場景中,狼的數(shù)量會發(fā)生變化,一些甚至憑空出現(xiàn)或消失。
多位人工智能領(lǐng)域人士表示,該問題可能因其概率模式的邏輯存有“硬傷”。加大訓(xùn)練量、增加訓(xùn)練數(shù)據(jù)與物理邏輯可改善該問題,但無法根治。
事實(shí)上,文生視頻大模型不是一條新賽道,OpenAI也并非賽道唯一的拓荒者。2023年6月,谷歌支持的人工智能初創(chuàng)公司Runway發(fā)布大模型Gen-2,可生成幾秒長的電影級影片;同年11月,動畫視頻生成公司Pika推出了可以生成分鐘級高質(zhì)動畫視頻的產(chǎn)品。
但Sora此次的技術(shù)創(chuàng)新,仍然引起了很多人的恐慌,不少評論區(qū)中出現(xiàn)“不禁止必會造成失業(yè)大潮”“導(dǎo)演、后期要失業(yè)了”等消極話語。一時(shí)間讓“顛覆技術(shù)”“顛覆行業(yè)”成為業(yè)內(nèi)熱議的關(guān)鍵詞。獵豹CEO傅盛認(rèn)為AI本質(zhì)上是平權(quán)工具,顛覆行業(yè)的同時(shí)也蓬勃了行業(yè)。
北京大學(xué)國家發(fā)展研究院助理研究員、BiMBA商學(xué)院副院長杜曉夢表示,效率的提升會帶來兩個(gè)選擇:人員的壓縮,或者擴(kuò)大工作量。“我看到更多的情況是,因?yàn)橛昧诉@個(gè)工具,我可以接更多的工作了。所以我覺得,用這個(gè)工具的公司會PK掉那些不用這個(gè)工具的公司?!贝送猓艜詨暨€指出,視頻行業(yè)還有很多的環(huán)節(jié)不能被替代,比如創(chuàng)意。
從事后期的工作人員也表示“解放”影視后期有點(diǎn)難,設(shè)計(jì)軟件也好,Sora也好,都只是工具,硬件和軟件的進(jìn)步都只是提高效率。后期是一個(gè)很大的范圍,涉及到拍攝、剪輯、包裝、調(diào)色、三維,這些工作還能細(xì)分,程序要把這么龐大的知識理解清楚是很難的。
隨著Sora的普及,第一批通過Sora賺錢的人已經(jīng)出現(xiàn)了。在某電商平臺上,關(guān)于Sora的教程、解讀,售價(jià)在幾元至近百元不等。其中一個(gè)售價(jià)為99元的課程簡介寫道“Sora一鍵生成視頻,限時(shí)優(yōu)惠99元?!币粡埦W(wǎng)傳截圖顯示,某機(jī)構(gòu)已售出2萬多份Sora培訓(xùn)課程,僅一天時(shí)間就獲得了200萬的收入。
作為AI培訓(xùn)付費(fèi)課程領(lǐng)域的頭部博主,李一舟此前曾推出AI課程《每個(gè)人的人工智能課》,原價(jià)999元,現(xiàn)價(jià)199元。飛瓜數(shù)據(jù)顯示,該課程一年內(nèi)賣出約25萬套,銷售額約5000萬。近期因違反《即時(shí)通信工具公眾信息服務(wù)發(fā)展管理暫行規(guī)定》暫停。
中國信息協(xié)會常務(wù)理事、國研新經(jīng)濟(jì)研究院創(chuàng)始院長朱克力表示,“李一舟人工智能課程被下架,無疑給當(dāng)前火熱的AI付費(fèi)課程市場敲響了一記警鐘。人們對于AI技術(shù)的興趣達(dá)到了前所未有的高度,但這種興趣背后,往往伴隨著對技術(shù)的誤解和盲目崇拜?!?/p>
DCCI互聯(lián)網(wǎng)研究院院長劉興亮認(rèn)為,Sora模型及其帶來的技術(shù)進(jìn)步,也引發(fā)了一系列倫理和社會挑戰(zhàn),“隨著AI生成內(nèi)容與現(xiàn)實(shí)之間的界限變得越來越模糊,如何確保內(nèi)容的真實(shí)性和透明性成為了一個(gè)重要問題。此外,版權(quán)、隱私和數(shù)據(jù)安全等問題也需要得到妥善解決?!?/p>
目前,OpenAI已經(jīng)將Sora提供給了一些藝術(shù)家用于創(chuàng)作,但距離面向公眾發(fā)行還需要一段時(shí)間,“我們將采取幾個(gè)重要的安全措施,并進(jìn)行對抗性測試,一旦公開發(fā)布,我們的文本分類器將檢查違反使用政策的文本輸入提示,例如極端暴力、色情內(nèi)容、名人肖像等?!監(jiān)penAI表示。