近日,OpenAI正式發(fā)布文本生成視頻AI模型Sora,著實給了打工人一個巨大的開年驚喜,生成視頻的效果很“炸裂”,不僅畫質(zhì)清晰、細節(jié)到位,人物表情和視角也無限逼近于專業(yè)水準。
據(jù)官網(wǎng)介紹,Sora可以通過文本指令直接生成60秒以內(nèi)的視頻,在此之前的視頻生成模型一般只能生成15秒以內(nèi)的視頻。在官網(wǎng)給出的示例中,人物的瞳孔、睫毛、皮膚紋理,都逼真到看不出一絲破綻。
OpenAI在官網(wǎng)中介紹,Sora不是一個單純的視頻生成模型,而是能夠理解和模擬現(xiàn)實世界的模型的基礎(chǔ),稱之為world simulators(世界模擬器),將視頻生成作為幫助 AI 理解真實世界的工具?;蛟S我們可以理解為,AI吸收數(shù)據(jù),通過Sora生成物理世界的影像,并逐漸理解物理世界,最終準確、真實地對物理世界進行反饋和互動。終極目標應(yīng)該是具身智能體,而視頻生成只是過程中的一部分。這也是Sora與其他文生視頻大模型的本質(zhì)區(qū)別之一。
360董事長周鴻祎說:“Sora只是小試牛刀,它展現(xiàn)的不僅僅是一個視頻制作的能力,而是大模型對真實世界有了理解和模擬之后,會帶來新的成果和突破?!敝茗櫟t甚至預(yù)言AGI實現(xiàn)將從10年縮短到1年,這也是業(yè)內(nèi)人士對Sora感到震撼的縮影之一。
(據(jù)澎湃新聞2.20)