亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        Sora與世界模型

        2024-03-28 15:34:48費斌杰
        南風窗 2024年7期
        關鍵詞:主網(wǎng)真實感貓貓

        費斌杰

        2月15日,OpenAI發(fā)布了Sora模型,能夠根據(jù)提示詞生成長達一分鐘的視頻,效果以假亂真。

        Sora究竟是怎么做到的呢?

        微軟研究院在近期發(fā)布了一篇論文,對Sora背后的技術框架給出了猜測,還是有較高的可信度的。

        我先給大家講一下重點。

        關鍵技術一:DiT。Sora模型與此前同類模型相比,最大的區(qū)別在于使用DiT作為模型的主網(wǎng)架構。

        DiT全稱為Diffusion Transformer,其本質(zhì)是DDPM與Transformer的結合。DDPM即去噪擴散概率模型,是一種傳統(tǒng)的擴散模型。

        Sora和Runway、Pika都用了Diffusion擴散模型。不同之處在于,Sora把主網(wǎng)架構從U-Net換成了Transformer。

        值得一提的事,DiT并不是一個新模型,是去年3月份發(fā)布的,兩個作者分別是Peebles和謝賽寧。

        Peeble在不久之后進入了OpenAI,成為Sora模型的核心主力,而謝賽寧教授則在紐約大學任教。

        有趣的是,當時他倆的這篇跨時代的論文,被CVPR拒稿了,因為創(chuàng)新不足(limited novelty)。

        關鍵技術二:視頻壓縮網(wǎng)絡與時空區(qū)塊。視頻數(shù)據(jù)包含的信息量巨大,如果不進行壓縮處理就開始訓練,會消耗大量帶寬和存儲資源。

        因此,Sora通過“視頻壓縮網(wǎng)絡”技術,將輸入的圖片或視頻壓縮成一個更低維度的表示形式。

        根據(jù)推測,這里的視頻壓縮網(wǎng)絡,大概率使用了VAE,即變分自編碼器。接下來,Sora將這些壓縮后的數(shù)據(jù)進一步分解為“時空區(qū)塊”(Spacetime Latent Patches),統(tǒng)一了圖像、視頻在“時間”與“空間”這兩個維度上的數(shù)據(jù)表達。

        這就是Sora能夠不限分辨率、視頻時長、視頻尺寸進行訓練的原因。

        理論上看,只要算力足夠,Sora生成的視頻長度可以無限長,圖像效果可以無限逼近真實。

        我們知道,涌現(xiàn)能力(Emergent Abilities)是本輪AI的第一性原理。

        如果說ChatGPT是涌現(xiàn)能力在文本生成方面的體現(xiàn),那么Sora模型就是涌現(xiàn)能力在視頻生成領域的體現(xiàn)。

        關于Sora是否存在涌現(xiàn),一直存在爭議。我認為這個結論是相當明確的。

        因為,“真實感”本身就是一種涌現(xiàn)。

        這次Sora生成的視頻,很多朋友看到的第一感受,就是“真實”。

        其實,要讓我們?nèi)祟惛杏X到真實,是一件看起來簡單,實則非常困難的事情。

        因為真實感的背后,是無數(shù)細節(jié)的堆疊。

        以Sora生成的貓貓走路視頻為例。這個視頻看起來很真實,是因為:

        潮濕地面的光影反射,符合基本光學原理。貓貓走路是四肢協(xié)調(diào),符合基本的曲柄連桿機械原理,以及自由度限制。貓咪毛茸茸且飄逸的毛發(fā),符合基本的流體力學原理,等等。

        只要其中有哪怕一處細節(jié)與常識嚴重不符,就會打破“真實感”。所以,真實感,其實也是一種涌現(xiàn)。需要無數(shù)個細節(jié)的擬真,才會涌現(xiàn)出真實感。

        Sora告訴我們,通過訓練大型視頻生成模型,有望構建真正意義上的物理世界模型,從而增進我們對世界的理解。

        相信Sora只是開始,還有更多的精彩在路上。

        猜你喜歡
        主網(wǎng)真實感貓貓
        SOA架構電力主網(wǎng)調(diào)度自動化圖模數(shù)一體化系統(tǒng)研究
        基于灰色關聯(lián)度的110千伏主網(wǎng)基建模型研究
        電氣自動化(2021年4期)2021-09-23 08:45:48
        世界海拔最高縣西藏雙湖縣納入國家電網(wǎng)主網(wǎng)覆蓋
        伙伴(2020年1期)2020-02-14 07:39:50
        藏貓貓
        回歸真實感
        房卡“藏貓貓”
        貓貓去哪兒
        細推物理重體驗 表現(xiàn)人物貴專精
        戲劇之家(2016年20期)2016-11-09 22:03:27
        淺議假定情境與表演的真實感
        戲劇之家(2015年24期)2016-01-12 18:48:40
        南豐蜜桔造型
        国产一级一厂片内射视频播放| www国产精品内射熟女| 免费看操片| 精品亚洲一区二区视频| 日本视频一中文有码中文| 国产精品特级毛片一区二区三区 | 天堂中文在线资源| 国产精品天堂avav在线| 久久本道久久综合一人| 日韩人妻另类中文字幕| 亚洲一区二区三区中文字幂| 国产亚洲AV无码一区二区二三区| 亚洲成av人片在久久性色av| 久久午夜av一区二区三区| 中国内射xxxx6981少妇| 久久综合视频网站| 国产女主播福利一区二区| 国产精品久久精品第一页| 少妇被躁爽到高潮无码文| 亚洲国产福利成人一区二区| 美女与黑人巨大进入免费观看| 69精品人人人人| 国产精品厕所| 韩国免费一级a一片在线| 日韩女同精品av在线观看| 国产精品综合一区二区三区| 欧美日韩精品一区二区三区高清视频| 亚洲蜜臀av一区二区三区漫画| 摸丰满大乳奶水www免费| 国产微拍精品一区二区| 熟女少妇av免费观看| 国产熟女一区二区三区不卡| 精品国产一区二区三区免费| 久久久久久久一线毛片| 强迫人妻hd中文字幕| 美女高潮黄又色高清视频免费| 亚洲香蕉成人AV网站在线观看 | 一本一本久久a久久精品综合| 老熟妇高潮av一区二区三区啪啪| 痴汉电车中文字幕在线| 国产成人乱色伦区|