沈 浩 盧 偉
中國(guó)傳媒大學(xué),北京 100024
基于深度學(xué)習(xí)等算法,通過文本、圖片、視頻等數(shù)據(jù)進(jìn)行訓(xùn)練而得到的能夠生成全新內(nèi)容的模型,我們稱之為生成式人工智能(Generative AI),同時(shí)為了區(qū)別于專業(yè)生產(chǎn)內(nèi)容(Professional Generated Content,PGC)和用戶生產(chǎn)內(nèi)容(User Generated Content,UGC),我們將這種新的生成式網(wǎng)絡(luò)信息內(nèi)容稱為人工智能生成內(nèi)容(Artificial Intelligence Generated Content, AIGC)。[1]2022 年11 月,基于問答的文本生成模型ChatGPT(Chat Generative Pre-trained Transformer)發(fā)布測(cè)試,很快火遍全網(wǎng),瑞銀集團(tuán)當(dāng)?shù)貢r(shí)間2 月1 日發(fā)布的一份研究報(bào)告顯示:短短一周之內(nèi)ChatGPT 用戶量便超一百萬,兩個(gè)月活躍用戶就達(dá)到了上億級(jí)。
ChatGPT 以問答的形式,融合聚攏了眾多的自然語言處理技術(shù),這類模型被稱為大語言模型(Large Language Model)。大語言模型是在大規(guī)模語料上進(jìn)行訓(xùn)練后得到的深度學(xué)習(xí)模型,可以理解輸入語言文本的含義,生成自然語言文本。它能夠更好地理解對(duì)話主題和用戶需求,可以給出更加真實(shí)、生動(dòng)和自然的回答,更好理解語言的結(jié)構(gòu)和上下文,使用戶的交互體驗(yàn)更加完善。
由此,像GPT 這樣的大語言模型在各領(lǐng)域的應(yīng)用也逐漸吸引了學(xué)術(shù)界更多的目光。GPT、Midjourney 以及AudioLM 是分別在語言生成、圖像生成及音頻生成方面表現(xiàn)較為優(yōu)秀的模型或工具。
生成式預(yù)訓(xùn)練Transformer 模型(Generative Pre-Trained Transformer,GPT)進(jìn)化至今,已成為千億級(jí)別參數(shù)量的大語言模型[2],在學(xué)習(xí)和理解人類語言的同時(shí),以積累的大量知識(shí)為基礎(chǔ),分析對(duì)話的上下文并能夠給出自然、流暢且質(zhì)量較高的回答。簡(jiǎn)而言之,它以積累的大量知識(shí)儲(chǔ)備為支撐,能夠進(jìn)行更符合人類常識(shí)和價(jià)值觀的對(duì)話。圖1 為OpenAI 官方對(duì)ChatGPT 原理的介紹。
圖1 ChatGPT 訓(xùn)練思路①
于2022 年3 月問世的Midjourney 是一款僅憑輸入文字就可以利用人工智能產(chǎn)出圖片的AI 繪圖工具。其實(shí)質(zhì)是利用Discord 機(jī)器人處理用戶與AI 服務(wù)器之間的請(qǐng)求和響應(yīng),將用戶編寫的參數(shù)傳入官方模型中,并將生成的圖片結(jié)果返回給用戶。2023年更新的Midjourney v5 版本憑借逼真的出圖質(zhì)量成功獲得了廣泛關(guān)注。圖2 是Midjourney 生成的名為“中國(guó)情侶”的圖片。
圖2 Midjourney 生成的圖像②
AudioLM 是一款音頻生成框架,用于生成長(zhǎng)時(shí)間連貫的高質(zhì)量音頻。其通過將輸入的音頻映射成離散的標(biāo)記序列,使用Transformer 模型預(yù)測(cè)序列中的下一標(biāo)記,并轉(zhuǎn)換成音頻輸出。簡(jiǎn)單來說,AudioLM 可以僅憑輸入的音頻為模板將其自然連貫地延續(xù)下去。圖3 是Google Research 上一篇博客《AudioLM:一種音頻生成的語言建模方法》中展示的訓(xùn)練AudioLM(音頻生成模型)的過程。
圖3 音頻生成模型AudioLM 架構(gòu)③
生成式人工智能正在改變各種行業(yè),影視行業(yè)自然也不例外。影視行業(yè)是一個(gè)復(fù)雜的產(chǎn)業(yè),其受眾、發(fā)行、制作的技術(shù)和設(shè)備對(duì)于影視作品的成功與否都有著重要影響。制作環(huán)節(jié)所占比重最大,是影視行業(yè)發(fā)展的基礎(chǔ),包括劇本創(chuàng)作、拍攝、后期制作等。而生成式人工智能恰恰能夠給予這些工作更高效、更準(zhǔn)確的支持,比如自動(dòng)編寫劇本、自動(dòng)對(duì)焦、智能剪輯、顏色校正、特效制作等。
在影視作品面向受眾的環(huán)節(jié)中,其市場(chǎng)表現(xiàn)與盈利水平構(gòu)成重要的價(jià)值指標(biāo)。生成式人工智能可以在分析觀眾反饋和評(píng)價(jià)以及預(yù)測(cè)市場(chǎng)表現(xiàn)等方面給出新的思路,比如利用生成式推薦范式為用戶推薦更加符合偏好的作品,從而提高影視作品的盈利能力。
總而言之,生成式人工智能不僅能夠大幅度提升影視作品的生產(chǎn)效率,還能夠影響其傳播效率和市場(chǎng)表現(xiàn),推動(dòng)影視行業(yè)的發(fā)展。Gartner 預(yù)測(cè),到2030 年,電影大片中AI 生成內(nèi)容的比例將從2022 年的0%上升到90%[3]。
NAB Show 是美國(guó)廣播電視協(xié)會(huì)主辦的年度貿(mào)易展,是全美最大的媒體、娛樂和技術(shù)展會(huì)。在剛剛結(jié)束的NAB Show 2023 中,生成式人工智能幾乎成為了最重要的主題。Adobe 和Blackmagic 推出的AI 工具已經(jīng)被用于《壯志凌云2:獨(dú)行俠》《阿凡達(dá):水之道》等電影中[4]。
新技術(shù)正在改變電影的構(gòu)思、開發(fā)和制作方式。生成式人工智能正在改變電影制作過程,并為創(chuàng)意表達(dá)提供新的機(jī)會(huì)。下面從內(nèi)容生成、視覺效果、后期制作、市場(chǎng)優(yōu)化和觀眾參與五個(gè)方面探討生成式人工智能可能為影視行業(yè)帶來的變化。
傳統(tǒng)的電影劇本創(chuàng)作方式往往要經(jīng)過一系列環(huán)節(jié),比如創(chuàng)意構(gòu)思、擬定故事大綱、角色塑造、情節(jié)細(xì)化、修正潤(rùn)色等,需要投入大量的創(chuàng)作時(shí)間和精力。
不同于此,生成式語言模型能夠通過自然語言處理(NLP)技術(shù)和機(jī)器學(xué)習(xí)(ML)算法生成符合語法語義規(guī)則且內(nèi)容相對(duì)真實(shí)流暢的文本描述,通過ChatGPT 等模型,我們可以通過對(duì)話的形式或者輸入一系列關(guān)鍵詞供模型識(shí)別參數(shù)并擬定劇本的核心要素,或提供更為精細(xì)的語料素材,供其進(jìn)行加工,自動(dòng)生成完整的劇本。
ChatGPT 等模型已具備高度貼近人類常識(shí)的劇本創(chuàng)作能力,能夠根據(jù)輸入的提示語生成完整的劇情。圖4是作者嘗試的一段示例。
圖4 文本生成示例
只要給出的條件夠多,生成式語言模型完全可以生產(chǎn)出邏輯清晰的劇本供編劇參考。
除了幫助設(shè)計(jì)場(chǎng)景制作和構(gòu)圖方案、為服裝道具設(shè)計(jì)提供靈感、提供各種特效制作方法外,生成式語言模型甚至可以直接根據(jù)輸入的內(nèi)容提供相應(yīng)制作成熟的視頻片段等。
Meta AI 公司于2022 年9 月29 日首次推出的人工智能系統(tǒng)Make-A-Video 成功實(shí)現(xiàn)了文本到視頻、圖片到視頻以及視頻到視頻等的生成功能。此類生成式模型帶來的啟發(fā)無疑為電影制作提供了更多新的選擇和便利。用戶輸入幾個(gè)單詞或幾行文字,或上傳一段已有的圖片或視頻,即可生成一段新的短視頻。圖5 來自Meta AI 公司官網(wǎng)提供的一段參數(shù)“A dog wearing a Superhero outfit with red cape flying through the sky”生成的短視頻。
圖5 文本生成短視頻示例④
傳統(tǒng)電影拍攝過程中有些難以拍攝的場(chǎng)景往往需要進(jìn)行前期布景和后期制作,如《變形金剛》系列電影為了達(dá)到讓觀眾更加身臨其境的效果,其制作中用到了很多特殊鏡頭設(shè)計(jì)、拍攝技法調(diào)整、場(chǎng)景布局以及新技法嘗試等[5]。
而有了生成式模型的幫助,不僅可以根據(jù)一段制作好的鏡頭生成不同片段(圖6),甚至還能將靜態(tài)的圖片直接轉(zhuǎn)為生動(dòng)的視頻(圖7),在拓寬作品想象力,提升觀眾視聽效果的同時(shí),也同樣節(jié)省了大量人力物力。
圖6 視頻轉(zhuǎn)多個(gè)變體④
圖7 靜態(tài)圖片轉(zhuǎn)視頻④
生成式人工智能還可以幫助完成虛擬現(xiàn)實(shí)(VR)技術(shù)中的場(chǎng)景制作等。由于視差、拍攝環(huán)境要求嚴(yán)格、素材存儲(chǔ)和傳輸困難、后期編輯困難等原因,VR 電影技術(shù)瓶頸主要體現(xiàn)在拍攝制作技術(shù)難度大和藝術(shù)創(chuàng)作難度大。2023 年3 月28 日,騰訊AI Lab 發(fā)布了自主研發(fā)的3D 游戲場(chǎng)景自動(dòng)生成解決方案,為AI 生成真實(shí)度較高的3D 場(chǎng)景提供了實(shí)現(xiàn)基礎(chǔ)[4]。
AI 驅(qū)動(dòng)的算法可以分析和編輯素材、應(yīng)用視覺效果,并協(xié)助進(jìn)行顏色分級(jí)、聲音設(shè)計(jì)和視頻編輯,這加快了后期制作過程,節(jié)省了時(shí)間和精力?;诰珳?zhǔn)的自動(dòng)標(biāo)記和識(shí)別技術(shù),人工智能不僅能夠幫助電影制作人完成音頻素材的管理和編輯,去除其中的噪音,提高音質(zhì),還能通過解析視頻素材,識(shí)別其中的角色和情感等信息,完成自動(dòng)剪輯、生成預(yù)告片和短視頻等復(fù)雜操作。甚至可以通過學(xué)習(xí)大量的案例素材,自動(dòng)生成新的特效和動(dòng)畫效果,大大提高電影的制作效率和質(zhì)量,節(jié)省制作成本。
如“剪映”“Genny”等應(yīng)用已經(jīng)能夠提供較為成熟、滿足用戶需求的智能音頻生成以及智能剪輯等功能。
通過大數(shù)據(jù)分析有關(guān)制作成本、票房表現(xiàn)和觀眾參與度的數(shù)據(jù),為具有成本效益的制作策略、營(yíng)銷活動(dòng)和收入預(yù)測(cè)提供見解和建議。以大數(shù)據(jù)分析用戶偏好為基礎(chǔ),通過模型解析電影作品,總結(jié)其中所包含的關(guān)鍵元素,如導(dǎo)演、演員陣容、題材、時(shí)長(zhǎng)等,再通過總結(jié)比對(duì)歷史上相似度較高的影視作品的票房數(shù)據(jù),在一定置信度內(nèi)可以預(yù)測(cè)當(dāng)前作品的票房、口碑等,并給出優(yōu)化建議[6]。
2013年奈飛(Netflix)通過大數(shù)據(jù)技術(shù)捧紅《紙牌屋》的成功案例提供了有力的現(xiàn)實(shí)依據(jù)。奈飛通過收集分析大量用戶的收視選擇、評(píng)論、搜索、播放操作等信息,總結(jié)出廣大受眾客觀的喜好,并以此作為依據(jù)決定成片方式、演員和導(dǎo)演的選擇以及播出時(shí)段等,使公司當(dāng)季收入同比提升了18%[7]。
這一成功案例讓全世界意識(shí)到了大數(shù)據(jù)的力量,隨著大模型在電影行業(yè)被提出與應(yīng)用,人工智能得以助力更高效與更精準(zhǔn)地分析用戶偏好,抽象出電影作品要素,在此基礎(chǔ)上,智能推薦與區(qū)塊鏈技術(shù)的疊加使用,使得電影作品能夠以較低的存儲(chǔ)和傳輸成本、更為個(gè)性化的表現(xiàn)形式觸達(dá)用戶。
智能推薦系統(tǒng)為滿足廣大用戶的個(gè)性化需求,針對(duì)不同行業(yè)的智能推薦系統(tǒng)給出了優(yōu)秀的解決方案,即首先通過大數(shù)據(jù)收集用戶的行為特征數(shù)據(jù),構(gòu)建精準(zhǔn)的用戶畫像,再通過用戶的歷史行為數(shù)據(jù)對(duì)用戶群體進(jìn)行分類,最后綜合這些數(shù)據(jù)并結(jié)合使用場(chǎng)景,按照預(yù)設(shè)的推薦策略進(jìn)行個(gè)性化推薦[8][9]。
受AIGC 啟發(fā)提出的生成式推薦范式為實(shí)現(xiàn)AI自動(dòng)編輯或生成Items 以及通過交互引導(dǎo)內(nèi)容編輯和生成活動(dòng)提供了理論基礎(chǔ),即用戶通過語言文字或按鈕選項(xiàng)進(jìn)行輸入后,AI 可以自動(dòng)分析用戶偏好并結(jié)合當(dāng)前語境為用戶生成適合的選擇。圖8 為知乎文章《生成式推薦:邁向下一代推薦系統(tǒng)新范式》介紹的生成式推薦范式。
圖8 智能推薦系統(tǒng)架構(gòu)⑤
互動(dòng)電影也可仿照這種范式,在智能推薦的基礎(chǔ)上分析用戶的行為特征以及群體分類等,按照一定的主題生成既匹配用戶特征又契合當(dāng)前劇情的選項(xiàng)參數(shù),并根據(jù)用戶之前的選擇動(dòng)態(tài)地生成更加符合用戶偏好的劇情節(jié)奏和走向。
值得一提的是,基于模型創(chuàng)建的電影,無論是單一劇情還是互動(dòng)型電影,都可以由一系列參數(shù)完成。也就是說只需要將同樣的參數(shù)輸入相同的模型,便可生成高度相似或相同的體驗(yàn),對(duì)個(gè)性化的AI 生成電影進(jìn)行共享,即二次體驗(yàn)。而這些數(shù)字化的參數(shù)存儲(chǔ)與傳輸比媒體文件容易得多,這就為區(qū)塊鏈技術(shù)的加持提供了可能,筆者將在下文進(jìn)行進(jìn)一步闡述。
總的來說,對(duì)小型工作室和獨(dú)立制作人,生成式人工智能可以輔助制作者們以更低的成本和人力制作出更好的作品。而對(duì)大型影視公司,AI 則可幫助他們優(yōu)化流程和預(yù)算分配,在同樣的投入下獲得更好的投資回報(bào)。
隨著互聯(lián)網(wǎng)的發(fā)展,對(duì)數(shù)據(jù)保密性要求逐漸提高,在網(wǎng)絡(luò)中各節(jié)點(diǎn)和信道都缺乏可信度的情況下,區(qū)塊鏈技術(shù)提供了優(yōu)秀的解決方案。
區(qū)塊鏈技術(shù)將時(shí)間戳、交易數(shù)據(jù)等一系列數(shù)據(jù)加密組裝并按時(shí)間順序劃分成一個(gè)個(gè)區(qū)塊再串接在一起,基于非對(duì)稱加密算法、共識(shí)機(jī)制等構(gòu)建出一個(gè)去中心化且可靠的數(shù)據(jù)模式,實(shí)現(xiàn)了一種高度獨(dú)立、安全高效的自由經(jīng)濟(jì)。用戶通過區(qū)塊鏈技術(shù)可以放心地進(jìn)行數(shù)字資產(chǎn)交易。
有了區(qū)塊鏈技術(shù)的加持,AI 生成電影作品可以以封裝好的參數(shù)序列形成數(shù)字資產(chǎn),在互聯(lián)網(wǎng)上實(shí)現(xiàn)安全、高效傳輸,并為實(shí)現(xiàn)一系列功能打下基礎(chǔ)。
影視作品的版權(quán)保護(hù)一直受到人們高度關(guān)注,由于AI 生成電影的制作方式只需簡(jiǎn)單的參數(shù)輸入,雖有一定的專業(yè)門檻,有條件者都可以使用模型或調(diào)用第三方提供的接口生成,在版權(quán)保護(hù)方面更容易引發(fā)思考。
區(qū)塊鏈技術(shù)為版權(quán)保護(hù)提供了高效、安全的解決方案。使用區(qū)塊鏈存儲(chǔ)電影的數(shù)字版權(quán)信息、登記周期等,可以大大減少登記和維權(quán)的成本,同時(shí)也能夠幫助提升保密性,節(jié)約交易成本[10]。近幾年興起的基于區(qū)塊鏈技術(shù)保護(hù)數(shù)字版權(quán)的概念也已誕生了相關(guān)產(chǎn)品,如螞蟻集團(tuán)提供的區(qū)塊鏈版權(quán)平臺(tái)等,已經(jīng)構(gòu)建出了較為成熟的維權(quán)體系。
由前文總結(jié)可以得出,在引入了AI 生成電影這一概念之后,不僅電影作品本身,與之綁定的一些數(shù)據(jù)如主題、作者、版權(quán)號(hào)等信息完全可以歸為一個(gè)整體,在生成電影時(shí)只需將額外綁定的參數(shù)用算法剝離出來,對(duì)電影作品本身不會(huì)構(gòu)成影響,這就給AI生成電影的發(fā)行、放映以及版權(quán)保護(hù)等提供了極大的便利。整部電影包括其生成時(shí)必要的參數(shù)、署名、發(fā)行商、版權(quán)號(hào)等經(jīng)打包后可以以較以往“輕便”得多的方式實(shí)現(xiàn)發(fā)行、溯源、維權(quán)等。
(1)偏見與歧視。由于地理環(huán)境、政治因素、文化差異等限制,供模型用于學(xué)習(xí)的數(shù)據(jù)可能有一定的局限性,存在社會(huì)偏見,進(jìn)而導(dǎo)致了其生成的作品也在一定程度上受到影響。例如ChatGPT 在訓(xùn)練時(shí)更多使用的是以英語為主的西方的語料,所以其生成的內(nèi)容也更多地體現(xiàn)了西方主流價(jià)值觀。
(2)“深度造假”等技術(shù)帶來的虛假內(nèi)容。AI 依托生成對(duì)抗網(wǎng)絡(luò)(GAN)技術(shù),通過學(xué)習(xí)大量真實(shí)圖像、視頻和聲音素材,可以生成真實(shí)人物的虛假外貌和行為,從而進(jìn)行深度造假或深度偽造(Deepfakes)。人工智能被用于多起網(wǎng)絡(luò)詐騙,對(duì)信息和財(cái)產(chǎn)安全造成威脅,甚至其通過面部圖像、視頻替換技術(shù)對(duì)個(gè)人的肖像權(quán)與名譽(yù)權(quán)造成損害。此外,隨著生成式人工智能產(chǎn)生的作品數(shù)量和樣式的積累,人們不禁發(fā)問:這些作品的歸屬權(quán)究竟在于輸入?yún)?shù)創(chuàng)造作品的作者,還是訓(xùn)練模型代碼的編寫者,亦或是AI系統(tǒng)的運(yùn)營(yíng)者。
(3)版權(quán)與問責(zé)。在使用AI 工具生成作品的過程中,使用者可能需要提供個(gè)人數(shù)據(jù),也引起了人們對(duì)個(gè)人信息保護(hù)的擔(dān)憂。隨著AI 工具越來越復(fù)雜,其內(nèi)容和版權(quán)的歸屬問題問責(zé)難度提高,所產(chǎn)生的負(fù)面結(jié)果應(yīng)該由誰來負(fù)責(zé),這一問題值得深入探討。
在各行各業(yè),關(guān)于人工智能是否會(huì)替代人類的勞動(dòng),對(duì)原本的社會(huì)結(jié)構(gòu)產(chǎn)生影響一直是人們熱衷探討的話題。隨著ChatGPT 強(qiáng)大的功能在互聯(lián)網(wǎng)上被越來越多地討論,其是否在創(chuàng)作型的工作崗位中具有替代性的探討也受到了人們的廣泛關(guān)注。
在電影創(chuàng)作方面,人工智能可以通過大量的算法和數(shù)據(jù),替代人工完成如字幕添加、特效制作、配樂剪輯等需要一定專業(yè)技能的工作。在節(jié)省人力、提高工作效率的同時(shí)也為電影創(chuàng)作者提供了更多的創(chuàng)作空間。
另外,人工智能可以幫助分析觀眾的行為和喜好并提供數(shù)據(jù)支持,創(chuàng)作者可以更加精準(zhǔn)地把控作品的受眾和市場(chǎng),提高電影作品的質(zhì)量。
雖然人工智能在一些方面可以代替人類更好地發(fā)揮作用,但由于其能力實(shí)際上是基于大量訓(xùn)練數(shù)據(jù)的積累,無法提供主觀的結(jié)果,在創(chuàng)造力和想象力方面是無法完全替代電影創(chuàng)作者的。另一方面,人類的情感和價(jià)值觀是機(jī)器無法準(zhǔn)確理解和表達(dá)的,在創(chuàng)作過程中,這些必不可少的因素都需要由人類去進(jìn)行創(chuàng)作和把控。
早在2014 年,Google 研究員就已經(jīng)開始研究AI創(chuàng)建圖像,并取得了一定的成果。AI 生成圖像技術(shù)發(fā)展至今,已經(jīng)能夠生成出以假亂真的高質(zhì)量圖像。人們不由得發(fā)問:演員會(huì)不會(huì)被AI生成圖像所替代?
實(shí)際上,在現(xiàn)有科技水平下,使用人工智能生成的高質(zhì)量演員圖像除了在真實(shí)感和自然度無法完全還原人類外,其語氣語調(diào)和面部表情等也很難做到精確模擬。另外,專業(yè)演員需要通過一定的表演技巧和自身的情感表現(xiàn)將電影角色的內(nèi)心世界表達(dá)給觀眾,不僅是面部表情和語調(diào)的變化,多層次、多維度的表演藝術(shù)是人工智能在短期內(nèi)無法完全理解和再現(xiàn)的。
綜上所述,人工智能發(fā)展至今雖已能夠在很多方面代替人類完成大量復(fù)雜的計(jì)算工作,但其在短期內(nèi)無法進(jìn)化到完全模擬人類進(jìn)行藝術(shù)創(chuàng)作等的水平。
當(dāng)前以ChatGPT 等為代表的生成式模型在互聯(lián)網(wǎng)上持續(xù)活躍,尤其是2023 年3 月14 日GPT-4 的發(fā)布,僅用了6個(gè)月的時(shí)間就將其給出事實(shí)性回應(yīng)的可能性提高了40%,讓人們看到了AI 新時(shí)代下模型的發(fā)展之迅速。而隨著以GPT 為代表的大型語言模型的進(jìn)一步發(fā)展,生成式人工智能技術(shù)必將帶來更多變革。
(1)自主人工智能模型開發(fā),通過強(qiáng)大的跨模態(tài)生成能力創(chuàng)建和生成自己的人工智能模型來學(xué)習(xí)和完成新任務(wù)。如在拍攝過程中針對(duì)不同場(chǎng)景、特效的處理,AI 可以自主收集不同類別的場(chǎng)景和特效素材,自主訓(xùn)練出新的模型,用來生成更加符合特定需求的場(chǎng)景和特效。例如《阿凡達(dá)》《星球大戰(zhàn)》這樣的特效電影,其中難以制作的特效便可以通過自動(dòng)訓(xùn)練模型生成,節(jié)約制作成本。
(2)更精確地預(yù)測(cè)未來情況,通過連接來自更多模式的更多數(shù)據(jù)點(diǎn),自主創(chuàng)建包含生態(tài)系統(tǒng)的整個(gè)虛擬世界,如自動(dòng)生成特效場(chǎng)景中完整的物理規(guī)則等。在電影《星際穿越》中,制作組需要針對(duì)故事中不同星球的引力等環(huán)境因素來制定不同的物理法則,再通過天體觀測(cè)、白晝交替的變化等特效鏡頭體現(xiàn)出來。有了AI 生成完整的虛擬世界之后,制作組可以將這些環(huán)境變化以及其在屏幕上的表現(xiàn)方式交給AI來完成,讓電影更具真實(shí)感。
作者貢獻(xiàn)聲明:
沈浩:指導(dǎo)設(shè)計(jì)整體框架,提出論文構(gòu)思及技術(shù)要點(diǎn),修訂論文,全文文字貢獻(xiàn)30%;
盧偉:主導(dǎo)完善論文框架,負(fù)責(zé)具體技術(shù)點(diǎn)整合及文字陳述,撰寫和修訂論文,全文文字貢獻(xiàn)70%。
注釋
①圖片已翻譯為中文,圖片來源:https://www.nolibox.com/creator_articles/principle_of_ChatGPT.html。
②圖片來源:環(huán)球網(wǎng)百度百家號(hào)https://baijiahao.baidu.com/s?id=1761200520504483423&wfr=spider&for=pc。
③圖片已翻譯為中文,圖片來源:https://ai.googleblog.com/2022/10/audiolm-language-modeling-approach-to.html。
④圖片來源:Make-A-Video 官網(wǎng)https://makeavideo.studio/。
⑤圖片已翻譯為中文,圖片來源:https://zhuanlan.zhihu.com/p/621252860。