趙 瑜 張亦弛
2022年12月,《科學(xué)》雜志將生成式人工智能與詹姆斯·韋布空間望遠鏡、巨型細胞、多年生水稻等成果并舉,一同評選為年度科學(xué)突破。雖然人工智能多次進入相關(guān)榜單,但在被稱為生成式人工智能(AI Generated Content,AIGC)元年的2022年,《科學(xué)》雜志更加關(guān)注它在藝術(shù)領(lǐng)域的運用,提示我們正在面對一個具有創(chuàng)造力的人工智能時代(AI gets creative)。1
生成式人工智能目前最知名的產(chǎn)品就是ChatGPT,強大的自然語言理解能力讓人機交互能力獲得了令世人矚目的提升。ChatGPT快速的故事大綱和情節(jié)生成能力在其面世之初就引起了關(guān)注。同樣也在2022年12月,由ChatGPT “自編自導(dǎo)” 的電影短片《安全地帶》(The Safe Zone)問世。故事講述了在一個已經(jīng)被人工智能掌權(quán)的世界中,三個人類手足爭奪一家人中唯一一個進入政府 “安全地帶”的生存機會。短片帶有明顯的反烏托邦色彩。生成式人工智能日益顯現(xiàn)的“ 創(chuàng)作” 能力,也讓人類憂思未來藝術(shù)的 “安全地帶” 何在。人工智能進入藝術(shù)這一最高級的人類精神活動2并非毫無爭議,如《太空歌劇院》 獲獎之后蜩螗羹沸便是明證。
一直以來影視行業(yè)對生成式人工智能的態(tài)度相對友好,計算機圖形處理、數(shù)字虛擬拍攝、CG特效制作等多個領(lǐng)域都已嵌入自動內(nèi)容生成因素。目前行業(yè)已經(jīng)在哪些領(lǐng)域應(yīng)用生成式人工智能?使用的效果如何?從藝術(shù)本身帶有的復(fù)雜性來看,智能機器是否可以替代人類,生產(chǎn)出有溫度、有創(chuàng)造力的作品?本文將通過行業(yè)典型案例分析,為解答上述問題提供智識資源與實踐指引。
目前AIGC更多地居于產(chǎn)業(yè)討論范疇,是內(nèi)容生產(chǎn)主體地位向機器和算法的進一步開放。2022年9月,中國信通院和京東探索研究院共同發(fā)布了《人工智能生成內(nèi)容(AIGC)白皮書》,將AIGC定義為“既是從內(nèi)容生產(chǎn)者視角進行分類的一類內(nèi)容,又是一種內(nèi)容生產(chǎn)方式,還是用于內(nèi)容自動化生成的一類技術(shù)集合”。3這個概念和早前的 “機器生產(chǎn)內(nèi)容”(Machine Generated Content,MGC)有一定的關(guān)聯(lián)。4卡內(nèi)基梅隆大學(xué)和里海大學(xué)的研究者將AIGC定義為“使用高級生成式人工智能(GAI)技術(shù)生成的內(nèi)容,而非人類作者創(chuàng)造的內(nèi)容,(前者)可以在短時間內(nèi)自動創(chuàng)建大量內(nèi)容”。5
AI抑或機器,都在內(nèi)容生產(chǎn)領(lǐng)域引入了技術(shù)人工物,也都在隱喻一種脫離人類掌控的自動化生產(chǎn)場景。影視從誕生伊始就是以技術(shù)人工物為中介的時間和空間雙重采樣6,每秒24幀的呈現(xiàn)模式成功地打散了連續(xù)性的時間,這種離散式的生產(chǎn)觀念突破為新媒體的發(fā)展開辟了道路,也為影視產(chǎn)業(yè)與計算機技術(shù)的結(jié)合奠定基礎(chǔ)。當(dāng)下,自動文本生成、自動圖像和影像生成技術(shù)紛紛進入影視行業(yè),雖然應(yīng)用的程度和效果不一,但已經(jīng)為影視工作者、研究者和欣賞者描繪了一幅“具有創(chuàng)造力的人工智能” 產(chǎn)業(yè)圖景。
圖1.短片《陽春》(Sunspring)劇照
導(dǎo)演Oscar Sharp和藝術(shù)家Ross Goodwin 在2016 年 運 用AI “本杰明” 編劇了短片《陽春》(Sunspring)。“本杰明” 是一個神經(jīng)網(wǎng)絡(luò)模型,根據(jù)標(biāo)題、對話、道具與動作等 “提示” 深度學(xué)習(xí)了大量的科幻劇本之后進行自動創(chuàng)作。與此同時 “本杰明” 還生成了一首歌的歌詞,最后成為影片的配曲。從影視敘事和美學(xué)特質(zhì)分析,劇本中大部分的臺詞缺乏邏輯性和連貫性,時常讓人不知所云。例如,影片的結(jié)尾是女主角的獨白特寫長鏡頭,喃喃地說著:“我的意思是,他是虛弱的。我以為我可以改變我的想法。他瘋狂地要把它拿出來。這是很久之前了。他有些遲了。我將要成為一個時刻。我就是想要告訴你,我比他好很多……” 不僅臺詞含糊,《陽春》的故事結(jié)構(gòu)也較為混亂,沒有學(xué)習(xí)到經(jīng)典劇作敘事規(guī)范。這一方面是 “本杰明” 的參數(shù)不夠以致深度學(xué)習(xí)效果不佳所導(dǎo)致的,另一方面也客觀上顯現(xiàn)出當(dāng)時的人工智能技術(shù)水平仍不能勝任長段落的寫作。
2017年《陽春》的原班人馬又用AI “本杰明” 編劇了第二部短片《這不是游戲》(It’s No Game)。乍看之下,這次 “本杰明” 的創(chuàng)作令人驚喜:不但故事結(jié)構(gòu)、具體情節(jié)和臺詞寫作都有了明顯的進步,長段落前后連貫甚至富含深意。有評論因此認(rèn)為AI編劇替換人類編劇可能性甚高。7然而,“本杰明” 只是該片的第一編劇而非唯一編劇,導(dǎo)演Oscar Sharp也參與了劇本的創(chuàng)作,這是一次 “人機互補” 的創(chuàng)作。由于創(chuàng)作者沒有公布具體的人機創(chuàng)作比例,AIGC用于自動劇本生成是否有了實質(zhì)性的進步仍不得而知,但需要導(dǎo)演參與創(chuàng)作的結(jié)果使人推測系統(tǒng)生成的原作并不令人滿意。
2020年美國查普曼大學(xué)影視制作專業(yè)的兩名學(xué)生使用基于GPT-3的AI編劇Shortly Read,續(xù)寫了電影劇本并拍成短片《 目擊者》(Solicitors)。人類創(chuàng)作者給了AI編劇一個由兩三句話組成的 “激勵事件”(Inciting Incident),之后AI續(xù)寫了接下來的故事情節(jié)。最終成片除了前20秒,所有內(nèi)容均由Shortly Read軟件編劇。雖然部分語句存在歧義和不通順的情況,但總體的故事走向明朗而富有懸念,尤其令人類創(chuàng)作者驚訝的是Shortly Read 居然在劇作中埋入了兩個歐·亨利風(fēng)格的轉(zhuǎn)折。該片的導(dǎo)演Jacob Vaus表示:“從故事的角度來看它踩準(zhǔn)了情節(jié)點,雖然是以一種有些奇異的方式?!?也許以此來判斷AIGC已經(jīng)產(chǎn)生了獨特的創(chuàng)造性仍然為時過早。不過相比令人不明就里的《陽春》,《目擊者》在故事連貫性和臺詞寫作上都有了質(zhì)的提升。
2021年2月,第一部由AI寫作的戲劇《人工智能:當(dāng)一個機器人寫劇本》網(wǎng)絡(luò)公映。此劇總長60分鐘,講述了一個機器人充滿歡樂與痛苦的日常生活,涉及它如何理解人類的終極命題——愛與死亡,頗具未來版《小王子》的氣質(zhì)。9劇本由GPT-2編寫,創(chuàng)作過程與前文述及的系統(tǒng)類似,即程序員輸入一段提示后,GPT-2根據(jù)提示生成附加的文本。這是GPT-2的第一部戲劇作品,故事內(nèi)容連貫、明確,臺詞也符合情理、易于理解。然而,和《這不是游戲》一樣,該劇本同樣存在人為的改動,改動的比例大約為10%。哥倫比亞大學(xué)人工智能專家德漢特因此認(rèn)為將這個劇本視為由人工智能創(chuàng)造的并不準(zhǔn)確,他判斷由人工智能獨立生成一個連貫而情節(jié)復(fù)雜的戲劇劇本還需要15年左右的時間。10
2022年12月,ChatGPT “自編自導(dǎo)” 了電影短片《安全地帶》。創(chuàng)作團隊先讓ChatGPT進行 “頭腦風(fēng)暴”,自主生成多個故事想法。隨后制片人挑選了其中一個選題并讓ChatGPT完善具體的情節(jié)。當(dāng)系統(tǒng)生成離題或是不合理的情節(jié)時,創(chuàng)作團隊會給出新的提示以進行修正。11最后ChatGPT生成了一個4分鐘左右的劇本以及導(dǎo)演分鏡表,通過人機互動ChatGPT甚至提供了燈光、鏡頭焦段、相機運動、演員服裝等一系列建議12,如同一個人類導(dǎo)演一樣,參與了影片創(chuàng)作各個方面。當(dāng)然,這個作品的目的是展示人機合作的創(chuàng)作成果,這其中包含著大量的人類反饋與智慧。而且如果將ChatGPT的電影 “處女作” 與經(jīng)典科幻作品相比,質(zhì)量和深度仍無法與人類比肩。
總體而言,雖然自動文本生成在近些年有了實質(zhì)性的進步,大參數(shù)模型如GPT-3已能夠生成更加多元的文本,甚至在ChatGPT的應(yīng)用中產(chǎn)生準(zhǔn)社會互動,但影視劇本不僅關(guān)乎語言結(jié)構(gòu)的完整、連貫,也關(guān)乎意義和情感的生成,目前人工智能寫作系統(tǒng)對于情感和敘事結(jié)構(gòu)的學(xué)習(xí)和理解仍然需要人類創(chuàng)作者的輔助。
在自動圖像生成領(lǐng)域,最受人矚目的莫過于Open AI的自動圖像生成產(chǎn)品達利(Dall·E2)。該系統(tǒng)功能強大,可以基于輸入的自然語言文本生成圖片,甚至能夠通過語義判斷探索不同的藝術(shù)風(fēng)格。
而在與影視有著直接關(guān)聯(lián)的影像生成領(lǐng)域,也有了不少突破。2016年8月,IBM的 “沃森” 系統(tǒng)為21世紀(jì)??怂沟膽乙煽植榔赌Ω穭?chuàng)作了一支預(yù)告片。為此 “沃森” 深度學(xué)習(xí)觀摩了100個恐怖片的預(yù)告片,并進行了視覺、聽覺和場景構(gòu)成的分析。隨后 “沃森” 挑選出電影《摩根》6分鐘的情節(jié),人類剪輯師再對這些場景進行剪輯,形成最終版的預(yù)告片。13所以這同樣是一個人機互補合作的應(yīng)用,人工智能沒有獨立完成所有的剪輯工作,但也邁出了理解影像敘事結(jié)構(gòu)的第一步。
2018年,AI “本杰明” 創(chuàng)作了第三部科幻短片《神游天外》(Zone Out)。不同于以往兩部短片,“本杰明” 不僅寫作了劇本,還演出并導(dǎo)演了這部短片。由于AI系統(tǒng)并沒有實體形象或者攝像機,人類創(chuàng)作者讓它學(xué)習(xí)了《陽春》演員在綠幕前錄制的個人視頻以及所有公域(Public Domain)影片作為創(chuàng)作素材。系統(tǒng)生成的劇本仍然和《陽春》一樣沒有邏輯性和故事性,影像的 “換臉” 也并不成功:公域電影演員的臉與《陽春》三位主演的臉重疊在了一起,閃爍不清。時長為6分鐘的短片《神游天外》基本上是對公域電影素材的剪輯重組,這使得所謂的自編、自導(dǎo)、自演更像是一次自動剪輯的嘗試,而沒有生成真正意義上的新影像。
目前應(yīng)用自動拍攝和剪輯系統(tǒng)較為成熟的是短視頻領(lǐng)域,因為這一領(lǐng)域?qū)δJ交臄⑹陆Y(jié)構(gòu)和影像風(fēng)格接受度更高。2020年新華智云研發(fā)推出了國內(nèi)首個Vlog機器人。這套設(shè)備 “集合了360°環(huán)視高清攝像機、專業(yè)攝影機和超高算力邊緣計算節(jié)點,通過激光視覺多傳感器混合定位導(dǎo)航、人物識別追蹤等技術(shù),能自由移動、自主采集視頻、自動識別人物、自行生成專屬VLOG”。14它采集的資料能實時上傳,在云端剪輯、處理,最終形成短視頻。通過深度學(xué)習(xí),機器人生成的Vlog具有合乎情理的故事情節(jié)和多模態(tài)的內(nèi)容類型。15
圖2. 動畫短片《犬與少年》(The Dog and The Boy)劇照
在由文本生成影像(Text-to-Video)的領(lǐng)域,Netflix與作家、喜劇演員Keaton Patti合作,模仿機器人的語氣創(chuàng)作了一系列劇本,再由AI生成動畫,形成系列短片。這批短片在Youtube的 “網(wǎng)飛是個笑話”(Netflix is a Joke)頻道上播出。16網(wǎng)飛已經(jīng)從多個維度嘗試文本生成動畫的技術(shù),如2021年的《謎題先生希望你少活一點》(Mr. Puzzles Wants You to Be Less Alive),不但敘事流暢,保持了情節(jié)、人物、場景的連貫性,且畫面的鏡頭語言達到了一定水準(zhǔn)。2023年,網(wǎng)飛又與日本AI軟件公司Rinna合作制作了三分鐘的動畫短片《犬與少年》(The Dog and The Boy),并用AI生成了動畫片的背景。17網(wǎng)飛的官方新聞表示,動畫行業(yè)的人才短缺是推動其使用AI繪制背景的原因。18
如果說網(wǎng)飛主要聚焦動畫生成,那么2022年的谷歌文本生成影像模型Phenaki則在真實影像的自動生成上有了突破。Phenaki生成的影像最大的特點是 “有故事,有長度”。19它能根據(jù)要求智能生成不同的景別和鏡頭運動模式,且能處理一定程度的變形,如讓泰迪熊流暢地轉(zhuǎn)變?yōu)榇笮茇垺?0
根據(jù)美國國會研究服務(wù)部( Congressional Research Service)于2021年發(fā)布的《人工智能:背景、選擇性問題和政策考量》,自從2015年起,全球范圍內(nèi)投入人工智能的私人和公共基金一直在持續(xù)增長。對AI企業(yè)的投資從2015年的128億美元增長到了2020年的678億美元。21研發(fā)了ChatGPT與Dalle·E的Open AI截至2023年1月,已經(jīng)籌資110億美元。可以預(yù)測,隨著全球在AI和AIGC領(lǐng)域的不斷投入,將涌現(xiàn)出更多、更完善的影視自動內(nèi)容生成產(chǎn)品,它們對影視行業(yè)的影響也將涉及全產(chǎn)業(yè)鏈。
圖3. CHAT GPT
在影視制作的前期,AIGC可以協(xié)助人類創(chuàng)作者進行劇本創(chuàng)作、概念圖描繪以及分鏡。即使目前自動劇本生成仍然處于初級階段,存在著諸如缺乏情節(jié)連貫性、故事合理性、臺詞邏輯性等問題,但是隨著技術(shù)迭代與經(jīng)費持續(xù)投入,AIGC的質(zhì)量會越來越接近于人的創(chuàng)作。例如敘事連貫性是一直困擾文本自動生成領(lǐng)域的老問題,近年來就出現(xiàn)了諸多新模型以優(yōu)化技術(shù)方案。2019年研究者推出了 “獎勵—塑造” 技術(shù)來引導(dǎo)模型朝著一個已知目標(biāo)行進,最終的測試結(jié)果顯示這種技術(shù)可以生成一個穩(wěn)定且目標(biāo)完成度較高的故事情節(jié),同時人類的評估者也覺得如此生成的故事有更可靠合理的事件順序。22同年,另一批研究者探索了 “計劃與寫作”(Plan and Write)的方式,測試結(jié)果顯示,靜態(tài)計劃模式(把整個故事線都計劃出來后再生成故事)比動態(tài)模式(生成故事線的一個單詞,緊接著生成故事中的一句話)更加有效,生成的故事更加連貫而多樣化。23這為之后的研究者提供了思路指引,有助于新的自動編劇軟件生成更加符合人類閱讀習(xí)慣的劇本。
在影視拍攝和制作后期,從攝影、導(dǎo)演、表演,到剪輯、聲音和配樂,AIGC的潛力也不容小覷。現(xiàn)階段,我們已經(jīng)有了像Phenaki這樣文本生成影像的突破性模型,但系統(tǒng)目前只能處理非常簡單的句子。目前該領(lǐng)域的研究集中在通過文本簡化等語言學(xué)轉(zhuǎn)換規(guī)則來進一步優(yōu)化系統(tǒng)性能。24此外,雖然《神游天外》這樣的作品十分粗糙,但也顯示了人工智能自導(dǎo)、自演并配音、配樂的可能性,影視生產(chǎn)的各個環(huán)節(jié)都有了智能化生產(chǎn)系統(tǒng)介入的空間甚至應(yīng)用嘗試。
雖然藝術(shù)創(chuàng)作被更多地歸于人類獨特的精神活動,但當(dāng)下的技術(shù)發(fā)展讓人機協(xié)同突破藝術(shù)探索的邊界成為可能。Dalle·E等自動圖像生成軟件不但可以直接應(yīng)用于概念設(shè)計、服裝設(shè)計,也可以為制片人和導(dǎo)演提供前期概念圖,減少用于雇傭場景設(shè)計師、概念設(shè)計師和分鏡設(shè)計師等工種的成本。英偉達開發(fā)的GauGAN智能工具,也在科幻電影的原畫創(chuàng)作中發(fā)揮了日益重要的作用。
人工智能系統(tǒng)同樣被運用于預(yù)視動畫和分鏡圖創(chuàng)作。2021年韓國研究者開發(fā)了ASAP系統(tǒng),該系統(tǒng)可以讓用戶在3D動視場景模擬他們的故事,為電影制作者自動生成分鏡和動畫預(yù)覽。用戶首先使用專業(yè)劇本軟件Final Draft寫作劇本,劇本隨后被ASAP系統(tǒng)分解為動作、角色和對話。通過深度學(xué)習(xí)、數(shù)據(jù)驅(qū)動和規(guī)則驅(qū)動,系統(tǒng)快速生成虛擬人及其物理動作、同聲姿勢,模擬出劇本中的行為和對話場景。用戶可以觀看自動生成的預(yù)視動畫,截取播放場景制作分鏡圖。25
人機協(xié)同讓人類從曾經(jīng)耗時耗力的工種中極大地解放出來,更為重要的是人類的創(chuàng)作模式和自動化生成內(nèi)容互相觸發(fā),進一步激發(fā)了靈感、擴增了創(chuàng)作空間。隨著智能系統(tǒng)的日益完善,它們也將超越一般意義的工具角色,成為人類創(chuàng)意的重要助手。
人工智能從既往的大練模型進入了練大模型階段,剛剛面世的GPT-4模型參數(shù)據(jù)說達到了令人震驚的百萬億級別。26基于這些大模型,不僅能生成更大規(guī)模、更多變風(fēng)格的文本,而且獲得了高于人類的視覺識別速度和生產(chǎn)效率。27前文述及的IBM “沃森”,從開始觀看電影《摩根》到人類剪輯師完成預(yù)告片,整個過程只用了24小時,而通常一支電影預(yù)告片的制作需要10-30天。這大大降低了時間成本和人力成本,也有助于降低相關(guān)預(yù)算。
在自動文本生成研發(fā)領(lǐng)域,慣常的做法是人類創(chuàng)作者輸入簡單的提示或開篇,就能得到一個不完美但至少篇幅達標(biāo)的劇本。ChatGPT也進一步向人類展現(xiàn)了智能系統(tǒng)在互聯(lián)網(wǎng)數(shù)據(jù)和知識沉淀的基礎(chǔ)上,在各個領(lǐng)域迅速生成綜述類文本的能力,甚至在交互性上達到全新的高度,具有重塑傳播、交互和知識結(jié)構(gòu)的可能性。這些帶有自動化生成因素的系統(tǒng)是否能被視作完全獨立的創(chuàng)作者,在當(dāng)下仍然需要審慎的觀察,但即便是作為一種輔助工具,這些技術(shù)對于克服人力短缺和提升效率,都有明顯的優(yōu)勢。
自動影像生成需要克服的技術(shù)難題更多也更加復(fù)雜,但現(xiàn)有的技術(shù)突破也至少顯示了AI創(chuàng)作者在生產(chǎn)數(shù)量和速度上超越人類的效能。特別是目前的自動影像生成在短視頻領(lǐng)域的進展十分迅速,視聽產(chǎn)業(yè)借助自動化生產(chǎn)系統(tǒng)能夠更加有效率地生產(chǎn)不同定位、不同風(fēng)格的作品,至少能給人類創(chuàng)作者提供有益的參考,讓人機協(xié)同發(fā)揮出更大效能。
人工智能在影視行業(yè)各環(huán)節(jié)顯示出了巨大的能動性,但直到目前預(yù)判系統(tǒng)將替代人類創(chuàng)作者仍然為時過早。目前AIGC還存在不擅于處理長篇幅作品、作品缺乏生命力的問題,并且激發(fā)了包括版權(quán)歸屬在內(nèi)的激烈討論和實踐困境。這些既是生成式人工智能的缺點,也是技術(shù)研發(fā)和社會制度完善的重點。
2019年以前,自動故事生成采取的模式就是從一個語言模型中采集樣本,從而推測出加入故事的下一個角色、單詞或句子來構(gòu)建劇情。但是通過這種方法創(chuàng)作的故事往往沒有一個清晰的行進線索。28這個問題在 “本杰明” 創(chuàng)作的三個劇本中體現(xiàn)得非常明顯,幾乎喪失了故事的最基本價值。這個問題到現(xiàn)在都沒有被根本性的解決。2022年的一個研究指出,自動寫作模型仍然缺乏語義連貫性,這在很大程度上限制了它們從事更長篇幅的創(chuàng)意寫作能力。29
由于AIGC會輸出不合故事邏輯的情節(jié)或自相矛盾的陳述,很多自動生成的作品采用了人機互補的形式。例如前文所述的《這不是游戲》《人工智能:當(dāng)一個機器人寫劇本》以及恐怖懸疑片《摩根》的預(yù)告片均是AI和人類的創(chuàng)意性合作。這種合作首先迫于AI創(chuàng)作的局限性,但也顯示了機器與人類創(chuàng)意結(jié)合的增強效應(yīng)。
AI創(chuàng)作的人機互補還出現(xiàn)在演員或觀眾詮釋劇本的環(huán)節(jié)。當(dāng)《陽春》被拍成影片,在詮釋最后一段不知所云的獨白時,女演員的眼中逐漸噙滿淚水。然而,劇本原文中并沒有對角色情感方面的描述,從某種角度上而言,這里的表演缺乏足夠的劇本支撐,仿佛是人類適應(yīng)人工智能,而非人工智能適應(yīng)人類的主客體倒置。如果目前所有的創(chuàng)作人員均完全采用AI創(chuàng)作的劇本,而不加以人工干預(yù),可以想見,這對于演員將會是巨大的挑戰(zhàn)?!赌繐粽摺返难輪T在接受采訪時說:“對于我而言,在一個大部分都是由人工智能編劇的影片中表演,最大的挑戰(zhàn)是試圖去找到我角色的動機以及對話中的意圖?!?0在人工智能無法真正習(xí)得(也許永遠無法習(xí)得)人類情感之時,人機協(xié)同交互是產(chǎn)生藝術(shù)作品的前提。至此,人類似乎還壟斷著意義的生產(chǎn)和再生產(chǎn),并且獨有對情感的理解和表達權(quán)利。
此外觀眾會對A I 生成的內(nèi)容存在過度解讀,雖然這也是某種意義上的 “人機互補”,但這種過度解讀也可能引起人類的不適感。例如,戲劇《人工智能:當(dāng)一個機器人寫劇本》中有一個場景,人類角色讓機器人給他講笑話,機器人說:“當(dāng)你死了,你的孩子死了,你的孫子也死了,我還會活著?!?這乍聽之下似乎是AI對人類的諷刺,讓人隱隱恐慌,但這也許僅是人類對此的過度解釋而并非AI的本意。恰如人工智能專家德漢特所言,AI并不能真正理解句子的含義。31連句子含義都無法理解,更不用說刻意諷刺人類了。
綜合上述材料,人工智能在影視領(lǐng)域的應(yīng)用受限于自然語言處理框架和對人類情感的習(xí)得難度,所以目前更多是采取了人機協(xié)作的模式。從這個角度分析,AI創(chuàng)作僅僅是人類的助手而非替代者。就像GPT-3為英國《衛(wèi)報》撰寫的評論所言:“我知道人類不信任而且害怕我,但我只做人類設(shè)定我去做的。我只是一組代碼管理者。”32
目前機器創(chuàng)作生成的故事雖然有偶爾的 “靈光乍現(xiàn)”33,但大體總是遵循著傳統(tǒng)的編劇模版,故事老套落俗,乏善可陳,并不具備創(chuàng)新的能力,“難以呈現(xiàn)個體的敘事、記憶和生命歷程”。34然而,也有部分模型顯示出創(chuàng)造的能動性,比如前文提到的谷歌的Phenaki在處理場景轉(zhuǎn)換上似乎有自己的想法:在處理一段宇航員在藍色房間里敲打鍵盤到宇航員身后出現(xiàn)藍色海洋的場景轉(zhuǎn)換上,宇航員的身后依次出現(xiàn)了橘色的光、透著高樓大廈的兩扇窗戶等,沒有出現(xiàn)在輸入文本里的畫面。雖然這樣的場景變化沒有令人信服的邏輯,但是做到了絲滑連貫、畫面和諧。連貫性是Phenaki生成視頻的一大優(yōu)勢,但并非每個視頻都能處理得盡善盡美。比方說在泰迪熊浮出水面和走上沙灘這兩個行為的銜接上,Phenaki無法讓畫面保持連貫,而是出現(xiàn)了卡頓以及場景的突然跳躍。35
藝術(shù)性并不完全取決于敘事的連貫性,更在于對情感的觸動能力,后者是機器創(chuàng)作更大的危機。在追求獨異性的晚現(xiàn)代,創(chuàng)作需要追求闡釋、敘事、審美、樂趣或者倫理的價值36,正是這些維度閃現(xiàn)著人類的智慧和靈性,也正是這些維度的創(chuàng)新和價值真正打動了受眾。未來AIGC是否有可能達到這樣的高度,還是藝術(shù)作品的 “靈韻” 會和本雅明認(rèn)為的那樣在機械生產(chǎn)的過程中凋謝37,這不僅僅是留給技術(shù)的問題,更是留給藝術(shù)之所是的根本性議題。
機器給人以中立客觀的印象,但無監(jiān)督學(xué)習(xí)模式也可能讓人工智能嵌入偏見。有研究者在對三種流行的語言模型生成的文本進行檢測后發(fā)現(xiàn),在職業(yè)、性別、種族等多個領(lǐng)域,機器生成文本都比人類編寫的維基百科文本呈現(xiàn)出更大的社會偏見。38
此外,在版權(quán)方面,也存在著模糊地帶。2019年,北京互聯(lián)網(wǎng)法院判定軟件智能生成的 “作品” 不屬于著作權(quán)法保護的文字作品,但即便如此,因其內(nèi)容仍需軟件的開發(fā)者和使用者的精力投入,百度網(wǎng)訊公司未經(jīng)菲林律所許可就擅自使用仍然構(gòu)成侵權(quán),賠償共計1560元。392020年,深圳南山區(qū)人民法院判決一家名為網(wǎng)貸之家的公司對騰訊Dreamwriter軟件自動撰寫的文章構(gòu)成侵權(quán),賠償1500元。這兩個判例的根本性差異在于對機器生成內(nèi)容是否適用著作權(quán)法的不同看法。不同于北京互聯(lián)網(wǎng)法院,深圳南山區(qū)人民法院認(rèn)為機器生成內(nèi)容同樣具有獨創(chuàng)性,符合著作權(quán)法對文字作品的保護條件。40這兩個針對AI版權(quán)做出的不同判決預(yù)示著AI生成內(nèi)容復(fù)雜的法律風(fēng)險與爭議。前文中,不論是ChatGPT還是其他軟件生成的文字和影像作品,因為尚未涉及商業(yè)用途,其版權(quán)歸屬都并不明確。未來,如果有一部由ChatGPT自編自導(dǎo)的長片要在院線上映,其利潤究竟是應(yīng)該歸屬于軟件開發(fā)者,還是人類創(chuàng)作團隊,抑或是原始訓(xùn)練數(shù)據(jù)的所有者,這其中涉及了復(fù)雜的法律問題。在美國編劇工會(WGA,Writers Guild of America)的新一輪罷工中,工會在與影視制片人聯(lián)盟(Alliance of Motion Picture and Television Producers)協(xié)議新合同的過程中提議,未來可以允許人類編劇使用ChatGPT編寫劇本,只要人類不需要與ChatGPT共享署名和分成。并且,對于一個交由人類編劇修改或改寫的AI生成劇本,其第一作者也仍應(yīng)為人類編劇。該工會甚至提議,AI不應(yīng)當(dāng)被認(rèn)為是傳統(tǒng)意義上的改編源材料。該工會站在編劇的角度為其爭取權(quán)益,將AI視為“低人一等” 的創(chuàng)作者情有可原。如果這樣的提議被付諸實踐,確實可以避免編劇陷入和軟件公司的版權(quán)紛爭。美國編劇工會認(rèn)為,像ChatGPT這樣的人工智能軟件生成的內(nèi)容,只能算作類似于維基百科一樣的調(diào)研材料。ChatGPT本身無法分辨其訓(xùn)練數(shù)據(jù)是版權(quán)保護的內(nèi)容還是公域內(nèi)容。因此,美國編劇工會認(rèn)為,這樣生成的內(nèi)容是無法受版權(quán)法保護的,AI也無權(quán)署名。41與美國編劇工會的 “開放態(tài)度” 相反的是,著名科幻雜志《克拉克世界》(Clarkesworld)在大量的人工智能生成的科幻作品涌入投稿箱后,已經(jīng)關(guān)閉了故事提交通道。該雜志創(chuàng)始人表示,他們希望能夠在確保能 “正確” 使用科技的時候再去擁抱它,而非在目前法律問題尚未決斷的時刻。42
除了版權(quán)問題,人工智能自動生成內(nèi)容如果產(chǎn)生侵權(quán)問題,由誰來承擔(dān)責(zé)任也是一個法律難題。目前人類的法律體系只能通過懲罰自然人或法人來強化規(guī)則框架,帶有自動化生產(chǎn)因素的系統(tǒng)如若產(chǎn)生抄襲、侵犯他人名譽權(quán)等問題,系統(tǒng)開發(fā)者是否會因此受到懲戒?受到侵害的組織和個體又如何實施法律救濟?這些問題可能在不久的將來就是人類社會面臨的現(xiàn)實問題。
圖4.短片《安全地帶》(The Safe Zone,2023)
2023年3月Open AI發(fā)布了GPT-4,人工智能進一步實現(xiàn)多模態(tài)的輸入和輸出,對人工信息生產(chǎn)、加工和傳播的能力也獲得了更大的提升。自GPT-2以來,大參數(shù)模型已經(jīng)多維度介入自動劇本生成、自動圖片和影像生成,影視行業(yè)固有的生產(chǎn)流程和創(chuàng)作邏輯面臨來自機器自動化生產(chǎn)的沖擊。
電影史的研究已經(jīng)明確了這一藝術(shù)類型和技術(shù)發(fā)展的緊密聯(lián)系,所以 “闖入花園的機器” 式的批判在影視研究中并非主旋律43,但技術(shù)人工物是否能夠獲得 “創(chuàng)作者”身份,這在藝術(shù)研究中將是一個充滿挑戰(zhàn)的議題。雖然AIGC仍然處于其嬰兒期,自動化生產(chǎn)系統(tǒng)并未從根本上擺脫工具的地位,基于這些系統(tǒng)生成的作品至多是系統(tǒng)能力的顯現(xiàn)而無法將之視作藝術(shù)創(chuàng)作而予以嚴(yán)肅的評論,但技術(shù)奇點將至的宿命論再次被Chat GPT點燃,人類對人工智能加速發(fā)展的技術(shù)前景和社會影響產(chǎn)生了更為彌散的不確定性。
毫無疑問, 人工智能已經(jīng)在多個領(lǐng)域成為一個能力出眾的行動者,但它是否能被賦予行動主體的地位,仍遭遇以人為中心的倫理觀的頑強抵抗。所以人工智能不僅是個技術(shù)問題,同時也是哲學(xué)問題。44在藝術(shù)領(lǐng)域,承認(rèn)自動化系統(tǒng)為創(chuàng)作主體將是一個更加具有冒犯性的問題,畢竟藝術(shù)長期被認(rèn)為是獨屬于人的精神活動。但也許于此更加務(wù)實的立足點是承認(rèn)人機協(xié)同的現(xiàn)實和前景,世界再也不可能認(rèn)可破壞機器的盧德主義。當(dāng)然這不是放棄人類的自主性,而是從實踐意識上切實思考如何引導(dǎo)智生產(chǎn)的發(fā)展方向。
當(dāng)科學(xué)家在不斷優(yōu)化人工智能系統(tǒng)的性能之時,人文藝術(shù)學(xué)者更加應(yīng)該深入思考哪些人類長久以來珍視的價值被寫入智能系統(tǒng),使技術(shù)成為追求至善生活的助力而非解構(gòu)性力量。我們不能等到思想的列車行駛到站之后再用炸藥改變其方向45,而是應(yīng)該在其行駛途中就擔(dān)負起引導(dǎo)者的職能。