摘要:2022年下半年,AI生成作畫在中外互聯(lián)網(wǎng)上引起熱議,在年中時人工智能生成的圖像還比較詭異生澀,而2022年末,運作原理高度相似的AI圖像生成軟件如雨后春筍般冒出,這些軟件絕大多數(shù)是使用了名為Stable Diffusion的圖像處理算法,這種算法接入了海量商業(yè)插畫作為數(shù)據(jù)集,對數(shù)據(jù)集中插畫風(fēng)格的模仿能力非常驚人,該算法的功能使許多美術(shù)從業(yè)者與學(xué)習(xí)者陷入恐慌,擔(dān)憂人類的美工行業(yè)可能被AI圖像生成系統(tǒng)代替。一方面,插畫師與某AI算法的支持者在版權(quán)問題上爭論不休,另一方面,諸多互聯(lián)網(wǎng)公司大量開除美工類藝術(shù)從業(yè)者,并將其美術(shù)作品輸入算法中,將生產(chǎn)的圖片應(yīng)用于項目中。在商業(yè)化可能性的討論之下,隱藏著人工智能圖像生成系統(tǒng)的本質(zhì)問題,也是美術(shù)從業(yè)者抵觸AI繪畫的根本原因——抄襲、剽竊這些在藝術(shù)界被唾棄的卑劣行為,在AI繪畫出現(xiàn)后披上了璀璨的遮羞布,散發(fā)著“科技”和“未來”的光輝。近年來,AI圖像生成系統(tǒng)在互聯(lián)網(wǎng)快速發(fā)展,這些軟件也對美術(shù)市場造成巨大的沖擊,在海量系統(tǒng)生成圖像的快消沖擊下,不僅是藝術(shù)創(chuàng)作者的生存空間被擠占,互聯(lián)的美術(shù)審美環(huán)境也受到了空前的挑戰(zhàn)。文章從圖像版權(quán)、藝術(shù)審美、生成原理等方面入手,探討Stable Diffusion算法相較于人類創(chuàng)作的優(yōu)劣,以及算法濫用對互聯(lián)網(wǎng)插畫審美環(huán)境的影響。
關(guān)鍵詞:人工智能;版權(quán)問題;數(shù)字繪畫;創(chuàng)作主體
中圖分類號:J205;TP18 文獻(xiàn)標(biāo)識碼:A 文章編號:1004-9436(2023)15-0-03
0 引言
從2022年8月起,在互聯(lián)網(wǎng)插畫師間引起高討論度的NovelAI系統(tǒng)與先前的Medjourney成為AI圖像生成爭論的導(dǎo)火索,高完成度的畫面乍一看很唬人,但都存在共同的邏輯問題。隨后諸多操作原理與運行原理高度相似的軟件如雨后春筍般出現(xiàn),軟件使用者、商業(yè)藝術(shù)家和美術(shù)學(xué)習(xí)者們所持的觀點各不相同。通過實驗、采訪程序使用者和對消費者進(jìn)行調(diào)研后,大致能從一個更理性客觀的角度了解以上AI圖像生成系統(tǒng)共同使用的算法Stable Diffusion,并且總結(jié)這個新事物目前應(yīng)用存在的問題和未來發(fā)展趨勢。
1 算法起源:開發(fā)初衷與原理
AI圖像生成系統(tǒng)是人工智能話題的一個熱點,目前最盛行的是Stable Diffusion(下文簡稱SD算法)。SD算法是Stability AI開發(fā)的一款從文本到圖像的潛在擴散模型程序,它會將素材庫的圖片拆解后重組出新的圖像。Stability AI在SD算法的發(fā)布上使用開源經(jīng)營模式并獲得大量的用戶,目前市面上的AI圖像生成軟件也大多使用該算法,使用者需要遵守開源協(xié)議。開發(fā)團(tuán)隊的初衷是希望數(shù)碼藝術(shù)工作者能使用該算法代替藝術(shù)創(chuàng)作前期大量的重復(fù)勞動,成為藝術(shù)創(chuàng)作者的新工具。
2022年,互聯(lián)網(wǎng)上名為Midjourney的圖像生成軟件已經(jīng)有一定的討論度,當(dāng)時它還被視為一種娛樂工具,當(dāng)時藝術(shù)家們對SD算法的態(tài)度還較為樂觀,生成的圖像也有很高的辨識度,很多人認(rèn)為AI生成的圖像存在明顯上限。直到更多圖片作為模仿對象被輸入SD算法的素材庫中,人們才開始重視其中的問題。
2 優(yōu)劣對比:人類藝術(shù)與算法
2022年9月,NovelAI的出現(xiàn)成為有關(guān)AI圖像生成系統(tǒng)的話題導(dǎo)火索,在商業(yè)插畫行業(yè)引起激烈討論,該軟件能模仿近5年大火的日式商業(yè)動漫風(fēng)格插畫,一時以假亂真,“AI繪畫要代替畫師了”的說法開始在網(wǎng)絡(luò)上流傳。之后,類似軟件相繼推出,都使用開源版SD算法作為核心程序,其中不同的圖像訓(xùn)練集整合后被使用者們稱為“模型”。生成圖像仔細(xì)甄別后依然存在許多畫面共性,無論開發(fā)公司Stability AI運營的Stable Diffusion軟件還是個人用戶線下制作模型,這些共同點廣泛存在于所有SD算法生成的圖像中。
2.1 SD算法的優(yōu)劣
SD算法的優(yōu)勢是能將數(shù)據(jù)集中的已有內(nèi)容拆解后重組成新的圖像。使用文生圖、圖生圖等功能時,程序會將數(shù)據(jù)集中的圖片的要素拆解再生成,生成速度受硬件水平影響。同時因為設(shè)置隨機值不同,雖然內(nèi)容都源自數(shù)據(jù)集,但是搭配形式會多至幾乎無限。盡管其中有很多圖像依然存在混沌與錯誤,但從諸多生成品中仍能挑選出效果相對較好的圖片。正如引起爭議的使用者艾森,他使用SD算法生成的圖像獲得藝術(shù)比賽頭獎這件事已廣為人知,他花費了近一個月不斷修改Mejourney的指令,使圖像盡可能接近自己的要求,再從上百張圖像中挑選出3張稍作修改后參加比賽。若在數(shù)據(jù)集中單獨輸入某藝術(shù)家的作品,算法也能對畫家的塑造手法和風(fēng)格進(jìn)行簡略模仿。
但SD算法也存在劣勢,其與DALL-E 2等其他生成算法是完全不同的邏輯模式,尚處于類似搜索引擎的弱人工智能階段。首先,該算法的核心劣勢是不能憑空產(chǎn)生圖片——該算法必須有龐大的圖像數(shù)據(jù)集,需要人類提供數(shù)據(jù)集作為模仿的對象與素材,而大多數(shù)據(jù)集都非法爬取自互聯(lián)網(wǎng),無數(shù)繪畫和攝影作品在作者不知情時被收集,藝術(shù)創(chuàng)作者們認(rèn)為這是侵權(quán)剽竊的行為,這也是目前SD算法和人類藝術(shù)創(chuàng)作者最大的矛盾。其次,生成的隨機經(jīng)常導(dǎo)致畫面的混沌,使用者需要不斷優(yōu)化文字指令使生成的圖像貼近需要的效果,除了輸入的指令之外,還要輸入反指令來避免不要的東西。SD算法還常出現(xiàn)邏輯錯誤,比如扭曲畸形的手與肢體,這些錯誤常使圖像陷入恐怖谷中。再次,該算法對圖像內(nèi)容無主觀判斷意識,生成的圖像看起來精致,卻沒有對圖像的實際理解能力,生成的圖像沒有思想與情感意義,沒有人腦的理解與賦予。因此,生成的產(chǎn)物再華麗也不具有藝術(shù)品的形象性、主體性和審美性這三大特征。最后,數(shù)據(jù)集中未經(jīng)人工過濾的網(wǎng)絡(luò)數(shù)據(jù)給算法帶入了人類現(xiàn)有的偏見,由于互聯(lián)網(wǎng)上存在諸多帶有刻板印象、性別偏見與種族主義的圖像,因此這些圖像在被制成數(shù)據(jù)集時,算法也會反映出這些偏見,這種情況在前文提到的NovelAI中表現(xiàn)得非常明顯。
2.2 人類繪畫的優(yōu)劣
藝術(shù)家是在SD算法的普及中受影響很大的人群,很多藝術(shù)家不滿自己的圖像作品被用于SD算法的拼貼素材,因為其導(dǎo)致大眾對華麗的生成品大為贊嘆,而真正的作品卻被淹沒在華麗的電子垃圾中。具有一定審美水平的人看到生成的圖像經(jīng)常會認(rèn)為SD算法生成的圖像缺少“靈魂”,審美優(yōu)勢是人類獨有且無法代替的能力[1]。首先是人類的繪畫邏輯,畫面內(nèi)容的處理是僅有在物質(zhì)世界有過生活經(jīng)驗的人才能理解的實踐邏輯,比如頭發(fā)與服裝的區(qū)分、手指的數(shù)量和吃面的方法等,這些實踐經(jīng)驗構(gòu)成的人類繪畫基礎(chǔ)都僅屬于人類。其次是形式美法則,比如畫面節(jié)奏、構(gòu)圖美感等,都是人類主觀意識中才具有的對美的理解[2]。再次,人類創(chuàng)意是真正的無限,SD算法的構(gòu)圖會更保守、更同質(zhì)化,下限高上限低;而藝術(shù)家構(gòu)圖則更加大膽,敢于嘗試,下限低上限高。最后,只有人類才有通過美術(shù)表達(dá)情感的能力和意識,無論是畫面的故事性表達(dá)還是情感表達(dá),都是人類所獨有且無法復(fù)制的。
但是,使用SD算法的AI圖像生成系統(tǒng)已經(jīng)無疑對美術(shù)市場產(chǎn)生了沖擊,而且最先受到?jīng)_擊的便是數(shù)字媒體等領(lǐng)域。隨著數(shù)字技術(shù)的進(jìn)步和普及,很多年輕的藝術(shù)家更加傾向于使用更高效、精準(zhǔn)和便捷的數(shù)字工具進(jìn)行創(chuàng)作,而隨著商業(yè)市場的擴大和從業(yè)者的增加,電子游戲等新興美術(shù)行業(yè)對插畫的需求呈爆炸性增長,但也存在從業(yè)者會迎合委托方審美而有意模仿已有風(fēng)格的同質(zhì)化,這種工作環(huán)境使數(shù)碼插畫從藝術(shù)創(chuàng)作逐漸轉(zhuǎn)向重復(fù)性勞動,從業(yè)者們在同質(zhì)化的作品中尋找不同的元素搭配,前期頭腦風(fēng)暴時會消耗大量的時間和精力,如果從業(yè)者在頭腦風(fēng)暴和概念設(shè)計階段使用SD算法,則能省去很多重復(fù)勞動[3]。
3 現(xiàn)狀反思:商業(yè)市場與混亂
3.1 洗稿的深入
2022年9月,一款名為NovelAI的AI圖像生成軟件在互聯(lián)網(wǎng)上引起熱議。作為當(dāng)時熱度最高的軟件,卻使用了侵權(quán)的圖像來源和違反開源協(xié)議的收費模式,該網(wǎng)站運營方直言使用SD算法接入了非法圖像網(wǎng)站Danbooru,該網(wǎng)站使用網(wǎng)絡(luò)爬蟲從諸多國內(nèi)外社交平臺上爬取免費與收費圖像并上載至網(wǎng)站數(shù)據(jù)庫。運營方的做法激怒了眾多數(shù)字藝術(shù)家,其反對自己的繪畫作品被用于SD算法的模仿,最終憤怒的人群破解了該網(wǎng)站并且提取出算法與數(shù)據(jù)集,該網(wǎng)站程序也被迫開源。與此同時,一些人使SD算法繼續(xù)向洗稿的方向發(fā)展。2023年2月13日,斯坦福博士生張呂敏發(fā)布了SD算法使用的Controlnet插件,該插件使用者的洗稿行為變得更加直接,其整合了圖像處理領(lǐng)域已有的景深提取、動作提取等功能,使生成圖像的抄襲行為變得更加赤裸直白。
3.2 侵權(quán)的事實
2023年1月末,蓋蒂圖片社起訴了SD算法的開發(fā)公司,稱該公司算法的訓(xùn)練集大多來自網(wǎng)上未授權(quán)的圖片。大數(shù)據(jù)生成的算法必須有一個龐大的素材數(shù)據(jù)庫,有研究團(tuán)隊提出需要注意系統(tǒng)是否用這些素材在生成時進(jìn)行了“抄襲”或者復(fù)制,若一張生成的圖片和數(shù)據(jù)庫里任何圖都不像,但圖像卻是SD算法根據(jù)其中千億個訓(xùn)練參數(shù)生成,則該算法會記住并在生成時使用這些數(shù)據(jù),就會泄漏圖片隱私,同時造成侵權(quán)。SD算法自誕生起便是圖像拆解重組機器,構(gòu)圖抄襲在美術(shù)界早已充滿爭議,若換成AI就合理,那對版權(quán)保護(hù)的法律將名存實亡。
不僅是插畫界,許多模特也對SD算法感到不滿,有模型制作人爬取了他們的寫真照片并與情色圖片一起投入數(shù)據(jù)集中進(jìn)行訓(xùn)練,而生成的面容正是自己的臉,雖然圖像細(xì)節(jié)存在SD算法生成的痕跡,但是這些圖像對大眾來說依然真假難辨,完成訓(xùn)練的程序普及后必會降低制作謠言的成本,形成“眼見不為實”的情況。
4 走向何方:人類創(chuàng)作與審美
為什么繪畫從業(yè)者會抵抗生成類AI?這不是單純的行業(yè)問題,而是這類算法的濫用會消解人的價值性,踐踏尊嚴(yán),切斷社群信任鏈。國內(nèi)語境經(jīng)常將人工智能圖像生成系統(tǒng)翻譯為“AI繪畫”,這是個不好的習(xí)慣,使用者僅是在輸入指令后算法將訓(xùn)練庫中海量圖像進(jìn)行組合,本質(zhì)就是復(fù)制和機械拼接,生成過程不構(gòu)成真正的藝術(shù)創(chuàng)作過程。而該算法給人類帶來的最大影響是消解圖像的價值性,它會使初學(xué)者陷入審美價值瓦解的茫然中。當(dāng)創(chuàng)作的價值性被生成圖瓦解,觀眾審美要求和精神消費價值觀也會一并瓦解。猜疑鏈的存在使繪畫市場出現(xiàn)鑒定AI的賽博獵巫行為,欣賞美術(shù)的欲望也會被猜疑鏈瓦解。若任其濫用,則視覺圖像終會變成一種觀眾心中司空見慣且不值得琢磨的背景。
無論是繪畫還是攝影,快速生成類AI的濫用都會給創(chuàng)作者群體和整個互聯(lián)網(wǎng)帶來嚴(yán)重的審美危機。很多畫師表示自己在社交平臺上發(fā)布作品時有很多陌生人對他們惡語相向說不如自己畫的,結(jié)果這些人使用的是SD算法,這些算法支持者總以共享的名義將算法濫用對社會的危害一筆帶過,在他們眼中,藝術(shù)家的畫作與任何人的照片都必須被“開源共享”。有一些不懂美術(shù)的人使用AI生成的圖像來鄙視攻擊真正的藝術(shù)家,否定別人的勞動成果。SD算法助長了大量心存惡意的使用者,他們的目的已不僅在于取代某一行業(yè),而是有目的地詆毀人的價值。大量難辨真假的聲音、圖像和難以追蹤的虛假信息將嚴(yán)重污染整個互聯(lián)網(wǎng),造假犯罪都變得輕而易舉。在生成圖像爆炸式增加時,真正的藝術(shù)創(chuàng)作將淹沒在信息的浪潮中,使人找不到真實有用的信息。
在由諸多對藝術(shù)創(chuàng)作心存惡意的人組成的社群中,“AI繪畫”成為他們博人眼球與釋放惡意的工具,將數(shù)據(jù)洗稿套上高科技皮囊后又在販賣“你連機器都不如”的焦慮,該算法自從接入了非法行為起,便成了掠奪與剝削的工具。芝加哥大學(xué)開發(fā)的圖像保護(hù)程序問世后,這些人又拼命詆毀該程序,在惡人眼中,有助他們偷竊肆虐即值得贊頌的好技術(shù),阻止他們并保護(hù)知識產(chǎn)權(quán)的則是科技發(fā)展的阻礙。SD算法創(chuàng)始人Emad Mostaque稱藝術(shù)從業(yè)人員在視覺傳達(dá)層面建立技能隔離來壟斷美術(shù)行業(yè),聲稱該算法“讓創(chuàng)作變得輕而易舉”。但其濫用又提高了真正美術(shù)創(chuàng)作的門檻,虛假繁復(fù)的生成圖像在干擾大眾審美的同時會使得真正的初學(xué)者退縮,美術(shù)初學(xué)者們會為自己苦苦練習(xí)幾個月卻不如算法生成的圖像而痛苦,僅剩對人類藝術(shù)抱有真摯追求的藝術(shù)家還在堅持。
5 結(jié)語
在生產(chǎn)力飛速發(fā)展且信息爆炸的時代,SD算法的出現(xiàn)是對數(shù)字美術(shù)行業(yè)的一次巨大沖擊,在相關(guān)法律處于空白的時間,它野蠻生長并處于非常大的爭議中,反對者稱支持者為“強盜”,而后者稱前者為“盧德主義”,這使AI生成圖像成了美術(shù)界最敏感的話題之一。算法本身沒有任何立場或者思想,卻是鋒利的雙刃劍,它可以像照相機或PS軟件一樣成為藝術(shù)家的工具,也能成為心術(shù)不正者攻擊他人的武器,它像鏡子一樣反映出了社交網(wǎng)絡(luò)上存在的問題。隨著數(shù)據(jù)集擴大,它相較人腦無法跨越的審美意識鴻溝也逐漸清晰,華麗的模仿與拼貼驚艷沒有意義,人類的創(chuàng)造力和對美的追求永遠(yuǎn)是無限且自由的。
參考文獻(xiàn):
[1] 歐文·瓊斯.世界紋樣[M].周思成,譯.北京:商務(wù)印書館,2019:1-3.
[2] 邢慶華.類型學(xué)視閾下的現(xiàn)代圖案設(shè)計[M].南京:東南大學(xué)出版社,2017:148-150.
[3] 雷吉斯·德布雷,黃迅余.圖像的生與死:西方觀圖史[M].黃建華,譯.上海:華東師范大學(xué)出版社,2014:237-243.
作者簡介:黎雩蓉(1997—),女,陜西西安人,碩士在讀,研究方向:數(shù)字媒體。