樂(lè)艷娜 馬瓊
2022年美國(guó)科羅拉多州博覽會(huì)的藝術(shù)比賽中,游戲設(shè)計(jì)師杰森·艾倫使用AI繪圖工具M(jìn)idjourney創(chuàng)作的作品《太空歌劇院》獲得第一名,很快在網(wǎng)絡(luò)上引起激烈的討論,其中很大一部分爭(zhēng)議聚焦在:AI會(huì)不會(huì)替代人類(lèi)畫(huà)家?
想要梵高為你畫(huà)一幅畫(huà)?只需輸入幾個(gè)關(guān)鍵詞就能實(shí)現(xiàn)——這是人工智能(AI)在藝術(shù)領(lǐng)域的新拓展。擴(kuò)散模型(Diffusion Model)等技術(shù)的出現(xiàn),已讓AI生成圖像成為現(xiàn)實(shí)。
層出不窮
AI繪畫(huà)從想象變成現(xiàn)實(shí),有賴(lài)于一些重要的產(chǎn)品問(wèn)世。
2021年1月,人工智能研究公司Open AI開(kāi)發(fā)的文本生成圖像工具DALL·E面世。DALL·E這個(gè)名字來(lái)自超現(xiàn)實(shí)主義畫(huà)家達(dá)利和《機(jī)器人總動(dòng)員》中的機(jī)器人瓦力。
正如它的名字所暗示的,DALL·E是一個(gè)能創(chuàng)作超現(xiàn)實(shí)畫(huà)作的機(jī)器人,可以從自然語(yǔ)言描述中生成圖像。但那時(shí)的它生成的圖像還比較簡(jiǎn)單,比如,你可以利用它生成牛油果形的扶手椅等。
同年12月,另一款可以直接在手機(jī)應(yīng)用商店下載的軟件Dream by WOMBO上架,由于使用便捷被很多人熟知,但生成的圖像質(zhì)量仍比較低。
真正的轉(zhuǎn)折點(diǎn)是2022年1月Disco Diffusion的出現(xiàn)。使用者只需輸入幾個(gè)關(guān)鍵詞,就能生成對(duì)應(yīng)的圖像,如果你想要某位大師的畫(huà)風(fēng)或者賽博朋克風(fēng)格,只需再加入相關(guān)描述語(yǔ),Disco Diffusion都能生成令人驚艷的效果圖。
阿文是國(guó)內(nèi)最早一批接觸AI繪畫(huà)的人,作為一個(gè)PPT設(shè)計(jì)師,他擁有豐富的計(jì)算機(jī)圖像創(chuàng)作經(jīng)驗(yàn)和藝術(shù)素材積累。初次使用Disco Diffusion,阿文就被AI繪畫(huà)的效果震驚:在他寫(xiě)下“星空下的向日葵花?!焙?,AI用梵高的畫(huà)風(fēng)生成了夢(mèng)境般的效果圖,展現(xiàn)出不輸人類(lèi)的畫(huà)技。
2022年4月,阿文開(kāi)始在社交媒體上分享Disco Diffusion的成果圖,也整理制作了初學(xué)者入門(mén)的中文教程,很多初學(xué)者通過(guò)他的教程開(kāi)始接觸這一軟件,也使阿文的微博粉絲量短短幾個(gè)月內(nèi)達(dá)到90萬(wàn)。
阿文形容,Disco Diffusion的特點(diǎn)是“不確定性”,這種不確定性能給人提供更多的靈感,但也讓它每次生成作品就像開(kāi)盲盒一樣,無(wú)法穩(wěn)定輸出。所以在AI繪畫(huà)的討論社區(qū)中,使用者們討論最多的話(huà)題就是如何用更精準(zhǔn)的描述詞得到自己想要的畫(huà)面。
阿文表示,人們?cè)诒M情地使用自己的想象力組合各種元素:兔子太空員在星際旅行、賽博朋克風(fēng)的宮殿、新海誠(chéng)風(fēng)格的田野……由于訓(xùn)練數(shù)據(jù)庫(kù)非常龐大,Disco Diffusion能實(shí)現(xiàn)大多數(shù)畫(huà)家風(fēng)格和常見(jiàn)事物元素的融合,而它的AI生成計(jì)算借助云端服務(wù)器,對(duì)用戶(hù)的本地硬件沒(méi)有很高的要求,降低了入門(mén)門(mén)檻,讓更多人得以了解和方便地體驗(yàn)AI繪畫(huà)。
開(kāi)放共建
除了文字生成圖像的功能外,Disco Diffusion還支持導(dǎo)入?yún)⒖紙D生成圖像和生成視頻等功能。
相較于人,AI繪畫(huà)的作品更加瘋狂大膽,宏觀畫(huà)面令人震撼,但對(duì)動(dòng)物和人的細(xì)節(jié)處理還有很多不足,人的臉部、手部細(xì)節(jié)經(jīng)常會(huì)很怪異或者缺失。同時(shí),它的界面只是簡(jiǎn)陋地堆滿(mǎn)英文代碼,生成一幅畫(huà)的時(shí)間長(zhǎng)達(dá)半小時(shí)到數(shù)小時(shí),這無(wú)疑會(huì)“勸退”許多初學(xué)者。
但這些問(wèn)題很快就被后來(lái)居上的開(kāi)發(fā)者們解決了。2022年3月面世的Midjourney擁有更簡(jiǎn)潔的操作界面,在人像的細(xì)節(jié)處理上也表現(xiàn)得更好,并且將生成一幅畫(huà)的時(shí)間縮短到了60秒。
1個(gè)月后,Open AI推出了DALL·E 2,它比初代DALL·E的清晰度高4倍,生成圖像的速度達(dá)到1分鐘10張圖,并且能生成更真實(shí)準(zhǔn)確的圖像,在生成的圖像上還可以直接涂抹修改。
“Disco Diffusion生成的宏偉場(chǎng)景和筆觸感很讓人震撼,但我最多只能用它做疊背景的素材,但是DALL·E 2的出現(xiàn)顛覆了我的想法,它完全有創(chuàng)作能力生成一些很具體的人像和物體?!卑⑽恼f(shuō)他曾嘗試用DALL·E 2給油畫(huà)里的人物改變發(fā)型、讓背對(duì)觀眾的大象轉(zhuǎn)身……這些對(duì)于人類(lèi)畫(huà)家來(lái)說(shuō)特別刁鉆的“甲方需求”,DALL·E 2都能非常輕松地完成,甚至還能根據(jù)原有畫(huà)作自動(dòng)補(bǔ)充擴(kuò)展圖像,這樣的人工智能自主生成內(nèi)容(AIGC)被認(rèn)為是當(dāng)前一個(gè)重要的技術(shù)趨勢(shì)。
但AI繪畫(huà)的發(fā)展還不止于此,僅僅1個(gè)月后,谷歌就在新發(fā)布的論文中介紹了它推出的AI繪圖工具Imagen,直接對(duì)標(biāo)DALL·E 2,號(hào)稱(chēng)其擁有“前所未有的寫(xiě)實(shí)感和深度的語(yǔ)言理解”,并在2022年6月推出了像素更高、細(xì)節(jié)更豐富的AI繪圖工具Parti。
與此同時(shí),各大科技公司紛紛涉足AI繪畫(huà)領(lǐng)域,Meta AI開(kāi)發(fā)了Make-A-Scene,可以根據(jù)任意給定的形狀和文字描述生成圖片;微軟和北京大學(xué)合作開(kāi)發(fā)了以“女?huà)z”為名的AI繪圖工具NüWA;百度推出“文心·一格”,可以用中文描述詞生成圖像。
雖然各種AI繪畫(huà)軟件層出不窮,但很多都需要申請(qǐng)內(nèi)測(cè)資格才能使用,普通用戶(hù)想體驗(yàn)更加豐富的功能,還需要等待或者付費(fèi)。這一現(xiàn)狀在8月22日被改變,當(dāng)前功能最強(qiáng)大的AI繪圖工具之一的Stable Diffusion宣布開(kāi)源,任何用戶(hù)都可以使用它開(kāi)源的技術(shù),借助云端或者本地服務(wù)器生成圖像。
更重要的是,在開(kāi)源社區(qū)人們可以對(duì)它進(jìn)行各種迭代優(yōu)化,僅僅1周的時(shí)間,就出現(xiàn)了各種版本和使用教程,它甚至被做成插件加入到修圖軟件中,實(shí)現(xiàn)無(wú)縫拼接補(bǔ)充圖片。
9月1日,2022世界人工智能大會(huì)(WAIC)在上海開(kāi)幕,Tiamat團(tuán)隊(duì)在會(huì)場(chǎng)展示了他們AI繪制的作品,并宣布在半個(gè)月后會(huì)從內(nèi)測(cè)變?yōu)檎缴暇€(xiàn)開(kāi)放。
Tiamat是目前國(guó)內(nèi)前沿的AI圖像生成引擎之一,除了提供AI繪圖工具,Tiamat還打造了一個(gè)交流社區(qū),愛(ài)好者們可以交流AI生成藝術(shù)的相關(guān)話(huà)題。
在社區(qū)中,愛(ài)好者們被稱(chēng)為“魔法師”,他們對(duì)于想要生成圖像的文字描述就是“魔法咒語(yǔ)”,對(duì)畫(huà)幅、清晰度、風(fēng)格等描述是“藥水配方”,輸入配方后只需要幾分鐘就能得到一張AI生成的對(duì)應(yīng)圖像。這樣的“AI魔法”讓剛剛接觸到這個(gè)領(lǐng)域的愛(ài)好者們非常驚喜,自3月上線(xiàn)后就在各大社交媒體平臺(tái)受到關(guān)注。
青柑是Tiamat的創(chuàng)始人之一,據(jù)她介紹,“Tiamat不只是一個(gè)工具,我們的定位是一個(gè)AI生成藝術(shù)社區(qū),希望每一個(gè)加入社區(qū)的人都能共建社區(qū),交流探討未來(lái)AI生成藝術(shù)的一切可能性。”
在同一會(huì)場(chǎng),百度也利用“文心·一格”現(xiàn)場(chǎng)生成了梵高風(fēng)格的“外灘游船”和莫奈風(fēng)格的“印象生煎”等具有上海風(fēng)貌的多種風(fēng)格藝術(shù)作品。在此之前,“文心·一格”還被用于補(bǔ)全名畫(huà)《富春山居圖》,補(bǔ)充的部分與原作風(fēng)格非常近似。
倫理隱憂(yōu)
在AI繪畫(huà)飛速發(fā)展的同時(shí),一些藝術(shù)家開(kāi)始擔(dān)憂(yōu)自己是否會(huì)被AI繪畫(huà)替代。2022年美國(guó)科羅拉多州博覽會(huì)的藝術(shù)比賽中,游戲設(shè)計(jì)師杰森·艾倫使用AI繪圖工具M(jìn)idjourney創(chuàng)作的作品《太空歌劇院》獲得第一名,很快在網(wǎng)絡(luò)上引起激烈的討論,其中很大一部分爭(zhēng)議聚焦在:AI會(huì)不會(huì)代替人類(lèi)畫(huà)家?
對(duì)于這個(gè)問(wèn)題,親身體驗(yàn)過(guò)各種AI繪圖工具的阿文覺(jué)得那些對(duì)藝術(shù)風(fēng)格、藝術(shù)史更了解的畫(huà)家在未來(lái)仍然會(huì)有優(yōu)勢(shì)?!罢J(rèn)識(shí)的藝術(shù)家越多,你生成的AI作品就會(huì)更加自由,風(fēng)格就更加多變,而不是僅使用梵高或者莫奈這些大眾熟悉的藝術(shù)家。所以AI不會(huì)讓我失業(yè),而我大概率能早點(diǎn)下班?!卑⑽恼f(shuō)。
而青柑表示:“更好的情況是,Tiamat會(huì)成為輔助工具,能幫助更多創(chuàng)作者去創(chuàng)作。現(xiàn)在也有很多小伙伴在這方面進(jìn)行了實(shí)踐,很好地將AI藝術(shù)融入了自己的創(chuàng)作之中,越來(lái)越多的人正在接受和擁抱新技術(shù)帶來(lái)的許多可能?!?/p>
除了是否會(huì)替代人類(lèi)畫(huà)家的討論外,關(guān)于AI繪畫(huà)其他的倫理問(wèn)題也逐漸浮現(xiàn),如AI模仿畫(huà)風(fēng)的侵權(quán)問(wèn)題、AI生成暴力圖片、AI加重刻板印象等。對(duì)此,阿文表示:“你可以把AI看成是一個(gè)能力很強(qiáng)的人類(lèi)畫(huà)家,人類(lèi)不能做的事情它同樣不能做?!?/p>
而Open AI在DALL·E 2的使用聲明中提到:“我們限制了 DALL·E 2 生成暴力、仇恨或成人圖像的能力。通過(guò)從訓(xùn)練數(shù)據(jù)中刪除最明確的內(nèi)容,我們最大限度地減少了 DALL·E 2 對(duì)這些概念的接觸。我們還使用了先進(jìn)的技術(shù)來(lái)防止生成逼真的真實(shí)個(gè)人面孔,包括公眾人物的面孔。”
同時(shí),由于學(xué)習(xí)的數(shù)據(jù)集不同,AI可能會(huì)學(xué)習(xí)到人類(lèi)的刻板印象、種族歧視和性別歧視等,Open AI團(tuán)隊(duì)提到他們正在努力增加措施限制這些情況的出現(xiàn)。Tiamat則是把能識(shí)別到人類(lèi)面部的數(shù)據(jù)主動(dòng)剔除,避免用戶(hù)使用“畫(huà)人”的功能。
(摘自《環(huán)球》2022年第9期)