基金項(xiàng)目:本論文為2023年度四川大學(xué)大學(xué)生創(chuàng)新創(chuàng)業(yè)訓(xùn)練計(jì)劃項(xiàng)目“美術(shù)理論視域下的人工智能繪畫研究——以midjourney程序?yàn)槔背晒?,?xiàng)目編號(hào):C2023126226
摘要:目的:人工智能相關(guān)技術(shù)的突飛猛進(jìn),大大推動(dòng)了科技與藝術(shù)的交融。在繪畫領(lǐng)域引入人工智能圖像生成技術(shù),是技術(shù)在藝術(shù)創(chuàng)作中的探索,是繪畫界對(duì)人工智能的嘗試,為繪畫藝術(shù)帶來了創(chuàng)新性和無限可能性。文本生成式高清圖像與超乎想象的繪畫作品給人們帶來了極大的視覺沖擊,引發(fā)了人們對(duì)人工智能繪畫在創(chuàng)作表現(xiàn)上的多維思考。如何理解文本生成式繪畫的創(chuàng)作主體性及創(chuàng)造力,成為一個(gè)重要議題。方法:為深入探討文本生成式繪畫的創(chuàng)作主體性及創(chuàng)造力,文章通過梳理文本生成式人工智能繪畫的創(chuàng)作過程,分別從人類與技術(shù)的角色、關(guān)系和作用入手,分析文本生成式繪畫中的創(chuàng)作主體性及創(chuàng)造力問題,闡明文本生成式人工智能繪畫創(chuàng)作主體性的動(dòng)態(tài)變化關(guān)系,總結(jié)人類與人工智能模型在該創(chuàng)作中發(fā)揮創(chuàng)造力的衡量方式及具體途徑,并引入人機(jī)協(xié)同藝術(shù)概念及特點(diǎn),展望其未來。結(jié)果:通過分析,可以得知人類與技術(shù)在人工智能繪畫創(chuàng)作中并無絕對(duì)主體性,二者的創(chuàng)作關(guān)系是動(dòng)態(tài)變化的,創(chuàng)作地位視具體參與方式及程度而定,只能針對(duì)具體案例進(jìn)行分析。結(jié)論:在藝術(shù)創(chuàng)作領(lǐng)域,人機(jī)協(xié)同是藝術(shù)創(chuàng)作未來發(fā)展的方向之一,人機(jī)協(xié)同藝術(shù)將有望引領(lǐng)人類邁入“全民藝術(shù)家”時(shí)代,實(shí)現(xiàn)藝術(shù)“民主化”。
關(guān)鍵詞:文本生成式繪畫;人工智能;創(chuàng)作主體性;創(chuàng)造力;人機(jī)協(xié)同藝術(shù)
中圖分類號(hào):J20-05;TP18 文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):1004-9436(2024)02-00-04
0 引言
藝術(shù)長期以來被視為僅有人類才能企及的高臺(tái),是人類的專有領(lǐng)域。而將人類藝術(shù)的繪畫概念引入人工智能圖像生成技術(shù),是技術(shù)在藝術(shù)創(chuàng)作中的嘗試,是科學(xué)與藝術(shù)融合的探索。所謂人工智能繪畫,主要指在人工智能的幫助下創(chuàng)作出藝術(shù)性的數(shù)字圖像。事實(shí)上,人工智能圖像生成早已存在,但過去的技術(shù)僅能生成簡單的低質(zhì)量圖像,且只有少數(shù)專業(yè)領(lǐng)域人員才能接觸使用,大多數(shù)企業(yè)和公眾并未意識(shí)到其潛力價(jià)值,也未引起社會(huì)廣泛關(guān)注。然而,文本生成圖像式擴(kuò)散模型的誕生改變了一切。高清圖像與超乎想象的畫面帶來了一次又一次的視覺沖擊,引發(fā)了對(duì)人工智能繪畫在創(chuàng)作表現(xiàn)上的多維思考。人工智能模型是否具有創(chuàng)作主體性及創(chuàng)造力,成為當(dāng)前面臨的重要議題。
1 創(chuàng)作主體性的變化
藝術(shù)家是藝術(shù)品的生產(chǎn)者和創(chuàng)作者,是藝術(shù)創(chuàng)作活動(dòng)的主體。在傳統(tǒng)繪畫創(chuàng)作中,藝術(shù)家在創(chuàng)作主體性上占據(jù)絕對(duì)權(quán)威。其在全部的藝術(shù)思維過程中具有獨(dú)立的、不受外界干擾的選擇和判斷能力,能夠順應(yīng)自己對(duì)藝術(shù)的獨(dú)到理解,充分把控具體創(chuàng)作過程,盡情發(fā)揮藝術(shù)意志,最終創(chuàng)作出完美的藝術(shù)作品。然而,在文本生成式繪畫中,操作者僅需輸入文本提示,人工智能模型就能依據(jù)提示生成畫作。整個(gè)創(chuàng)作過程中,人類對(duì)畫面的掌控僅來自文本提示,且這種掌控是間接性的,是經(jīng)由人工智能“理解”后實(shí)現(xiàn)的作品。人工智能對(duì)藝術(shù)創(chuàng)作的介入,人類在藝術(shù)創(chuàng)作中的權(quán)利讓渡,引發(fā)了關(guān)于人工智能繪畫創(chuàng)作主體性的爭議。一些學(xué)者認(rèn)為,藝術(shù)創(chuàng)作主體性是指藝術(shù)家在創(chuàng)作過程中表達(dá)個(gè)性、情感、思想和價(jià)值觀的特性,而人工智能只是一種技術(shù)工具,不能代替人類的審美和創(chuàng)造力。另一些學(xué)者則認(rèn)為,人工智能可以模仿人類的藝術(shù)樣式和法則生成具有美感的作品,從而展現(xiàn)出一定的藝術(shù)創(chuàng)作主體性。
通常,創(chuàng)作主體性以創(chuàng)作中是否具有掌控力、作品是否為純粹意志體現(xiàn)等為判斷依據(jù)。在文本生成式人工智能繪畫中,創(chuàng)作內(nèi)容由文本提示主導(dǎo),創(chuàng)作形式由算法實(shí)現(xiàn)。因此,文本提示效用在衡量創(chuàng)作主體上起到了關(guān)鍵作用。當(dāng)人類提供高質(zhì)量文本提示促使人工智能生成符合其意志的作品,使其成為創(chuàng)作想法的執(zhí)行者時(shí),人類在創(chuàng)作中處于主要地位。當(dāng)文本提示僅為開啟程序自動(dòng)化的指令或保留較大的創(chuàng)作空白時(shí),人工智能將代替人類作出選擇,成為創(chuàng)作主體。不可否認(rèn)的是,在藝術(shù)作品所承載的情感體驗(yàn)方面,人工智能是缺失的。算法設(shè)置是客觀的,選擇傾向由概率決定,不涉及主觀情感。但如果把目光轉(zhuǎn)移到具有人類主觀意志的文本提示上時(shí),也并不能將其與最終作品完全掛鉤。作品呈現(xiàn)受到了人工智能介入,人類無法直接將心靈體驗(yàn)進(jìn)行視覺呈現(xiàn)。
總體而言,人類與技術(shù)在人工智能繪畫創(chuàng)作中并無絕對(duì)主體性,二者的創(chuàng)作關(guān)系是動(dòng)態(tài)變化的,創(chuàng)作地位視具體參與方式及程度而定,只能針對(duì)具體案例進(jìn)行分析。不過,參與方式的間接性并不影響人類發(fā)揮主觀能動(dòng)性調(diào)節(jié)創(chuàng)作主體的關(guān)系。最新的midjourney V4版本在文本生成圖像的基礎(chǔ)上推出了墊圖功能(image prompting)。人類可以在輸入文本提示的同時(shí)提供基礎(chǔ)圖像,模型將結(jié)合該圖像及提示內(nèi)容生成作品。這種方式給予了作品一定的視覺約束,能夠在很大程度上提升人類在人工智能繪畫創(chuàng)作中的主體性及掌控力,是對(duì)作品總體方向的把控。在未來人工智能繪畫的嚴(yán)肅應(yīng)用場(chǎng)景下,以發(fā)揮人類與人工智能各自優(yōu)勢(shì)為目的的創(chuàng)作主體調(diào)節(jié)將成為二者在具體創(chuàng)作方式上創(chuàng)新發(fā)展的重要依據(jù)。
2 人工智能繪畫創(chuàng)造力判斷
文本生成式人工智能繪畫創(chuàng)作主體性的動(dòng)態(tài)變化關(guān)系使其生成作品的創(chuàng)造力判斷受到極大的挑戰(zhàn)。傳統(tǒng)藝術(shù)創(chuàng)作中,藝術(shù)家為作品所賦予的創(chuàng)造力似乎成了偽命題,程式化的算法運(yùn)行與人類主控的讓渡使人工智能繪畫是否具有創(chuàng)造力飽受爭議。普遍觀點(diǎn)以人類藝術(shù)家創(chuàng)作為標(biāo)準(zhǔn),從經(jīng)歷、情感、理念等方面衡量人工智能繪畫創(chuàng)作,并判斷其缺乏創(chuàng)造意識(shí)而屬于“復(fù)制”“模仿”一類。Adobe集團(tuán)產(chǎn)品營銷經(jīng)理塔蒂亞娜·梅希亞(Tatiana Mejia)提出:“創(chuàng)造力在很大程度上是人性的,人工智能無法取代創(chuàng)意火花?!北本┐髮W(xué)藝術(shù)學(xué)院丁寧教授指出,藝術(shù)家最敏感于自身所處的時(shí)代,現(xiàn)實(shí)與命運(yùn)永遠(yuǎn)是其體驗(yàn)和思究的對(duì)象,而從人工智能繪畫產(chǎn)品中僅能分析出程序算法的理性,也由此失去了藝術(shù)特有的感性基礎(chǔ)[1]。相反,利用人工智能創(chuàng)作《埃德蒙·德·貝拉米肖像》的藝術(shù)團(tuán)體在新聞采訪中則聲稱,“人工智能成功地創(chuàng)造了藝術(shù)”“創(chuàng)造力不僅屬于人類”。清華大學(xué)美術(shù)學(xué)院的吳瓊教授也認(rèn)為人工智能可以通過算法生成新的形式,并以一定程度的“獨(dú)立性”完成創(chuàng)作[2]。由于文本生成式人工智能繪畫的創(chuàng)造力判斷受到人類和模型的共同影響,因此其創(chuàng)造力討論可以從“人類創(chuàng)造力”和“人工智能模型創(chuàng)造力”這兩個(gè)視角展開。
2.1 人類創(chuàng)造力
人工智能繪畫的創(chuàng)作并不是僅由人工智能模型及算法技術(shù)來實(shí)現(xiàn)的,其是人和模型共同作用的結(jié)果,最終作品的呈現(xiàn)由人和機(jī)器交互控制實(shí)現(xiàn)。因此,對(duì)于人工智能繪畫創(chuàng)造力的分析,首先不能忽略人類創(chuàng)造力在作品生成中的影響。一般而言,人類創(chuàng)造力以三種方式發(fā)揮作用:一是模型的設(shè)計(jì)開發(fā),如選擇架構(gòu)、數(shù)據(jù)、優(yōu)化方法等;二是與模型交互,如提供文本提示、反饋生成作品等;三是受模型輸出圖像啟發(fā)、反思等。三種方式對(duì)應(yīng)開發(fā)人員、操作者、觀眾三方參與者,多數(shù)情況下,操作者與觀眾是同一主體。
其中,操作者直接對(duì)生成作品結(jié)果產(chǎn)生影響。模型輸入端的文本提示由操作者提供,文本描述的內(nèi)容源自操作者的主觀選擇,但對(duì)于其是否發(fā)揮創(chuàng)造作用,需要針對(duì)具體過程展開分析。喬納斯·奧本蘭德(Jonas Oppenlaender)對(duì)此提出了兩種輸入場(chǎng)景,一種為操作者隨機(jī)獲取文本片段用于圖像生成,另一種為輸入他者創(chuàng)作的文本。兩種場(chǎng)景的區(qū)別在于第一種完全不包含任何主觀構(gòu)思,第二種則為可能受操作者誤讀的文本復(fù)制。喬納斯認(rèn)為,在以上兩種場(chǎng)景中,人類不一定需要發(fā)揮想象力,與模型的互動(dòng)除基礎(chǔ)的語言辨識(shí)外,既沒有技能又沒有創(chuàng)造性,最終生成的圖像只是“一個(gè)不完美的人的創(chuàng)造力代表”[3]。
那么操作者發(fā)揮創(chuàng)造力的途徑有哪些呢?具體方式共有三種。第一種為優(yōu)化文本提示內(nèi)容,通過發(fā)揮人類主觀意志撰寫描述性和富有想象力的文本提示,使用不同的詞、句式和修飾,指導(dǎo)模型生成新穎多樣的圖像。對(duì)理想作品進(jìn)行風(fēng)格、比例定義,以及參數(shù)調(diào)整,也是產(chǎn)生高保真圖像的關(guān)鍵。第二種為迭代文本提示組合,即探索不同的文本樣式、組合及其他可以修改或優(yōu)化生成圖像的提示。喬納斯在對(duì)midjourney社區(qū)的研究中發(fā)現(xiàn),一些新手常常用較長而具體的提示試圖生成驚艷的畫作,但結(jié)果不盡如人意。相反,另一些人僅用簡約的提示就能毫不費(fèi)力地生成美麗的圖像,這實(shí)際上涉及文本提示的有效性問題。輸入有效提示是一種體現(xiàn)對(duì)訓(xùn)練集和神經(jīng)網(wǎng)絡(luò)潛在空間認(rèn)識(shí)程度的技能。來自美國哥倫比亞大學(xué)的劉薇安(Vivian Liu)和莉迪亞·奇爾頓(Lydia B. Chilton )
通過實(shí)驗(yàn)研究,提出了一套文本提示設(shè)計(jì)指南,從不同維度考察了理想圖像生成的成功模式和失敗模式,并在midjourney和DALL·E 2這兩個(gè)文本生成圖像式模型上進(jìn)行了實(shí)踐[4]。例如,提示應(yīng)相對(duì)簡短,控制在60個(gè)單詞或400個(gè)字符以內(nèi);盡量使用英文字符,因?yàn)榇蠖鄶?shù)模型是用英語訓(xùn)練的,英文字符能夠提高圖像與提示的一致性;遵循一定的輸入模板:描述—風(fēng)格—尺寸;使用正確的語法和清晰的語義,避免模糊和歧義等。第三種為篩選策劃反饋圖像。從多個(gè)輸出中篩選符合預(yù)期或目的的最佳圖像,或?qū)ι蓤D像進(jìn)行編輯、修改、再生成等來表達(dá)自己的想法。在midjourney中,系統(tǒng)會(huì)根據(jù)首次輸入的文本提示生成4個(gè)低分辨率圖像。操作者可以使用每個(gè)圖像網(wǎng)格下的按鈕對(duì)圖像進(jìn)行放大、變體或重啟。
從作品接受角度來看,當(dāng)人工智能繪畫作品能夠引起觀眾的情感反應(yīng),深化人類對(duì)人工智能的認(rèn)知理解,以及拓寬科學(xué)與藝術(shù)的可能性、促進(jìn)相關(guān)行業(yè)產(chǎn)業(yè)發(fā)展、調(diào)動(dòng)全民藝術(shù)參與積極性時(shí),可以視其為對(duì)社會(huì)產(chǎn)生了創(chuàng)造力。例如,贏得科羅拉多州博覽會(huì)(Colorado State Fair)數(shù)字藝術(shù)比賽大獎(jiǎng)的人工智能繪畫作品《太空歌劇院》(Théatre D’opéra Spatial)就引起了全社會(huì)對(duì)人工智能繪畫合法性及版權(quán)歸屬的爭議探討,并在此基礎(chǔ)上產(chǎn)生了多項(xiàng)研究。
2.2 人工智能模型創(chuàng)造力
關(guān)于人工智能模型是否具有創(chuàng)造力是目前最具爭議性的話題,也是一些狹隘觀點(diǎn)下評(píng)判人工智能繪畫是否具有創(chuàng)造力的直接依據(jù)。拋開其中的人類作用,算法模型本身是否具有創(chuàng)造力?如何理解和定義這種有別于人類主觀意識(shí)的創(chuàng)造?這些問題都有待思考。
文本生成圖像模型(Text to image model)是機(jī)器學(xué)習(xí)中一種重要的模型,以自然語言輸入,并生成與文本提示相匹配的圖像。不同于以往的圖像生成方法GANs和VAEs,這些模型使用一種新興的生成神經(jīng)網(wǎng)絡(luò)——去噪擴(kuò)散模型來生成圖像。該模型通過逐步添加高斯噪聲破壞訓(xùn)練數(shù)據(jù),擦除數(shù)據(jù)中的細(xì)節(jié),直到它變成純?cè)肼暎缓笸ㄟ^訓(xùn)練神經(jīng)網(wǎng)絡(luò)來反向扭轉(zhuǎn)這種破壞過程——逐漸去噪以合成純?cè)肼暤臄?shù)據(jù),直到重新產(chǎn)生干凈的樣本。哈佛大學(xué)卡洛斯·龐塞實(shí)驗(yàn)室的一項(xiàng)研究認(rèn)為,擴(kuò)散模型逐漸向初始輪廓添加細(xì)節(jié)來創(chuàng)建圖像的工作模式,實(shí)際上和畫家從草圖不斷完善至最終成稿的作畫方式十分類似[5]。同時(shí),在反向擴(kuò)散階段,模型通過深度神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)和預(yù)測(cè)如何從損壞圖像中去噪恢復(fù)先前圖像的特征,并在生成階段將訓(xùn)練所學(xué)規(guī)律應(yīng)用到新的圖像生成中,這一過程與人類視覺學(xué)習(xí)有一定的相似性。因此,去噪擴(kuò)散模型所生成的圖像并不是所謂的“復(fù)制”,也并不是簡單地由其數(shù)據(jù)庫已有圖像復(fù)制拼貼重組而成,而是學(xué)習(xí)數(shù)據(jù)庫圖像的結(jié)構(gòu)和分布特征,并根據(jù)給定條件來創(chuàng)作新的圖像。
來自牛津大學(xué)的數(shù)學(xué)家馬庫斯·杜·索托伊(Marcus du Sautoy)在其著作《創(chuàng)造力代碼:人工智能繪畫的藝術(shù)與創(chuàng)新》一書中引用了蘇塞克斯大學(xué)認(rèn)知科學(xué)教授瑪格麗特·博登(Margaret Boden)關(guān)于創(chuàng)造力的三種類型的論述。他指出,創(chuàng)造力可以分為探索創(chuàng)造力(Exploratory creativity)、組合創(chuàng)造力(Creativity involves combination)、變革創(chuàng)造力(Transformational creativity)。探索創(chuàng)造力指在已有基礎(chǔ)上不斷探索擴(kuò)展其邊界或極限,但仍然受一定的規(guī)則束縛;組合創(chuàng)造力指尋求多個(gè)不同事物相結(jié)合的能力;而變革創(chuàng)造力相較于前兩種創(chuàng)造力而言更加神秘莫測(cè),是能夠使事物發(fā)生根本性改變的罕見本領(lǐng)。如同水達(dá)到沸點(diǎn)時(shí)突然蒸發(fā)為水蒸氣一樣,進(jìn)入了一種全新的狀態(tài)。事實(shí)證明,在人工智能繪畫領(lǐng)域,探索創(chuàng)造力和組合創(chuàng)造力已經(jīng)實(shí)現(xiàn)。例如,機(jī)器學(xué)習(xí)算法可以從大量數(shù)據(jù)中提取模式并進(jìn)行分類、聚類等操作,建立對(duì)特定事物的“概念”,從而使文本提示與生成圖像相匹配,符合探索創(chuàng)造力的定義。同樣,人工智能可以通過對(duì)不同繪畫風(fēng)格、類型、題材的融合生成創(chuàng)造性結(jié)果,發(fā)揮組合創(chuàng)造力。
然而,人們依舊對(duì)人工智能繪畫的創(chuàng)造力存疑,根本原因在于一般認(rèn)為人工智能繪畫并非全新創(chuàng)造,而是算法程式的運(yùn)行結(jié)果,即人工智能繪畫不具備變革創(chuàng)造力。對(duì)此,中國科學(xué)院院士張鈸在清華大學(xué)美術(shù)學(xué)院“社會(huì)智慧 場(chǎng)景創(chuàng)新”論壇中提出,以人工智能繪畫為代表的生成藝術(shù),其完全創(chuàng)新性體現(xiàn)于算法隨機(jī)性與概率,生成的作品是獨(dú)一無二的,從部件到結(jié)構(gòu)都是全新的。谷歌機(jī)器智能首席科學(xué)家布萊斯·阿圭拉(Blaise Agüeray Arcas)則用大腦的神經(jīng)路徑來解釋人工智能變革創(chuàng)造力。他認(rèn)為人類大腦的基本思維過程是從感知開始的,可以被基本定義為人們將周圍事物轉(zhuǎn)變?yōu)轭^腦中的概念,而創(chuàng)造力是這個(gè)過程的另一面,它將概念變?yōu)楝F(xiàn)實(shí)。在圖像和概念之間,人們的視覺皮層像一系列計(jì)算元素一樣傳遞信息。通過程序和代碼,人工智能也可以進(jìn)行類似工作。不過,要想能夠在藝術(shù)方面進(jìn)行創(chuàng)作和交流,還需要進(jìn)一步的能力——想象力。當(dāng)人工神經(jīng)網(wǎng)絡(luò)被逆轉(zhuǎn)時(shí),計(jì)算機(jī)可以基于對(duì)語言和視覺元素概念化和抽象化的理解來創(chuàng)造新的圖像,類似于人類從生活經(jīng)驗(yàn)中汲取靈感[6]24-25。從創(chuàng)作形式中重要的算法環(huán)節(jié)來闡釋人工智能繪畫的變革創(chuàng)造力有一定的合理性,但僅以技術(shù)為據(jù)實(shí)際上遠(yuǎn)離了藝術(shù)的專有屬性。以人工智能工作聞名的概念藝術(shù)家安娜·里德勒
(Anna Ridler)反對(duì)利用這種公式化的方法來定義創(chuàng)造力,“它把它扁平化,認(rèn)為藝術(shù)是有趣的壁紙,而不是試圖表達(dá)想法和尋找真相的東西。人工智能無法處理概念:時(shí)間、記憶、思想、情感中的崩潰時(shí)刻——所有這些都是真正的人類技能,它使一件藝術(shù)品成為一件藝術(shù)品,而不是視覺上看起來漂亮的東西”。博登也認(rèn)為,作為創(chuàng)造性作品的支柱之一,作品應(yīng)是有價(jià)值的。畫作生成對(duì)人工智能來說是一個(gè)簡單的過程,但如何進(jìn)行具有藝術(shù)價(jià)值的輸出是真正的挑戰(zhàn)。人工智能是否能夠認(rèn)識(shí)人類品位及美學(xué)內(nèi)涵,在藝術(shù)價(jià)值層面,新的、獨(dú)一無二的生成作品是否具有創(chuàng)造力,都是需要探討的問題[6]41-49。
綜上所述,人工智能繪畫創(chuàng)作過程的多方參與及創(chuàng)作主體性的動(dòng)態(tài)變化造就了其創(chuàng)造力來源是一個(gè)集合體,由人類和模型共同承擔(dān)。在關(guān)鍵性的變革創(chuàng)造力判斷上,須依據(jù)二者的具體參與方式及發(fā)揮的作用來衡量,須針對(duì)不同的創(chuàng)作環(huán)節(jié)展開特定分析,而非一概而論。
3 人機(jī)協(xié)同藝術(shù)的新生
以文本生成圖像式人工智能繪畫為代表,藝術(shù)呈現(xiàn)出一種全新的面貌——人機(jī)協(xié)同藝術(shù)。人機(jī)協(xié)同藝術(shù)體現(xiàn)了人類與人工智能通過互動(dòng)、溝通、協(xié)作,共同創(chuàng)作藝術(shù)品的過程。與人類藝術(shù)創(chuàng)作或機(jī)械自動(dòng)化圖像生成完全不同的是,在這種形式中人和機(jī)器缺一不可,人腦和機(jī)器同時(shí)發(fā)揮了各自的優(yōu)勢(shì)作用。人類并非機(jī)器實(shí)現(xiàn)其自動(dòng)化的幫助者,機(jī)器也并非人類使用的工具。人類和機(jī)器在創(chuàng)作過程中有著不同分工,如人類以邏輯、構(gòu)思、審美發(fā)揮優(yōu)勢(shì),機(jī)器則承擔(dān)以組合、概率、作品高效率實(shí)現(xiàn)為主的作用。人機(jī)協(xié)作使藝術(shù)創(chuàng)作的效率大幅提升,人工智能可以處理大量的數(shù)據(jù)、素材、任務(wù),節(jié)省人類的時(shí)間和精力,使人能夠?qū)⒆⒁饬Ψ旁诟颖举|(zhì)的意識(shí)探索及審美修正等方面。更重要的是,人工智能可以潛入人類難以到達(dá)的空間,發(fā)現(xiàn)人類難以察覺的內(nèi)容。以微軟的“下一個(gè)倫勃朗”項(xiàng)目為例,通過提取倫勃朗作品的畫面特征、主題偏好、色彩組合等數(shù)據(jù)展開深入分析,算法生成了一幅全新的倫勃朗風(fēng)格肖像畫?;蛟S人們會(huì)質(zhì)疑再造一個(gè)“倫勃朗”的必要性,但項(xiàng)目的意義就在于,人工智能可以揭示人們現(xiàn)在認(rèn)為理所當(dāng)然的藝術(shù)品中那些可能錯(cuò)過的新結(jié)構(gòu),將人類真正推向新事物。
在創(chuàng)造力領(lǐng)域,人機(jī)協(xié)作為人類智慧與機(jī)器智慧充分施展提供了空間。正如馬庫斯所言,“人工智能在創(chuàng)造力方面可以發(fā)揮的作用可能是增強(qiáng)人類的創(chuàng)造力,這將是一種向前發(fā)展的合作伙伴關(guān)系,我們可以一起讓事情變得比我們單獨(dú)工作更有趣”。人工智能創(chuàng)造力的增強(qiáng)并不意味著人類自身創(chuàng)造力的停滯甚至退化,正如汽車比人類的速度更快,但人們并沒有因此停止步行。技術(shù)應(yīng)被視為想象力的引擎,它促使人類不得不從根本上重新思考和構(gòu)建人工智能時(shí)代的藝術(shù)創(chuàng)作。
隨著藝術(shù)創(chuàng)作主體的變化轉(zhuǎn)換、藝術(shù)創(chuàng)造力的重新定義,人機(jī)協(xié)同藝術(shù)必然需要構(gòu)建其專有理論,解決其與傳統(tǒng)藝術(shù)理論的關(guān)系問題,并對(duì)其衍生問題作出回答,還需要得到社會(huì)與大眾的接納認(rèn)可。面對(duì)目前人工智能藝術(shù)引發(fā)的恐慌與排斥,Midjourney創(chuàng)始人大衛(wèi)·霍爾茲(David Holz)作出了恰到好處的比喻,“人們完全誤解了人工智能是什么。他們認(rèn)為它是一只會(huì)吃人的老虎,是一個(gè)危險(xiǎn)的對(duì)手。水中也有危險(xiǎn),你可能會(huì)淹死,但流動(dòng)河水的危險(xiǎn)與老虎的危險(xiǎn)截然不同。水是危險(xiǎn)的,但你也可以在里面游泳、造船、筑壩發(fā)電。水是危險(xiǎn)的,但它也是文明的驅(qū)動(dòng)力。知道如何與水共處和工作的人類會(huì)過得更好。水沒有意志,沒有惡意,雖然有淹死于其中的可能,但這并不意味著我們應(yīng)該禁止水。當(dāng)你發(fā)現(xiàn)新的水源時(shí),這真是一件好事”。自工業(yè)時(shí)代以來,每一項(xiàng)新技術(shù)的出現(xiàn)都引發(fā)了恐懼與接受的循環(huán),而此刻的人工智能繪畫也面臨同樣的處境。人工智能的巨大優(yōu)勢(shì)并不可怕,人類必須思考如何與人工智能協(xié)作甚至共生。
4 結(jié)語
縱觀歷史長河,技術(shù)的變革對(duì)藝術(shù)生產(chǎn)和接受都產(chǎn)生了巨大的影響。從傳統(tǒng)藝術(shù)到當(dāng)代藝術(shù)的演進(jìn),實(shí)則就是藝術(shù)民主化路徑的生動(dòng)體現(xiàn)。機(jī)械復(fù)制技術(shù)的來臨使藝術(shù)的形式、內(nèi)容、功能從單一走向多元,藝術(shù)創(chuàng)作、藝術(shù)接受和藝術(shù)評(píng)論從少(下轉(zhuǎn)第頁)(上接第頁)數(shù)精英特權(quán)壟斷轉(zhuǎn)向成為民主化、大眾化的實(shí)踐,藝術(shù)創(chuàng)作成果由全民共享??萍嫉目焖侔l(fā)展也為藝術(shù)實(shí)踐孕育了更多新興場(chǎng)域,使審美取向表達(dá)更加多元化和個(gè)性化。19世紀(jì),攝影技術(shù)的興起使攝影師能夠被視為藝術(shù)家。而今天,人工智能的進(jìn)步有望引領(lǐng)人類邁入“全民藝術(shù)家”時(shí)代,引領(lǐng)藝術(shù)“民主化”進(jìn)程。藝術(shù)將不再是人類的專有領(lǐng)域,而是能夠?qū)崿F(xiàn)人與機(jī)器協(xié)作共享,創(chuàng)造力也將朝著全新的方向發(fā)展。人機(jī)協(xié)同將成為未來藝術(shù)發(fā)展的一大重要趨勢(shì),人工智能對(duì)藝術(shù)領(lǐng)域的涉足或許會(huì)與攝影一樣,成為眾多藝術(shù)形式中一個(gè)全新的分支。
參考文獻(xiàn):
[1] 丁寧.凝視過去、現(xiàn)在與未來[J].美術(shù),2019(9):44-45.
[2] 李杰,李葉.吳瓊:人機(jī)智能深度協(xié)同是人工智能時(shí)代設(shè)計(jì)
的重要特征[EB/OL].清華大學(xué)美術(shù)學(xué)院,(2021-11-15)
[2023-10-27]. https://www.ad.tsinghua.edu.cn/info/1205/
28095.htm.
[3] 喬納斯·奧本蘭德.文本到圖像生成的創(chuàng)造力[J].康奈爾大學(xué)組建論文檢索數(shù)據(jù)庫,2022(10):6-7.
[4] 劉薇薇,莉迪亞.提示工程文本到圖像生成模型的設(shè)計(jì)指南[J].康奈爾大學(xué)組建論文檢索數(shù)據(jù)庫,2021(9):2-3.
[5] 王斌旭,約翰·瓦斯托拉.擴(kuò)散模型像畫家一樣生成圖像:先輪廓后細(xì)節(jié)的分析理論[J].康奈爾大學(xué)組建論文檢索數(shù)據(jù)庫,2023(3):1-2.
[6] 庫爾特.人工智能中的藝術(shù)創(chuàng)造力[D].荷蘭:拉德堡德大學(xué),2018:24-25,41-49.
作者簡介:張笑娟(2002—),女,云南昆明人,本科在讀,研究方向:美術(shù)理論。