阿離
每每談到AI替代人類工作這個(gè)話題,更多時(shí)候還是以重復(fù)、機(jī)械式工作為主,可當(dāng)某一天AI能夠在創(chuàng)造力上同人類一較高低,會(huì)是怎樣一番情景呢?
前不久,一款登頂50個(gè)國(guó)家免費(fèi)榜的APP就讓人們重新認(rèn)識(shí)了AI在創(chuàng)造力方面的應(yīng)用,在畫畫這個(gè)需要靈感和天賦的領(lǐng)域,一款名為Dream By Wombo的智能夢(mèng)境生成器軟件成功刷爆了全球網(wǎng)友社交圈??吹竭@些精美的圖畫,你能相信它們是由原本“沒有情感”的AI創(chuàng)作的嗎(如圖1)?
圖1 網(wǎng)絡(luò)上的Dream By Wombo作品
Dream By Wombo本身是一款使用人工智能(AI)來生成復(fù)雜藝術(shù)作品的應(yīng)用。用戶只需輸入提示(或從Dream的建議中進(jìn)行選擇,如“未來城市”、“鉆石樹”等),然后選擇一種藝術(shù)風(fēng)格,如Dali、Fantasy或Steampunk等。然后,用戶可以實(shí)時(shí)觀看Dream By Wombo根據(jù)這些輸入創(chuàng)建藝術(shù)品的全過程。
Dream By Wombo使用的是CLIP引導(dǎo)的方法,CLIP是人工智能實(shí)驗(yàn)室 OpenAI 的一個(gè)開源的神經(jīng)網(wǎng)絡(luò)。該網(wǎng)絡(luò)使用了互聯(lián)網(wǎng)上的“圖像-文字描述”配對(duì)訓(xùn)練,并且可以評(píng)估用戶提供的文字描述與圖像的關(guān)聯(lián)程度。
為了生成藝術(shù)作品,Dream 模型從一個(gè)隨機(jī)生成的向量開始,即圖像的數(shù)學(xué)表示。向量中的每個(gè)條目對(duì)應(yīng)于圖像的一個(gè)微小細(xì)節(jié)。有些可能對(duì)應(yīng)于顏色,有些對(duì)應(yīng)于形狀,有些對(duì)應(yīng)于更抽象的含義。通常隨機(jī)向量首先對(duì)應(yīng)于一個(gè)灰色的像素塊。然后,該算法使用 CLIP 來確定當(dāng)前矢量圖像與用戶提示的對(duì)應(yīng)程度,并在多次迭代中改進(jìn)對(duì)應(yīng)關(guān)系。用戶實(shí)時(shí)觀看算法執(zhí)行此過程;該應(yīng)用程序會(huì)在最終產(chǎn)品出現(xiàn)之前創(chuàng)建多個(gè)圖像。過程的隨機(jī)性意味著 Dream 永遠(yuǎn)不會(huì)兩次制作相同的藝術(shù)品,就如同人們很難做兩個(gè)同樣的夢(mèng)一樣。
用戶在Dream By Wombo中輸入一個(gè)單詞或短語(yǔ)作為提示,并使用算法(通過暴露于大量不同的圖像來訓(xùn)練)來生成完全獨(dú)特的原創(chuàng)藝術(shù)品。Dream By Wombo使用較為簡(jiǎn)單,不過目前尚未有中文版本,因此國(guó)內(nèi)英文不太好的用戶使用起來可能會(huì)稍微慢一些。
下載并啟動(dòng)Dream By Wombo軟件后,可以看到其主界面較為簡(jiǎn)潔,啟動(dòng)軟件后用戶可以根據(jù)自己的夢(mèng)境在“Enter prompt”框中輸入一些英文單詞作為關(guān)鍵詞使用,再根據(jù)個(gè)人愛好選擇使用一個(gè)藝術(shù)風(fēng)格。Dream By Wombo當(dāng)前默認(rèn)提供了巴洛克、蒸汽朋克、漫畫等二十多種畫風(fēng)可選,選定完成后點(diǎn)擊“Create”按鈕就能自動(dòng)生成一張對(duì)應(yīng)的AI畫作(如圖2)。
圖2 關(guān)鍵詞最好為英文單詞
非常有意思的是Dream By Wombo每次作畫的結(jié)果都是不同的,即便是用戶使用了相同的關(guān)鍵字和藝術(shù)風(fēng)格,其生成的畫作可能在大體感覺上比較類似,但細(xì)微的差別總是存在,這或許也是AI作畫的魅力所在吧!
值得一提的是在Dream By Wombo之前,其實(shí)已經(jīng)有不少AI軟件在嘗試創(chuàng)作了,NightCafe Creation、Disco Diffusion等軟件都可以進(jìn)行類似的操作,但要么需要付費(fèi),要么對(duì)登錄賬號(hào)有一定要求,因此,對(duì)于大多數(shù)普通用戶而言,Dream By Wombo顯然是更好的選擇。
讓AI創(chuàng)作藝術(shù)品并非突發(fā)奇想,早在Dream By Wombo之前,這幾年已經(jīng)浮現(xiàn)出不少讓AI作畫的技術(shù)工具。最早是谷歌在2015年推出的DeepDream,還有英偉達(dá)的GauGAN、OpenAI的DALL·E、開源的Disco Diffusion等。
以DeepDream為例,其利用深度學(xué)習(xí)技術(shù)識(shí)別圖片,再把自己解讀的畫面呈現(xiàn)出來。后來谷歌將這一項(xiàng)目開源,讓所有人都可以上傳圖片,再生產(chǎn)出被DeepDream解讀的結(jié)果。實(shí)際上,DeepDream真正想要了解的是神經(jīng)網(wǎng)絡(luò)黑盒子的工作邏輯。神經(jīng)網(wǎng)絡(luò)在識(shí)別圖像時(shí)通常是層數(shù)越多越細(xì)致,第一層神經(jīng)網(wǎng)絡(luò)可能在識(shí)別輪廓,中間層的神經(jīng)網(wǎng)絡(luò)可能就在識(shí)別紋理、筆觸等等細(xì)節(jié)了。我們看到的那些正確識(shí)別出圖像的算法,都是經(jīng)由人工調(diào)試后的,而DeepDream則跳過了人工指導(dǎo)、矯正這一步,直接憑著自己的意愿識(shí)別圖片,并且會(huì)經(jīng)過數(shù)次重復(fù),最終就成了我們現(xiàn)在看到的樣子(如圖3)。
圖3 DeepDream的識(shí)別與創(chuàng)作
除了藝術(shù)創(chuàng)作之外,這些年區(qū)塊鏈技術(shù)的進(jìn)步,疊加AI獨(dú)一無(wú)二和視覺驚艷的特點(diǎn),AI作畫影響到的圈層也越來越廣泛,比較典型的有美術(shù)圈、藝術(shù)收藏圈以及NFT領(lǐng)域,畢竟唯一性已經(jīng)是一個(gè)相當(dāng)不錯(cuò)的賣點(diǎn)了,只不過市場(chǎng)是否接受就真不一定了。