近些年,人工智能圖像生成應(yīng)用程序成為網(wǎng)絡(luò)中的一個(gè)熱潮,DALL-E便是其中比較成熟的一款,使用者無(wú)需使用任何的攝影器材、繪畫(huà)軟件等,便可創(chuàng)造出高品質(zhì)的圖像作品。而且,這項(xiàng)新技術(shù)的偉大之處在于:任何人都可以參與這種革命性的圖像創(chuàng)作方式。雖然在網(wǎng)絡(luò)上很容易找到那些利用DALL-E制作的圖像案例,但是,要使用這個(gè)強(qiáng)大的工具來(lái)生成可靠的精美藝術(shù)品/逼真的圖像,還是需要做好一定的準(zhǔn)備工作。
什么是 DALL-E?
DALL-E(目前正式命名為DALL·E 2),是一種深度學(xué)習(xí)的AI,它可以將文本敘事轉(zhuǎn)換為所描述內(nèi)容的數(shù)字圖像。其由OpenAI開(kāi)發(fā),這是一個(gè)位于美國(guó)舊金山的AI實(shí)驗(yàn)室,當(dāng)下流行的ChatGPT也是由其制造的。2021年1月,OpenAI向世界宣布了最初的DALL-E,DALL·E2則在2022年的4月份推出,它帶來(lái)了更強(qiáng)的真實(shí)感、更高的分辨率(最高可達(dá)2048×2048)和更強(qiáng)大的AI等改進(jìn)。DALL-E這個(gè)名字是西班牙超現(xiàn)實(shí)主義藝術(shù)家薩爾瓦多·達(dá)利(SalvadorDali)的名字與皮克斯動(dòng)畫(huà)工作室WALL-E中的同名機(jī)器人的合成詞,它會(huì)從互聯(lián)網(wǎng)上收集數(shù)以億計(jì)的照片/圖像和輸入的文本相配對(duì),從而讓AI了解文本和視覺(jué)數(shù)據(jù)之間的關(guān)系。因?yàn)榧夹g(shù)的發(fā)展,AI圖像生成器在近些年迅速地流行起來(lái)——對(duì)于大多數(shù)的普通用戶而言,有時(shí)候甚至?xí)煜鼳I圖像與真實(shí)照片之間的差異。
如何使用DALL-E?
即使是初次接觸者, 也可使用DALL-E——這就是DALL-E的美妙之處。實(shí)際上,該程序是由人類的語(yǔ)言組成,例如,你想看到“一條有虎紋的狗”的圖像,只需要在DALL-E的文本框中輸入相關(guān)詞語(yǔ),然后點(diǎn)擊生成。
要開(kāi)始使用DALL-E,需要訪問(wèn)DALL-E網(wǎng)站并進(jìn)行登錄——如果您沒(méi)有帳戶,則需要?jiǎng)?chuàng)建一個(gè),當(dāng)然也可以使用Google、Microsoft帳戶進(jìn)行登錄。登錄后,會(huì)在頁(yè)面的中央看到一個(gè)大的對(duì)話框。單擊框上方的“驚喜”按鈕,并填寫(xiě)預(yù)設(shè)文本提示或者嵌入自己的幾個(gè)關(guān)鍵詞來(lái)告訴AI自己想要看到的內(nèi)容——這里可以隨意輸入,最多400個(gè)字符,然后單擊“生成”按鈕開(kāi)始該過(guò)程。
其后會(huì)顯示四個(gè)示例圖像,此時(shí),可以單擊任何一個(gè)來(lái)查看大的視圖。如果合適,便選擇右上角的向下箭頭按鈕,將其下載到個(gè)人的計(jì)算機(jī)內(nèi)。如果結(jié)果有問(wèn)題——圖像與自己的描述不符,則可以通過(guò)單擊標(biāo)記圖標(biāo)并選擇適當(dāng)?shù)倪x項(xiàng)來(lái)“提醒”O(jiān)penAI。通常,DALL-E需要不到一分鐘的時(shí)間來(lái)呈現(xiàn)結(jié)果,但在繁忙的時(shí)候可能需要更長(zhǎng)的時(shí)間。
DALL-E生成的每張圖像都會(huì)自動(dòng)保存,在瀏覽器窗口的右側(cè)會(huì)顯現(xiàn)一個(gè)縮略圖網(wǎng)格——最新的作品便顯示在其頂部。使用者以后可以隨時(shí)返回,并打開(kāi)這些圖像來(lái)做參考、下載或修改,以此用于新作品。
DALL-E是免費(fèi)的嗎?
首次注冊(cè)DALL-E時(shí),使用者將獲得50個(gè)積分——這是一筆豐厚的積分,可以讓使用者有機(jī)會(huì)熟悉AI的工作原理。
如果要查看自己的積分狀況,可以打頁(yè)面右上角的選項(xiàng)菜單——該菜單看起來(lái)像三個(gè)水平的點(diǎn)。使用者的剩余積分便會(huì)顯示在登錄姓名和電子郵件的下方。此外,DALL-E每個(gè)月會(huì)贈(zèng)予使用者15個(gè)免費(fèi)積分,如果需要更多的積分,則可以通過(guò)選項(xiàng)菜單來(lái)選擇購(gòu)買積分——115個(gè)積分的費(fèi)用為15美元。其中,需要注意的是:免費(fèi)積分是每月清零,而付費(fèi)積分則是在12個(gè)月后清零,所以,按需要來(lái)訂購(gòu)自己需要的積分,不要過(guò)多地積攢。如果使用者預(yù)計(jì)自己會(huì)大量地使用DALL-E,此時(shí)也可以聯(lián)系OpenAI的銷售團(tuán)隊(duì)。
如何使用DALL-E進(jìn)行圖像補(bǔ)全
DALL-E可以生成足以用作成品的圖像,但在大多數(shù)情況下,1024×1024像素的分辨率會(huì)顯得有點(diǎn)小,并且無(wú)法像其他的AI圖像生成程序那樣進(jìn)行升級(jí)。此時(shí),有兩種解決的方法——首先,可以簡(jiǎn)單地下載DALL-E圖像,并使用其他應(yīng)用程序或服務(wù)對(duì)其進(jìn)行升級(jí);其次,還可以使用DALL-E outpainting在圖像的任何方向上擴(kuò)展其邊緣而不改變其比例。
那么,如何進(jìn)行操作?首先,打開(kāi)一張來(lái)自DALL-E的圖片。例如可以輸入“松林中的湖泊和沐浴大象的寫(xiě)實(shí)畫(huà)作”,或者從右側(cè)的縮略圖網(wǎng)格中選擇之前生成的圖像中進(jìn)行再次創(chuàng)作。單擊圖像頂部的“編輯”按鈕后,便會(huì)出現(xiàn)一個(gè)編輯屏幕,此時(shí)允許使用者添加或者擦除自己想要修改的部分。此時(shí),DALL-E會(huì)彈出警告說(shuō)沒(méi)有保存完整的圖像,因此使用者應(yīng)該經(jīng)常下載圖像以保存自己的進(jìn)度。在使用者第一次進(jìn)入編輯時(shí),橡皮擦工具就處于激活的狀態(tài),所以除非是使用者想替換某些元素,否則不要單擊自己的圖像。如果要添加到圖像的邊緣,需要單擊底部那個(gè)帶加號(hào)的按鈕——這是添加生成框工具。隨后,一個(gè)大的方框便會(huì)跟隨使用者的指針出現(xiàn),此時(shí),使用者可以把1024×1024像素的方框放在圖像的任何邊緣或者角落,以此來(lái)擴(kuò)充圖像。將現(xiàn)有圖像進(jìn)行重疊是一個(gè)好辦法,這樣DALL-E就會(huì)出現(xiàn)一些參考材料,當(dāng)使用者對(duì)其感到滿意時(shí)便可以進(jìn)行點(diǎn)擊。
你可以保留原來(lái)的提示,如果你想在邊緣引入一些新的元素,也可以將其改變。點(diǎn)擊“生成”按鈕,DALL-E就會(huì)開(kāi)始進(jìn)行圖像補(bǔ)全。此時(shí),使用者會(huì)看到四種變化,你可以使用新的框架下面的白色箭頭來(lái)點(diǎn)擊選項(xiàng)——點(diǎn)擊“接受”可以選擇其中一個(gè);如果不接受,就點(diǎn)擊“取消”。當(dāng)然,每個(gè)修改都要花費(fèi)一個(gè)積分。此外,使用者也可以把生成框拖到一個(gè)新的位置,并展開(kāi)另一個(gè)邊緣或者角落,隨時(shí)更改提示。當(dāng)你在邊緣工作時(shí),需要考慮如何裁剪最終的圖像,以避免產(chǎn)生超過(guò)需要的數(shù)量。
DALL-E的提示工程
如果,使用者不確切地知曉自己的需求,可以從簡(jiǎn)單的詞語(yǔ)開(kāi)始。而且,使用者給DALL-E留出相應(yīng)的空白,DALL-E則可以用超出預(yù)期的奇妙創(chuàng)作給我們帶來(lái)驚喜。瀏覽DALL-E的案例是一個(gè)很好的學(xué)習(xí)方法,回到DALL-E的主頁(yè),然后向下滾動(dòng),便可以查看特色的圖片。如果將指針滾動(dòng)到圖像上,則會(huì)顯示用于創(chuàng)建它的提示。
如果使用者的目標(biāo)是特定的圖像,添加您可能在實(shí)際藝術(shù)品或照片描述中找到的關(guān)鍵字可以幫助引導(dǎo)AI朝著正確的方向發(fā)展;如果想要具有大量散景的攝影質(zhì)量,請(qǐng)?jiān)谧约旱奶崾局惺褂盟蛘咧付姆N類型的相機(jī)和鏡頭來(lái)捕捉想要的圖像類型——例如,可以描述圖片的構(gòu)圖(廣角或者特寫(xiě))、場(chǎng)景中的燈光(日出或者夜晚)、觀看者的位置(上方或者下方)、人和物體的方向(右側(cè)或者右側(cè))……