我們最常見到的人工智能(AI)應(yīng)用場景或許是“看圖說話”,即讓AI識別出一張圖片上的內(nèi)容是什么,并用文字表示出來。許多人甚至還在Google上玩過你畫我猜的游戲,用來幫助它們的AI做海量的學(xué)習(xí)訓(xùn)練。
4月初,人工智能研究實驗室OpenAI讓AI在圖片上的發(fā)揮更進(jìn)了一步。他們發(fā)布了一個新的AI系統(tǒng)DALL-E2,可以實現(xiàn)將文本描述轉(zhuǎn)換為圖像的功能。比如輸入“宇航員在太空中騎馬”,它就會生成一張帶有浪漫色彩的太空騎馬圖。
DALL-E的名字來自機(jī)器人瓦力(Wall-E)和藝術(shù)家達(dá)利相結(jié)合,2則代表它是第二代產(chǎn)品。和上一代相比,DALL-E2制作的圖更高清、更生動,速度也更流暢。據(jù)介紹,DALL-E2的核心是一個模擬了大腦神經(jīng)元網(wǎng)絡(luò)的數(shù)學(xué)系統(tǒng),它和我們所認(rèn)知的AI一樣,都是通過分析大量數(shù)據(jù)來學(xué)習(xí)?!半m然制作出來的這些圖像既超現(xiàn)實又呈現(xiàn)卡通化,但它們證明了,人工智能已經(jīng)學(xué)會‘世界被組合在一起的基礎(chǔ)邏輯。這些圖像實在是令人驚嘆?!薄堵槭±砉た萍荚u論》稱。
OpenAI還試圖讓DALL-E2減少作惡,為此添加了“反欺凌過濾器”,禁止一些不當(dāng)圖片的生成。但DALL-E2基于現(xiàn)實世界習(xí)得的數(shù)據(jù)難免會帶上性別和歧視的成分。比如讓DALL-E2畫一名律師,它生成的圖片都是白人男性。