胡雯雯
自從Google開始研究人工神經(jīng)網(wǎng)絡(luò)(Artificial Neural Networks)以來,一直在嘗試教它圖像分類和識(shí)別的技能。比如說,給它一個(gè)特定主題如“叉子”,讓它匹配出叉子的圖像;又或是給它一張叉子的圖片,讓它識(shí)別并且歸類。
這對(duì)人類來說是小兒科,但對(duì)人工智能系統(tǒng)來說,則意味著要看成千上萬張類似的圖片,才能掌握一個(gè)主題的共同點(diǎn),提高識(shí)別精確度。
大概是想讓更多人參與進(jìn)來,分擔(dān)這項(xiàng)費(fèi)時(shí)費(fèi)力的教學(xué)工作,Google最近向大眾公開了這個(gè)人工智能系統(tǒng)的代碼。一些軟件工程師將其應(yīng)用到自己的網(wǎng)站上(Psychic VR Lab 和 Deep Neural Net Dreams),讓網(wǎng)友們隨意上傳圖片,看它能識(shí)別出什么來。結(jié)果令人大吃一驚,這貨居然是個(gè)藝術(shù)家!
一棵樹的樹冠,被它詮釋成梵高風(fēng)格的小教堂,一朵下垂的向日葵花盤,被它詮釋成了一只胖乎乎的鳥,就連蒙克那幅著名的《吶喊》,也被它畫滿了密密麻麻的眼睛。
這是怎么回事?我們先來看看Google 人工神經(jīng)網(wǎng)絡(luò)的原理。它是模擬人腦神經(jīng)元來運(yùn)作的,包含10-30層人工神經(jīng)元。每一層都會(huì)專注于眼前圖像的某些細(xì)節(jié),將它分析后傳給下一層神經(jīng)元,一層層傳遞后,由最后一層判斷它到底是什么。
面對(duì)一個(gè)單獨(dú)的主題時(shí),比如喵星人,它識(shí)別起來是比較容易的。但如果給它一張照片或一幅圖,里面有天空、云朵、草地、河流、美女……那它要怎么決定其重點(diǎn)并且歸類呢?如果我們?cè)僖笏骸安徽撃阌X得自己看到的是什么,我們要你變出更多來”呢?
有趣的事情就這么發(fā)生了。
系統(tǒng)中每一個(gè)神經(jīng)元層次,關(guān)注的點(diǎn)都不同。較低層的對(duì)物體的邊緣輪廓,或是對(duì)簡(jiǎn)明的線條和裝飾性圖案很敏感,因此會(huì)將它們強(qiáng)調(diào)和放大;高一些的神經(jīng)元層,則對(duì)物體的整體、比較復(fù)雜的圖案感興趣。
因此,當(dāng)我們給它一張藍(lán)天白云的圖時(shí),盡管一些細(xì)碎的云朵在我們看來沒有任何意義,但被它自動(dòng)腦補(bǔ)后,可能會(huì)變成小鳥和小魚。然后為了強(qiáng)調(diào)這個(gè)特征,它又會(huì)繪制出更多的小鳥和小魚。
由于科學(xué)家們給它學(xué)習(xí)過的幾百萬張圖片,大部分跟動(dòng)物和建筑物有關(guān),所以它的想象力也總是圍繞著這些。在這套人工神經(jīng)網(wǎng)絡(luò)的眼中,鸚鵡螺會(huì)長(zhǎng)出狗頭,面包會(huì)變成毛毛蟲,就連日本漫畫中的大眼睛妹子,臉也會(huì)變成圓睜雙眼的汪星人。
好了,有人說,如果我給你的圖里什么輪廓都沒有呢?就是一張純?cè)朦c(diǎn),就像電視沒信號(hào)發(fā)出沙沙聲時(shí)的那種畫面,你詮釋給我看看?
真就有人做了這個(gè)實(shí)驗(yàn)。麻省理工的電腦科學(xué)與人工智能實(shí)驗(yàn)室,將純?cè)朦c(diǎn)圖給自己訓(xùn)練過的人工神經(jīng)網(wǎng)絡(luò)看,將它識(shí)別出的圖案細(xì)節(jié)放大后再詮釋,多次循環(huán)后,最終得出一系列精美絕倫的畫,有些像拜占庭的馬賽克,有些則像梵高的《星空》(有興趣可以自行搜索一下圖片名places205-googlenet)。
知乎上也有網(wǎng)友貼出自己用這套系統(tǒng)模擬出的圖像,雖然許多仍是沒有意義的噪點(diǎn),但里面也出現(xiàn)了螞蟻、巨石和海星等的圖象。
對(duì)于這個(gè)橫空出世的藝術(shù)家,工程師們已經(jīng)把它的風(fēng)格歸了類,叫“inceptionism潛夢(mèng)派”。這種技術(shù)能讓我們更好地理解神經(jīng)元處理任務(wù)的方式。