我們對(duì)“計(jì)算機(jī)視覺(jué)”一詞并不陌生,它指的是讓計(jì)算機(jī)通過(guò)相關(guān)設(shè)備模擬生物視覺(jué)來(lái)處理采集到的圖片或視頻,以實(shí)現(xiàn)對(duì)相應(yīng)場(chǎng)景的多維理解。那么,我們是否能夠更進(jìn)一步?本期TED大會(huì)邀請(qǐng)人工智能領(lǐng)域先鋒李飛飛,分享她的科研成果。
生命誕生初期,世界對(duì)它們來(lái)說(shuō)是一片“虛無(wú)”,此時(shí)的生物還未進(jìn)化出視覺(jué),也沒(méi)有“看”這一概念存在。慢慢地,生物感光系統(tǒng)開(kāi)始出現(xiàn),經(jīng)歷了數(shù)千萬(wàn)年的進(jìn)化,世界上終于誕生了第一只眼睛。生命發(fā)現(xiàn)這世上除了自己還有別的存在,海洋從此有了樣貌。
視覺(jué)的產(chǎn)生極大地推動(dòng)了生物進(jìn)化的進(jìn)程,使生物擁有了更加敏捷、強(qiáng)大的身體和更加復(fù)雜的神經(jīng)系統(tǒng)??匆?jiàn)變成理解,理解帶來(lái)行動(dòng),而這一切都促進(jìn)了智能的發(fā)展。
現(xiàn)在,在好奇心的驅(qū)使下,人類正在為計(jì)算機(jī)視覺(jué)賦予更多智能。十幾年前,人們因大型神經(jīng)網(wǎng)絡(luò)能夠在1500萬(wàn)張圖片中識(shí)別目標(biāo)對(duì)象而備受鼓舞,現(xiàn)在,生成式人工智能已經(jīng)可以將人們輸入的句子轉(zhuǎn)換為圖片和視頻,計(jì)算機(jī)視覺(jué)的智能時(shí)代已經(jīng)到來(lái)了。
但是,現(xiàn)有的計(jì)算機(jī)視覺(jué)系統(tǒng)依然只能“看見(jiàn)”,它可以讓系統(tǒng)生成一只在水中玩耍的貓,卻不能合理地讓貓的皮毛變濕,計(jì)算機(jī)視覺(jué)需要新的突破。
現(xiàn)實(shí)生活中,當(dāng)我們身處三維空間,我們會(huì)進(jìn)行觀察、學(xué)習(xí)、判斷和預(yù)測(cè)。例如,當(dāng)看到貓推杯子的影像時(shí),我們的大腦會(huì)觀察杯子的形狀和位置,判斷杯子與周圍物體的關(guān)系,產(chǎn)生它即將被打碎的推斷,并情不自禁地想要伸出手扶它。
采取行動(dòng)是擁有空間意識(shí)的生物與生俱來(lái)的沖動(dòng),它能夠?qū)⒏兄c行動(dòng)聯(lián)系起來(lái),我將這一概念稱作“空間智能”。生物用數(shù)百萬(wàn)年進(jìn)化出了空間智能,將眼睛捕捉到的二維圖像投射進(jìn)大腦,轉(zhuǎn)化為三維的認(rèn)知?,F(xiàn)在,我將這種視覺(jué)與行動(dòng)的良性循環(huán)引入了人工智能領(lǐng)域。
研究人員正在開(kāi)發(fā)各種各樣的新算法——讓機(jī)器將一組照片轉(zhuǎn)換成三維空間、將單個(gè)圖像轉(zhuǎn)換為三維形式、將詞句所描述的三維空間布局轉(zhuǎn)換為真實(shí)的房間圖像、根據(jù)單個(gè)圖像生成無(wú)限延伸的空間……這是一個(gè)可能性的萌芽,這種進(jìn)步正在加速機(jī)器的學(xué)習(xí),空間智能會(huì)成為所有需要理解并與這個(gè)世界互動(dòng)的人工智能系統(tǒng)的關(guān)鍵組成部分。
如今,我和團(tuán)隊(duì)正在訓(xùn)練人工智能機(jī)器人,為它開(kāi)發(fā)基于三維空間模型的仿真環(huán)境系統(tǒng),讓它更好地執(zhí)行任務(wù)??臻g智能能夠讓機(jī)器真正與人類、與真實(shí)或虛擬的三維空間交互,這勢(shì)必會(huì)對(duì)世界產(chǎn)生深遠(yuǎn)的影響。以醫(yī)療保健領(lǐng)域?yàn)槔?,?xùn)練后的人工智能傳感器能夠更好地監(jiān)測(cè)醫(yī)生和病人的情況,不僅成為“眼睛”,還能成為“手”,給予大家更多互動(dòng)式的幫助。
我相信,人工智能領(lǐng)域的“寒武紀(jì)大爆發(fā)”(發(fā)生在寒武紀(jì)早期的海洋后生動(dòng)物爆發(fā)性輻射事件)一定會(huì)到來(lái),這是一個(gè)激動(dòng)的時(shí)刻,想要實(shí)現(xiàn)這個(gè)未來(lái)卻并不容易。每邁出一步,我們都要深思熟慮,始終開(kāi)發(fā)以人為本的技術(shù),不僅驅(qū)動(dòng)人工智能機(jī)器人成為實(shí)用的工具,還要讓它們成為真正值得信賴的合作伙伴,提高我們的生產(chǎn)力的同時(shí),也不損害我們每個(gè)人的尊嚴(yán)。
未來(lái),人工智能系統(tǒng)會(huì)擁有更強(qiáng)的理解能力、洞察力和空間感知能力,它將和我們一起追求更好的生活方式,創(chuàng)造更美好的世界。
(責(zé)任編輯 / 牛一名" 美術(shù)編輯 / 周游)