IT界的競爭就看誰的東西更新、更快,技術(shù)不斷的保持領先。這也是為什么微軟一定需要有強大研究院的原因之一。
計算機真的能超越人類嗎?1997年,在計算機“深藍”戰(zhàn)勝世界棋王卡斯帕羅夫的第二天,IBM公司的股票價格上揚了3.6個百分點。這一局棋,為IBM帶來了2億美元的收益,而電腦第一次戰(zhàn)勝世界棋王,被西方媒體評為世界十大新聞之一。
《黑客帝國》、《終結(jié)者》等關于人機大戰(zhàn)的電影似乎宣揚著人類對于計算機未來的擔憂,但另一方面,人類又不斷利用計算科學挑戰(zhàn)著自身的極限,“以前,心理學家、認知學家認為,計算機要超過人類還有很長很長的距離,很多發(fā)表在《科學》(science)或者《自然》(Nature)上的文章,都試圖證明這一點,人臉識別就是最主要的例證。那時候,計算機確實做得非常糟糕,但自從我們做這個工作后,再沒有那樣的文章了?!?/p>
說這話的人名字叫馬毅,九個月前,他還在美國伊利諾伊大學厄巴納一香檳分校電氣與計算機工程系的實驗室里研究視覺計算,而現(xiàn)在,他卻坐在中關村希格瑪大廈的辦公室里接受本刊記者的采訪。在兼任副教授的同時,馬毅多了一重身份——微軟亞洲研究院視覺計算組負責人,他正在微軟亞洲研究院這個新平臺上,用計算挑戰(zhàn)著人類的視覺極限——人臉識別。
忙人
馬毅的身份很“特殊”。在微軟亞洲研究院,他不僅是項目負責人、項目合作公關大使,還是一位副教授,一個實實在在的大忙人。
他的一天往往是這樣開始的:早晨起來第一件事,是回復美國那邊的Email或者打電話,給他的研究生一些工作上的指導,安排微軟視覺計算組成員們的日常事務和項目合作等方面的事情;晚上回家還要繼續(xù)美國的工作,甚至一度,他還在半夜參加過幾個電話會議?!鞍滋煸谖④浬习?,晚上有時候還要和學校打電話,我實際上是拿一份工資做兩件事情?!瘪R毅和記者開起了玩笑。
繁忙的事物并沒有打亂馬毅的研發(fā)節(jié)奏,用他的話來說,團隊合作把其在管理上花的時間降到最低,另一方面,“最有效的管理就是以身作則。我必須做好技術(shù)方面的工作,如果你自己都做不到,就不可能要求我們下面比較年輕的研究人員去做更有風險但可能回報更大、更有影響力的工作?!?/p>
如果形容一下現(xiàn)在的工作狀態(tài)和以前純做研究時的不同,馬毅用了兩個字——刺激?!拔以瓉硪苍L問過微軟亞洲研究院,覺得這是最活躍的一個研究院,但直到過來后才體會到這兒的節(jié)奏有多快,真正的活力在哪里?!瘪R毅語帶興奮,“如果在學校長期呆下去,很可能關在一個很小的領域閉門造車;在大公司接觸很多完全不同的項目,開拓了眼界,現(xiàn)在我考慮更多的問題是自己做的東西是不是真有適用性,對這個領域今后的發(fā)展有更深的影響?!?/p>
現(xiàn)在,計算機的并行處理和多核處理技術(shù)還有新的數(shù)學工具,已經(jīng)讓計算機視覺計算達到了可以生產(chǎn)實際產(chǎn)品,并產(chǎn)生影響的時候。馬毅開始考慮如何把最先進的技術(shù)成果轉(zhuǎn)移到應用中去。
識人
馬毅所說的最先進的視覺計算成果就是“人臉識別”。如果說,視覺計算是模仿人類的眼睛和大腦識別物體、恢復三維景觀并對其產(chǎn)生認知、判斷的話,人臉識別就是通過對人臉不同表情或局部圖像的分析,準確識別出來對像是誰。
為了讓記者更直觀的理解這一技術(shù),馬毅做了一個演示。當打開電腦上的人臉識別系統(tǒng),攝像頭迅速捕捉到了馬毅的搞怪表情,鏈接到后臺的人臉數(shù)據(jù)庫之后,計算機不一會就在數(shù)百個人臉中“框”出了一臉嚴肅的馬毅。你可能想象不到,在看似簡單的過程背后,隱藏的卻是一連串復雜的算法。“眼睛變化、張嘴變化都可能失去可識別性,我們的方法和以前的很不一樣,已經(jīng)實現(xiàn)專利化了?!?/p>
至于人臉識別技術(shù)的應用領域,你可能首先想到安防。比如在門禁系統(tǒng),門卡的可轉(zhuǎn)移性、可復制性,讓不安全的縫隙越擴越大,但如果利用人臉識別或者生物信息的識別,安全風險就能得到很大程度的降低?!跋裰讣y、虹膜或者是DNA檢測,都具有一定的侵擾性,人臉識別的好處就是,可以在人完全沒有任何感知的情況下,做到準確監(jiān)測?!?/p>
對于計算機個人信息的保護或檢索方面,人臉識別系統(tǒng)的應用范圍更為寬廣。就算密碼被盜,人臉識別系統(tǒng)能很快監(jiān)測出是不是主人在使用計算機,并能按照事先的設置,關機、自動拍下或識別非正?!叭肭终摺钡哪槨I踔猎陂_會的時候,如果忘記了對面坐的重要人物是誰,可以用手機拍下他的照片,人臉識別系統(tǒng)會通過互聯(lián)網(wǎng),告訴你這個人的名字、背景。
技術(shù)已經(jīng)不滿足于停留在“識別”階段,它正向“識人”邁進。而這種“識人”技術(shù)就好像給終端賦予智慧,使其能夠像人類一樣思考。一個小小的例子就能說明問題:當你把人臉識別技術(shù)用在家庭相冊的整理上面,系統(tǒng)會自動幫助你根據(jù)人臉的形狀或者表情進行分類整理,而這種功能已經(jīng)在Facebook上實現(xiàn)了。
超越人
“技術(shù)超越的不光是人類的能力,甚至人類的想象?!睆幕ヂ?lián)網(wǎng)上可以看到和博物館一樣逼真的藝術(shù)品的每一個細節(jié),連光線的明暗都能夠根據(jù)觀賞角度分別開來;在照片完全損毀的情況下,甚至星雪花狀,或者只要保持小部分像素的一致性,計算機都能很精確識別出來,怎么樣,很奇妙吧?
視覺計算就是這么神奇,它為人類描繪了幻想的空間,用人所不能及的計算能力勾勒著智能世界的輪廓。計算機就在超越人類極限的同時,幫助打破新的極限,或者豐富著人類的生活。
“互聯(lián)網(wǎng)發(fā)展到現(xiàn)在,越來越廣的操作建立在視覺的基礎上,越來越強的內(nèi)容展現(xiàn)也專注在視覺上,而越來越多用戶去創(chuàng)造的,同樣還是圍繞視覺。”NVIDIA亞太區(qū)高級市場總監(jiān)莊海歐曾對互聯(lián)網(wǎng)的將來作出如此判斷。微軟不久前推出的第五任搜索引擎——必應(Bing),充分挖掘了視覺計算的潛能,更為精準和細致的圖片搜索,就是微軟在搜索領域挑戰(zhàn)谷歌的又一利器。包括最近微軟Xbox的一些互動游戲,靠照相機實時把三維的信息準確復原出來,讓人機交互無限接近人人交互的效果。
“企業(yè)的競爭力歸根到底都是人才競爭,看誰能吸引到最好的人才,對吧?”馬毅笑著說,這也不難解釋為什么微軟亞洲研究院要把他從伊利諾伊大學“挖”過來。安裝了人臉識別系統(tǒng)的筆記本或者手機到了非權(quán)限人手中,將變成廢銅爛鐵一樣,而再也沒有比永不會丟失的筆記本或者手機,更有吸引力的東西了。