魯媛媛
“機(jī)器人能否終將統(tǒng)治世界?”沒(méi)人知道答案,但這絲毫也不影響人們對(duì)這個(gè)充滿(mǎn)哲學(xué)色彩的計(jì)算話題繼續(xù)保持好奇。
從電腦被發(fā)明的那一刻起,人與機(jī)器的交流就像一部默片。無(wú)論借助的是鍵盤(pán)、鼠標(biāo)或觸摸屏,我們總是以無(wú)言的方式傳遞著自己的喜怒哀樂(lè)。但在眾多科學(xué)家或者科幻家的心里,人與機(jī)器的互動(dòng)遠(yuǎn)遠(yuǎn)不僅于此,于是各種人工智能的場(chǎng)景不斷在電影中閃現(xiàn),而現(xiàn)實(shí)生活中,連接人與機(jī)器的語(yǔ)音感知?jiǎng)t一直是被人類(lèi)渴望征服的難點(diǎn)。
現(xiàn)在,通過(guò)最新的“深度神經(jīng)網(wǎng)絡(luò)(DNN, Deep Neural Networks)”技術(shù),微軟“跨越語(yǔ)言,溝通無(wú)礙”的語(yǔ)音翻譯系統(tǒng)將這一切都變得非常自然。當(dāng)人們手持麥克風(fēng),對(duì)著電腦說(shuō)出自己的語(yǔ)言后,電腦就可以把它變?yōu)槟阆M尸F(xiàn)的語(yǔ)種,并保持你原有的語(yǔ)音語(yǔ)調(diào)配合字幕朗讀出來(lái)。
這個(gè)名字看上去有些神秘的技術(shù)可不是一個(gè)“愿景”。最近一段在新浪微博上瘋傳的機(jī)器翻譯視頻,就為這個(gè)愿景做了一次很好的注腳。當(dāng)天,當(dāng)天津高校的學(xué)生在微軟亞洲研究院舉辦的“二十一世紀(jì)的計(jì)算大會(huì)”上看到微軟公司全球首席研究官里克·雷斯特(Rick Rashid)博士所帶來(lái)的這一演示時(shí),有人即時(shí)就發(fā)微博呼吁:“如此棒的技術(shù),大會(huì)的同聲傳譯人員可以休息了?!鄙踔劣袀€(gè)學(xué)生興奮地向Rick提問(wèn):“機(jī)器人能否終將統(tǒng)治世界?”
這個(gè)問(wèn)題也許曾在許多愛(ài)好科幻的小朋友心中縈繞不去,但作為一個(gè)高校的學(xué)生,能夠重新點(diǎn)燃自己兒時(shí)的幻想,這不能不說(shuō)是科技所帶來(lái)的“魔力”。而在微軟研究院,所有的研究都是基于夢(mèng)想而生。在其創(chuàng)始人Rick看來(lái),“基礎(chǔ)研究的價(jià)值之一就在于從某種意義上講,沒(méi)有人知道它能給我們帶來(lái)什么?!?/p>
把不可能變?yōu)樽匀?/b>
每天早晚都刷牙的人也許并不會(huì)去思考,刷牙這件事曾經(jīng)是一件多么不可思議的事情,但絕大多數(shù)的技術(shù)發(fā)展都經(jīng)歷了類(lèi)似從不可能到可能,然后自然而然的過(guò)程。著眼于未來(lái)計(jì)算的“自然而然”,哪怕眼下還壓根看不到它可以實(shí)現(xiàn)的可能,這就是微軟研究院的工作理念。
與大多數(shù)跨國(guó)公司在中國(guó)的研發(fā)機(jī)構(gòu)不同,微軟亞洲研究院并不是做產(chǎn)品開(kāi)發(fā)的機(jī)構(gòu),它從事的是自然用戶(hù)界面、新一代多媒體、以數(shù)字為中心的計(jì)算、互聯(lián)網(wǎng)搜索與在線廣告、計(jì)算機(jī)科學(xué)基礎(chǔ)研究等基礎(chǔ)性研究,這些項(xiàng)目也許要到5年甚至10年后才會(huì)成為商用的產(chǎn)品。更為不同的是,每位微軟亞洲研究院的研究員都有充分的自由去研究自己感興趣的方向而不用擔(dān)心任何資金方面的問(wèn)題——實(shí)際上,他們的研究經(jīng)費(fèi)由微軟總部全額撥付,這也使得他們不需要像其他企業(yè)的研究院那樣去找產(chǎn)品線“化緣”。
對(duì)于科學(xué)狂熱份子來(lái)說(shuō),這可能是他們夢(mèng)寐以求的地方,但在現(xiàn)任院長(zhǎng)洪小文看來(lái),肩負(fù)以改變?nèi)祟?lèi)未來(lái)生活為己任的科學(xué)研究者,必須要忍受一次次的失敗與否定,但這又不能使其原有的想象力受到局限。
比如高寫(xiě)實(shí)、能說(shuō)會(huì)動(dòng)的3D真人頭像;所握即所得的數(shù)字筆;視頻人臉識(shí)別技術(shù)等,當(dāng)最初微軟研究院決定去做這些基礎(chǔ)研究的時(shí)候,他們所持有的唯一目的就是如何重新構(gòu)想人機(jī)之間的交互,并讓這種交互變得更加自然。單獨(dú)來(lái)看,也許每個(gè)技術(shù)所能折射出的最終應(yīng)用還有些模糊,但是當(dāng)研究積累到一定階段,令世人驚奇的成果就“自然而然”地出現(xiàn)了。
正如Kinect的廣告語(yǔ)所言:“You are the controller(你就是遙控器)”。它讓每個(gè)人都能輕松成為玩家,帶給用戶(hù)前所未有的娛樂(lè)體驗(yàn)。而在此背后,凝結(jié)的是微軟研究院多年的研究成果。Kinect發(fā)布僅僅兩個(gè)月,就售出了超過(guò)800萬(wàn)臺(tái),平均每天銷(xiāo)售133333臺(tái),被吉尼斯世界紀(jì)錄評(píng)為有史以來(lái)銷(xiāo)售最快的電子消費(fèi)產(chǎn)品。
然而Kinect帶來(lái)的驚喜并不僅限于此,來(lái)自世界各地的發(fā)燒友和研究人員正將它延伸至更廣闊的領(lǐng)域——醫(yī)療復(fù)健、教育、日常生活等眾多領(lǐng)域。2011年6月,基于Windows非商業(yè)Kinect軟件開(kāi)發(fā)工具包(Kinect for Windows SDK beta)發(fā)布,使得越來(lái)越多個(gè)人開(kāi)發(fā)的Kinect應(yīng)用視頻被傳到Y(jié)ouTube網(wǎng)站上,展示Kinect是怎樣轉(zhuǎn)變和提高人們學(xué)習(xí)、生活和創(chuàng)新的方式。
如今,“Kinect效應(yīng)”開(kāi)始在世界各地蔓延:為美國(guó)患孤獨(dú)癥的孩子帶去歡樂(lè),幫助英國(guó)醫(yī)院的中風(fēng)患者康復(fù),讓西班牙醫(yī)生通過(guò)手勢(shì)控制手術(shù)等。當(dāng)這一切自然發(fā)生的時(shí)候,你還需要去一再確認(rèn)技術(shù)將如何改變世界嗎?
研究的基礎(chǔ)之本
“計(jì)算機(jī)行業(yè)與其他行業(yè)一樣,在其發(fā)展過(guò)程中,總是需要有一家公司投資于基礎(chǔ)研究。目前,這家公司碰巧就是微軟?!笨突仿〈髮W(xué)計(jì)算機(jī)系主任Jeannette M. Wing認(rèn)為,“微軟研究院最重要的意義在于它在整個(gè)‘學(xué)術(shù)界—產(chǎn)業(yè)界—政府的研究生態(tài)系統(tǒng)中所扮演的角色?!?/p>
作為微軟研究院的創(chuàng)始人,Rick數(shù)十年來(lái)一直保持的就是對(duì)基礎(chǔ)研究的堅(jiān)持。這可能會(huì)讓很多人不解:許多公司為了搶占市場(chǎng)機(jī)會(huì),會(huì)直接收購(gòu)別的公司現(xiàn)有的技術(shù),而微軟顯然也有這個(gè)實(shí)力,為什么還要自己去研究?是不是為了把更多的知識(shí)產(chǎn)權(quán)掌控在手?
對(duì)此,Rick的解釋耐人尋味:“我們確實(shí)獲得了大量的知識(shí)產(chǎn)權(quán),但我認(rèn)為這并不是微軟長(zhǎng)期投資于基礎(chǔ)性研究最真實(shí)、最主要的原因?!?/p>
在他看來(lái),基礎(chǔ)研究機(jī)構(gòu)就像一個(gè)早期預(yù)警系統(tǒng),總是能告訴我們新的想法、新的技術(shù)。因而在此方面的投入實(shí)際上是為了微軟未來(lái)的生存進(jìn)行投資,如果未來(lái)有了新的局面、新的需求,微軟就可以隨時(shí)做好準(zhǔn)備、產(chǎn)生改變。據(jù)Rick回憶:“20年前微軟做出堅(jiān)守基礎(chǔ)研究決定時(shí)的那些競(jìng)爭(zhēng)對(duì)手現(xiàn)在大多數(shù)都不在了,而微軟仍然存在,并且發(fā)展越來(lái)越大。這說(shuō)明我們對(duì)基礎(chǔ)研究做出的大量投資,使得我們有能力積極地適應(yīng)、積極地變化。為什么我們一直能夠產(chǎn)生高價(jià)值的產(chǎn)品影響我們的未來(lái),我想這就是核心、這就是關(guān)鍵。”
如今,微軟搭載其最新Windows 8操作系統(tǒng)所推出的平板電腦Surface又引領(lǐng)了業(yè)界新的搶購(gòu)風(fēng)潮。但據(jù)微軟亞洲研究院院長(zhǎng)洪小文博士透露,微軟研究院已經(jīng)投入到更面向未來(lái)的基礎(chǔ)研究中,比如進(jìn)一步改善人類(lèi)對(duì)電腦屏幕的觸感。目前在微軟研究院的實(shí)驗(yàn)室里,研究人員已經(jīng)可以實(shí)現(xiàn)當(dāng)人類(lèi)觸摸屏幕上的虛擬鍵盤(pán)時(shí),屏幕會(huì)通過(guò)反彈的深淺力度來(lái)回應(yīng)使用者的手指,并讓其明確感知到所觸摸的按鍵是什么;或者通過(guò)增加屏幕某一區(qū)域的粗糙感來(lái)告知使用者與其他區(qū)域的不同。
洪小文表示:“自然而然是人機(jī)交互的終極目標(biāo),為了實(shí)現(xiàn)這一目標(biāo),我們需要讓機(jī)器對(duì)人類(lèi)做出的指令有著更為‘人性化的回應(yīng)?!甭?tīng)上去也許有些神奇,但在微軟研究院看來(lái),一切終將自然而然。