石寧鈺
國(guó)際上人工智能的創(chuàng)新和創(chuàng)業(yè)日趨活躍,這將在中關(guān)村掀起一場(chǎng)新的技術(shù)革命……
圍棋人機(jī)大戰(zhàn)讓人工智能再度受到廣泛關(guān)注。當(dāng)街頭巷尾都還在紛紛論人工智能到底是什么、它和我們有什么關(guān)系時(shí),這條人工智能的路早已繼續(xù)高歌猛進(jìn),漸漸在中關(guān)村蔓延開來。
概念由來:朋友聚會(huì)提出來的“人工智能”
1956年夏天,在美國(guó)達(dá)特茅斯大學(xué)(Dartmouth)召開了一次影響深遠(yuǎn)的歷史性會(huì)議。這次聚會(huì)屬于朋友間沙龍式的學(xué)術(shù)研討,與會(huì)者僅僅只有10個(gè)人,當(dāng)時(shí)僅僅是些名不見經(jīng)傳的年輕學(xué)者,但后來,他們的名字人們不再陌生,例如申龍是《信息論》的創(chuàng)始人,塞繆爾編寫了第一個(gè)電腦跳棋程序,麥卡錫、明斯基、紐厄爾和西蒙都是“圖林獎(jiǎng)”的獲獎(jiǎng)?wù)摺?/p>
達(dá)特茅斯會(huì)議歷時(shí)長(zhǎng)達(dá)兩個(gè)多月,首次提出了“人工智能”(Artificial Intelligence)這一術(shù)語。
達(dá)特茅斯會(huì)議雖然提出了人工智能,但卻沒能再提出有關(guān)于此的更多內(nèi)容,事實(shí)上,人工智能的研究狀況比科學(xué)家們的設(shè)想要復(fù)雜和艱難的多。20世紀(jì)70年代初,人工智能在經(jīng)歷了一段比較快速的發(fā)展時(shí)期后,很快就遇到了問題,開始走向低谷。
人工智能的科學(xué)家并沒有被一時(shí)的困難所嚇倒,他們?cè)谡J(rèn)真總結(jié)經(jīng)驗(yàn)教訓(xùn)的基礎(chǔ)上努力探索,使人工智能走出實(shí)驗(yàn)室,走向?qū)嵱没H斯ど窠?jīng)網(wǎng)絡(luò)(artificial neural networks)技術(shù)的迅速發(fā)展無疑讓人工智能的學(xué)術(shù)界看到了新的希望,讓人工神經(jīng)網(wǎng)絡(luò)被視為實(shí)現(xiàn)人工智能的可能途徑。其實(shí)它不是一個(gè)新概念,20世紀(jì)60年代,人們把它稱之為感知機(jī),再后來人們開始創(chuàng)造多層感知機(jī),也就是我們今天通常聽到的人工神經(jīng)網(wǎng)絡(luò)。
ANN中有稱作神經(jīng)元的計(jì)算單元。這些人工神經(jīng)元通過突觸連接,這里的突觸指的是權(quán)重值。也就是說,給定一個(gè)數(shù)字,一個(gè)神經(jīng)元將執(zhí)行某種計(jì)算,然后計(jì)算結(jié)果會(huì)被乘上一個(gè)權(quán)重。如果你的神經(jīng)網(wǎng)絡(luò)只有一層,那么加權(quán)后的結(jié)果就是該神經(jīng)網(wǎng)絡(luò)的輸出值。或者,你也可以配置多層神經(jīng)元,這就是深度學(xué)習(xí)的基礎(chǔ)概念。
如何執(zhí)行:人工神經(jīng)網(wǎng)絡(luò)通過反向傳播實(shí)現(xiàn)
關(guān)于運(yùn)行計(jì)算的神經(jīng)元和神經(jīng)突觸,它們又是如何學(xué)習(xí)執(zhí)行計(jì)算?從本質(zhì)上說,就是我們需要問它們大量的問題,并提供給它們答案,也就是有監(jiān)督學(xué)習(xí)。借助于足夠多的問題和答案案例,儲(chǔ)存在每個(gè)神經(jīng)元和神經(jīng)突觸中的計(jì)算和權(quán)值就能慢慢進(jìn)行調(diào)整。通常,這是通過一個(gè)叫做反向傳播(backpropagation)的過程實(shí)現(xiàn)的。
具體來說,反向傳播算法就是在學(xué)習(xí)過程中從最開始輸入層輸入特征向量,網(wǎng)絡(luò)層層計(jì)算獲得輸出,輸出層發(fā)現(xiàn)輸出和正確的信息不一樣,這時(shí)它就讓最后一層神經(jīng)元進(jìn)行參數(shù)調(diào)整,最后一層神經(jīng)元不僅自己調(diào)整參數(shù),還會(huì)勒令連接它的倒數(shù)第二層神經(jīng)元調(diào)整,層層往回退著調(diào)整。經(jīng)過調(diào)整的網(wǎng)絡(luò)會(huì)在樣本上繼續(xù)測(cè)試,如果輸出還是老出錯(cuò),繼續(xù)來一輪調(diào)整,直到網(wǎng)絡(luò)輸出滿意為止。
舉例說明,把一張貓的照片交給計(jì)算機(jī)讓其識(shí)別,計(jì)算機(jī)通過這張照片的像素信息逐層分析,每一層都會(huì)有若干個(gè)神經(jīng)元負(fù)責(zé)分解畫面上的信息,比如說第一層負(fù)責(zé)分析照片上的輪廓信息,這個(gè)時(shí)候可能有一半的神經(jīng)元判斷這個(gè)照片上是狗,另一半覺得這個(gè)照片上是貓,沒關(guān)系,再交給下一層分析,下一層的神經(jīng)元負(fù)責(zé)分析照片上的顏色信息,再下一層負(fù)責(zé)分析照片上的紋理信息,以此類推。到了最后一層計(jì)算機(jī)得出的結(jié)果是照片上的動(dòng)物是狗。但如果計(jì)算得出了錯(cuò)誤的信息,神經(jīng)網(wǎng)絡(luò)就得重新再來一遍,這時(shí)候每層的神經(jīng)網(wǎng)絡(luò)就會(huì)反省上一次的錯(cuò)誤,分析得出正確的結(jié)果。
技術(shù)變革:爭(zhēng)做人工智能時(shí)代的微軟英特爾
深度學(xué)習(xí)近幾年已經(jīng)引起很多擁有大數(shù)據(jù)的互聯(lián)網(wǎng)公司爭(zhēng)相投入資源研發(fā)。這個(gè)最初來自學(xué)術(shù)界的研究成果漸漸開始影響到各大高科技公司……
2012年,百度語音和圖像產(chǎn)品快速崛起,在語音識(shí)別準(zhǔn)確率方面,2012年全年的進(jìn)展超過了業(yè)界過去多年進(jìn)展的總和。在圖像處理方面,百度僅用一個(gè)多月的時(shí)間就上線了世界首個(gè)全網(wǎng)人臉?biāo)阉鳟a(chǎn)品,這些重大突破都得益于深度學(xué)習(xí)技術(shù)的突破與應(yīng)用。
2013年年初,百度CEO李彥宏宣布成立百度深度學(xué)習(xí)研究院(Institute of Deep Learning,IDL),這是百度歷史上首個(gè)正式成立的前瞻性研究機(jī)構(gòu),致力于“讓計(jì)算機(jī)像人腦一樣智能”的科學(xué)研究。李彥宏明確表示,希望IDL成為像AT&T-Bell labs(貝爾實(shí)驗(yàn)室)、Xerox PARC(施樂帕洛阿爾托研究中心)一樣的頂尖研究機(jī)構(gòu)。
地平線機(jī)器人技術(shù)研發(fā)有限公司成立于2015年6月,其創(chuàng)始人余凱曾為百度深度學(xué)習(xí)研究院常務(wù)副院長(zhǎng)。自2015年5月離職后,余凱便致力于打造基于深度神經(jīng)網(wǎng)絡(luò)的人工智能“大腦”平臺(tái),其中包括了軟件和芯片的研發(fā),可以做到低功耗、本地化的解決環(huán)境感知、人機(jī)交互、決策控制等問題。其中,軟件方面,地平線做了一套基于神經(jīng)網(wǎng)絡(luò)的操作系統(tǒng),目前也正在研發(fā)分別面向自動(dòng)駕駛的“雨果”平臺(tái)和智能家居的“安徒生”平臺(tái),并已開始在一些具體的應(yīng)用場(chǎng)景中逐步落地。硬件方面,未來地平線機(jī)器人還會(huì)為這個(gè)平臺(tái)設(shè)計(jì)一個(gè)大腦芯片BPU (Brain Processing Unit) ,支撐自家的操作系統(tǒng),到那時(shí)效能會(huì)提升 2-3 個(gè)數(shù)量級(jí)(100-1000 倍)。
中國(guó)科學(xué)院計(jì)算技術(shù)研究所日前發(fā)布全球首顆神經(jīng)網(wǎng)絡(luò)處理器“寒武紀(jì)”。該處理器比“AlphaGo”所使用的處理器在性能上提升兩個(gè)數(shù)量級(jí),在硬件設(shè)計(jì)上更符合神經(jīng)網(wǎng)絡(luò)逐層分析的特點(diǎn),從而能準(zhǔn)確、快速地識(shí)別更加復(fù)雜的事物。也就是說,它能夠讓人工智能跑得更快、更遠(yuǎn)。
該課題組負(fù)責(zé)人之一、中科院計(jì)算所陳天石博士透露,今年課題組和中科院計(jì)算所已經(jīng)孵化了中科寒武紀(jì)公司,正式開始進(jìn)行科研成果的產(chǎn)業(yè)化。未來應(yīng)用瞄準(zhǔn)企業(yè)、科研院所里的高性能服務(wù)器、高效能終端芯片、機(jī)器人芯片三大領(lǐng)域,實(shí)現(xiàn)更多功能、可服務(wù)的領(lǐng)域,既包括社會(huì)民生,也包括國(guó)家重大需求。
陳天石介紹,寒武紀(jì)這個(gè)地質(zhì)紀(jì)年是生物多樣性大爆發(fā)的時(shí)代,這項(xiàng)科研成果之所以取這個(gè)名字,就是希望人工智能也能像生命一樣出現(xiàn)大爆發(fā)。
國(guó)際上人工智能的創(chuàng)新和創(chuàng)業(yè)日趨活躍。以創(chuàng)業(yè)企業(yè)為例,市場(chǎng)調(diào)查公司“風(fēng)險(xiǎn)掃描”繪制的一張人工智能創(chuàng)業(yè)地圖顯示,截至2015年,全球人工智能初創(chuàng)企業(yè)已有855家,橫跨13個(gè)門類,總估值超過87億美元。在中關(guān)村,隨著一大批核心科研成果誕生、轉(zhuǎn)化,人工智能領(lǐng)域加速發(fā)展,正帶動(dòng)一場(chǎng)新的技術(shù)變革。中關(guān)村企業(yè)將爭(zhēng)做人工智能時(shí)代的微軟英特爾。