□ 文Google全球技術(shù)總監(jiān)、上海研發(fā)院院長(zhǎng) 陳 曉
谷歌:人工智能引領(lǐng)未來(lái)
□ 文Google全球技術(shù)總監(jiān)、上海研發(fā)院院長(zhǎng) 陳 曉
說(shuō)到人工智能領(lǐng)域,經(jīng)常用到的專(zhuān)業(yè)用語(yǔ)是機(jī)器學(xué)習(xí)。人工智能起源于上世紀(jì)中期,自人工智能鼻祖圖靈教授發(fā)明圖靈機(jī)之后,一些科學(xué)家們就開(kāi)始?jí)粝霗C(jī)器是否可以在某個(gè)時(shí)刻能有人類(lèi)的感知,能像人類(lèi)這么聰慧智能,能夠完成人類(lèi)才能夠完成的任務(wù)。機(jī)器學(xué)習(xí)則是實(shí)現(xiàn)人工智能的一種手段。在近十年里發(fā)展特別迅猛,特別是2012年以來(lái),機(jī)器(深度)學(xué)習(xí)成為人工智能領(lǐng)域中最主要也最成功的方法。
大家應(yīng)該會(huì)注意到最近在互聯(lián)網(wǎng)上的新聞,從去年底到今年年初,在圍棋界有一位“大師”(網(wǎng)上注冊(cè)名為”master“)在網(wǎng)絡(luò)上和圍棋界的高手交手,連贏60場(chǎng),而它就是去年3月份和韓國(guó)圍棋冠軍李世石在人機(jī)大戰(zhàn)對(duì)弈的AlphaGo。有一千年歷史的圍棋是人類(lèi)發(fā)明最智慧、最玄妙的游戲,一開(kāi)始很難想象,一個(gè)人類(lèi)發(fā)明的機(jī)器可以在圍棋上戰(zhàn)勝人類(lèi)的大腦。人工智能原本似乎是高深尖的科技手段,因?yàn)檫@個(gè)事件的發(fā)生和廣為傳播,就把人工智能的概念推到了廣大公眾的視野中。
這幾年機(jī)器學(xué)習(xí)和人工智能有一些井噴式的發(fā)展,為什么會(huì)這樣?機(jī)器學(xué)習(xí)的概念是什么?機(jī)器學(xué)習(xí)其實(shí)是建造一些能夠有一定智慧的機(jī)器,通過(guò)事例學(xué)習(xí)去訓(xùn)練去“琢磨”怎么完成某項(xiàng)任務(wù),而不是人類(lèi)用一些硬式的邏輯、固定的指示和程序讓機(jī)器做到某項(xiàng)任務(wù),因?yàn)橛邢薜闹噶钍菦](méi)有辦法應(yīng)對(duì)非常渾沌、混亂的世界的。比如說(shuō)簡(jiǎn)單的交通標(biāo)志,不管是停止、讓路還是禁止通行的標(biāo)志,其實(shí)是有具體和標(biāo)準(zhǔn)的規(guī)則。但是在現(xiàn)實(shí)生活中,可能會(huì)被霧霾雨水迷糊了,會(huì)被積雪遮擋了,標(biāo)志牌被撞歪了,于是有了千變?nèi)f化的不可測(cè),這時(shí)候人工智能就能起很大的作用,讓機(jī)器自己學(xué)習(xí)怎么解決問(wèn)題,而不是依賴(lài)人類(lèi)的固定程序。
Google為什么在人工智能方面特別在乎?為什么站在這個(gè)前沿上致力于研究開(kāi)發(fā)、應(yīng)用和推廣?Google本身的使命就是能夠整合全球各種各樣的信息(包括語(yǔ)音、圖片、地圖等)而且希望能夠讓人人使用并從中收益。而人工智能和機(jī)器學(xué)習(xí)起到最大的作用就是能夠“讀懂”海量的信息,幫助人們消化吸收,并提供建議。我們公司的總裁Sundar Pichai高瞻遠(yuǎn)矚,指引公司從2012年開(kāi)始投入了很多的人力物力專(zhuān)注于人工智能,幾年來(lái)在各個(gè)方面有了一些突破性的技術(shù)革新,在應(yīng)用上也有很多喜人的成果。去年他提出,“人工智能這一具有顛覆性作用的核心技術(shù),使我們開(kāi)始重新審視我們的所有產(chǎn)品。Google公司從移動(dòng)優(yōu)先將會(huì)轉(zhuǎn)向人工智能優(yōu)先、人工智能為先的時(shí)代?!?/p>
說(shuō)到機(jī)器學(xué)習(xí),最近更常見(jiàn)或者其中最主要的技術(shù)手段就是神經(jīng)網(wǎng)絡(luò)(深度學(xué)習(xí))。機(jī)器神經(jīng)網(wǎng)絡(luò)受啟發(fā)于人類(lèi)自己的生物學(xué)神經(jīng)網(wǎng)絡(luò)系統(tǒng),因?yàn)樯锎竽X里的神經(jīng)元基本功能就是對(duì)外界進(jìn)行感知、采集、處理并做出判斷,并和其他神經(jīng)元在近距離傳遞信息。模擬了這樣的系統(tǒng),機(jī)器神經(jīng)網(wǎng)絡(luò)也有大量機(jī)器神經(jīng)元,每個(gè)神經(jīng)元有自己的責(zé)任和義務(wù)去處理一件事,傳遞到最后一層做出總的判斷。比如說(shuō)超大的一個(gè)圖片可以分成大量的小圖,每一個(gè)機(jī)器神經(jīng)元去處理、認(rèn)知這個(gè)圖片,并給出自己的結(jié)論和可能性的權(quán)重。神經(jīng)網(wǎng)絡(luò)系統(tǒng)最終在大量神經(jīng)元的采集信息中得出一個(gè)結(jié)論,“認(rèn)為”這張圖片94.7%的可能性是一只狗,3%的可能性是一只貓或者其他的東西等等,盡管這張圖片可能是非?;靵y的,但最后能相當(dāng)準(zhǔn)確地做出最終判斷。當(dāng)然生物的腦神經(jīng)更復(fù)雜更聰明,可以任意方向進(jìn)行信息互換,而機(jī)器的神經(jīng)元是一層層從輸入到輸出的單項(xiàng)傳播,還沒(méi)能模擬到那么復(fù)雜。深度學(xué)習(xí)的“深度”得以實(shí)現(xiàn)要感謝于我們所生活的這個(gè)時(shí)代正在發(fā)生著計(jì)算機(jī)計(jì)算能力、信息存貯容量和網(wǎng)絡(luò)上數(shù)字信息的爆炸性增長(zhǎng)。有了網(wǎng)絡(luò)之后,人人都可以采集數(shù)據(jù)、產(chǎn)生數(shù)據(jù)放到云端和網(wǎng)絡(luò),而現(xiàn)在的存儲(chǔ)能量似乎也是無(wú)限的,沒(méi)有人會(huì)擔(dān)心沒(méi)有地方存儲(chǔ),總可以找到存儲(chǔ)空間。因?yàn)榇鎯?chǔ)空間的無(wú)限增長(zhǎng),計(jì)算能力(CPU、GPU)也能較容易地獲取,加上大量的視頻、音頻、圖片資料的產(chǎn)生,便促成了這兩年人工智能機(jī)器學(xué)習(xí)井噴式的進(jìn)步。
>> 谷歌全球技術(shù)總監(jiān)、中國(guó)上海研發(fā)院院長(zhǎng) 陳曉
一個(gè)簡(jiǎn)單的例子,比如Google有一個(gè)平臺(tái)YouTube,上面有很多的視頻,通過(guò)幾百萬(wàn)張圖片的截取獲得圖片的訓(xùn)練集,丟進(jìn)這樣一個(gè)神經(jīng)網(wǎng)絡(luò)系統(tǒng)(深層學(xué)習(xí)機(jī)器)進(jìn)行訓(xùn)練,成功的關(guān)鍵就是要有大量的例子能夠輸送進(jìn)去,系統(tǒng)有運(yùn)算能力,能在這一大堆的數(shù)據(jù)中進(jìn)行挖掘和訓(xùn)練,最后能夠產(chǎn)生一種模型來(lái)“理解”、“辨別”圖片。而現(xiàn)在的有些模型已經(jīng)有了很大的進(jìn)步,開(kāi)始產(chǎn)生一種通用的“智能”,一個(gè)地方一種形式訓(xùn)練出來(lái)的模型還可以擴(kuò)展到其他的應(yīng)用。這個(gè)“深層”的機(jī)器學(xué)習(xí)系統(tǒng),可以在最后的幾層做一些適當(dāng)?shù)脑O(shè)置和改變,輸送你自己的采樣,“調(diào)教”出適合不同領(lǐng)域和功能的運(yùn)算模型來(lái)。
Google在過(guò)去幾年中,尤其是近四五年來(lái)在人工智能方面做了大量的研究,那么有哪些效果呢?翻譯是我們Google的拳頭產(chǎn)品,對(duì)人工智能的運(yùn)用非常深刻。說(shuō)起人工自動(dòng)翻譯,我在二十多年前上海交大圖像所讀研究生的時(shí)候做了中英翻譯的語(yǔ)言處理方面的嘗試,當(dāng)時(shí)還是發(fā)展初期,我本人的能量也非常渺小膚淺,認(rèn)為這個(gè)幾乎不可能。雖然大家乍一想這也許是個(gè)相對(duì)簡(jiǎn)單的事,因?yàn)槊糠N語(yǔ)言的詞匯量有限,人類(lèi)對(duì)每種語(yǔ)言之間的翻譯有足夠的認(rèn)知,似乎可以一對(duì)一翻譯??墒亲寵C(jī)器翻譯真的簡(jiǎn)單嗎?我在國(guó)內(nèi)一個(gè)一流的游樂(lè)園游玩的時(shí)候捕捉到很多讓人忍俊不禁的翻譯,比如一個(gè)警告牌“小心滑倒”,中國(guó)人一看都明白其實(shí)是小心不要滑倒,而牌子上英文翻譯基本意思就是讓人們小小心心地滑倒,這就鬧笑話了。
Google翻譯目前支持103種語(yǔ)言,每天處理的詞語(yǔ)數(shù)量達(dá)到1400億,92%的用戶是美國(guó)以外的,現(xiàn)在網(wǎng)絡(luò)上50%的頁(yè)面是英語(yǔ)或者非英語(yǔ)的。翻譯的需求量和大家在谷歌上所用的服務(wù)量是相當(dāng)驚人的。我們最近用人工智能或者深度學(xué)習(xí)的手段可以做到這樣一件事,谷歌翻譯在手機(jī)上的一個(gè)應(yīng)用,可以對(duì)一個(gè)物件,比方說(shuō)盒裝牛奶進(jìn)行拍照采集圖片,并截取其中文字翻譯成你懂的語(yǔ)言,比方從英文的“milk”到“牛奶”,然后還原圖片展現(xiàn)給你。對(duì)于熱愛(ài)旅游的人們,可以通過(guò)Google翻譯這一應(yīng)用功能克服語(yǔ)言障礙,給旅游帶來(lái)更多的便利和享受。
去年我們推出基于神經(jīng)網(wǎng)絡(luò)的翻譯體系,替代了我們?cè)瓉?lái)的基于詞組的翻譯系統(tǒng)。當(dāng)時(shí)的改變是驚人的,有一個(gè)飛躍的質(zhì)量提升??赡艽蠹覍?duì)具體的質(zhì)量評(píng)估量化數(shù)字沒(méi)有什么概念,但是做個(gè)比較,這個(gè)提升的跨度比近十年來(lái)在原來(lái)系統(tǒng)中所有的質(zhì)量?jī)?yōu)化所提高的總和還要多,也看到某些語(yǔ)言已經(jīng)達(dá)到了人工翻譯的水平,相當(dāng)喜人。很高興地和大家分享,中文和英文對(duì)的翻譯也第一批享受到了這一改變帶來(lái)的進(jìn)步,現(xiàn)在大家用的谷歌翻譯(translate.google.cn)有關(guān)中英文互譯全面使用了新的神經(jīng)網(wǎng)絡(luò)翻譯系統(tǒng)。谷歌將進(jìn)一步把神經(jīng)網(wǎng)絡(luò)翻譯系統(tǒng)推廣到所有103種語(yǔ)言。
為什么神經(jīng)網(wǎng)絡(luò)翻譯可以做到更好、更自然的效果?原來(lái)的基于詞組的翻譯就像把一幅圖分解成一小塊一小塊翻譯然后原序拼接而成,就容易造成我們最初看到的問(wèn)題,詞和詞的翻譯是正確的,但是擺在一塊兒的意義就不對(duì)了,甚至是相反的。而神經(jīng)網(wǎng)絡(luò)機(jī)器翻譯系統(tǒng)則是整句或者整段結(jié)合上下文進(jìn)行翻譯,并真正了解和符合目標(biāo)語(yǔ)言的習(xí)慣,最后再把語(yǔ)序進(jìn)行一些調(diào)整,最終的語(yǔ)句更通暢、更自然、更準(zhǔn)確,更符合目標(biāo)人群“說(shuō)”的話。
就像Sundar Pichai所說(shuō),我們?cè)谌鎸徱曀械暮诵漠a(chǎn)品,已經(jīng)或者正在或者將要用人工智能的辦法做各種嘗試和優(yōu)化。比如Google的搜索,其實(shí)機(jī)器學(xué)習(xí)對(duì)搜索的改變也是近兩年里質(zhì)量提升飛躍最大的一次改變。比如說(shuō)郵件系統(tǒng),垃圾郵件的診斷就一直是用人工智能機(jī)器學(xué)習(xí)的辦法來(lái)處理。Google郵箱(Gmail)去年推出了一項(xiàng)功能,即自動(dòng)回復(fù)。隨著手機(jī)的廣泛應(yīng)用,人們更多地在用手機(jī)查郵件,因?yàn)槭謾C(jī)的文字輸入比較不便,我們就開(kāi)始通過(guò)大量的郵件和機(jī)器學(xué)習(xí)訓(xùn)練出自動(dòng)回復(fù)功能?,F(xiàn)在手機(jī)郵件10%是通過(guò)自動(dòng)回復(fù)來(lái)完成的。
在Google現(xiàn)有的核心產(chǎn)品上我們花了大量的精力推廣應(yīng)用人工智能,我們也在一些新興的衍生的產(chǎn)品方向,通過(guò)人工智能的應(yīng)用來(lái)對(duì)人類(lèi)的生活和文化起到更多的推動(dòng)。2011年我們推出了Google文化學(xué)院,隨后2012年在中國(guó)推出,旨在記錄保存人類(lèi)的文化遺產(chǎn)并通過(guò)文化學(xué)院這個(gè)平臺(tái)分享給身處世界各地的人們。目前有70多個(gè)國(guó)家的1000多個(gè)文化藝術(shù)機(jī)構(gòu)跟我們合作,把他們收藏的文化遺產(chǎn)、人類(lèi)文化和藝術(shù)的結(jié)晶數(shù)字化,在線跟大家分享。中國(guó)很多傳統(tǒng)文化通過(guò)這個(gè)形式,讓全球的文化和藝術(shù)愛(ài)好者得以接觸和欣賞。而Google里就有這么一些文化藝術(shù)愛(ài)好者,又有一些技術(shù)背景,他們希望有一些新的方式去詮釋和解讀這些藝術(shù)作品,于是考慮到了人工智能。他們做了一個(gè)嘗試,叫X-degree of Seperation,我自己把它翻成“幾步之遙”,就是能否在任何的兩個(gè)藝術(shù)品中,找到一種關(guān)聯(lián)?提供一條視覺(jué)通道把似乎不相關(guān)的兩件藝術(shù)品通過(guò)一些相似藝術(shù)品最終聯(lián)系起來(lái)?對(duì)于藝術(shù)我是門(mén)外漢,但是有藝術(shù)背景的人對(duì)此功能還是感到很震撼的。
Google也在醫(yī)療健康方面有很多應(yīng)用人工智能的嘗試,而且取得了非常喜人的進(jìn)步。比如說(shuō)全球糖尿病的患者有4億多,視網(wǎng)膜病變?nèi)绻皶r(shí)發(fā)現(xiàn)是可以制止和治療的,如果沒(méi)有及時(shí)治療,會(huì)導(dǎo)致不可逆的失明。診斷辦法其實(shí)就是有專(zhuān)業(yè)技能的專(zhuān)家們?nèi)タ匆暰W(wǎng)膜的眼后部的拍片。大家都知道,病人多、醫(yī)生少,或者一些不發(fā)達(dá)的地方,設(shè)備和人才不能夠涵蓋到,這個(gè)時(shí)候人工智能和機(jī)器可以起到很大的作用。我們和印度、美國(guó)的一些醫(yī)療機(jī)構(gòu)合作,利用他們所提供的醫(yī)療圖片采集(大概20多萬(wàn)張)進(jìn)行調(diào)試和訓(xùn)練,集成了一個(gè)模型。目前經(jīng)專(zhuān)家評(píng)斷,已經(jīng)達(dá)到專(zhuān)家的水平。我們很高興有這樣的成果,也希望在更多的健康領(lǐng)域和醫(yī)療領(lǐng)域中,能夠幫助到人類(lèi)的進(jìn)步。
人工智能是計(jì)算機(jī)科學(xué)的新翹楚。Google的所有核心產(chǎn)品和新興領(lǐng)域都已經(jīng)開(kāi)始進(jìn)行人工智能或機(jī)器學(xué)習(xí)的探索、研究和應(yīng)用。我們也開(kāi)源了Google機(jī)器學(xué)習(xí)系統(tǒng)TensorFlow供大家一起探究。我們相信人類(lèi)在人工智能的技術(shù)中會(huì)受益更多,人類(lèi)一直是也終將是最后的贏家!