劉有婷
當(dāng)下哪些科技最火?毫無(wú)疑問(wèn),人工智能技術(shù)名列前茅。提起人工智能,人們總能想起它帶來(lái)的便利,比如智慧醫(yī)療、無(wú)人駕駛、人臉識(shí)別等。盡管人工智能在市面上的應(yīng)用如火如荼,但是中國(guó)科學(xué)院自動(dòng)化研究所副研究員張煦堯表示,從研究的角度來(lái)看,這門(mén)技術(shù)仍有很多問(wèn)題有待解決。
其中,人工智能系統(tǒng)不夠魯棒是阻止這門(mén)技術(shù)進(jìn)一步大規(guī)模應(yīng)用的主要原因之一,而如何打造更加魯棒的智能系統(tǒng),就是張煦堯的主要研究?jī)?nèi)容。涉足人工智能領(lǐng)域多年,他在模式識(shí)別,機(jī)器學(xué)習(xí),以及深度學(xué)習(xí)等方面做出了一系列有影響力的成果,已在相關(guān)頂級(jí)期刊和會(huì)議上發(fā)表論文70余篇。
對(duì)張煦堯來(lái)說(shuō),人工智能領(lǐng)域就像一座初見(jiàn)光芒的寶藏,他致力于在其中發(fā)現(xiàn)更多的“財(cái)富”。
自1956年夏,麥卡錫、明斯基等科學(xué)家首次提出“人工智能”這一概念以來(lái),相關(guān)的科學(xué)技術(shù)迅速發(fā)展起來(lái),并越來(lái)越多地應(yīng)用到人們的生活當(dāng)中。尤其是以深度學(xué)習(xí)為代表的人工智能技術(shù),取得了巨大的成就。然而,人工智能系統(tǒng)卻并不完美,因?yàn)樗炔粔螋敯簦膊粔蚩煽俊?/p>
人工智能經(jīng)過(guò)60多年的發(fā)展,為什么還不足夠魯棒?這就要從人工智能領(lǐng)域發(fā)展基于的三個(gè)假設(shè)說(shuō)起。
第一個(gè)假設(shè)是封閉世界假設(shè)。張煦堯簡(jiǎn)單解釋道:“世界是開(kāi)放的,因?yàn)樗袩o(wú)數(shù)不同的事物。但是人工智能的世界是封閉的,你教給它一樣?xùn)|西,它就認(rèn)為整個(gè)世界就只有這樣?xùn)|西。比如,阿爾法狗會(huì)下圍棋,但是它不會(huì)做其他事情?!比说膶W(xué)習(xí)是一個(gè)“主動(dòng)的”增量學(xué)習(xí)過(guò)程,但機(jī)器的學(xué)習(xí)卻是“被動(dòng)的”批量學(xué)習(xí)過(guò)程。正是由于封閉世界假設(shè),導(dǎo)致機(jī)器在面對(duì)開(kāi)放環(huán)境中的新類(lèi)別數(shù)據(jù)以及噪音數(shù)據(jù)時(shí)往往會(huì)出現(xiàn)過(guò)于自信的明顯錯(cuò)誤。
第二個(gè)假設(shè)是獨(dú)立同分布假設(shè),即人工智能訓(xùn)練的環(huán)境和測(cè)試的環(huán)境是獨(dú)立同分布的。舉例來(lái)說(shuō),語(yǔ)音識(shí)別的機(jī)器在訓(xùn)練時(shí)接收的是普通話,但是有人對(duì)著它說(shuō)廣東話,它就無(wú)法識(shí)別或識(shí)別率低下。這就是導(dǎo)致人工智能不夠魯棒的第二個(gè)因素?,F(xiàn)實(shí)世界中的很多數(shù)據(jù)不是獨(dú)立的,充分利用非獨(dú)立數(shù)據(jù)的上下文關(guān)系如語(yǔ)言上下文和幾何上下文,可以顯著提升識(shí)別的準(zhǔn)確率。此外,在非獨(dú)立同分布情形下,通過(guò)自適應(yīng)以及多模態(tài)和多任務(wù)學(xué)習(xí),也可有效提升魯棒性。
第三個(gè)假設(shè)是大數(shù)據(jù)假設(shè)。張煦堯表示,人工智能之所以這么強(qiáng)大是因?yàn)槠浔澈笥写髷?shù)據(jù)的支撐。如果想要實(shí)現(xiàn)某一個(gè)功能,一般的做法就是采集大量相關(guān)數(shù)據(jù),然后對(duì)數(shù)據(jù)做精準(zhǔn)的標(biāo)注。但在實(shí)際應(yīng)用中,這兩者是相矛盾的?!叭绻胍么髷?shù)據(jù),就避免不了噪音數(shù)據(jù)的出現(xiàn)?!币?yàn)樵诤A康臄?shù)據(jù)中,不可能保證每一個(gè)數(shù)據(jù)都是高質(zhì)量的。為克服這一問(wèn)題,人工智能系統(tǒng)需要具備數(shù)據(jù)的容錯(cuò)學(xué)習(xí)能力,以及小樣本和弱監(jiān)督學(xué)習(xí)能力。
張煦堯在蒙特利爾大學(xué)訪問(wèn)期間留影
“只有打破這三個(gè)假設(shè),才能實(shí)現(xiàn)更加魯棒的人工智能應(yīng)用。”為了克服這三個(gè)假設(shè)的局限性,學(xué)術(shù)界一直在探索新的模型和新的算法,涌現(xiàn)出大量研究成果和學(xué)術(shù)論文。近期,張煦堯有關(guān)“三個(gè)假設(shè)”的研究論文“Towards Robust Pattern Recognition: A Review”以綜述的形式發(fā)表在國(guó)際期刊Proceedings of the IEEE上。
進(jìn)入21世紀(jì)后,人們對(duì)于人工智能的關(guān)注大多聚焦在其應(yīng)用上,但是張煦堯認(rèn)為,人工智能的長(zhǎng)遠(yuǎn)發(fā)展一定要突破基礎(chǔ)研究中的問(wèn)題。2008年,張煦堯從武漢大學(xué)畢業(yè)以后,進(jìn)入中國(guó)科學(xué)院自動(dòng)化研究所跟隨模式識(shí)別國(guó)家重點(diǎn)實(shí)驗(yàn)室主任劉成林研究員攻讀博士學(xué)位。劉成林研究員深厚的學(xué)術(shù)功底和嚴(yán)謹(jǐn)?shù)膶W(xué)術(shù)態(tài)度對(duì)張煦堯產(chǎn)生了深遠(yuǎn)的影響,同時(shí)張煦堯本科時(shí)期學(xué)習(xí)的是計(jì)算數(shù)學(xué)專業(yè),這為他之后的研究工作打下了堅(jiān)實(shí)的基礎(chǔ)。
張煦堯的博士論文從大類(lèi)別集和非獨(dú)立同分布角度出發(fā),對(duì)模式分類(lèi)中的維數(shù)削減、分類(lèi)器設(shè)計(jì)及分類(lèi)器自適應(yīng)等重要問(wèn)題進(jìn)行了深入研究。所取得的關(guān)鍵成果發(fā)表在人工智能頂級(jí)期刊和會(huì)議上,在國(guó)際上取得了較好影響,并被TPAMI選為該刊2013年7月的焦點(diǎn)論文。此外,中國(guó)計(jì)算機(jī)學(xué)會(huì)(CCF)獎(jiǎng)勵(lì)委員會(huì)還授予他2014年度“CCF優(yōu)秀博士學(xué)位論文獎(jiǎng)”。
博士前期,張煦堯的科研工作經(jīng)歷了一段瓶頸期。因?yàn)闆](méi)有成果產(chǎn)出,他曾一度處于低落、迷茫的狀態(tài)中。為了使自己盡快從迷茫中脫身,張煦堯前往加拿大模式識(shí)別與機(jī)器智能中心訪問(wèn)學(xué)習(xí),跟隨加拿大皇家科學(xué)院院士Ching Y.Suen教授學(xué)習(xí)模式識(shí)別的相關(guān)知識(shí)。2015年,已經(jīng)在人工智能領(lǐng)域小有成績(jī)的張煦堯又前往深度學(xué)習(xí)發(fā)源地蒙特利爾大學(xué)進(jìn)行訪問(wèn)研究。
在蒙特利爾大學(xué),張煦堯認(rèn)識(shí)了深度學(xué)習(xí)三巨頭之一,也就是2018年圖靈獎(jiǎng)獲得者Yoshua Bengio教授。經(jīng)過(guò)一年的學(xué)習(xí)和研究后,張煦堯取得了很大的收獲,并與Yoshua Bengio教授合作發(fā)表了三篇與深度學(xué)習(xí)相關(guān)的成果論文。
說(shuō)起Yoshua Bengio教授,張煦堯語(yǔ)氣中有著藏不住的仰慕之情。他說(shuō),深度學(xué)習(xí)三巨頭之所以在這一領(lǐng)域能夠取得這么大成就,是因?yàn)樗麄兪肿⒅鼗A(chǔ)平臺(tái)的搭建以及基礎(chǔ)理論研究工作。在其他人還不看好深度學(xué)習(xí)的時(shí)候,他們就一直在持續(xù)地研究和探索,并向?qū)W術(shù)界開(kāi)源其深度學(xué)習(xí)平臺(tái),如早期的Theano平臺(tái)等。無(wú)論神經(jīng)網(wǎng)絡(luò)研究經(jīng)歷了怎樣的起落,他們都一直在堅(jiān)持??梢哉f(shuō),他們是從無(wú)到有地推動(dòng)了深度學(xué)習(xí)的發(fā)展。
雖然跟隨國(guó)際熱點(diǎn)進(jìn)行“超車(chē)”十分重要,但是中國(guó)要想實(shí)現(xiàn)科技強(qiáng)國(guó)的目標(biāo),還要重視原始創(chuàng)新的研究。用張煦堯的話來(lái)說(shuō),既能夠“從1做到100”,也能“從0做到1”。他的研究工作就是一個(gè)“從0到1”的過(guò)程,進(jìn)入一個(gè)“無(wú)人區(qū)”,其起步必定艱難。所幸,張煦堯獲得了中國(guó)科學(xué)院基礎(chǔ)前沿科學(xué)研究計(jì)劃從0到1原始創(chuàng)新項(xiàng)目的支持,以及中國(guó)科協(xié)青年人才托舉工程的支持。
最近,中國(guó)科學(xué)院開(kāi)始籌建人工智能創(chuàng)新研究院,并成立了“2035創(chuàng)新任務(wù)團(tuán)隊(duì)”,張煦堯入選了自主進(jìn)化智能基礎(chǔ)理論團(tuán)隊(duì)。目前,在項(xiàng)目和團(tuán)隊(duì)的支持下,他的研究工作正在順利進(jìn)行當(dāng)中,但是他表示,研究真正想要取得大的突破,樂(lè)觀估計(jì),還需扎扎實(shí)實(shí)地坐好幾年冷板凳。
如今,人工智能應(yīng)用無(wú)處不在,但是它不能憑空創(chuàng)造需求,而是必須依附于各個(gè)已有的產(chǎn)品,為用戶提供更好的體驗(yàn)。所以從一定角度來(lái)看,人工智能技術(shù)的應(yīng)用大多是錦上添花,而不是雪中送炭。
在一些關(guān)鍵領(lǐng)域,由于人工智能不夠魯棒和不夠可靠,很可能造成這一領(lǐng)域的巨大風(fēng)險(xiǎn),如在無(wú)人駕駛、金融、醫(yī)療等領(lǐng)域。張煦堯生動(dòng)地形容道:“人工智能有個(gè)很大的缺點(diǎn),那就是它明明錯(cuò)了,卻還十分自信?!币虼酥眯哦裙烙?jì)是提高智能系統(tǒng)魯棒性的有效途徑之一。張煦堯以無(wú)人駕駛汽車(chē)為例介紹說(shuō):“當(dāng)一輛無(wú)人駕駛汽車(chē)要轉(zhuǎn)彎時(shí),如果它的置信度是0.999,那它就直接轉(zhuǎn)彎了。但是,當(dāng)它的置信度只有0.1時(shí),它的識(shí)別不是很可靠,這時(shí)就需要人為的干涉來(lái)避免風(fēng)險(xiǎn)?!绷硗?,當(dāng)人工智能的應(yīng)用環(huán)境、條件、數(shù)據(jù)規(guī)模、數(shù)據(jù)質(zhì)量發(fā)生變化時(shí),如何能依舊保證較高的準(zhǔn)確率,也是智能系統(tǒng)獲得普適應(yīng)用所面臨的挑戰(zhàn)。
在中國(guó)科學(xué)院大學(xué)授課
對(duì)于人工智能威脅論,張煦堯認(rèn)為談這些為時(shí)過(guò)早。在他看來(lái),人工智能與人的智能有著本質(zhì)不同,最顯著的是,人有“自知之明”,而人工智能卻沒(méi)有,這也是造成它不夠魯棒的根本所在。所以,我們所看到的人工智能應(yīng)用大多是錦上添花。未來(lái),張煦堯希望可以真正觸及人工智能的技術(shù)痛點(diǎn),實(shí)現(xiàn)這門(mén)技術(shù)雪中送炭的作用。
研究工作之余,張煦堯還指導(dǎo)了多名博士研究生和碩士研究生。他在中國(guó)科學(xué)院大學(xué)參與教授的“模式識(shí)別”“深度學(xué)習(xí)”等多門(mén)課程,受到了同學(xué)們的廣泛歡迎,并獲得2019年中國(guó)科學(xué)院大學(xué)校級(jí)研究生優(yōu)秀課程。
作為新時(shí)代的青年教師,張煦堯在教育上有著自己的見(jiàn)解,他常常告訴學(xué)生們,要有質(zhì)疑精神。在他看來(lái),科研就是一個(gè)新舊結(jié)合、新舊博弈、新舊更替的過(guò)程,只有敢于質(zhì)疑,才能衍生出新的方向,才能真正推動(dòng)科技的發(fā)展。