2011年,在中山大學(xué)即將碩士畢業(yè)的羅平寄出了一份厚厚的郵件,這份郵件要寄給彼時(shí)正在香港中文大學(xué)任教的湯曉鷗教授。湯曉鷗是全球人臉識(shí)別技術(shù)的“開(kāi)拓者”和“探路者”,為補(bǔ)香港中文大學(xué)信息工程系在圖像處理上的短板,他于2001年創(chuàng)立了“多媒體實(shí)驗(yàn)室”(又稱(chēng)MMLAB),主要研究系統(tǒng)性能與人臉識(shí)別。在研讀學(xué)術(shù)論文時(shí),MMLAB的研究吸引到羅平,促使他萌生了加入實(shí)驗(yàn)室繼續(xù)深造的想法,于是認(rèn)真準(zhǔn)備了一份簡(jiǎn)歷。塑料皮精美封裝、彩色打印,這份用心設(shè)計(jì)的簡(jiǎn)歷成功引起湯曉鷗的注意?!皽蠋熢貞?,他之前和后來(lái)從未遇到過(guò)設(shè)計(jì)如此獨(dú)特的簡(jiǎn)歷?!绷_平笑著說(shuō)。
正是這份簡(jiǎn)歷,牽起了羅平與湯曉鷗、王曉剛(商湯研究院院長(zhǎng)、香港中文大學(xué)電子工程系教授)的師生緣。師從兩位計(jì)算機(jī)視覺(jué)領(lǐng)域的頂級(jí)專(zhuān)家讀博士,羅平獲得了在學(xué)術(shù)上的迅速成長(zhǎng),并成為亞洲最早將深度學(xué)習(xí)應(yīng)用于計(jì)算機(jī)視覺(jué)的研究者之一。
梳理羅平的科研足跡,從紅樓疊影的中山大學(xué)、萬(wàn)木蔥籠的蓮花山計(jì)算機(jī)視覺(jué)研究院、兼容并蓄的香港中文大學(xué)、堅(jiān)持原創(chuàng)的商湯科技到亞洲“常春藤”香港大學(xué),伴隨時(shí)空的變化,他的研究也經(jīng)歷了從軟件工程、計(jì)算機(jī)視覺(jué)、深度學(xué)習(xí)向更廣泛的人工智能方向轉(zhuǎn)變。歪打正著,羅平在科研上的步伐都不偏不倚踩在了計(jì)算機(jī)學(xué)科發(fā)展的點(diǎn)上。在慶幸這份幸運(yùn)的同時(shí),羅平也承認(rèn)面臨的壓力。計(jì)算機(jī)視覺(jué)在過(guò)去5年的發(fā)展,對(duì)于羅平這些身處領(lǐng)域中的研究者來(lái)說(shuō),是帶有“洗劫”性質(zhì)的破壞性創(chuàng)新。如何打破壁壘,在瞬息萬(wàn)變的破壞性創(chuàng)新中建立更合理的機(jī)制,讓羅平的思維一直保持在最活躍的狀態(tài)。
蓮花山“朝圣”
“羅平博士開(kāi)發(fā)了具創(chuàng)新性的人工智能技術(shù),以教授機(jī)器人理解豐富的人類(lèi)語(yǔ)言與行為,如人臉姿態(tài)與語(yǔ)言、人臉屬性與情感、肢體動(dòng)作、服飾和社會(huì)關(guān)系等。相信人類(lèi)智能在任何人工智能系統(tǒng)中都扮演著重要角色,通過(guò)構(gòu)建人類(lèi)智能和人工智能的協(xié)作橋梁,能夠極大提升AI技術(shù)的性能。”這是2020年入選“35歲以下科技創(chuàng)新35人”亞太地區(qū)榜單時(shí),《麻省理工技術(shù)評(píng)論》給羅平的頒獎(jiǎng)詞。
其實(shí)在此前,羅平已贏得諸多獎(jiǎng)項(xiàng),2014年國(guó)際圖像識(shí)別挑戰(zhàn)賽(ImageNet ILSVRC)亞軍、2017年DAVIS視頻分割挑戰(zhàn)賽冠軍、2017年八百萬(wàn)Youtube視頻識(shí)別挑戰(zhàn)賽金牌及2018年自動(dòng)駕駛可駕駛車(chē)道區(qū)域分析冠軍等。為表彰他們最早把深度學(xué)習(xí)應(yīng)用于人臉識(shí)別的原創(chuàng)性工作,羅平和湯曉鷗還在2013年被授予微軟學(xué)者獎(jiǎng)。獎(jiǎng)項(xiàng)對(duì)于羅平,不僅是領(lǐng)域內(nèi)對(duì)他工作的認(rèn)可,也記載了他的科研軌跡。
成為醫(yī)生,是高中時(shí)羅平對(duì)職業(yè)的向往。報(bào)考大學(xué)時(shí),他的第一志愿是中山大學(xué)的8年制醫(yī)學(xué)專(zhuān)業(yè),但未能如愿,最后被第一年招生的軟件工程專(zhuān)業(yè)錄取。所以進(jìn)入計(jì)算機(jī)這一正在快速發(fā)展的領(lǐng)域,在羅平是機(jī)緣巧合。
學(xué)習(xí)過(guò)程中,羅平發(fā)現(xiàn)自己對(duì)計(jì)算機(jī)科學(xué)有極大興趣。專(zhuān)業(yè)開(kāi)設(shè)課程豐富,讓羅平迅速積累了不少知識(shí)。因在課后加入了朝紅陽(yáng)老師組織的科研小組,羅平在大三時(shí)就有機(jī)會(huì)參與到一個(gè)“863”課題的攻關(guān)中。完整參與一個(gè)大項(xiàng)目,對(duì)于一個(gè)本科生來(lái)說(shuō)是一個(gè)很高的起點(diǎn),羅平幸運(yùn)地踩到了這個(gè)點(diǎn)上。
項(xiàng)目由蓮花山計(jì)算機(jī)視覺(jué)研究院、北京電影學(xué)院動(dòng)畫(huà)學(xué)院、中山大學(xué)三方共同申請(qǐng),目標(biāo)是研發(fā)中國(guó)第一個(gè)具有自主知識(shí)產(chǎn)權(quán)的動(dòng)漫制作系統(tǒng)與數(shù)據(jù)庫(kù)。由全球著名計(jì)算機(jī)視覺(jué)專(zhuān)家朱松純教授帶領(lǐng)的蓮花山計(jì)算機(jī)視覺(jué)研究院負(fù)責(zé)算法與理論研究,北京電影學(xué)院動(dòng)畫(huà)學(xué)院提供動(dòng)畫(huà)素材與專(zhuān)業(yè)的動(dòng)畫(huà)制作流程,中山大學(xué)負(fù)責(zé)軟件工程實(shí)踐。
大三被派至蓮花山,直到從中山大學(xué)碩士畢業(yè),羅平一直都在那里開(kāi)展研究。蓮花山環(huán)境優(yōu)美,令人心曠神怡。在風(fēng)景如畫(huà)之處能跟隨領(lǐng)域內(nèi)的大專(zhuān)家學(xué)習(xí),接觸當(dāng)時(shí)最頂級(jí)的計(jì)算機(jī)視覺(jué)研究,對(duì)羅平來(lái)說(shuō)是一種超值的收獲。
朱松純是湖北鄂州人,2005年,他在故鄉(xiāng)創(chuàng)辦蓮花山計(jì)算機(jī)視覺(jué)研究院,籌建了世界上最早的大數(shù)據(jù)標(biāo)注團(tuán)隊(duì)之一,發(fā)布了以精細(xì)化程度高、語(yǔ)義信息豐富著稱(chēng)的大規(guī)模數(shù)據(jù)庫(kù)LHI Dataset?!坝酶怕誓P妥鲞吘壧崛?,進(jìn)行人臉識(shí)別研究,是當(dāng)時(shí)計(jì)算機(jī)視覺(jué)的主流,朱老師又是代表人物,因此蓮花山成了‘圣地’,吸引了大批人來(lái)此‘朝圣’?!绷_平說(shuō)。
被譽(yù)為“AI教母”的李飛飛,創(chuàng)建了數(shù)據(jù)庫(kù)ImageNet。業(yè)內(nèi)評(píng)價(jià):“沒(méi)有ImageNet,就沒(méi)有現(xiàn)在的深度學(xué)習(xí)革命?!倍鳬mageNet概念的起源,與2005年李飛飛到蓮花山的一次參會(huì)有或多或少的關(guān)聯(lián)。
2003年,朱松純因在做圖像解譯方面的突破拿到了計(jì)算機(jī)視覺(jué)的最高榮譽(yù)馬爾獎(jiǎng),隨后他牽頭舉辦了首屆“蓮花山計(jì)算機(jī)視覺(jué)與模式識(shí)別國(guó)際研討會(huì)”,此時(shí)李飛飛剛從美國(guó)加州理工學(xué)院博士畢業(yè),受邀參加了會(huì)議。
會(huì)后,李飛飛認(rèn)識(shí)到基于統(tǒng)計(jì)的算法極度依賴數(shù)據(jù)集的規(guī)模和代表性,大多數(shù)研究者都只是在盡可能地尋找更好的算法,但他們訓(xùn)練模型所基于的數(shù)據(jù)卻并不能反映真實(shí)的世界,這樣即使再好的算法也不會(huì)訓(xùn)練出有用的結(jié)果。因此她決定構(gòu)建一個(gè)足夠大的能夠反映真實(shí)世界的開(kāi)放數(shù)據(jù)集。
2007年年初,李飛飛回到美國(guó)普林斯頓大學(xué)任教,同時(shí)啟動(dòng)了ImageNet項(xiàng)目。通過(guò)眾包平臺(tái),李飛飛有效避開(kāi)了此前朱松純?cè)跇?gòu)建LHI Dataset時(shí)遇到的資金和時(shí)間上的瓶頸問(wèn)題。到2009年,ImageNet已經(jīng)完成了320萬(wàn)張圖片的標(biāo)注,而后來(lái)ImageNet大規(guī)模視覺(jué)識(shí)別挑戰(zhàn)賽(ILSVRC)的成功舉辦,更是大家有目共睹的。
“蓮花山上最前沿的計(jì)算機(jī)視覺(jué)研究啟發(fā)了很多曾在那里待過(guò)的人,也包括我?!绷_平說(shuō)。本科時(shí),他已在圖像處理的頂級(jí)會(huì)議發(fā)表論文,2009年碩士第一年他就在計(jì)算機(jī)視覺(jué)三大會(huì)之一的歐洲計(jì)算機(jī)視覺(jué)國(guó)際會(huì)議(ECCV)上發(fā)表文章。
“那個(gè)年代沒(méi)有深度學(xué)習(xí),通過(guò)設(shè)計(jì)圖像的語(yǔ)法,像名詞、動(dòng)詞、形容詞那樣去描述圖像,每一個(gè)計(jì)算部件在模型里負(fù)責(zé)什么,解釋得非常清楚、完美。”用統(tǒng)計(jì)建模的方式去做計(jì)算機(jī)視覺(jué),開(kāi)拓了羅平的視野,也為他后來(lái)的研究奠定了扎實(shí)基礎(chǔ)。“能在蓮花山接觸到當(dāng)時(shí)世界最好的計(jì)算機(jī)視覺(jué)科研,我覺(jué)得是一件很神奇的事情?!绷_平說(shuō)。
探路新方向
在蓮花山研發(fā)動(dòng)漫制作系統(tǒng)時(shí),羅平注意到了一些新的系統(tǒng)功能需求,例如把各種場(chǎng)景重新分割,不同因素再組合,制作新的動(dòng)畫(huà)。這需要做視頻結(jié)構(gòu)化研究,包括視頻解析、視頻分割、物體跟蹤等。另外如何把二維圖片做成三維模型,也是一大功能需求。
在研讀論文時(shí),羅平了解到香港中文大學(xué)的湯曉鷗在做這樣的工作,在平面上畫(huà)線,能直接生成三維圖形。被這項(xiàng)工作深深吸引的羅平,認(rèn)真準(zhǔn)備了那份自薦信。收到信后,湯曉鷗沒(méi)有猶豫,將羅平收入麾下。師從湯曉鷗和王曉剛兩位計(jì)算機(jī)視覺(jué)領(lǐng)域的領(lǐng)軍人物,羅平在香港中文大學(xué)度過(guò)了3年的博士求學(xué)時(shí)光。
兩位恩師給羅平帶來(lái)的影響很大,包括從論文選題、實(shí)驗(yàn)到寫(xiě)作風(fēng)格,剛開(kāi)始都需要通過(guò)學(xué)習(xí)和模仿他們來(lái)得到提高。通過(guò)持續(xù)學(xué)習(xí),羅平逐漸發(fā)展出自己的風(fēng)格。
羅平之前的研究注重計(jì)算機(jī)視覺(jué)的建模跟理論,不太關(guān)注性能指標(biāo)的評(píng)估。到香港后,他發(fā)現(xiàn)原來(lái)計(jì)算機(jī)視覺(jué)可以有非常嚴(yán)謹(jǐn)?shù)?,甚至?yán)謹(jǐn)?shù)接行┛鋸埖拇罅啃阅茉u(píng)測(cè)?!八麄兎浅W⒅厮惴▽?shí)際落地的效果,會(huì)想方設(shè)法地證偽,去跟別人‘PK’,來(lái)確定究竟哪些方向真正值得提高,這是我之前從未接觸過(guò)的?!绷_平說(shuō)。
在香港求學(xué)更將羅平領(lǐng)入了一個(gè)全新的方向。2009年,微軟第一次將深度學(xué)習(xí)應(yīng)用于大規(guī)模語(yǔ)音識(shí)別,只用了很短的時(shí)間就完成了微軟一個(gè)龐大團(tuán)隊(duì)花幾個(gè)月做的事,在業(yè)內(nèi)引起了轟動(dòng)。敏銳的湯曉鷗很快嗅到這個(gè)新方向的潛力:他心想,語(yǔ)音的信號(hào)與視覺(jué)差不多,既然深度學(xué)習(xí)能在語(yǔ)音上取得驚人的效果,那深度學(xué)習(xí)也可能在視覺(jué)上取得驚人的效果。于是他當(dāng)即和王曉剛商量。
王曉剛在讀博時(shí)研究計(jì)算機(jī)視覺(jué)的方法主要是概率圖模型,但也聽(tīng)過(guò)深度學(xué)習(xí),也很感興趣,堅(jiān)定要研究深度學(xué)習(xí)。對(duì)于這個(gè)當(dāng)時(shí)很少人關(guān)注的方向,湯曉鷗和王曉剛選擇了兩位學(xué)生來(lái)探索,其他人繼續(xù)做原來(lái)的工作。這兩位被選中的學(xué)生之一便是羅平?!皽蠋熀髞?lái)跟我聊,因?yàn)樗X(jué)得我在入學(xué)前已經(jīng)有頂會(huì)的文章,不用那么著急發(fā)文章,可以慢一點(diǎn)嘗試一些新探索?!绷_平說(shuō)。
湯曉鷗團(tuán)隊(duì)算得上是亞洲計(jì)算機(jī)視覺(jué)領(lǐng)域最早進(jìn)行深度學(xué)習(xí)研究的團(tuán)隊(duì)。2011年開(kāi)始做深度學(xué)習(xí)時(shí),條件還很差。早期深度學(xué)習(xí)框架還沒(méi)出現(xiàn),全球能跑通深度學(xué)習(xí)的團(tuán)隊(duì)屈指可數(shù),他們從零開(kāi)始,是摸著石頭過(guò)河。最開(kāi)始,他們是用C++寫(xiě)代碼在筆記本電腦來(lái)跑數(shù)據(jù)。羅平回憶,他發(fā)表在國(guó)際計(jì)算機(jī)視覺(jué)與模式識(shí)別會(huì)議(CVPR)上的第一篇深度學(xué)習(xí)文章是在個(gè)人筆記本電腦上完成的。因?yàn)楫?dāng)時(shí)他們根本沒(méi)有拿CPU跑數(shù)據(jù)的意識(shí),結(jié)果一個(gè)研究做了幾個(gè)月,都沒(méi)有獲得好的實(shí)驗(yàn)結(jié)果。
湯曉鷗在深圳先進(jìn)院有任職,與內(nèi)地學(xué)者深入合作,可以申請(qǐng)一些內(nèi)地的項(xiàng)目,拿到經(jīng)費(fèi)后才買(mǎi)了很多CPU。而那時(shí)王曉剛也還是一個(gè)處于長(zhǎng)聘制考核中的助理教授,其實(shí)很有壓力。但他一直堅(jiān)持和大家一起失敗了又繼續(xù),從來(lái)沒(méi)有放棄。
當(dāng)時(shí)卷積神經(jīng)網(wǎng)絡(luò)用于深度學(xué)習(xí)研究的工具屬性已初見(jiàn)端倪,但一開(kāi)始,羅平并沒(méi)有嘗試使用卷積神經(jīng)網(wǎng)絡(luò),因?yàn)榇蠹议_(kāi)始注意到它,其實(shí)是在2012年的ImageNet比賽上它取得很大成功后?!拔覀冏钤缡褂玫倪€是玻爾茲曼機(jī)這樣的模型,其實(shí)還是統(tǒng)計(jì)學(xué)習(xí)建模那套東西,我在蓮花山學(xué)的就是統(tǒng)計(jì)建模,這套東西對(duì)我來(lái)說(shuō)非常熟。后來(lái)卷積神經(jīng)網(wǎng)絡(luò)提供了強(qiáng)大的工具,把它與統(tǒng)計(jì)建模結(jié)合,有基礎(chǔ)加上工具,這可能也是我后來(lái)進(jìn)展比較快的原因?!?/p>
隨后,羅平在計(jì)算機(jī)視覺(jué)和深度學(xué)習(xí)上做出了一系列開(kāi)創(chuàng)性成果,2012年他率先將深度學(xué)習(xí)用于人臉?lè)指?、人臉生成等領(lǐng)域。與此同時(shí),他做的人臉關(guān)鍵點(diǎn)工作還是多任務(wù)深度學(xué)習(xí)的代表性工作。
羅平和團(tuán)隊(duì)伙伴的探索,掀起了深度學(xué)習(xí)應(yīng)用于計(jì)算機(jī)視覺(jué)研究的熱潮。2011年計(jì)算機(jī)視覺(jué)領(lǐng)域頂會(huì)CVPR與深度學(xué)習(xí)相關(guān)的文章只有4篇,如今CVPR一年接收2000多篇文章,全部都與深度學(xué)習(xí)相關(guān)。而對(duì)于羅平他們來(lái)說(shuō),先行一點(diǎn)點(diǎn),就與別人拉開(kāi)了很大距離。據(jù)統(tǒng)計(jì),2011年到2013年,羅平所在的MMLAB在國(guó)際計(jì)算機(jī)視覺(jué)大會(huì)(ICCV)和CVPR上一共發(fā)表了14篇基于深度學(xué)習(xí)的研究論文,占了兩大頂會(huì)在全球范圍內(nèi)接收的深度學(xué)習(xí)論文總量(29篇)的一半。
當(dāng)時(shí),香港中文大學(xué)的學(xué)者在全球計(jì)算機(jī)視覺(jué)研究領(lǐng)域被封神。羅平記得去北京領(lǐng)微軟學(xué)者獎(jiǎng)時(shí),已故曠視科技公司首席科學(xué)家孫劍曾對(duì)他說(shuō):“我從來(lái)沒(méi)想過(guò)人臉識(shí)別可以這么做?!边@對(duì)羅平是一個(gè)肯定的評(píng)價(jià)。
如此年輕,又在一個(gè)嶄新的領(lǐng)域取得如此突出的成績(jī),有人曾問(wèn)過(guò)羅平當(dāng)時(shí)有沒(méi)有膨脹。他笑著坦言,確實(shí)出現(xiàn)過(guò)小插曲,讓他錯(cuò)過(guò)了一個(gè)更大的成果。獲得微軟學(xué)者獎(jiǎng),就等于不用面試,直接拿到微軟重要科研小組的實(shí)習(xí)入場(chǎng)券,但羅平是為數(shù)極少的拿到獎(jiǎng)卻從來(lái)沒(méi)去實(shí)習(xí)過(guò)的人。
“湯老師當(dāng)時(shí)給我的規(guī)劃其實(shí)是跟著何愷明(計(jì)算機(jī)視覺(jué)領(lǐng)域著名學(xué)者)去做一些事情,但我手上有很多課題,覺(jué)得都能出不錯(cuò)的論文,所以就完美錯(cuò)過(guò)了下一波熱點(diǎn)——何愷明領(lǐng)銜的深度殘差網(wǎng)絡(luò)開(kāi)發(fā)?!绷_平說(shuō)。
盡管如此,羅平所在的香港中文大學(xué)MMLAB還是吃到了深度學(xué)習(xí)應(yīng)用于計(jì)算機(jī)視覺(jué)領(lǐng)域發(fā)展的紅利。到了2014年,MMLAB在深度學(xué)習(xí)視覺(jué)上的研究已經(jīng)突破了學(xué)術(shù)與科研的邊界,開(kāi)始體現(xiàn)出落地與產(chǎn)業(yè)化的態(tài)勢(shì):2014年3月的高斯人臉識(shí)別(GaussianFace)算法在LFW數(shù)據(jù)庫(kù)上準(zhǔn)確率達(dá)到98.52%,首次超過(guò)人眼識(shí)別率;6月的DeepID系列算法將準(zhǔn)確率提升至99.55%,突破落地門(mén)檻。
資本的嗅覺(jué)很敏銳,MMLAB獲得了高達(dá)數(shù)千萬(wàn)美元的天使輪投資。中國(guó)視覺(jué)人工智能市場(chǎng)從此拉開(kāi)帷幕。2014年10月,商湯科技成立。
在“破壞”中突圍
2014年年底,從香港中文大學(xué)畢業(yè)后,羅平加入商湯科技,偏向于市場(chǎng)和企業(yè)需求,他為淘寶、阿里巴巴做了服裝品類(lèi)分析、識(shí)別,線上換裝等相關(guān)的計(jì)算機(jī)視覺(jué)落地應(yīng)用研發(fā)和技術(shù)儲(chǔ)備工作,雖然工作開(kāi)展順利,但他一直有回到學(xué)術(shù)界的想法。
羅平感恩路上遇到的恩師、前輩,湯曉鷗、王曉剛及香港大學(xué)的王文平教授都是助力他成長(zhǎng)的貴人。前兩位恩師將他帶入一個(gè)全新的領(lǐng)域,后一位前輩則將他帶回了學(xué)術(shù)界。
與王文平的兩次交集,羅平記憶深刻。一次是2011年申請(qǐng)讀博士時(shí),王教授曾去中山大學(xué)面試,面試完后與羅平握了手,說(shuō)“希望你能來(lái)”。另一次是2019年找教職,王教授告訴他香港大學(xué)有好機(jī)會(huì),入職第一天,他又跟羅平握了手。王文平溫文儒雅、德行高尚,尤其他的兩次握手為羅平留下了深刻印象?!耙?yàn)橐粋€(gè)德高望重的人會(huì)主動(dòng)過(guò)來(lái)跟你握手,對(duì)年輕人是非常大的觸動(dòng)?!绷_平說(shuō)。
回到學(xué)術(shù)界的羅平,也回到了血雨腥風(fēng)的“主戰(zhàn)場(chǎng)”,回顧過(guò)去5年,他坦言自己一直在尋求突破,嘗試在破壞中建立新的機(jī)制?!皩W(xué)術(shù)界變化非???,深度學(xué)習(xí)的定義、計(jì)算機(jī)視覺(jué)的一些根本假設(shè),它們的變化都是破壞性的發(fā)展,特別是2022年OpenAI發(fā)布了ChatGPT,計(jì)算機(jī)視覺(jué)領(lǐng)域在過(guò)去5年被‘洗劫’了很多次。”羅平說(shuō)。
每次面對(duì)破壞性的變化,羅平都不會(huì)回避,而是直接迎上去。從卷積神經(jīng)網(wǎng)絡(luò)、基礎(chǔ)模型到生成式模型,在破壞性創(chuàng)新帶來(lái)的挑戰(zhàn)中,羅平帶領(lǐng)團(tuán)隊(duì)不斷突圍,力圖去建立更合理的機(jī)制。
2023年8月,上海舉辦了第一屆生成式人工智能(AIGC)國(guó)際會(huì)議,羅平參會(huì)并擔(dān)任會(huì)議程序委員會(huì)聯(lián)合主席?!霸贑hatGPT、AIGC快速發(fā)展的背景下,首屆、也是世界范圍內(nèi)第一個(gè)專(zhuān)門(mén)針對(duì)人工智能生成內(nèi)容的國(guó)際會(huì)議在上海舉辦,也證明了我們直面破壞性變化的勇氣和胸懷?!绷_平坦言。
香港的科研支持主要來(lái)自于企業(yè)的捐贈(zèng),在此支持模式下,羅平追蹤著計(jì)算機(jī)視覺(jué)最前沿的技術(shù)發(fā)展。同時(shí),他也承擔(dān)著科技部2030下一代人工智能重點(diǎn)研發(fā)計(jì)劃課題。他透露了目前課題進(jìn)展情況:“各項(xiàng)指標(biāo)超前,甚至還在不停迭代?!?/p>
羅平回憶,在MMLAB求學(xué)時(shí),開(kāi)會(huì)時(shí)每個(gè)學(xué)生都要上臺(tái)用一句話總結(jié)自己想要做的工作,而湯曉鷗的要求是,這句話必須總結(jié)到位,只要?jiǎng)e人聽(tīng)這一句話,就能立刻判斷出這個(gè)課題是否有研究的價(jià)值。
湯曉鷗選題就兩個(gè)標(biāo)準(zhǔn):一個(gè)是開(kāi)辟一個(gè)新方向,另一個(gè)是結(jié)束一個(gè)方向。2019年回到香港大學(xué)后,羅平指導(dǎo)學(xué)生和開(kāi)展研究的要求也是如此。
“我指導(dǎo)學(xué)生的風(fēng)格完全受湯老師的影響,他是那種不會(huì)說(shuō)‘不’的人,你有任何想法、意愿跟要求,他都盡量想辦法無(wú)條件地滿足。他學(xué)生很多,博士生加上一些訪問(wèn)學(xué)者,整個(gè)師門(mén)算下來(lái)有四五百人,我相信大家都覺(jué)得他是世界上最好的人?!绷_平說(shuō)。
羅平想成為湯曉鷗那樣的人,他也在用行動(dòng)去成為那樣的人,給學(xué)生創(chuàng)造機(jī)會(huì),鼓勵(lì)他們做獨(dú)一無(wú)二的創(chuàng)新,尊重他們的想法,并適當(dāng)引導(dǎo)。在學(xué)生眼中他是一個(gè)很棒的人。采訪中,羅平的學(xué)生胡宇韜和紀(jì)源豐提到老師時(shí)都非常敬重和佩服他。
湯曉鷗將香港中文大學(xué)建成了中國(guó)計(jì)算機(jī)視覺(jué)的“黃埔軍?!?,在他選擇一條冷清的道路時(shí),有一批校友與他同行,隨后又遇到羅平等同路人繼承出新,他們走在了時(shí)代的前面,也得到了時(shí)代的饋贈(zèng)。2023年湯曉鷗的故去,讓羅平對(duì)未來(lái)要走的路做了認(rèn)真思忖。
未來(lái),羅平愿將科研與基金事業(yè)揉到一起,他正在參與籌備MMLAB慈善基金,希望基金能為實(shí)驗(yàn)室成員及他們的孩子提供一些幫助,尤其鼓勵(lì)他們投入人工智能跟交叉學(xué)科的研究中來(lái)。“我相信,這也是湯老師和他的家人都希望看到的?!痹诓淮_定的探索中繼續(xù)前進(jìn),總有人與羅平共闖“華山”。