姓名:毛宏亮
身份:AI深度學習算法工程師
技能:用代碼鏈接現實與AI世界
2017年9月,我結束了21年的學校生涯,步入一家IT技術企業(yè),成為人工智能領域里的深度學習算法工程師。
在這一天到來之前,我根本不知道“深度學習”是什么,也不了解AI算法工程師的工作內容,但我一直希望成為一個學者,活躍在學術前沿。人工智能領域新知識不斷涌現的特點恰恰符合我想追求新知識新技術的志向,一段“無知者無畏”的深度學習之旅就此拉開了帷幕。
學習不簡單
成為深度學習算法工程師的第一天起,我一而再再而三地向別人致歉“不好意思,我不懂深度學習,真的不懂”。雖然經歷了多年電子、計算機方面的專業(yè)學習,但對于深度學習或者說人工智能這一全新的領域,我的了解少得可憐。
人工智能集合多個領域的知識:神經網絡的設計源頭是生物學,網絡內的運算規(guī)則需要你明白微積分等基本數學知識;深度學習模型的考究,有傳承來自物理學的統(tǒng)計模型。
“神經網絡”“卷積”“池化”“長短時記憶”最初遇到這些專業(yè)詞匯時,我也曾一臉迷糊,只能在和同事討論時拿出手機偷偷查詢。于是,每天在論文和國外報告中補充新知識和新技術成為了我這個“深度學習小白”的日常?!吧窠浘W絡”是模擬生物學的神經元激勵充放電過程,“池化”是選擇一組數字該怎么保留刪除……雖是填鴨式學習,卻讓我在短時間內快速了解了一個新的知識領域。慢慢地,這些深奧的詞語變成了我日常掛在嘴邊的工作常用詞。
2017年底,檢驗我學習成果的機會來了——我需要在自己的部門做一個深度學習的技術分享。一邊是精心制作的PPT,一邊是我在白板上的龍飛鳳舞,分享開始前,我設想的是,由淺入深,同時又能點到即止。可惜設想只能是設想,現實總歸是現實——雖然對人工智能的了解已經比之前增進不少,但這些新概念和算法在解釋時卻顯得依舊復雜。
當時我挺沮喪,甚至有些茫然。不過,現在回過頭來看這段過程,幫助卻是不少,至少讓我從一個連基礎詞匯都不認識的“小白”成長為一個能系統(tǒng)性地描述深度學習還引申出了自己理解的合格工程師。
拒絕1%的差錯率
人臉識別這個技術大家應該不陌生,去銀行辦理業(yè)務、過關入境都會涉及。公司的產品經理正是感受到了時代和市場的脈搏,向我提議趁早開發(fā)人臉識別即可自動支付的程序,并以公司食堂為試點。
“問題是人臉不是唯一ID,它不像銀行賬戶、員工編號能完全一對一對應。如果計算機有99%的準確率,這就意味著每識別100個人會有1個人被識別錯,如果1000個人每天三頓飯那就表示平均每天有30個人被識別錯。食堂一天要處理30起支付事故,新技術沒怎么解決問題就先制造一堆麻煩!”我認為產品經理的想法過于理想化。
算法不是想當然的事,尤其是深度學習,必須考慮到當下技術還不夠成熟的情況,避免搬起石頭砸自己的腳。我是我們團隊的算法負責人,對自己的工作負有使命感,如果工作不完善或者不合邏輯,我就應該指出來,拒絕可能發(fā)生的1%差錯。
“難道用戶都提出需求了,我們還不做嗎?還賺不賺錢啦?!薄皠谀!碑a品經理抱怨道,還用無奈又幾近乞憐的目光投向我。
“好吧,至少應該明確一下我們算法的局限性和食堂具體應用場景的人臉數量。如果要進一步提升計算機的精度,我們得附加別的條件。”我站在白板前,向產品經理不斷強調。
最終,我和團隊同事們商量出對策:在人臉識別的基礎上附加兩個條件:一是在先期注冊時通過短信二次驗證做好人臉和數據的一比一復核;二是設置刷臉支付出錯后的反饋機制,確保支付萬無一失。
人工智能給工程師開了一道解決問題的敞亮大門,但它自身卻沒法告訴我們進門后的路該怎么走。所以,當深度學習算法工程師面臨一個問題的時候,首先要做的不是想怎么解決,而是去思考這個問題本身是不是邏輯完備,思路清晰。算法工程師提供的是核心技術的支撐,如果核心都是不可靠的,那么整個工程就離崩潰不遠了。
人工智能,Always New
“你覺得注意力機制(Attention Mechanism)對人臉識別有用嗎?”我向負責人臉識別算法的同事詢問道。
“應該沒什么用吧,畢竟卷積神經網絡已經把人臉的局部信息有選擇性地篩選了,注意力機制想做的也是類似的事”,他搖了搖頭,攤開雙手,一臉無奈的表情。
“的確是這樣,我再想想?!蔽一氐诫娔X前。實驗表明注意力機制并不能明顯提高人臉識別的準確率,但這個機制的算法卻比卷積神經網絡簡單,如果……我興奮地走到算法同事的身邊,使勁拍了一下他的背,“你覺得如果二選一,會怎么樣?”
“二選一,什么意思?”他一臉懵懂無知。
“注意力機制的確和卷積操作的功能存在重疊,如果我們嘗試拋棄其中一種,你覺得OK不?”我向他晃了晃手指,然后告訴他我將神經網絡里面大量的卷積運算替換成了注意力機制,減少了算法復雜度,降低了計算的冗余度,同時人臉識別的精準度并沒有下降太多。
“這個的確很有意思,但可惜人家Google團隊早講過這個故事了?!苯又蛭艺故玖薌oogle研究院最近發(fā)表的一篇論文——《Attention is All you Need》。
我簡單瀏覽了文章摘要,發(fā)現我所謂的“獨創(chuàng)思路”早已經有了類似的表述,而且使用的替換方法比我想得更簡單方便。我默默嘆氣:嗨,誰叫人家水平比我高呢!
不過,我的這一番思考也不是完全沒有用處,在我們公司,使用這一算法進行人臉識別功能操作卻還沒有進行過。我趕緊查找到這篇文章,找到附在文章中的程序代碼,用新代碼對我們的算法進行了合適的改寫,替換了原有的卷積操作。算法復雜度下降,程序計算時間縮短了,但精準度卻沒有什么改變……雖然在深度學習領域,這段算法將很快被新的算法再次替代,但在當下也算是一次成功的創(chuàng)新成果。
在人工智能的“比賽”中,概念和算法的快速更替,技術的日新月異總是讓人猝不及防。很多時候,并不是缺乏想法和好的思考角度,而是自己能想到的想法已經早已被別人想到,甚至更加全面周到。在日新月異的AI領域,唯一能做的就是學好基礎,不斷實踐,然后和它一起成長。
有人說:“人工智能領域是一個高風險的職業(yè),你隨時有可能被后浪覆蓋?!边@句話聽上去似乎有些悲觀,不過恰恰這也是人工智能最激動人心的地方,因為這也表明了也許只要你敢想、敢創(chuàng)新、敢行動,就有機會在時代浪潮中做一些改變自己,改變他人,甚至改變世界的事。
對話專業(yè)
智能相關專業(yè)
Alpha GO、無人駕駛、智能零售……人工智能的應用和普及越來越廣,各領域對人工智能人才的需求也越來越旺。中國科學院大學、南開大學、天津大學等高校陸續(xù)開設了人工智能學院和相關專業(yè)。對新科學、新技術、新領域感興趣的你,快跟上老師們的步伐,看看要成為未來的人工智能專家,你現在得做哪些準備!
老師說
Q1:哪些專業(yè)與人工智能領域的關系度最密切?
方勇純:北京大學、南開大學等高校在10多年前就已開設了智能類本科專業(yè)——“智能科學與技術”。經過這些年的發(fā)展,開設這一專業(yè)的高校不斷增多,目前已達到60所左右。其實,人工智能是一個多學科交叉的綜合性學科,它和信息類很多專業(yè),例如信息自動化、計算機類、電子類、通信類等專業(yè)都息息相關,這些專業(yè)側重于智能技術的不同方面,感興趣的考生可以根據自己的實際情況選擇報考最適合自己的專業(yè)。
Q2:以上專業(yè)學生畢業(yè)后可以從事哪些和人工智能領域相關的職業(yè)?
方勇純:智能相關專業(yè)的學生就業(yè)口徑非常寬,畢業(yè)生可以去信息類大型企業(yè),也可以去國家各部委從事與智能技術相關的管理與服務工作,還可以到各科研院所從事智能方面的人才培養(yǎng)與科學研究工作。
學長學姐說
Q1:我可以通過哪些渠道了解人工智能領域的各類最新信息資訊?
毛宏亮:推薦閱讀教材《人工智能基礎》,這是一本面向高中生的人工智能教材,講授了人工智能的發(fā)展歷史、基本概念和應用。如果想了解人工智能的歷史和信息,可以閱讀尼克寫的《人工智能簡史》,或通過雷鋒網、36氪等網站了解人工智能最新資訊。如果有同學對算法有一定研究,可以打開http://www.tensorfly.cn(TensorFlow中文社區(qū))這個網址,開始深度學習的第一步,實現自己的第一個神經網絡模型。
Q2:如果我未來想在人工智能領域發(fā)展,我在高中階段首先要做哪些準備呢?
毛宏亮:首先要把英語學好。人工智能領域的知識更新很快,這領域的職場人士常常需要閱讀論文,尤其是英文論文,并關注目前技術領先的國內外人工智能實驗室在做些什么,所以熟練掌握英語就顯得尤為重要。(采寫:王秀英)