周琪
一次崩潰
2017年,胖頭魚遭遇了他25年人生中一次巨大的崩潰。他清晰地記得那天,晚上11點多,在香港中文大學(xué)附近的沙田海濱海長廊,不知不覺跑了20公里,到終點時忍不住哭了出來。
他注意到附近一直有人待著不離開,明白對方是擔心他一時想不開,心想:這里真是個溫暖的地方啊。
他太有理由苦悶了。不久前,他以清華大學(xué)電子工程系優(yōu)等生身份來到港中大多媒體實驗室讀博,師從王曉剛教授,而王曉剛師從湯曉鷗。后者于2001年7月建立的多媒體實驗室,多年來有“計算機視覺界黃埔軍?!钡拿雷u。
第一年通常大家都不發(fā)論文,但胖頭魚想試一試,盡管并非計算機視覺科班出身,但他對自己的學(xué)習能力一直很有信心。還有一個原因是,他了解自己,如果沒有什么挑戰(zhàn),人就會懶散起來,大不了就是論文被拒,運氣好了還能減輕一下接下來的科研壓力,專心做點長期研究。
“計算機視覺+自然語言處理”的方向是一開始就定下的,實驗室里研究這個方向的只有他一個,這意味著,遇到難過的坎,唯有孤軍奮戰(zhàn)。和導(dǎo)師王曉剛商量時,對方并沒有阻攔,鼓勵他說是很有價值的研究方向,但要為困難做好準備。
在接近研究終點線的地方,困難猝不及防地降臨。修改了一段代碼BUG后,識別結(jié)果表現(xiàn)反而變差了。CVPR(全球計算機視覺頂級學(xué)術(shù)會議)提交論文的截止日就在眼前,無助、沮喪、自我懷疑在那一刻如海水般涌向他。
胖頭魚更新了一條朋友圈,那幾乎是最后的情緒出口,但內(nèi)容和平日里開朗的人設(shè)實在不符,加上不愿給朋友們增添情感上的負擔,他只允許這一條“存活”5分鐘,5分鐘后,這條朋友圈將和崩潰一道,消失在沙田海。
5分鐘足夠了,底下出現(xiàn)了很多留言,他還收到了王曉剛發(fā)來的信息,了解情況后,導(dǎo)師勸慰他不用擔心,并推薦了一位或許可以提供幫助的人選。
目前,博士生三年級的胖頭魚在商湯科技的自動駕駛團隊實習,并帶領(lǐng)一支團隊,和導(dǎo)師王曉剛,現(xiàn)任商湯科技研究院院長只差了兩個層級,就像在多媒體實驗室一樣。
商湯科技是香港中文大學(xué)教授湯曉鷗2014年創(chuàng)立的計算機視覺和深度學(xué)習原創(chuàng)技術(shù)的創(chuàng)新型科技公司,去年5月末,商湯宣布完成 C+輪 6.2 億美元融資,投后估值達45 億美元,是全球最大的AI獨角獸。近期也有消息說,商湯最新估值已達60億美元。
公元前1650年左右的中國商湯時期,農(nóng)業(yè)、手工業(yè)迅速發(fā)展,早期漢字甲骨文誕生并得到充分應(yīng)用,該時期成為人類古代文明進步的重要階段。
這成為商湯科技名字的由來,不過,民間的另一個版本是,“湯老師”從商了,所以叫商湯。
“湯氏”研究場
湯曉鷗于計算機視覺領(lǐng)域有一呼百應(yīng)的影響力,他避開媒體的追逐,幾乎不接受采訪,酷愛電影和“曬娃”的形象深入人心——每一次公開演講,他都會拿電影出來類比和演示。比如《戰(zhàn)狼》的成功證明了尊重原創(chuàng)是一件多么重要的事情,再比如,在一場人工智能大會上,他演示了商湯的黑科技如何把一輛汽車毫無痕跡地植入《花樣年華》,“其實我最想植入的應(yīng)該還是我兒子的照片,這也沒有什么別的原因,因為我覺得他比梁朝偉長得還帥。我也跟他說,你不要相信人工智能,你長得這么帥,談女朋友一定要親自去談?!痹诟壑写蠖嗝襟w實驗室首頁,湯曉鷗用兒子Samuel的照片科普人臉深度識別,一張上面標著“濃眉”“有吸引力”,對應(yīng)人臉屬性,還有一張上面標著“You are Samuel”(你是Samuel),對應(yīng)人臉識別。
從商前,湯曉鷗先后在香港中文大學(xué)和微軟亞洲研究院(MSRA)工作。《十九年來,從微軟亞洲研究院走出了他們》一文中這樣定義這座微軟在海外設(shè)立的首個研究院,“沒有人可以繞開這個機構(gòu)去談?wù)撨^去十幾年的中國科技史”。張宏江、李開復(fù)、沈向洋、張亞勤等一大串星光熠熠的名字都來自那里。
戴娟大四時經(jīng)師兄介紹來到MSRA,跟隨湯曉鷗實習,“有學(xué)者氣”是湯留給她的第一印象。“從2004年到現(xiàn)在,感覺他一直沒怎么變過?!眲偨佑|人臉識別那會兒,湯曉鷗對她只有一個要求,沉下心來,讀300篇論文?!八膊粫頇z查,但是他會跟你說,你這樣做的原因是什么,不熟悉這個行業(yè),就沒辦法做出更優(yōu)秀的研究方向和議題?!?/p>
實習七個月里,開頭將近三個月,戴娟都把自己埋在論文堆里,當時深感痛苦,現(xiàn)在覺得,這個苦不能繞,也繞不開。畢業(yè)后,她拖著大大的行李箱,第一次離開大陸,進入港中大多媒體實驗室,當時,20多個人里,她是唯一的女生。2005年,計算機視覺尚未成為“顯學(xué)”,選擇這個專業(yè),意味著選擇了純研究的道路。
戴娟在中國科技大學(xué)電子信息工程專業(yè)讀本科時,就耳聞多媒體實驗室的“口碑”,所有從實驗室走出去的學(xué)生都去了美國最牛的學(xué)校,MIT、耶魯、劍橋、哥大(作者注:哥倫比亞大學(xué)的簡稱)……每一個都讓她心動?!皽蠋煏贿z余力地幫學(xué)生找最好的出口,他真的很關(guān)心自己的學(xué)生?!?/p>
在多媒體實驗室,論文分享會是每周的規(guī)定動作,大家一起讀論文,互相改論文,分享要點、筆記,戴娟從師兄林達華的筆記里“偷學(xué)”了不少統(tǒng)計學(xué)的知識,后者是商湯科技的聯(lián)合創(chuàng)始人。
實驗室?guī)в袕娏业摹皽巷L格”,開放、包容、平等、透明。所有人共享所有算法,對新人而言,最幸運的莫過于,開始任何一項研究,都可以站在巨人的肩膀上。人與人之間的較勁,則幾乎感覺不到,大家關(guān)心的是團隊投中國際頂級會議的論文數(shù)量,要是有人沒中,其他人都會上去安慰。
“我覺得湯老師的理念是,希望所有學(xué)生都能去全世界最優(yōu)秀的大學(xué)。不是說一定要誰去MIT,誰去哥大,一切都是有可能的。在學(xué)術(shù)界,你要希望身邊的朋友變得更好,這樣無論你以后做什么,都會有更好的圈子來支撐?!贝骶觌x開實驗室后,簡歷上新添了蘋果公司Siri和微軟Windows Phone的產(chǎn)品經(jīng)理兩個職務(wù),去年回到“初心”商湯,仿佛穿越到了學(xué)生時代。“它是最安穩(wěn)的一個地方,因為你不是一個人在戰(zhàn)斗,遇到問題時有團隊,是很厲害的一群人?!?/p>
這種被天才包圍的感覺,大水也有。去年,他所在的團隊勇奪計算機視覺界的頂級競賽之一MS COCO冠軍。兩年前,他定點投了商湯實習職位,大水研究的方向是目標檢測,和自動駕駛中的場景改善高度匹配。
“在這里大家不會互相甩活,會主動接活,遇到問題的時候,大家會先考慮這個事情自己是不是能直接解決掉,然后再去找其他人,而不是說我發(fā)現(xiàn)這個問題好像跟我沒關(guān)系,就直接拋出去,看誰能解決掉,這個是我特別喜歡的一點?!?/p>
當被問起實習生和正式員工的差別時,大水仔細想了想后答,沒有。
關(guān)于“無差別”,胖頭魚舉了一個例子。算法測試是科研人員檢驗代碼是否WORK(可以落地)的必經(jīng)之路,它需要強大的GPU(圖形處理器)集群——超算中心支持。商湯有14 000塊單價萬元以上的GPU,是亞洲規(guī)模最大的 AI 超算平臺,依托深度學(xué)習訓(xùn)練框架 SenseParrots,支持千卡并行訓(xùn)練、千億級參數(shù)模型、百億訓(xùn)練樣板、億級類別分類任務(wù)。任何時間,任何地點,提交測試需求后,會進入隊列,先后次序只和任務(wù)的緊急程度相關(guān),無關(guān)提交人員的身份?!叭绻抨牭脑?,最晚,也是最極端的情況,就是你白天掛上,晚上肯定能跑上。正常情況是掛上就跑了。”
包括實習生在內(nèi),商湯的研究員人均擁有數(shù)十塊GPU卡。大水說,這里的超算集群是他見過所有公司里最好的,大大加快了迭代的速度,降低了試錯的代價。
“賠本”招人
巨大的投入隱藏在背后,超算中心特別“燒錢”。據(jù)《財經(jīng)天下》報道,商湯的研究員閆俊杰博士做過估算,按下那個標有“run”(啟動)字樣的按鈕,一次數(shù)據(jù)迭代整體花費至少50萬元。CEO徐立笑稱,“我們有150多個博士天天在算法平臺上按‘run,訓(xùn)練人工智能模型?!?/p>
我在商湯上海辦公室見到了這位37歲的CEO。偌大的空間橫放著兩張白漆辦公桌,和公共辦公場地的桌子沒有區(qū)別,上面是一臺筆記本電腦,空曠程度讓人懷疑這只是臨時的辦公場所。徐立穿著NIKE定制的黑色公司服,連帽衛(wèi)衣和寬松運動褲的搭配,胸前印著更新后的“商湯”logo。和早前的公司logo相比,中文取代了英文SenseTime,占據(jù)了醒目位置。
“尚簡而重能”,徐立去年在公司立了一條規(guī)定,在公司內(nèi)實行稱謂“減負”,互相直呼其名。違規(guī)者要向公司用于青海捐助的慈善基金“充值”。他相信,這有助于鑄造并保護一種開放、坦誠、純粹的團隊文化。
計算機視覺領(lǐng)域的玩家?guī)缀醵加兄踬~號,在這個專業(yè)人士熱衷的社交網(wǎng)站上,自稱港中大“多媒體實驗室出來的學(xué)渣”的“AI觀察員”稱徐立是圈內(nèi)的全能型選手,“寫得了算法,做得了DSP(數(shù)字信號處理),三天兩頭出新技能。平時工作應(yīng)付得得心應(yīng)手(開會、寫PPT、寫代碼、出去吃喝打球打游戲一個不誤,每天回家路上看篇paper,睡覺前再來個睡前讀物),不耽誤每年CVPR/ICCV/ECCV(全球計算機視覺領(lǐng)域三大頂級會議)再投個三五篇paper,綽號中國聯(lián)通(宵)。”
徐立在港中大師從賈佳亞教授。賈佳亞2017年5月作為杰出科學(xué)家加盟騰訊優(yōu)圖實驗室。接受36氪采訪時,他稱徐立是“讓他非常自豪的一個學(xué)生”,“徐立是一個非常聰明的人。不只是我們組里面,他可以說是我見過的所有學(xué)生里最聰明的人之一。他能夠觸類旁通,從細節(jié)上理解問題。他在我們組的時候從最早需要幾個月做完一篇論文到一個星期解決戰(zhàn)斗就充分證明了他的能力”。
2014年3月,湯曉鷗團隊發(fā)布研究成果,基于原創(chuàng)的人臉識別算法,準確率達到98.52%,首次超越人眼識別能力(97.53%),這開啟了湯曉鷗創(chuàng)業(yè)的決心。在此之前,受困于數(shù)據(jù)規(guī)模有限和算力不足,學(xué)界對能否突破工業(yè)紅線,即計算機識別準確率高于人眼,并沒有十足的把握,用徐立的話說,就像在隧道里摸黑行走,什么時候到達出口,不知道。
商湯徹底打開了湯曉鷗對隧道外世界的想象力。在一次香港的對談中,他說,在香港科技園主席的支持下,公司兩周就在香港成立了,“過去20年的努力,都是為了這一刻”,面對臺下坐著的學(xué)生,他感慨道,“都說香港錯過了互聯(lián)網(wǎng)時代,商湯要做的,是引領(lǐng)人工智能時代”。
徐立自稱聯(lián)合創(chuàng)始人里“最不學(xué)術(shù)”的那個,他在很多場合說過自己加入的故事?!皽蠋熣业轿?,說我們現(xiàn)在做的這些事情不夠有power(力量),做商湯有一個目的,形成影響力,然后做更多更大的事情。我聽完之后,覺得一個人有長遠的想法,能夠去改變世界,真的不一樣。當時我基本上沒有猶豫,就說‘OK,我非常想去?!?/p>
2015年初,湯曉鷗召集深圳和香港兩地的商湯員工一起吃飯,迎接農(nóng)歷新年,徐立記得,當時的人連兩桌都湊不滿,其中還有6位聯(lián)合創(chuàng)始人。到了3月,算上實習生,整個公司也就30多人。
那年夏天,湯曉鷗和徐立去美國硅谷參觀了幾家創(chuàng)業(yè)公司。戴娟當時在硅谷所在的舊金山灣區(qū)工作,據(jù)她回憶,那次硅谷之行,湯曉鷗沒有約重量級人物見面,反倒是約了她好多在Facebook工作的研究員、工程師朋友聊天,他好奇他們的企業(yè)文化是怎樣的,甚至會問Facebook如何布置辦公室,廚房長什么樣子。“湯老師想知道為什么員工喜歡去Facebook工作。他就是一個研究型的學(xué)者,沒有做過startup(創(chuàng)業(yè)公司),就先看全世界最好的startup都是怎么做的。”
徐立用“擴招”形容2015年。2014年底獲得IDG資本數(shù)千萬美元的天使輪投資后,商湯開啟了“大包大攬”式的人才招聘計劃。幾位創(chuàng)始人在計算機視覺領(lǐng)域沉浸多年,比誰都清楚人才對一家技術(shù)初創(chuàng)公司意味著什么。那時,AlphaGo引爆世界尚未發(fā)生,在美國,名校計算機系畢業(yè),最聰明的都去了華爾街,投身金融業(yè),那里意味著穩(wěn)定、高收入、成功。在香港,徐立的很多同學(xué)也去了銀行,人才的錯配讓這位年輕的CEO看到了機會。
“我們當時就有一個判斷,人工智能的戰(zhàn)爭是人才的戰(zhàn)爭,而人才是需要培養(yǎng)的,一般要經(jīng)過3~5年的訓(xùn)練。于是商湯做了兩件事,一是把過去幾年行業(yè)里做得比較好的人招過來,二是攔住那些剛剛畢業(yè)的博士,告訴他們不要去銀行了,來這里?!?/p>
扎克伯格說,增長是最重要的,盈利只在第二位。對成立之初的商湯而言,任何事都比不上積累人才重要。為了吸引人才,不惜血本砸錢買顯卡,搭建運算平臺,然后,請一堆博士過來用,一分錢沒賺,凈燒錢。有投資人忍不住跟徐立說,“這樣下去不行,咱們不是辦研究機構(gòu),要有項目落地,要回應(yīng)需求,快速迭代”。徐立內(nèi)心并不認同,“你想啊,在這個行業(yè)有積累,又是Top(最好)的人,我覺得,差不多就一輛巴士,最多了,這些人里有的去了微軟、谷歌、Facebook……你如果把剩下的都招進來,那別人要再做同樣的事的時候,會發(fā)現(xiàn)市場上人才真空了,就不得不從零開始培養(yǎng)。”
事實上,“賠本招人”的效果比預(yù)期更好,有人從微軟、谷歌、Facebook回到國內(nèi),加入商湯,當然,迎接他們的是體面的收入、公司期權(quán),以及一種與美國科技巨頭既相似又不同的創(chuàng)業(yè)氛圍。
2015年末,積蓄的能量開始在商業(yè)上顯現(xiàn),商湯在多個垂直領(lǐng)域拿單,合作客戶不乏中移動這樣的大客戶,2017年宣布實現(xiàn)正向盈利。
作為一枚通過了微軟4輪面試和蘋果公司15輪面試的學(xué)霸,戴娟比較過商湯和她的兩個老東家。在她看來,微軟屬于成熟的大公司類型,自上而下作決策;蘋果是創(chuàng)業(yè)型,自下而上作決策,任何人有一個好的產(chǎn)品想法,都可以找人一起做,在蘋果公司,人們常說People follow visionaries(人們愿意追隨愿景)。商湯更接近蘋果模式,在內(nèi)部鼓勵大家提出各自的想法,再由高層去判斷這些想法是否和公司的戰(zhàn)略一致。
戴娟目前負責的教育產(chǎn)品就是“自下而上”決策的典型。起初,湯曉鷗交給她的任務(wù)是編寫一本人工智能教科書,經(jīng)過幾輪和工程院院長、研究院院長的溝通,戴娟產(chǎn)生了規(guī)劃教育產(chǎn)品的想法,從教材到配套教具,再到教師培訓(xùn),團隊規(guī)模從3個人擴大到了近30人。
黑羊文化
《Facebook臉書效應(yīng)》的作者曾感慨,“當我在他們的辦公室里時,我時常覺得,這也許是今天這個星球上最聰明的一批年輕人,1 200個雇員的平均年齡是31歲?!边@句話或許同樣適用于商湯——公司2 800名員工的平均年齡是29歲。
我試圖弄清這個“人才黑洞”的形成原理,并把這個問題拋給徐立。他不假思索地給出了一個無比正確的答案,“因為我們的愿景,讓人工智能引領(lǐng)人類進步,我們要用真正領(lǐng)先的技術(shù)重新定義世界……”
這番回答顯然難以令人信服,我第一次在采訪中試圖打斷,“不好意思,我覺得其他一流公司一定也給了他們這樣的愿景”。
“是這樣,但關(guān)鍵是你要access(接觸)到所謂改變世界的東西,而不只是做一個團隊里的一顆螺絲釘。另外,像谷歌模式是一個人揭竿,幾個人圍成一個小團隊,但我們可以用100個人干同一件事,我認為這也是中國人的優(yōu)勢,既有規(guī)模,又有體系。我會告訴大家,我們來join(參與)一個big project(大項目),我們要做的是讓技術(shù)盡快落地,去重新定義大家對世界的認知?!彼呀?jīng)決定要在公司設(shè)一面墻,出現(xiàn)在上面的產(chǎn)品,未必是最賺錢的,但一定要是改變了世界的。
胖頭魚為自己建了一個網(wǎng)站,上面列滿了華麗的履歷。去年夏天,F(xiàn)acebook邀請他去實習,四個月里,他體會到中美在人工智能發(fā)展路徑上的差異,和中國相比,美國走得更慢、更穩(wěn),中國的前進速度更快,充滿試錯的可能性。
他問王曉剛等到畢業(yè)后,應(yīng)該選擇出國還是留在商湯,最終決定留下來。就好像當年這位導(dǎo)師一通一個小時的電話就讓他下定決心不做金融轉(zhuǎn)而研究計算機視覺一樣,他相信王曉剛真的會為他未來的發(fā)展考慮,“王老師的優(yōu)點是他會在給你一個任務(wù)之前,替你想這件事你愿不愿意做,他不會把浪費時間的雜事扔給你,比如幫他做個PPT什么的。己所不欲,勿施于人?!?/p>
研究總監(jiān)石建萍覺得,“湯老師的靠譜帶來了‘人才黑洞”。她帶領(lǐng)自動駕駛團隊在2017年底促成了商湯和本田公司簽訂了為期5年的戰(zhàn)略合作。為此,本田支付了一筆價格不菲的技術(shù)專利費用?!白詣玉{駛團隊是一個盈利部門?!边@給了石建萍底氣。今年初,30歲的她位列MIT TR35,這是《麻省理工科技評論》為找出最有可能改變世界的牛人而設(shè)立的獎項,針對35歲以下的青年科技才俊,Google 聯(lián)合創(chuàng)始人拉里·佩奇(2002年)和謝爾蓋·布林(2002年),Linux 之父林納斯·托瓦茲(1999年),F(xiàn)acebook 創(chuàng)始人馬克·扎克伯格(2007年),Yahoo 創(chuàng)始人楊致遠(1999年),Apple 設(shè)計總監(jiān)喬納夫·伊森(1999年)等,都曾是該獎的座上賓。
“湯老師從90年代開始就一直做計算機視覺,在行業(yè)里很出名,你看整個行業(yè)的AI公司,這樣閱歷的創(chuàng)始人非常少,因為本身是一個新的行業(yè),就是一幫志同道合的人一起出來做事情嘛?!?img src="https://cimg.fx361.com/images/2019/05/26/qkimageszosyzosy201905zosy20190517-5-l.jpg"/>
石建萍記得,剛來商湯時,公司項目并不多,也沒有幾個客戶,各自的工作按技術(shù)點,而不是行業(yè)線區(qū)分,檢測、識別、分割、跟蹤……“那種感覺和學(xué)校的實驗室很像,連作息都是一樣的?!?/p>
湯曉鷗喜歡和學(xué)生待在一起,吃飯、爬山、游艇派對,講一些學(xué)生們喜歡也能get到的笑話,盡管這些笑話在一些商務(wù)場合并不太容易獲得所有人的共鳴,仍不妨礙他做一個學(xué)生心目中的“段子手”的熱情。
這位創(chuàng)始人在學(xué)習了很多大公司的文化后,拒絕了“狼性”,“‘群狼過后,寸草不生,我一直不太理解這句話,為什么狼要吃草。我們公司的文化是羊,商湯是很有同情心,很有同理心的公司。但羊也有缺點,比如說羊群效應(yīng),因此我們想做不一樣的羊——黑羊(Black Sheep),去做別人沒有做過的事情,甚至是別人想不到的事情?!睖珪扎t曾列出Facebook、蘋果、谷歌發(fā)布AR平臺的時間(分別為2017年的4月、6月、9月),而商湯切入這一領(lǐng)域的時間為2016年1月,因此他開玩笑將商湯比作“第一個吃蘋果的人”。
在2019年會上,他向所有人推薦了《波西米亞狂想曲》,那是一部講述皇后樂隊從無到有,從疏離到重聚,從低谷到巔峰的電影,四位充滿天賦的樂隊成員將生命傾注到他們熱愛的音樂事業(yè)中,在世界搖滾樂歷史上留下了偉大的一筆。毫無疑問,這也是湯曉鷗寄托在商湯身上的野心。