王躍+唐安
讓機(jī)器看懂世界很難,一個(gè)2歲小孩看過一次貓就能從圖片中識別出“貓”,可計(jì)算機(jī)卻不行。
李飛飛是利用深度學(xué)習(xí)解決計(jì)算機(jī)視覺問題的第一代學(xué)者,受2歲小孩識圖的啟發(fā),利用大數(shù)據(jù)訓(xùn)練機(jī)器。
華裔、女性、人工智能、科學(xué)家,“洗衣妹”、“清潔工”、“逆襲”這些標(biāo)簽湊在一起,給她的人生更添了一抹傳奇色彩。
人工智能是個(gè)好故事,其中最重要的素材當(dāng)屬人才。科技巨頭們?yōu)榇耸贡M渾身解數(shù)。谷歌費(fèi)盡心機(jī)把“深度學(xué)習(xí)”之父Geoffrey Hinton招致麾下,F(xiàn)acebook有深度學(xué)習(xí)的領(lǐng)袖學(xué)者Yann LeCun,蘋果有Geoffrey Hinton的一位明星弟子Russ Salakhutdinov,百度曾挖來吳恩達(dá)……人才的爭奪愈演愈烈之時(shí),曾埋首大學(xué)實(shí)驗(yàn)室里的科學(xué)家們紛紛踏足工業(yè)界,助力這一波AI浪潮。
近半年,最出名的一次科學(xué)家出山,當(dāng)屬與吳恩達(dá)齊名的另一位華裔學(xué)者李飛飛加入Google云部門,擔(dān)任Google云端人工智能的首席科學(xué)家。在AI界,李飛飛的大名如雷貫耳。她是斯坦福視覺實(shí)驗(yàn)室、豐田汽車-斯坦福人工智能研究中心的負(fù)責(zé)人,1976年出生于北京,33歲就拿到了斯坦福的終身教職,是當(dāng)時(shí)最年輕的終身教授。
如果用圍棋來比喻,李飛飛是稀有的幾個(gè)九段高手之一。她專注于計(jì)算機(jī)視覺上的研究已達(dá)15 年之久,被評價(jià)為“計(jì)算機(jī)視覺領(lǐng)域改變圖像識別方向的人”。所謂計(jì)算機(jī)視覺,即教會(huì)計(jì)算機(jī)看懂世界。這是AI研究長久以來的目標(biāo),然而,對于人來說的一個(gè)相當(dāng)簡單的認(rèn)知過程,對于計(jì)算機(jī)卻非常困難。李飛飛的最重要的成就之一就是2007年發(fā)起了 ImageNet,現(xiàn)在全球最大的圖像識別數(shù)據(jù)庫。
華裔、女性、人工智能、科學(xué)家,這些標(biāo)簽湊在一起,讓人們對李飛飛刮目相看,尤其“洗衣妹”“清潔工”“逆襲”這些聳動(dòng)的字眼總出現(xiàn)在她的相關(guān)報(bào)道中,給她的人生更添了一抹傳奇色彩。北京出生的她在四川長大,16歲跟隨父母移民到美國新澤西州的Parsippany 小鎮(zhèn)。當(dāng)時(shí)全家人英語都很差,父母又沒有良好的經(jīng)濟(jì)來源,只能做一些類似超市收銀員、修理相機(jī)等工作賺取微薄的收入,生活得很邊緣。李飛飛邊補(bǔ)英語邊上學(xué)邊打零工,兩年后竟拿到了普林斯頓大學(xué)的全額獎(jiǎng)學(xué)金錄取。這讓她在小鎮(zhèn)名噪一時(shí),當(dāng)?shù)貓?bào)紙還刊登了她的報(bào)道,標(biāo)題是《“美國夢”成真了!》。大學(xué)期間,憑借敏銳的商業(yè)嗅覺,李飛飛借錢買下一家洗衣店給父母經(jīng)營。周一到周五,她在大學(xué)上課,到了周末,她便走出實(shí)驗(yàn)室,變身“洗衣妹”。她曾笑言:“我非常愛普林斯頓,不過也非常愛我的洗衣店,缺少了它們中的任何一件,都沒有現(xiàn)在的我。”
李飛飛從小就很喜歡數(shù)學(xué)和科學(xué),大學(xué)便選擇了物理專業(yè)?!爱?dāng)時(shí)懷著成為愛因斯坦的夢想,物理可以說是人類世界最基礎(chǔ)的科學(xué)。但在學(xué)習(xí)物理的過程中,我發(fā)現(xiàn)其實(shí)20世紀(jì)初,最偉大的物理學(xué)家包括愛因斯坦開始思考的問題已經(jīng)從物理轉(zhuǎn)向了生物。他們在思考人是從哪里來的,人的智慧是從哪里來的,所以我也開始關(guān)注。我也很關(guān)注神經(jīng)生物學(xué),大學(xué)時(shí)做了幾個(gè)神經(jīng)生物學(xué)的暑期實(shí)習(xí),覺得特好玩?!笨梢哉f這時(shí)候,對于人的智慧與生物的興趣,就為李飛飛后來走入人工智能的世界埋下了線索。
1999年,她畢業(yè)時(shí)正值大牛市,華爾街異常繁榮。很多著名投行和咨詢公司向她來拋了橄欖枝,她卻拒絕了,而是追隨了內(nèi)心,遠(yuǎn)赴西藏研究了一年藏醫(yī)。對于生物學(xué)的熱情從來沒有停止過,西藏歸來,她進(jìn)入加州理工攻讀博士學(xué)位,選擇的是認(rèn)知神經(jīng)生物學(xué)以及人工智能的方向,后來就“陰差陽錯(cuò)地走上了人工智能這條路”。
李飛飛是將深度學(xué)習(xí)用來解決計(jì)算機(jī)視覺問題的第一代學(xué)者。讓機(jī)器看懂世界很難,一個(gè)2歲小孩看過一次貓就能從圖片中識別出“貓”,可計(jì)算機(jī)卻不行?!拔覀冇煤芏鄼C(jī)器學(xué)習(xí)概率學(xué)的方式,但我們得手工去設(shè)計(jì),它的能力很快表現(xiàn)出局限,而且所有的數(shù)據(jù)集都特別小。到2007年時(shí),我自己剛剛變成一個(gè)年輕的教授,我在思考怎么突破這個(gè)瓶頸?!碑?dāng)時(shí)李飛飛已成為斯坦福大學(xué)計(jì)算機(jī)系教授,圖像識別領(lǐng)域還是冷門,同事們勸她換個(gè)方向,以便拿到終生教職,她沒聽。有一天,她突然意識到,由于人眼每200毫秒就能獲取一幅圖像,別看兩歲的小孩就能識別物體,但他從0到2歲就已經(jīng)看到了上億的圖片了,是計(jì)算機(jī)的幾何級倍數(shù),因?yàn)槿说难劬﹄S時(shí)都在吸收自然環(huán)境中的圖像,據(jù)此,李飛飛提出了大數(shù)據(jù)的概念。她開始從網(wǎng)上抓取海量照片,給它們打上標(biāo)簽后,訓(xùn)練計(jì)算機(jī)進(jìn)行深度學(xué)習(xí),即給出一定算法,讓計(jì)算機(jī)自己學(xué)習(xí)識別。
李飛飛帶著博士生從網(wǎng)上下載了上億張圖片,如果靠一個(gè)人來手工標(biāo)注,不吃不喝不睡,都要花上20年才能完成。后來是亞馬遜的眾包平臺解救了她,她在上面雇傭來自全世界的網(wǎng)友一起給圖片打標(biāo)簽。其間,實(shí)驗(yàn)室一度缺少人手,又申請不到經(jīng)費(fèi)。最困難的時(shí)候,她甚至想重開洗衣店,籌集實(shí)驗(yàn)資金。最終,來自167個(gè)國家的5萬名網(wǎng)友一共花了3年時(shí)間完成了海量圖片的標(biāo)注,隨后,具有里程碑意義的ImageNet誕生了。
ImageNet數(shù)據(jù)庫的重要價(jià)值還在于它是開源的,每個(gè)實(shí)驗(yàn)室都可以調(diào)取使用。依據(jù) ImageNet ,李飛飛發(fā)起了一年一度的視覺識別挑戰(zhàn)賽,邀請谷歌、微軟等科技巨頭參賽,促進(jìn)圖像識別和人工智能領(lǐng)域的交流。ImageNet 相當(dāng)于一個(gè)算法考場,參賽者可以利用它龐大的題庫進(jìn)行考試,正確率越高,就意味著該參賽者的圖像識別算法越好。為了爭奪榜首名次,各大科技巨頭也卯足了勁兒地進(jìn)行圖像識別方面的研究,就在過去幾年中,機(jī)器的圖像識別能力大大提高,出錯(cuò)率僅為約 5%(比人眼還低)。可以說該比賽刺激了圖像識別的發(fā)展,而李飛飛對計(jì)算機(jī)視覺乃至整個(gè)人工智能的發(fā)展都是最大的功臣之一。
今年初,李飛飛來到北京參加活動(dòng)。接受采訪時(shí),她會(huì)以“說實(shí)話我對AlphaGo 并不是特別了解”、“我沒有看過《西部世界》”、“我沒有看過《最強(qiáng)大腦》”、“我沒有讀過《失控》那本書”等句子來開場。李飛飛坦承,她不是一個(gè)特別關(guān)注熱點(diǎn)的人,“我個(gè)人的心得是,眼睛看到的前方應(yīng)該是比較空曠的。如果你眼睛看到的前方是熱鬧的,那這個(gè)方向就不是最好的研究方向。而空曠的地方一般都不是熱點(diǎn),因此你必須找準(zhǔn)自己的焦點(diǎn)。如果我關(guān)注熱點(diǎn),就沒有今天的ImageNet?!比欢怯泻芏嘞窭铒w飛這樣在冷板凳上鉆研數(shù)十載的科學(xué)家,才成就了今天人工智能的熱點(diǎn)。
這次加入Google,李飛飛并沒有離開斯坦福的職位,她利用的是自己兩年的學(xué)術(shù)假期。在美國的大學(xué)里,教授每7年可以享受一次為期一年的假期。從默默埋首實(shí)驗(yàn)室到移步工業(yè)界,李飛飛說她希望“將人工智能技術(shù)民主化”,就是讓更多人可以受惠于技術(shù)進(jìn)步。那為什么選擇了Google呢?她回答:“Google云部門本身以及Google的數(shù)據(jù),對應(yīng)人工智能技術(shù)有很大的幫助?!?/p>
Q=楊瀾A=李飛飛
Q:所謂的深度學(xué)習(xí),包括研究者對機(jī)器的訓(xùn)練嗎?怎樣實(shí)現(xiàn)的呢?
A:最早期的深度學(xué)習(xí)是通過我們supervise training(監(jiān)督培訓(xùn)),每張標(biāo)注的圖片,我們有正確答案,然后把它交給神經(jīng)網(wǎng)絡(luò),比如圖片里是pixel(谷歌手機(jī)),它就開始去搜集pixel的一些樣式。然后它把它放進(jìn)一個(gè)數(shù)學(xué)模型里,然后它得出第一次的答案,因?yàn)樗勒_答案是一只貓,那它就發(fā)現(xiàn)不對,那么我們就通過正確和錯(cuò)誤的答案的這個(gè)差別,來重新去修正一些參數(shù),然后這樣不斷的迭代。成千上萬次后它就得到了正確的答案。
Q:如果看到一張圖片,主角是一只貓,它的背景是個(gè)舊貨市場,或這個(gè)貓?jiān)谧妨硪恢回垺C(jī)器現(xiàn)在有能力來區(qū)別背景和主角,或它們之間的關(guān)系嗎?
A:現(xiàn)在可以,我們已經(jīng)發(fā)展到物體在復(fù)雜的背景前,只要它有合理的大小就能被識別。下一步是不光是識別這張圖片里有一只貓,它也許背景比較亂,這只貓?jiān)谀睦铮覀兡馨阉虺鰜?,這也已經(jīng)達(dá)到了。一只貓追一只狗或另一只貓,我們開始在做這些工作,實(shí)驗(yàn)室上剛推出了一篇論文,就關(guān)于識別運(yùn)動(dòng)和關(guān)系的,但還沒有完全做到,比如貓是什么表情,它們可能往哪走,這些更多的我們還沒做出來。
Q:我看到有個(gè)文章里寫道,對于我們來說很普通的常識,比如一杯水放在桌子上,對于機(jī)器,它很難辨別出杯子和桌子間的關(guān)系,它們是不是長在一起?
A:所以我們?nèi)斯ぶ悄芸茖W(xué)家往往不擔(dān)心人工智能變成終結(jié)者,因?yàn)樗鼈冞B這種基本常識都沒有,人工智能雖然現(xiàn)在很厲害,它通過大數(shù)據(jù)深度學(xué)習(xí),但還是停留在你說我背的階段,你給它大數(shù)據(jù),它記住了,記得還比較聰明,存儲(chǔ)量、計(jì)算量也很大,你再給它一些圖片,它能識別。但一旦進(jìn)入抽象,進(jìn)入對世界的基礎(chǔ)認(rèn)知,包括重力的關(guān)系,杯子和桌子的關(guān)系,你把一個(gè)杯子拿起來,人工智能現(xiàn)在并不能告訴你水會(huì)倒流出來,除非它已經(jīng)看過無數(shù)的圖片,所以確實(shí)它還有很多沒有做到。
Q:你提到有人文關(guān)懷的人工智能,我很贊同,最終無論是誰在研究人工智能,誰在使用,人工智能在為人做什么,其實(shí)它一直是人和機(jī)的交互。聽說你也在特別關(guān)注一些陪護(hù)領(lǐng)域的人工智能的發(fā)展,能介紹一些這方面的情況嗎?
A:其實(shí)這跟我個(gè)人的經(jīng)歷有關(guān),我姥姥已經(jīng)95歲了,我離她很遠(yuǎn),家里人有些也離她比較遠(yuǎn),我們特別關(guān)心她每天的起居,所以大概三年前我就開始思考人工智能真的是走向應(yīng)用場景了,會(huì)對人類社會(huì)造成深遠(yuǎn)的影響。我就思考到醫(yī)療,而我不是第一個(gè),也不是最后一個(gè),很多同事也開始思考醫(yī)療的重要性。首先人類的健康是特別重要的,第二醫(yī)療特別貴,第三醫(yī)療是個(gè)特別數(shù)據(jù)化的問題,人工智能恰恰又特別擅長數(shù)據(jù)問題,而且還有一個(gè)社會(huì)老齡化的問題。所以我就開始和斯坦福醫(yī)學(xué)院合作,我們做了3個(gè)項(xiàng)目去展示人工智能技術(shù)以及計(jì)算機(jī)視覺和機(jī)器學(xué)習(xí)技術(shù)能在3個(gè)不同的場景進(jìn)行一些突破。第一個(gè)場景是重癥醫(yī)療室,ICU里有很多工作,在美國一般是一或兩個(gè)病人有一個(gè)護(hù)士,輪職的12個(gè)小時(shí)看護(hù),護(hù)士醫(yī)生都是不帶停的,美國整個(gè)GDP的1%都用在ICU里邊。ICU里如果出現(xiàn)任何差錯(cuò)就是生命和死亡的問題,所以我們就跟斯坦??茖W(xué)醫(yī)學(xué)院合作,通過modern sensor(現(xiàn)代傳感器)來幫助護(hù)士和醫(yī)生。
Q:那姥姥什么時(shí)候能用上你的技術(shù)?
A:我要努力工作呀。另外一個(gè)場景就是老人院,在西方有很多老人獨(dú)立生活,但在獨(dú)立生活中,家人也好,醫(yī)療工作人員也好,其實(shí)很關(guān)注他們的作息,身體和心理的變化。所以我們也跟舊金山的一個(gè)老人院合作,通過modern sensor和護(hù)士一起了解老人的生活方式,而且可以做一些預(yù)測,這是我們現(xiàn)在關(guān)注的方向。
Q: MIT的人工智能實(shí)驗(yàn)室和斯坦福的人工智能實(shí)驗(yàn)室分別都是兩位女士來領(lǐng)軍的,但在整個(gè)行業(yè)中,女性科學(xué)家的比例究竟有多少呢?
A:非常少,我和Daniela Rus領(lǐng)軍兩個(gè)實(shí)驗(yàn)室,是歷史的巧合,不是常態(tài)。在斯坦福人工智能實(shí)驗(yàn)室,到目前為止我還是唯一的女性教授,我們一共有20多位教授啊。在斯坦福整個(gè)工程學(xué)院,女性教授少于15%。在整個(gè)人工智能領(lǐng)域,女性可能不會(huì)多于10%。
Q:你覺得這種現(xiàn)象需要改變嗎?是像有些人說的女孩子天生就對科學(xué)不怎么感興趣嗎?或是這方面的能力不如男孩子?
A:我覺得需要改變,這不光是女性的問題,是人類的問題。每一項(xiàng)科技都代表我們的價(jià)值觀,如果我們希望科技是一個(gè)樸實(shí)友好的、代表全人類的價(jià)值觀,那誰來承載起它?它包括男性、女性,黑人、白人、黃種人,包括不同領(lǐng)域的人。
我常跟我同事和學(xué)生提一個(gè)很好玩的事,就是你到谷歌的圖片搜索里搜一個(gè)非常簡單的詞grandma(奶奶),就會(huì)發(fā)現(xiàn)第一頁顯示的全是白人的老奶奶,你就想,如果是一個(gè)外星人到我們地球想學(xué)我們地球上的人,問grandma是什么東西呢?一搜看到的就是白人老奶奶。這個(gè)小小的例子可以告訴你,如果科技不引入我們的價(jià)值觀、不引入我們關(guān)懷的一些東西,它不小心就會(huì)只代表一部分人的價(jià)值觀和關(guān)注的事。所以我一直強(qiáng)調(diào),不管是女性還是其他來自不同背景的人,我們一定要參與人工智能,參與科技。如果你相信科技能改變?nèi)祟惖脑挘悄憔蛠?,我們?yīng)該鼓勵(lì)這種參與。