記=本刊特約記者 姚尚汶 羅 旭
A=安德雷斯·韋思岸(Andreas Weigend)
他曾任美國互聯(lián)網(wǎng)巨頭亞馬遜公司首席科學(xué)家兼CTO,如今是阿里巴巴集團的全球顧問;他在斯坦福大學(xué)、加州大學(xué)、上海交通大學(xué)等高校任職,發(fā)表超過100篇機器學(xué)習(xí)技巧應(yīng)用的科學(xué)文獻;他還是諸多創(chuàng)業(yè)公司,以及世界經(jīng)濟論壇的顧問,被業(yè)內(nèi)人士譽為“大數(shù)據(jù)的鼻祖”。他是安德雷斯·韋思岸(Andreas Weigend)。
這樣一位行業(yè)大牛,年過半百仍活力充沛,一路從北美洲來到亞洲。記者有幸跟隨著他,聽他暢談對數(shù)據(jù)教育的看法,以及對未來世界的預(yù)測。在他眼里,數(shù)據(jù)的意義歸根究底是一個字——人。
記:您曾在亞馬遜公司任職,還在高校教授過電子商務(wù)、大數(shù)據(jù)等相關(guān)課程。您能聊聊自己過去的工作經(jīng)歷嗎?
A:有一晚我在家,電話響起,有人問我愿不愿意進入亞馬遜與杰夫·貝佐斯(Jeff Bezos,亞馬遜創(chuàng)始人及現(xiàn)任董事長兼CEO)一起工作。我當(dāng)時對進入大公司不感興趣,因為我喜歡自己獨立做事情,不想受他人控制,也不想告訴別人我在做什么。這樣一種思考人生的方式,跟多數(shù)人對于職業(yè)生涯的想象很不同:進入大公司,努力地、慢慢地在公司里爬升。但后來我還是被說服進入亞馬遜,也很榮幸能與貝佐斯一起工作。
過去十年我都在教書,因為教育是最重要的事業(yè);我也寫了一本書——《大數(shù)據(jù)和我們》;同時還與眾多大公司、中小企業(yè)及新創(chuàng)團隊合作。這些工作經(jīng)歷看起來很碎片化,但核心在于:我只做自己并保有好奇心。我真正好奇的是人,以及如何透過數(shù)據(jù)去了解人類行為。
記:后來您來到中國,擔(dān)任了阿里巴巴的全球顧問。這又是一段怎樣的經(jīng)歷呢?
A:2001年,馬云雇用我作為他的“數(shù)據(jù)教練”,因為他想要了解數(shù)據(jù)科學(xué)。他對數(shù)據(jù)是如此癡迷,甚至跟我說不要稱呼他為Jack Ma,而是“Data Ma” (數(shù)據(jù)馬)。我倆都有一個共識,就是世界變化太快了。之前,我和馬云對于“移動電話”沒有任何概念,直到2007年史蒂夫·喬布斯(Steve Jobs)發(fā)明了蘋果手機(iPhone),我們覺得那簡直是不可置信的點子。
記:科技發(fā)展給世界帶來了天翻地覆的變化。您不斷提到數(shù)據(jù)的重要性。作為數(shù)據(jù)科學(xué)的代表人物,在您眼中,“數(shù)據(jù)”究竟指什么?
A:每天起床,你做的第一件事是什么?我想多數(shù)人是看手機、看微信。這樣的操作讓騰訊公司知道你何時醒來,電信公司也會知道你何時醒來,因為你是通過基站連接微信。也許你醒來做的第一件事不是看手機,而是走進廁所開燈,那么電力公司設(shè)置的智能機器可以通過傳輸?shù)臄?shù)據(jù)知道你用了哪些電器;或者早起時,你在廚房喝了一杯咖啡,電力公司一樣能透過咖啡機的電能消耗數(shù)據(jù)知道你喝了多少毫升的咖啡。這些故事的重點在于:我們沒有隱私,數(shù)據(jù)無處不在,總是與我們在一起。
記:看來我們被數(shù)據(jù)包圍,自己留下的、被他人記錄和分析的數(shù)據(jù)多得超乎想象。關(guān)于數(shù)據(jù),大家還有另一個看法,就是“比起人類的判斷,數(shù)據(jù)是不會出錯的”。您怎么看待這種說法?
A:對于這個問題,我不知道答案,但必須去試,才知道數(shù)據(jù)會不會出錯。銀行可以根據(jù)不同的條件算出某人貸款的還款幾率。假設(shè)你是銀行的員工,一位單身媽媽走進銀行說自己打算貸款。她有兩個孩子,但她曾因為養(yǎng)育孩子中止了學(xué)業(yè),目前也沒有穩(wěn)定工作。這時,你該說“抱歉,我們不能給你貸款,因為沒有任何數(shù)據(jù)證明你在未來能夠償還”還是 “這種情況真是糟糕,也許我們該給你一次機會”?我們是應(yīng)該殘忍地相信通過數(shù)據(jù)計算出的還貸幾率,還是做決定時更加人道?我沒有答案。
記:您曾說“教育是最重要的事業(yè)”,而您本人也曾經(jīng)在歐洲、美洲和亞洲教過不同的學(xué)生。您覺得學(xué)生在高中階段最重要的學(xué)習(xí)內(nèi)容應(yīng)該是什么?
A:現(xiàn)在,我們活在一個容易得到答案的時代,所以我覺得判斷答案真假的能力其實才是更重要的。當(dāng)你拋出關(guān)鍵詞,搜索網(wǎng)站將回復(fù)無數(shù)個解決問題的答案,正確答案能很容易地被獲取,然而錯誤的也是。所以,評估答案的正確性比給出正確答案還要重要。在亞馬遜,我常說給出一項推薦很容易,但評估一項推薦很難。因為網(wǎng)站可以很容易地推薦某商品給你,但我們必須要思考什么是好的推薦,分析這項推薦是好還是壞。
記:提問勝過解答,這是您強調(diào)的學(xué)習(xí)內(nèi)容。那么,青少年要怎樣才能提出好的問題?
A:如何提出好的、恰當(dāng)?shù)膯栴}?如何以創(chuàng)造力去回答問題?我認為根源都來自于好奇心。我們需要讓中學(xué)生對自己身處的世界、自己創(chuàng)造的數(shù)據(jù)、大數(shù)據(jù)公司使用的數(shù)據(jù)感到好奇。我很幸運,有個物理學(xué)家父親,他時常帶我和兄弟們?nèi)ド⒉?,并沿路指著東西告訴我們有什么問題要問。因為與他人的問題相比,人們總是會對自己提出的問題更感興趣。在學(xué)校中,所有題型都難以令人興奮,比如物理課上,你靠著紙與筆能獲得答案,但有了計算機以后,這就不重要了。重要的是,當(dāng)你迅速得到答案之后,能不能再提出下一個問題。
記:除了好奇心,您覺得中學(xué)生還需要具備什么能力?
A:除了好奇心外,我覺得中學(xué)生還要學(xué)的是“信息素養(yǎng)(Data Literacy)”。中學(xué)生不僅要學(xué)習(xí)生物學(xué)、地球科學(xué)、社會學(xué),還應(yīng)該學(xué)信息科學(xué),尤其是信息科學(xué)的閱讀能力!信息科學(xué)的閱讀能力是指:你看見紙上的符號,從而理解和創(chuàng)造意義。舉例而言,我看著高鐵時刻表,然后思考和推演,進而決定我必須在1月2日下午1:30前抵達高鐵站才能趕上火車,并順利地在規(guī)定時間內(nèi)到達目的地。這就是所謂的閱讀能力——你不需依賴他人解釋就能獨自理解其意義。網(wǎng)絡(luò)上充斥著各種信息,而你需要信息閱讀能力去分辨出差別,為我所用。
信息素養(yǎng)還包含“詮釋信息的能力”。我說的“詮釋”,不僅是指看一份地圖,知道某間餐廳在哪、怎么走,而且是指如何更好地理解和使用信息。記得我第一次來到亞洲,進入一間月餅店,不懂中文的我開始思考:“商家會用什么方式去標記蛋黃口味、豬肉口味以及牛肉口味的月餅?”我構(gòu)思出一個“理論”:如果包裝上有黃色標記,那應(yīng)該是蛋黃口味。當(dāng)我告訴中國朋友這個想法時,他卻說:“這還用想,包裝上面肯定會有中文寫著它們各自的口味!”我覺得這樣理解信息的經(jīng)驗很有趣:如果不識字,只能絞盡腦汁用某種巧合去詮釋;但識字的人,相對于你占有更多優(yōu)勢,因為他知道“葫蘆里究竟賣的是什么藥”。
記:要怎樣做才能更好地具備信息素養(yǎng)呢?
A:有時記者會在新聞標題上加入一個大大的“73%”——其實這就是沒有信息素養(yǎng)的例子。因為他們不理解這個數(shù)字本身是沒有任何意義的,也許73%改成71%或79%也沒有任何不同。許多人也是一樣,對于有效數(shù)字(Significant Digits)并沒有任何概念,所以我認為不濫用數(shù)字,是邁向信息素養(yǎng)的第一步。
還有一點很重要:知道什么是重要的,什么不是。舉例而言,我不懂中文,所以當(dāng)我看著“王”和“玉”,無法辨認“玉”的那一點究竟是什么意義。假設(shè)“王”的左下角出現(xiàn)了一些墨跡,那它應(yīng)該被叫做“王”還是“玉”?我對中文的無知程度,和那些只將“73%”擺在頭條的記者對于數(shù)據(jù)一樣,不知道什么是重要的。
昨天我做了次腳底按摩,剛好那時候我餓了,就想叫一份水餃外賣。然而當(dāng)我詢問店主時,他只簡短回復(fù)我:“不?!碑?dāng)時我有些氣憤,因為我以為店主不愿意讓我們點外賣是為了讓我以高價買他們的雞湯,我不喜歡這種壟斷行為。然而等到按摩結(jié)束后,我才發(fā)現(xiàn)店家已經(jīng)為我們準備好了附贈的雞湯與果凍,我根本不需要另外點一份水餃,這才是他說“不”的真正原因。我頓時感到羞愧。這個故事并不是告訴大家要相信人性的光明面,而是指當(dāng)你在異鄉(xiāng)旅行時,要意識到自己的感知有可能是錯誤的,而且錯誤會傳播,這也是數(shù)據(jù)素養(yǎng)中很重要的一部分。
記:那么這種辨別數(shù)據(jù)的素質(zhì)可以怎樣運用到實際生活和工作中呢?
A:我們要學(xué)會分辨“可能的、可行的、不可行的以及不可能的”??尚械囊馑际恰昂苡锌赡馨l(fā)生”;不可行的意思是“可能,但幾率不高”;不可能的意思是“真的沒任何機會”。舉例而言,把沙發(fā)從緊閉式窗戶丟出去是不可行的,而砸破窗戶后就可以做到,但幾率不大。所以這件事是“不可行”,而不是“不可能”,你在做之前要有所判斷。
我欣賞嘗試,也欣賞錯誤的發(fā)生,因為這給了包容多樣性一次機會,還能讓人從錯誤中學(xué)習(xí),這種心態(tài)正是信息教育所需要的。在谷歌,當(dāng)員工能夠糾正上層的錯誤時,他是會獲得獎賞的,這是谷歌的工作態(tài)度。