魏忠
十幾年前,我剛進(jìn)高校工作,一件事情讓我決定從此在我所在的交通運(yùn)輸規(guī)劃領(lǐng)域不再發(fā)表學(xué)術(shù)論文——我去聽(tīng)取學(xué)校一位權(quán)威教授的碩士答辯,該學(xué)生以一年前的8月25日和一年后的8月25日兩天進(jìn)行交通規(guī)劃研究,證明了一個(gè)非常復(fù)雜嚴(yán)肅的論證,我打開(kāi)電腦查了一下,發(fā)現(xiàn)這兩天一個(gè)是周五,一個(gè)是周三,而上海的周三和周五是交通流量完全相反的,于是我便說(shuō):“你表面是非常嚴(yán)肅的證明,而事實(shí)上不關(guān)心真相,不就成了扯淡嗎?”事后,我被人嚴(yán)肅地提醒要注意言語(yǔ)分寸。
又過(guò)了一年,我?guī)е晃唤?jīng)濟(jì)學(xué)家去佘山旅游,由于封路避行恰巧發(fā)現(xiàn)我們的學(xué)生正在佘山進(jìn)行交通測(cè)試,帶頭的又是某位知名教授的學(xué)生,我記得非常清楚,那天是5月19日,由于特殊活動(dòng)佘山封路,學(xué)生們說(shuō)這樣非常方便他們測(cè)量日常的交通流量。然而,封路與正常流量又完全不同,做交通課題卻找封路時(shí)候去做流量測(cè)試,狗P。
今天我可以說(shuō)我為什么不寫(xiě)“學(xué)術(shù)論文”了:我是搞信息的,至少在我研究的領(lǐng)域“扯淡”“狗P”是很?chē)?yán)肅的學(xué)術(shù)詞匯,并不是罵人。他們都是英文的一個(gè)詞“Bullshit”,看起來(lái)是有些憤怒和粗魯,但確實(shí)是指那些“公然罔顧事實(shí)和邏輯的語(yǔ)言、統(tǒng)計(jì)數(shù)據(jù)、圖表,以及其他呈現(xiàn)方式”,它們的目的是讓受眾留下深刻印象并且讓人難以抗拒,而反扯淡和駁斥狗P指的是“公開(kāi)批駁有問(wèn)題的東西”。駁斥的對(duì)象其實(shí)比狗P更廣,還可以包括謊言、背叛、詭計(jì)和不公。這個(gè)詞匯,是由時(shí)任普林斯頓大學(xué)哲學(xué)系主任、全球最具影響力的哲學(xué)家之一的G·法蘭克福發(fā)掘的,2005年他發(fā)表了On Bullshit一書(shū),該書(shū)成為亞馬遜十大暢銷(xiāo)書(shū)之一,法蘭克福認(rèn)為:扯淡不完全是撒謊,掩蓋真相,而是根本不關(guān)心真相,扯淡不僅是反真相的,而且更嚴(yán)重的是它是反價(jià)值的,扯淡會(huì)消磨掉人類(lèi)嚴(yán)肅說(shuō)出的各種價(jià)值,進(jìn)而解構(gòu)各種具有價(jià)值的事情和生活,這才是扯淡的最大危害。法蘭克福的On Bullshit的中文譯名就是《論扯淡》,這個(gè)名字還是比較含糊的,而英文如果直譯,就是“狗P、牛糞、狗屎”。
2015年,我女兒所在的華盛頓大學(xué)的兩位教授(一位生物學(xué)教授、一位信息學(xué)教授)在網(wǎng)絡(luò)上相繼開(kāi)了一門(mén)課,就叫“大數(shù)據(jù)時(shí)代如何辨別狗P”,幾年后這門(mén)課成為大學(xué)的正式課程。從該課的宗旨和目標(biāo)來(lái)看,實(shí)際上它就是在大數(shù)據(jù)時(shí)代,如何提高學(xué)生的“信息素養(yǎng)”。
一個(gè)粗俗的詞匯成為了一個(gè)學(xué)術(shù)詞匯,甚至成為一所大學(xué)的正式課程廣受歡迎,并有越來(lái)越多的人認(rèn)識(shí)到它的重要性,那是因?yàn)?,隨著大數(shù)據(jù)和人工智能的發(fā)展,“扯淡”和“狗P”已經(jīng)泛濫成災(zāi)且走向越來(lái)越專(zhuān)業(yè),“狗P們?cè)趯?zhuān)業(yè)地造假,統(tǒng)計(jì)和信息學(xué)家以及科學(xué)家們?cè)跇I(yè)余地辟謠”,即使一些有科學(xué)素養(yǎng)的人其信息素養(yǎng)也未必高到哪里去。好了,現(xiàn)在有了一項(xiàng)專(zhuān)項(xiàng)的課程來(lái)提醒不專(zhuān)業(yè)的信息時(shí)代的螺絲釘:謹(jǐn)防狗P。
其實(shí),“大數(shù)據(jù)時(shí)代辨別狗P”并不難,卻也不簡(jiǎn)單。舉個(gè)例子來(lái)說(shuō),傳統(tǒng)的教師的很多信息素養(yǎng)是通過(guò)類(lèi)似“2/8定律”“250定律”“溫水煮青蛙實(shí)驗(yàn)”“鯰魚(yú)效應(yīng)”“霍桑實(shí)驗(yàn)”來(lái)建立的。華盛頓大學(xué)的這門(mén)課程基本上也采用類(lèi)似的“大數(shù)據(jù)時(shí)代的統(tǒng)計(jì)故事”,通過(guò)12周的課程(華大采用3季3學(xué)期制),就能建立起學(xué)生的信息素養(yǎng)。下面,我簡(jiǎn)要介紹一下12周都講些什么。
第1周:扯淡概論。作者發(fā)現(xiàn)TED上的精彩演講往往采用的是扯淡的藝術(shù)。扯淡和反扯淡最大的問(wèn)題在于成本不對(duì)稱(chēng)。例如,最近國(guó)內(nèi)的幾件扯淡的事情:“港珠澳大橋左行右行嚴(yán)重的設(shè)計(jì)錯(cuò)誤”“醫(yī)生罷工造成死亡率急劇下降”。扯淡者并不一定是數(shù)學(xué)不好或者邏輯有問(wèn)題,而是因?yàn)槠で榫w降低了他們的思考能力;被扯淡者去傳播也未必智商低下,他們并不關(guān)心真相而歡迎結(jié)論。一個(gè)眾所周知的觀點(diǎn)是人一旦進(jìn)入群體中,智商就會(huì)嚴(yán)重降低,這也是為什么傳銷(xiāo)的洗腦課總是能成功地引人而入的主要原因。而更為吊詭的是,人們往往不容易輕信小謊言,卻很容易相信大謊言,19世紀(jì)英國(guó)作家科爾頓說(shuō):“有些騙局布設(shè)得如此巧妙,只有傻子才不受騙上當(dāng)?!蹦切┎荚O(shè)巧妙的往往是大謊言。長(zhǎng)期接受和依賴(lài)謊言的人們當(dāng)中甚至還有在謊言破滅后,自己也加入到維持謊言之中的。
第2周:發(fā)現(xiàn)扯淡。真理和自由一樣,需要永遠(yuǎn)保持警惕。那么如何發(fā)現(xiàn)自己在并不專(zhuān)業(yè)的領(lǐng)域中的扯淡呢?課程中通過(guò)一些簡(jiǎn)單而有趣的統(tǒng)計(jì)學(xué)驗(yàn)證來(lái)提高學(xué)生的信息素養(yǎng)。例如,本福德定律,通過(guò)對(duì)造假數(shù)據(jù)的第一個(gè)有效數(shù)字的分布,識(shí)別科學(xué)研究中的數(shù)據(jù)質(zhì)量。
1945年7月16日上午,世界上第一顆原子彈在美國(guó)新墨西哥州沙漠地區(qū)爆炸。意大利裔美國(guó)物理學(xué)家恩利克·費(fèi)米把筆記本里的一頁(yè)紙撕碎了,一感到震波,他即把舉過(guò)頭頂?shù)淖ブ〖埰氖炙砷_(kāi)。碎紙飄揚(yáng)而下,在費(fèi)米身后2.5m處落地,心算之后費(fèi)米宣布,原子彈能量相當(dāng)于10000tTNT當(dāng)量。費(fèi)米可以這么做,當(dāng)然學(xué)生也可以這么做。
第3周:扯淡分布和扯淡生態(tài)。扯淡經(jīng)常出現(xiàn)的場(chǎng)合是媒體、社交網(wǎng)絡(luò)、政治、道德、宗教場(chǎng)所、新聞發(fā)布和官方宣傳領(lǐng)域,即難以辨別真?zhèn)?、辨別真?zhèn)斡钟新闊┑膱?chǎng)合。例如,轉(zhuǎn)基因的技術(shù)討論,往往演變發(fā)展到道德討論、國(guó)家陰謀、民族種族等扯淡領(lǐng)域,即使國(guó)家也不得不遷就輿情,智者遠(yuǎn)離又使得扯淡的力量空前強(qiáng)大。
第4周:因果關(guān)系。這一周的課程內(nèi)容為相關(guān)與因果、充分與必要、中位數(shù)與平均數(shù)、虛假關(guān)聯(lián)關(guān)系??傮w來(lái)講就是,統(tǒng)計(jì)學(xué)不嚴(yán)格的因果關(guān)系很容易變成人的邏輯的推論扯淡。例如,最有名的膽固醇與心血管病的關(guān)系問(wèn)題。最近科學(xué)發(fā)現(xiàn),正是由于心血管損傷造成大量膽固醇修復(fù)血管,而“壞膽固醇”又堆積在血管造成問(wèn)題。然而,如果減少攝入或者分泌“壞膽固醇”,可能連心血管堵塞的機(jī)會(huì)都沒(méi)有了。統(tǒng)計(jì)學(xué)上的因果倒置需要領(lǐng)域?qū)<?,統(tǒng)計(jì)學(xué)家貿(mào)然進(jìn)入專(zhuān)業(yè)領(lǐng)域會(huì)有很多災(zāi)難性的后果。
第5周:統(tǒng)計(jì)陷阱和欺騙。近年來(lái),統(tǒng)計(jì)陷阱有很多的慘痛教訓(xùn),這些案例讓人記憶深刻的同時(shí)也普及了統(tǒng)計(jì)學(xué)的進(jìn)展。例如,兒科大夫用不嚴(yán)密的一連串統(tǒng)計(jì)學(xué)概率推斷一位死了兩個(gè)孩子的母親殺嬰;維爾羅杰斯效應(yīng)用來(lái)發(fā)現(xiàn)兩個(gè)地域的GDP增長(zhǎng)率平均值只要一個(gè)人移民就可以……通過(guò)這些典型的案例,學(xué)生們可以不必為高大上的貝葉斯類(lèi)的統(tǒng)計(jì)術(shù)語(yǔ)嚇破膽,即使統(tǒng)計(jì)學(xué)家也要明白貝葉斯規(guī)則,也要明白質(zhì)與量不等價(jià)。
第6周:數(shù)據(jù)可視化。利用圖形和人眼誤區(qū)可以產(chǎn)生圖像和圖形誤解,這是所有網(wǎng)民都知道的事實(shí),這門(mén)課的可貴之處在于教學(xué)生使用一些典型的工具去制作這些“扯淡圖形”。利用數(shù)據(jù)可視化造假,我們要知道眼睛對(duì)什么敏感,對(duì)什么不敏感,并不是什么時(shí)候都是眼見(jiàn)為實(shí)的,這些工具包括比例油墨、字符垃圾、誤導(dǎo)軸、夸大比例。
第7周:大數(shù)據(jù)。我在上大學(xué)的時(shí)候,學(xué)過(guò)菲利普斯曲線,說(shuō)的是失業(yè)率與勞動(dòng)生產(chǎn)率的關(guān)系,這是一個(gè)經(jīng)典的經(jīng)濟(jì)學(xué)理論,然而近些年它卻不準(zhǔn)了,這是由于政府都知道了這個(gè)秘密,當(dāng)一個(gè)秘密被知道并作為調(diào)整的目標(biāo)的時(shí)候,就再也不準(zhǔn)了,這就是古德哈特定律。在大數(shù)據(jù)領(lǐng)域最扯淡的案例是“啤酒和尿布的故事”。這件事真?zhèn)螣o(wú)從考究,據(jù)說(shuō)是從沃爾瑪來(lái)的,但是無(wú)論是中國(guó)的沃爾瑪還是美國(guó)的沃爾瑪,我都沒(méi)有發(fā)現(xiàn)啤酒和尿布放在一起。一位超市專(zhuān)家告訴我,即使啤酒尿布成立,也不會(huì)放在一起,那是因?yàn)槟菢蛹炔恍l(wèi)生,也不經(jīng)濟(jì)(若成立,超市會(huì)故意放得遠(yuǎn)遠(yuǎn)的),更不合理(跟超市收銀臺(tái)放在一起的是體積小、利潤(rùn)高的)。很多大數(shù)據(jù)講師也愿意講啤酒和尿布,統(tǒng)計(jì)陷阱和欺騙的目的并不是欺騙,而是這個(gè)故事精彩,而精彩的故事往往會(huì)誤導(dǎo)聽(tīng)眾。
第8周:出版偏見(jiàn)。如果期刊喜歡發(fā)表積極的結(jié)果而不是負(fù)面的結(jié)果,那么即使是一個(gè)盡職盡責(zé)的科學(xué)家群體,也會(huì)產(chǎn)生誤導(dǎo)性的學(xué)術(shù)記錄——就像目前出版環(huán)境中的情況一樣。絕大多數(shù)工程和科技使用的是成熟的技術(shù),而成熟的技術(shù)“科技創(chuàng)新可能很少或者不被人注意”,從傳播學(xué)的角度講,新的技術(shù)和熱點(diǎn)技術(shù)容易引起轟動(dòng)。然而,美國(guó)科學(xué)家發(fā)現(xiàn),“絕大多數(shù)科學(xué)論文都是錯(cuò)的”。錯(cuò)的科學(xué)發(fā)現(xiàn)不一定是科學(xué)家有意為之,很可能某些條件較為苛刻,更重要的原因在于出版偏見(jiàn)。
第9周:掠奪性出版和科學(xué)不端行為。這一周延續(xù)上周的學(xué)習(xí)內(nèi)容,如果有人故意造假,或者出版社靠收取版面費(fèi)為生,后果會(huì)更為嚴(yán)重。例如,哈佛大學(xué)醫(yī)學(xué)院一位教授在2018年10月被辭退,他是著名的心臟權(quán)威,過(guò)去15年偽造15篇論文,被幾萬(wàn)名學(xué)者追蹤研究,學(xué)術(shù)造假手段太隱蔽了,這也是在大數(shù)據(jù)時(shí)代才被發(fā)現(xiàn)。
第10周:所謂胡說(shuō)八道的道德規(guī)范。這一周主要講騷擾和質(zhì)疑的界限以及道德。學(xué)術(shù)領(lǐng)域的事情,盡量用行業(yè)評(píng)價(jià),但如果行業(yè)內(nèi)形成“均衡”了呢?總體上來(lái)講,質(zhì)疑是就事論事,用科學(xué)的方法,不牽涉到道德、宗教、政治、民族。
第11周:假新聞。這一周是上一周內(nèi)容的延續(xù),包括如何判別假新聞、假新聞及其特征。
第12周:駁斥扯淡。從這門(mén)課的目標(biāo)就能看到這一周的主要內(nèi)容:①對(duì)你的信息食譜中出現(xiàn)的狗P保持警惕;②無(wú)論何時(shí)何地遇到狗P,都能夠識(shí)別出來(lái);③能夠準(zhǔn)確說(shuō)明為什么一則狗P是狗P;④能夠在統(tǒng)計(jì)學(xué)或科學(xué)專(zhuān)業(yè)的人面前給出對(duì)狗P的技術(shù)分析;⑤能夠在迷信的阿姨和不自覺(jué)間表露出種族主義的叔叔面前分析狗P,讓他們能聽(tīng)懂,并且有說(shuō)服力。
大數(shù)據(jù)時(shí)代,專(zhuān)業(yè)領(lǐng)域越來(lái)越細(xì),個(gè)人不知道的東西越來(lái)越多,與此同時(shí),人工智能、社交網(wǎng)絡(luò)發(fā)展迅速,處于數(shù)據(jù)洪流中的人,不可能不把自己一部分思維“外包給外腦”,即10年前提出的“人機(jī)協(xié)同時(shí)代”。然而,這個(gè)時(shí)代除了人腦要處理機(jī)器不能處理的每個(gè)人的專(zhuān)業(yè)領(lǐng)域或者人文領(lǐng)域之外,具備對(duì)抗“狗P的一般素養(yǎng)”是異常重要的,而這就是這門(mén)課的重要目的,為這門(mén)課點(diǎn)贊。
2018年在上海的人工智能大會(huì)上,馬云說(shuō):“我不擔(dān)心人工智能時(shí)代機(jī)器會(huì)取代人,而擔(dān)心人類(lèi)思維不再進(jìn)步?!笔堑模闯兜?、反狗P就是第一步,用文明一點(diǎn)的詞匯說(shuō),就是“核心信息素養(yǎng)”。