沈志昌 郎 煒 張森娜
?
大數(shù)據(jù)的科普意義
沈志昌1,2郎 煒2張森娜2
1.臺(tái)灣新光三越公司 2.中華科技史學(xué)會(huì)
倘佯在大數(shù)據(jù)沖擊的思想大海中,人們進(jìn)入一個(gè)沒有正確答案且擁有更多復(fù)雜問題的時(shí)代里。面對(duì)多元文化的環(huán)境,必須厘清所獲得的大量信息和數(shù)據(jù),加以判斷、分析、歸納,以期顯現(xiàn)出個(gè)人所需要的生活方向,進(jìn)而做出正確、合理的決斷,才能游走在經(jīng)濟(jì)迅速變化的繩索之上。由于智能型科技的發(fā)展,使得眾人提供信息、共享信息、吸取信息更為便捷。這種由0與1編碼、塑造出來的世界,滿足了人們記憶、聯(lián)系、存取的情感和情緒。然而,用深?yuàn)W算法所撰寫的大數(shù)據(jù),也相對(duì)帶來了令人意想不到的困惑。為了免于沉溺在美麗的神話里,有必要了解大數(shù)據(jù)的科普意義。
大數(shù)據(jù) 相關(guān)性 科學(xué)普及
在文藝復(fù)興時(shí)期,學(xué)者們身處知識(shí)制約的時(shí)代,多用一般的工具來解讀未來,如探索宇宙及人體結(jié)構(gòu)等。與生活在現(xiàn)代的我們相比,他們并沒有本質(zhì)上的差異。隨著智能型裝置、云端技術(shù)的快速發(fā)展,使得以服務(wù)器為主導(dǎo)的大數(shù)據(jù)(big data)不斷涌現(xiàn)。由于互聯(lián)網(wǎng)的連結(jié)和應(yīng)用達(dá)到空前的境界,因而可將過去與現(xiàn)在的信息連結(jié)在一起,并以此預(yù)測(cè)未來發(fā)展的趨勢(shì),甚至以其尋覓未雨綢繆的因應(yīng)之道。
世界知名導(dǎo)演盧貝松拍了一部電影《Lucy》,充分展現(xiàn)人類借由藥物與計(jì)算機(jī)結(jié)合,從而進(jìn)入大數(shù)據(jù)的世界。女主角Lucy,因其體內(nèi)吸收了過量的藥物CPH4,而大幅地開啟了她腦內(nèi)的潛能,由10%逐漸地提升到100%。當(dāng)Lucy的腦內(nèi)潛能不斷上升時(shí),同時(shí)還會(huì)擁有超越一般人的記憶力和學(xué)習(xí)能力。因此,她能夠操控周邊的電子儀器、設(shè)備和物質(zhì),也可以讀取他人內(nèi)心深處的思維、進(jìn)行時(shí)空旅行等。Lucy回到過去,見到了人猿露西,看遍了世界的演化,讓自己覺得擁有神一般的能力。
后來,Lucy慢慢感受到自己身軀的極限,遂請(qǐng)教授設(shè)法與超級(jí)計(jì)算機(jī)連結(jié)。最終,她變成了黑色實(shí)體的USB,內(nèi)存由0與1所形成的大數(shù)據(jù)知識(shí),它們可以延續(xù)著她的生命。如今,智能型手機(jī)已相當(dāng)普遍,每天會(huì)涌入海量的數(shù)據(jù),舉凡食、衣、住、行等信息皆可從手機(jī)中獲得。身處大數(shù)據(jù)的今日,有必要了解“到底什么是大數(shù)據(jù)”。
艾略特曾對(duì)20世紀(jì)60年代的西方社會(huì)做了一番描述,當(dāng)時(shí)的西方社會(huì)好像躺在手術(shù)臺(tái)上的病人,注入了強(qiáng)心針之后,她似乎重新變得生氣勃勃。從前科幻小說中的題材,如今逐步地實(shí)現(xiàn)了。在宇航方面,人們登上了月球、探測(cè)遙遠(yuǎn)的天際,既驚喜又迷惑。生命科學(xué)中脫氧核醣核酸的發(fā)現(xiàn),開啟了人工合成人的可能性。核能和太陽能等新能源的開發(fā)與運(yùn)用,均與計(jì)算機(jī)科技有密不可分的關(guān)系。這些科學(xué)發(fā)展的成就,讓人們?cè)俅误w會(huì)文藝復(fù)興運(yùn)動(dòng)的喜悅。人是無所不能的,應(yīng)該重新思考對(duì)人類、地球,乃至宇宙的認(rèn)識(shí)。
500年前,人們利用帆船航行大海,尋找東方的香料和黃金。而今,則是運(yùn)用互聯(lián)網(wǎng)來尋找黃金和財(cái)富。2008年,美國遭遇金融危機(jī),它是由金融機(jī)構(gòu)運(yùn)用云端技術(shù)所造成的結(jié)果。這場(chǎng)國際金融危機(jī),系以金融創(chuàng)新帶動(dòng)著全球經(jīng)濟(jì)引擎的信用?;诟哳~回報(bào)的預(yù)期,使得詭異虛擬的經(jīng)濟(jì)世界從夢(mèng)想變成夢(mèng)魘,導(dǎo)致全世界的實(shí)體經(jīng)濟(jì)籠罩在此陰影之中。為此,美國總統(tǒng)奧巴馬提出“物聯(lián)網(wǎng)振興經(jīng)濟(jì)”的戰(zhàn)略,并強(qiáng)化感測(cè)技術(shù)和智能型基礎(chǔ)設(shè)施的建置。
2012年,奧巴馬政府認(rèn)為,大數(shù)據(jù)是“未來的新石油”。從大數(shù)據(jù)中提煉出有用的資料,那就是新石油。只要對(duì)海量的數(shù)據(jù)進(jìn)行分析,就能創(chuàng)造出相當(dāng)?shù)慕?jīng)濟(jì)價(jià)值。處在廣大國土的美國民眾,如需購物就要開車采購,因而美國政府重視能源的開發(fā)。如無石油開車,則無法行駛各處,這樣的生活會(huì)苦不堪言。對(duì)美國百姓而言,用石油來描述大數(shù)據(jù)中的黃金島,最為貼切。當(dāng)百姓的生活過不下去時(shí),就會(huì)信心動(dòng)搖,產(chǎn)生危機(jī)。通常,政府當(dāng)局為了解決問題,都會(huì)宣告一個(gè)夢(mèng)幻的國度,讓人們?nèi)计鹣M男判摹?/p>
2008年的經(jīng)濟(jì)危機(jī)起源于一個(gè)“貪”字,時(shí)間一久人們總是會(huì)淡忘它。因?yàn)樯羁偸且^續(xù)過下去,所以自勉“危機(jī)就是轉(zhuǎn)機(jī)”。真是成也IT、敗也IT,借著夢(mèng)想來暫時(shí)性減緩失去的危機(jī)?,F(xiàn)今,從政府到各產(chǎn)業(yè),都已離不開大數(shù)據(jù)。金融機(jī)構(gòu)運(yùn)用云端大數(shù)據(jù),結(jié)果卻又步上了昔日的金融危機(jī)。捷克裔法國作家米蘭·昆德拉在翻閱希特勒書中的照片時(shí),不禁想起了自己的童年。他成長的過程,適逢殘酷的戰(zhàn)爭(zhēng),好幾位親人死于集中營。在他的生命中,這一段失落的時(shí)光,已不復(fù)回歸。NOKIA的廣告詞說得好,科技始終來自于人性。一旦科技抹滅了人性,人們就需要好好思考是否能在大數(shù)據(jù)的科技下駕馭自己的命運(yùn)!
大數(shù)據(jù)泛指云計(jì)算和物聯(lián)網(wǎng)的合體,它是計(jì)算機(jī)相關(guān)產(chǎn)業(yè)應(yīng)用的延伸,其特點(diǎn)不在于數(shù)據(jù)的多寡,而在于人們?nèi)绾问褂糜?jì)算機(jī)軟硬件,以及如何建制綿密的互聯(lián)網(wǎng)結(jié)構(gòu),從海量的數(shù)據(jù)中尋得有用的知識(shí),而非找到正確的答案。
與生活息息相關(guān)的各領(lǐng)域產(chǎn)業(yè)中,都企圖以機(jī)械學(xué)習(xí)與統(tǒng)計(jì)分析等方法,將龐大的資料轉(zhuǎn)化成可獲利的工具。例如,能源和石油探勘、生命科學(xué)基因體、商業(yè)行為分析、多尺度的物理設(shè)計(jì)和制造業(yè)、氣候模型與預(yù)測(cè)、天文、以及數(shù)字內(nèi)容產(chǎn)業(yè)等等。在美國,大部分頂尖資本家和科技精英們對(duì)網(wǎng)絡(luò)蓬勃發(fā)展的討論沸沸揚(yáng)揚(yáng),他們都希望借由控制人人不得不通過的網(wǎng)絡(luò)大發(fā)利市,以及企圖永遠(yuǎn)經(jīng)營世界搜尋引擎、云端運(yùn)算、廣告刊登服務(wù)和社群網(wǎng)絡(luò)等,利用本身不是金礦主人的網(wǎng)絡(luò)群眾,幫忙找到礦坑里的金子。通過美元貨幣,把全球財(cái)務(wù)導(dǎo)入有利于美國避險(xiǎn)基金計(jì)劃的方向。2008年,美國發(fā)生房貸崩解,引發(fā)了金融海嘯,其災(zāi)禍大多起于云端運(yùn)算。
云端運(yùn)算是一種計(jì)算機(jī)運(yùn)算的概念,它呈現(xiàn)了對(duì)人類“經(jīng)驗(yàn)”的“模擬”效果,使我們省去了寶貴的時(shí)間和精力。然而,使用計(jì)算機(jī)的人往往有一種強(qiáng)烈的傾向,要去強(qiáng)調(diào)“模擬”與“經(jīng)驗(yàn)”相似。有時(shí)候,還會(huì)反過來運(yùn)用計(jì)算機(jī)建構(gòu)出來的模型去規(guī)劃真實(shí)經(jīng)驗(yàn)世界的模型。計(jì)算機(jī)運(yùn)用象征符號(hào)間的關(guān)系,來處理多套符號(hào),它們是“信息0、1”的流動(dòng)。那些符號(hào)及規(guī)則的運(yùn)算,可將真實(shí)世界連結(jié)起來,顯示一些具有代表性的意義。許多方程式需要在“大量”的未知點(diǎn)上找到適當(dāng)?shù)臄?shù)值,方能解出方程式演算的結(jié)果,進(jìn)而獲對(duì)真實(shí)世界的代表性做出解釋。
隨著社群媒體、手機(jī)、監(jiān)視器、生產(chǎn)線和各種傳感器等的普及,不同管道的數(shù)據(jù)不斷誕生大量數(shù)據(jù)。例如,當(dāng)進(jìn)行臉書(Facebook)按贊、網(wǎng)頁搜尋、提款機(jī)作業(yè)、信用卡消費(fèi)、醫(yī)療健檢等行為時(shí),暫且不管是否行使同意或不同意的動(dòng)作,都會(huì)有意或無意地提供了該項(xiàng)行為的數(shù)據(jù),將其上傳到網(wǎng)絡(luò)上的各個(gè)數(shù)據(jù)庫內(nèi)。從這些海量的數(shù)據(jù)中,專家們可設(shè)法找出它們之間的關(guān)聯(lián)性,推測(cè)或解出原先看不到的圖像。利用這些整理出來的結(jié)果,商人可借此推估顧客下一步想買的東西,醫(yī)生也可以預(yù)測(cè)病人的身體狀況和癥狀發(fā)展。大數(shù)據(jù)生活中的任何信息,都擁有某種程度的關(guān)聯(lián)性,以擬定的問題架構(gòu),可進(jìn)一步地尋找詮釋的方法。
欲了解消費(fèi)者為何購買某項(xiàng)產(chǎn)品,并不容易。大數(shù)據(jù)強(qiáng)調(diào)相互關(guān)系比因果關(guān)系重要,因而不需要耗費(fèi)精神在事件的因果關(guān)系上,只要能掌握事件發(fā)生過程的相關(guān)性,或許可以略知一二。以醫(yī)學(xué)為例,尋找某種病癥過程中的相關(guān)性,然后再進(jìn)一步尋找病癥與基因間的關(guān)系。為此,列舉兩個(gè)有關(guān)醫(yī)學(xué)的例子,以便了解相關(guān)性的重要。
4.1 健康預(yù)防方面
2014年10月30日,報(bào)紙的標(biāo)題是“牛奶一日3杯,死亡率高1倍”,它是根據(jù)英國醫(yī)學(xué)雜志刊登瑞典烏普薩拉大學(xué)教授麥可森的研究報(bào)告。麥可森提到,在1987—1990年間,針對(duì)61400位婦女,記錄她們的飲食習(xí)慣,進(jìn)行了長達(dá)20年的追蹤與觀察。由于報(bào)告是知名教授所做的研究,所以他的結(jié)果應(yīng)有相當(dāng)?shù)目尚哦?。他說,若婦女一天飲用3杯(約共680cc)以上的牛奶,則死亡率比每天喝不到一杯的人高出1倍,而且還會(huì)增加骨折的現(xiàn)象。雖然他也對(duì)男性做了類似的研究,但觀察的時(shí)間沒有那么長。
根據(jù)麥可森的說法,牛奶似乎變成了毒品了。有些專家認(rèn)為可能是病人已經(jīng)骨質(zhì)疏松,再將死因歸咎于每天大量攝取牛奶。這樣的因果關(guān)系完全顛倒了,因?yàn)楣琴|(zhì)疏松的人易骨折,容易導(dǎo)致死亡。然而,鼓勵(lì)受測(cè)者多喝牛奶,因而導(dǎo)致骨折,這與死亡率增加的“關(guān)聯(lián)性”卻很明顯。因此,多喝牛奶,是否容易骨折,是否會(huì)導(dǎo)致死亡率增加,這才是應(yīng)該關(guān)注的課題,而非該研究的結(jié)論。
4.2 身體檢測(cè)方面
20世紀(jì)60年代末期,美國醫(yī)生對(duì)背痛病人尚無治療對(duì)策。通常,要求病人回家臥床休息。這個(gè)療法雖然簡(jiǎn)單,但卻極為有效。即使不處理,還是會(huì)有90%的病人在7周內(nèi)好轉(zhuǎn)。到了20世紀(jì)80年代末,磁振照影問世后,情況改變了。磁振照影讓醫(yī)生首度能夠透視人體,將脊椎和周邊軟組織的影像看得一清二楚,使得醫(yī)生相信可以做出精確的診斷,找出造成疼痛的病因。然而,當(dāng)看清每一個(gè)細(xì)節(jié)后,反而讓醫(yī)生們很難了解應(yīng)該要注意什么,一時(shí)很難分辨出何者較為重要,何者較不相干。
由于磁振造影技術(shù)能夠讓檢視每一個(gè)細(xì)小組織的缺陷,結(jié)果反而成為包袱,因?yàn)槿毕菡且环N老化過程。信息太多的危險(xiǎn),會(huì)干擾醫(yī)生合理的分析。相關(guān)性與因果性攪和在一起,反而會(huì)使人們困擾、迷失。因?yàn)檎掌宫F(xiàn)的很有說服力,所以就會(huì)延伸出合理的結(jié)論。醫(yī)生想幫疼痛找出一個(gè)解釋,以便厘清生理結(jié)構(gòu)上的病因,再施行手術(shù)來修補(bǔ)。倘若醫(yī)生過于重視磁振造影的信息,則一時(shí)將很難擺脫數(shù)據(jù)應(yīng)該多多益善的迷戀。
上述兩個(gè)例子,主要在強(qiáng)調(diào)相關(guān)性的重要,它不可提供進(jìn)一步研究的方向。健康是大家關(guān)切的,雖然學(xué)者或醫(yī)生擁有令人崇敬的威嚴(yán),但是他們?nèi)魶]有深入地探討相關(guān)性,則很有可能會(huì)做出不負(fù)責(zé)任或錯(cuò)誤的決策。
處于講究速度及崇尚IT推陳出新的消費(fèi)年代,消費(fèi)者隨時(shí)可享有免費(fèi)的粉絲團(tuán)或感同身受的體驗(yàn)環(huán)境。若講求尊重消費(fèi)者主權(quán),則每個(gè)人均有選擇的自由。然而,人們過于習(xí)慣接受快速信息的刺激,大腦根本來不及消化,也會(huì)一時(shí)理不出頭緒,最終只好隨波逐流。
認(rèn)識(shí)大數(shù)據(jù),已不只是興趣,而是一項(xiàng)不可缺少的技能。生活不只是生存,什么知識(shí)都要會(huì)一點(diǎn),它是召喚記憶的煉金術(shù)。大數(shù)據(jù)的神秘性,希臘神話中,赫密斯帶著他的雙蛇雙翼之杖,掌管著商業(yè)、旅游及競(jìng)技等活動(dòng)。他讓神、人進(jìn)入夢(mèng)鄉(xiāng)、也能使沉睡者立刻蘇醒,游走于天地之間。
目前,人們已經(jīng)很難逃離大數(shù)據(jù)所培養(yǎng)的生態(tài)圈。在這樣的生態(tài)圈里,人們會(huì)在有意無意間碰到切身利益與顧及道德不能兩全的情形。有時(shí)候,為了切身的利益,人們可能會(huì)犧牲道德的規(guī)范,甚至陷害別人,終至道德“江河日下”。日常生活中,粗茶淡飯便可生存。然而,一旦道德規(guī)范匱乏,難免成為“率獸食人”。現(xiàn)今的大數(shù)據(jù)生活,正在考驗(yàn)人們的智慧,如何有效地掌握道德規(guī)范。
[1] 顏瓊玉, 莊雅茜. 一次看懂大數(shù)據(jù)的威力[J]. 商業(yè)周刊,2014(1410).
[2] 沈志昌, 劉宗平. 大數(shù)據(jù)始祖——哥白尼[J]. 中華科技史學(xué)會(huì)學(xué)刊, 2014 (19):70-74.
[3] 徐葆耕. 西方文學(xué)——心靈的歷史[M]. 新竹:臺(tái)灣清華大學(xué)出版社, 1990.
[4] 杰容·藍(lán)尼爾. 周宜芳, 譯. 別讓科技統(tǒng)治你[M]. 臺(tái)北:天下遠(yuǎn)見出版公司,2011.
[5] 米蘭·昆德拉著. 韓少功、韓剛合, 譯. 生命中不能承受之輕[M]. 臺(tái)北:時(shí)報(bào)文化出版公司,1990.
[6] 王偉仲. 開創(chuàng)科學(xué)計(jì)算的研究與職場(chǎng)生涯[J]. 數(shù)學(xué)傳播季刊,2014, 38(2): 12-22.
[7] 黃文璋. 統(tǒng)計(jì)里的關(guān)系[J]. 數(shù)學(xué)傳播季刊, 2007, 31(1): 49-67.
[8] 雷勒. 楊玉齡, 譯. 大腦決策手冊(cè)——該用腦袋的哪個(gè)部分做決策?[M]. 臺(tái)北:天下遠(yuǎn)見出版公司,2010.
[9] 陳雅雯. 蛇的原型意象研究[J]. 成大宗教與文化學(xué)報(bào),2013(20): 111-146.