文|匡文波
匡文波:大數(shù)據(jù)熱的冷思考
文|匡文波
編者按:大數(shù)據(jù)時(shí)代新聞表達(dá)形式會(huì)發(fā)生哪些改變?新聞學(xué)教育體系會(huì)做出哪些相應(yīng)改變?數(shù)據(jù)新聞的興起會(huì)給傳統(tǒng)媒體的新聞采編人員帶來哪些挑戰(zhàn)和機(jī)遇?6月27日至28日,“大數(shù)據(jù)與全球傳播變革”國際學(xué)術(shù)研討會(huì)在河北大學(xué)召開,來自中國人民大學(xué)新聞學(xué)院博士生導(dǎo)師匡文波、河北大學(xué)新聞傳播學(xué)院教授陶丹等專家各抒己見,共商數(shù)據(jù)新聞引發(fā)的數(shù)據(jù)思考。
匡文波:中國人民大學(xué)新聞學(xué)院教授、博士生導(dǎo)師。
大數(shù)據(jù)本是一個(gè)技術(shù)詞匯,但是卻成為了社會(huì)熱點(diǎn)名詞。在這個(gè)大數(shù)據(jù)爆炸的時(shí)代,數(shù)據(jù)分析似乎無所不能,從商業(yè)、體育、醫(yī)療到軍事領(lǐng)域,大數(shù)據(jù)分析都在大顯身手。但是,大數(shù)據(jù)不是萬能的;而且大數(shù)據(jù)是把“雙刃劍”,國家和企業(yè)因大數(shù)據(jù)獲益的同時(shí),個(gè)人隱私的保護(hù)卻從此變得更加艱難。
大數(shù)據(jù)技術(shù)給作戰(zhàn)指揮帶來新的機(jī)遇,但若認(rèn)為“有數(shù)據(jù)就夠了,數(shù)據(jù)會(huì)說話”則是片面的。大數(shù)據(jù)的價(jià)值應(yīng)該被認(rèn)同,但不應(yīng)被夸大,看到優(yōu)勢一面的同時(shí)也要看到劣勢一面。一句話,大數(shù)據(jù)不是萬能的,如果我們盲從大數(shù)據(jù),就容易產(chǎn)生“大錯(cuò)誤”,出現(xiàn)大問題。
首先是結(jié)果不確定。數(shù)據(jù)量的大幅增加會(huì)造成結(jié)果的不準(zhǔn)確,來源不同的各種信息混雜在一起會(huì)加大數(shù)據(jù)的混亂程度,導(dǎo)致出現(xiàn)錯(cuò)誤發(fā)現(xiàn)的風(fēng)險(xiǎn)增加。
其次是邏輯無規(guī)律。大數(shù)據(jù)能夠提高指揮效率、加快獲取情報(bào)、加速信息處理,然而數(shù)據(jù)量的增大會(huì)帶來規(guī)律的喪失和嚴(yán)重失真。據(jù)運(yùn)行過程中不同的數(shù)據(jù)會(huì)相互融合,發(fā)生變異得到新的數(shù)據(jù),以至于很難發(fā)現(xiàn)事件背后的規(guī)律。
第三,大數(shù)據(jù)是對過去已發(fā)生的事件進(jìn)行經(jīng)驗(yàn)總結(jié),本身不具備創(chuàng)新性。數(shù)據(jù)偏愛潮流,忽視杰作。當(dāng)大量個(gè)體對某種文化產(chǎn)品迅速產(chǎn)生興趣時(shí),數(shù)據(jù)分析可以敏銳地偵測到這種趨勢。
第四,數(shù)據(jù)不懂社交。人的大腦懂得社會(huì)認(rèn)知。計(jì)算機(jī)數(shù)據(jù)分析擅長的是測量社會(huì)交往的“量”而非“質(zhì)”。大數(shù)據(jù)不可能捕捉到你心底對于那些一年才見2次的兒時(shí)玩伴的感情,更不必說但丁對于僅有兩面之緣的貝阿特麗斯的感情了。因此,在社交關(guān)系的決策中,不要愚蠢到放棄頭腦中那臺充滿魔力的機(jī)器,而去相信你辦工作上的那臺機(jī)器。
第五,數(shù)據(jù)不懂背景。人類的決策不是離散的事件,而是鑲嵌在時(shí)間序列和背景之中的。經(jīng)過數(shù)百萬年的演化,人腦已經(jīng)變得善于處理這樣的現(xiàn)實(shí)。數(shù)據(jù)分析則不懂得如何敘事,也不懂得思維的浮現(xiàn)過程。人們的決定并不是僅僅基于離散的事件的,它往往是基于前后關(guān)聯(lián)的情景的。而大數(shù)據(jù)分析則很難分析清楚就算最簡單的小說里的線索和各種前后關(guān)系。
第六,大數(shù)據(jù)產(chǎn)生過多的發(fā)現(xiàn),并產(chǎn)生虛假的關(guān)聯(lián),會(huì)引導(dǎo)我們作出錯(cuò)誤的結(jié)論。
數(shù)據(jù)時(shí)代給個(gè)人隱私保護(hù)帶來的挑戰(zhàn)主要表現(xiàn)在:
2.1 窺視與監(jiān)視
洛杉磯警察局和加利福尼亞大學(xué)合作利用大數(shù)據(jù)預(yù)測犯罪的發(fā)生;谷歌流感趨勢利用搜索關(guān)鍵詞預(yù)測禽流感的散布。而商家利用這些數(shù)據(jù),可以對消費(fèi)者的喜好進(jìn)行判斷,預(yù)估用戶的需求,從而提供一些比較獨(dú)特的個(gè)性化服務(wù)。這一塊的應(yīng)用,還包括百度利用搜索記錄進(jìn)行推薦,包括逐漸完善的Google Now。
但是在這些人性化的背后,是令人戰(zhàn)栗的隱私安全。你在互聯(lián)網(wǎng)上分享出來的各種信息,很有可能會(huì)在明天成為黑客攻擊你的最后一根稻草。如果這些數(shù)據(jù)都是某個(gè)人產(chǎn)生的,而不法分子的目的也是針對這個(gè)人的,那這個(gè)人的過去以及未來,近乎是“全裸”在別人面前,這樣的結(jié)果你想要嗎?而會(huì)有什么樣的結(jié)果你能預(yù)料到嗎?是的,我相信上段時(shí)間好萊塢女明星私密照泄露事件,不僅僅是蘋果的問題,也還有那些女明星自己對互聯(lián)網(wǎng)隱私保護(hù)不力的原因。
2.2 隱私信息披露與未經(jīng)許可的商業(yè)利用
大數(shù)據(jù)帶來的不僅是各種便利及機(jī)會(huì),同樣也會(huì)讓我們時(shí)刻都暴露在“第三只眼”之下。
在荷蘭,許多使用“TomTom”牌導(dǎo)航儀的司機(jī)發(fā)現(xiàn),生產(chǎn)商將導(dǎo)航儀記錄下來的數(shù)據(jù)信息打包賣給了荷蘭政府,警察根據(jù)數(shù)據(jù)顯示的司機(jī)駕駛習(xí)慣,在那些最可能“創(chuàng)收”的地方設(shè)置了限速“陷阱”,不少司機(jī)都因此“中招”。此事被曝光后,TomTom公司的CEO公開道歉。
淘寶、京東、亞馬遜網(wǎng)站監(jiān)視我們的購物習(xí)慣,百度、谷歌監(jiān)視著我們的網(wǎng)頁瀏覽習(xí)慣,而微博竊取著我們的社交關(guān)系網(wǎng)。在各種機(jī)構(gòu)搜集數(shù)據(jù)的同時(shí),普通人的各種私人信息也會(huì)成為被收集的數(shù)據(jù)。在哪里使用了購物卡、租用汽車等等,這些信息都會(huì)被收集起來。
這些私人信息被收集起來后會(huì)供給誰使用?會(huì)繼續(xù)保持匿名,還是在使用后被刪除?曾經(jīng)有公司宣布要通過“臉譜”、推特和其他社交網(wǎng)站收集的信息分析個(gè)人的貸款信譽(yù),結(jié)果引發(fā)了民眾的抗議,這個(gè)計(jì)劃最終被取消。
當(dāng)大數(shù)據(jù)應(yīng)用軟件細(xì)化和明確到每個(gè)人的數(shù)據(jù)時(shí),企業(yè)就可以針對每個(gè)人的喜好來進(jìn)行非常具體的營銷。例如,如果某人在社交網(wǎng)站上表示自己喜歡某個(gè)品牌某個(gè)款式的牛仔褲,那么百貨商店就可以在此人下一次進(jìn)入該品牌專柜時(shí)向他的手機(jī)發(fā)送該款式的優(yōu)惠券。也許零售商和部分消費(fèi)者會(huì)喜歡這種促銷模式,但是其中涉及的隱私泄露也是非??膳碌?。
許多公司都會(huì)標(biāo)明收集的信息是“匿名”的,但信息越多,被對號入座的可能性就越大。
2.3 歧視
個(gè)人健康信息等隱私的泄露,會(huì)導(dǎo)致歧視的發(fā)生。
大數(shù)據(jù)是好的時(shí)代,也是壞的時(shí)代:如果免費(fèi)檢測基因的公司拿到了個(gè)人的健康隱私數(shù)據(jù),就能精準(zhǔn)地推銷醫(yī)藥產(chǎn)品,建立點(diǎn)對點(diǎn)的商業(yè)模式,這對公司是一個(gè)黃金時(shí)代。但如果大數(shù)據(jù)被污染了,也就是說,數(shù)據(jù)被人為操縱或注入虛假信息,據(jù)此作出的判斷就會(huì)誤導(dǎo)人們。
2.4 隱私信息的惡意使用
隱私信息的泄露,會(huì)導(dǎo)致詐騙頻發(fā)。個(gè)人隱私泄露的頻繁發(fā)生威脅到個(gè)人的生活安全,成為影響社會(huì)治安的主要因素,如:電信詐騙、個(gè)人或交友圈信息泄露后的身份冒充、購物信息泄露后冒充賣家詐騙。隱私信息的泄露,最典型的案例就是人肉搜索。
今日的手機(jī),絕非移動(dòng)電話,而是手機(jī)是具有通信功能的迷你型電腦。由于手機(jī)24小時(shí)不離身,已經(jīng)成為了隱私泄露最危險(xiǎn)的智能終端。
2014年夏天,小米智能手機(jī)被曝搜集并向其服務(wù)器傳輸用戶個(gè)人信息事件被炒得沸沸揚(yáng)揚(yáng)。此事一出,立即在博客圈引發(fā)熱烈討論。幾番升級之后,此事似乎淡出了人們的視線?,F(xiàn)在,臺灣“國家通訊傳播委員會(huì)”又把此事帶回公眾視野。該委員會(huì)8日稱,小米智能手機(jī)或仍在不知不覺中向其服務(wù)器傳送用戶數(shù)據(jù)。
今日的手機(jī),不僅成為了偷拍利器,而且手機(jī)暴露用戶的位置信息??萍既請?bào)2015年5月7日報(bào)道,美國科研人員日前開發(fā)出一種具備厘米級精度的定位系統(tǒng)。該系統(tǒng)基于GPS信號,用較低的成本就能將手機(jī)等移動(dòng)設(shè)備的定位精度提高上百倍,將誤差的尺寸從汽車一般大縮小到硬幣一樣小。這一技術(shù)為人們?nèi)粘I顜砀啾憷?,如厘米級精度的GPS可能會(huì)導(dǎo)致更好的車聯(lián)網(wǎng)技術(shù),讓車與車交流發(fā)生革命性的變化。如果你的車能夠知道盲點(diǎn)處來車的精確位置和速度,就能提前反應(yīng),避免碰撞。但是,手機(jī)精確定位技術(shù)也是個(gè)人位置信息等隱私信息保護(hù)的噩夢。
蘋果今年發(fā)布了可穿戴設(shè)備Apple Watch,它的發(fā)布很有可能將各種大大小小的可穿戴設(shè)備普及開來。這種普及是好事,因?yàn)樗軌蚪o用戶帶來各種便利,但它健康狀況記錄、運(yùn)動(dòng)追蹤(GPS)等功能則給互聯(lián)網(wǎng)隱私帶來了更大、更多的挑戰(zhàn)??纱┐髟O(shè)備由于體積小,所以語音就成了這些設(shè)備最主要的交互方式,這也就使得一些設(shè)備會(huì)記錄用戶的聲紋數(shù)據(jù)。但如果聲紋隱私無法得到保護(hù),現(xiàn)在的聲音合成軟件又到處都是,那么肯定會(huì)有不法分子利用你的聲音去詐騙。試想下,如果有親友在QQ上向你借錢,你的第一反應(yīng)肯定是通話驗(yàn)證下是否真假,如果不法分子用聲紋信息合成的聲音,這時(shí)你還能辨別得了?
這還不是最致命的,最致命的是你的喜怒哀也盡被人掌控。除了家人、醫(yī)生和競爭對手,還有誰會(huì)關(guān)心我們的心率是否正常?但請別忽視這個(gè)問題。一旦將心跳數(shù)據(jù)與其它數(shù)據(jù)相結(jié)合,所能泄露的秘密遠(yuǎn)遠(yuǎn)超出我們的想象。試想,攻擊者可以實(shí)時(shí)聽到我們的語音,并能實(shí)時(shí)了解我們的心跳,那么我們就會(huì)像在《尼基塔》中被阿曼達(dá)用專業(yè)儀器測謊的艾麗克斯一樣。區(qū)別在于,攻擊者躲在暗處,而我們對這種“測謊”毫無戒備。結(jié)合智能手環(huán)的心跳數(shù)據(jù)和智能眼鏡的實(shí)時(shí)影像,攻擊者可能比我們自己更了解我們的真實(shí)情感——喜怒哀樂等。我們這個(gè)時(shí)代,強(qiáng)調(diào)云、強(qiáng)調(diào)大數(shù)據(jù),我們的這些健康數(shù)據(jù)雖然是記錄在自己的設(shè)備上,但最終多多少少會(huì)被上傳到云中。如果有權(quán)限查看你數(shù)據(jù)的人別有用心,那么他只要記下與你談話的時(shí)間再結(jié)合這些數(shù)據(jù),你在生活中就有時(shí)刻被監(jiān)視的可能性。
除了這些外,可穿戴設(shè)備上的GPS傳感器也是種威脅,它泄露了用戶個(gè)體的行蹤,讓你無處可藏。
筆者并不是要批評大數(shù)據(jù)不是一種偉大的工具。只是,和任何一種工具一樣,大數(shù)據(jù)有拿手強(qiáng)項(xiàng),也有不擅長的領(lǐng)域。