賈夢(mèng)夢(mèng)
摘 要 當(dāng)前大數(shù)據(jù)在媒介實(shí)務(wù)中的應(yīng)用發(fā)展如火如荼,然而,我國(guó)目前的媒介大數(shù)據(jù)實(shí)踐尚處于摸索階段,仍面臨著多方面的悖論,主要包括數(shù)據(jù)規(guī)模大與數(shù)據(jù)價(jià)值密度低的悖論、數(shù)據(jù)的全面性與真實(shí)度不確定性的悖論、數(shù)據(jù)的開放性與模糊的所有權(quán)的悖論、內(nèi)容生產(chǎn)的便捷性與工業(yè)化傾向的悖論、預(yù)測(cè)的可能與自由意志喪失的悖論、精準(zhǔn)的廣告服務(wù)與媒介消費(fèi)主義的悖論、定向化服務(wù)與信息窄化的悖論等。
關(guān)鍵詞 大數(shù)據(jù);媒介實(shí)務(wù);悖論
中圖分類號(hào) G2 文獻(xiàn)標(biāo)識(shí)碼 A 文章編號(hào) 2096-0360(2017)07-0012-03
“大數(shù)據(jù)”在中國(guó)是從2009年開始,作為一個(gè)技術(shù)熱詞最先在互聯(lián)網(wǎng)圈內(nèi)廣為流傳。在短短幾年時(shí)間內(nèi),大數(shù)據(jù)的媒體格局發(fā)生了巨大變化,被廣泛應(yīng)用到媒介實(shí)踐中?!按髷?shù)據(jù)(Big data),或稱巨量數(shù)據(jù)、海量數(shù)據(jù)、大資料,指的是所涉及的數(shù)據(jù)量規(guī)模巨大到無(wú)法通過人工或者計(jì)算機(jī),在合理的時(shí)間內(nèi)達(dá)到截取、管理、處理、并整理成為人類所能解讀的形式的信息?!盵1]大數(shù)據(jù)在數(shù)據(jù)的采集、儲(chǔ)存、處理及應(yīng)用等各方面,都與傳統(tǒng)數(shù)據(jù)有著根本性的變革。然而,我國(guó)目前的媒介大數(shù)據(jù)實(shí)踐大都尚處于摸索階段,一些關(guān)鍵性的問題尚未解決,大數(shù)據(jù)在媒介實(shí)踐中仍面臨著多方面的悖論。
1 數(shù)據(jù)規(guī)模大與數(shù)據(jù)價(jià)值密度低的悖論
數(shù)據(jù)規(guī)模龐大是大數(shù)據(jù)最基本的屬性,但是,數(shù)據(jù)量在呈幾何級(jí)量級(jí)增長(zhǎng)時(shí),其背后隱藏的有意義信息卻并沒有呈現(xiàn)相應(yīng)比例的增長(zhǎng)。類似于經(jīng)濟(jì)學(xué)中“邊際遞減效應(yīng)”,當(dāng)數(shù)據(jù)規(guī)模很大時(shí),也同樣面臨單位數(shù)據(jù)量“貶值”的風(fēng)險(xiǎn)。
一方面,受眾在某些方面具有高度同質(zhì)性,而且隨著總體樣本的增加,垃圾數(shù)據(jù)和噪音也可能增長(zhǎng),真正有意義的信息比重可能很低,而有用信息的獲取和處理難度不斷加大,人力物力成本也隨之增加,數(shù)據(jù)的邊際意義遞減。例如,現(xiàn)在很多地方都安裝了監(jiān)控,能夠獲得連續(xù)的監(jiān)控視頻信息,這可能為有關(guān)部門提供了便利;但這些實(shí)時(shí)錄制、儲(chǔ)存的海量視頻數(shù)據(jù),可能能派上用場(chǎng)的只有幾秒鐘,甚至可能常年都不會(huì)被用到。
另一方面,大數(shù)據(jù)多以不確定的碎片化形式存在,目前我國(guó)大多數(shù)公司對(duì)數(shù)據(jù)的挖掘和應(yīng)用能力不足,距離從大數(shù)據(jù)中提取最大戰(zhàn)略價(jià)值還相距甚遠(yuǎn)。如果借用馬斯洛的需求層次理論,將大數(shù)據(jù)戰(zhàn)略分成不同層次的金字塔,依次為:數(shù)據(jù)—信息—知識(shí)—智慧,那么大多數(shù)媒介組織對(duì)大數(shù)據(jù)的利用水平還只停留在信息和知識(shí)階段[2]。盡管企業(yè)掌握著大量數(shù)據(jù),但將數(shù)據(jù)轉(zhuǎn)化為知識(shí)和信息,甚至是智慧,仍任重道遠(yuǎn)。
2 數(shù)據(jù)樣本的全面性與真實(shí)度不確定性的
悖論
大數(shù)據(jù)提供了幾乎全樣本的數(shù)據(jù),但不得不承認(rèn),其真實(shí)度和準(zhǔn)確性都可能存在偏差。因?yàn)榧词勾髷?shù)據(jù)的規(guī)模和處理速度都非常大,但數(shù)據(jù)本身的增長(zhǎng)速度仍遠(yuǎn)大于數(shù)據(jù)分析速度;在數(shù)據(jù)呈幾何量級(jí)的增長(zhǎng)的同時(shí),“垃圾”數(shù)據(jù)也隨之增多。因而,大數(shù)據(jù)的方法必須是有一定時(shí)效性的,其結(jié)果也只能以宏觀的模糊呈現(xiàn)為特點(diǎn)。
此外,大數(shù)據(jù)的主要采集渠道——互聯(lián)網(wǎng)上的數(shù)據(jù)的真實(shí)性也值得懷疑。首先,因?yàn)榫W(wǎng)絡(luò)空間的匿名性和草根性,很多時(shí)候,我們很難在浩如煙海的信息中甄別數(shù)據(jù)真實(shí)與否,更何況是純粹的技術(shù)處理過程。其次,戈夫曼的“擬劇理論”告訴我們,在日常生活中,人們會(huì)運(yùn)用各種符號(hào)的選擇和運(yùn)用,來控制呈現(xiàn)在他人面前的形象,即利用符號(hào)進(jìn)行表演。社交平臺(tái)正是利用文字、圖片、視頻等符號(hào),將我們的“后臺(tái)”生活搬到了“前臺(tái)”,出于印象管理的需要,人們很可能會(huì)故意“喬裝打扮”展示其美好的一面,而刪除或掩蓋與其理想的形象不一致的活動(dòng)或事實(shí),這個(gè)過程就產(chǎn)生了一些“偽數(shù)據(jù)”。大數(shù)據(jù)是全樣本數(shù)據(jù),它包含了所有真實(shí)或者虛假的數(shù)據(jù),但計(jì)算機(jī)進(jìn)行大數(shù)據(jù)處理時(shí),并不會(huì)自動(dòng)識(shí)別,而是對(duì)收集到的所有數(shù)據(jù)加以批量處理,這種分析方式在某些方面可能會(huì)導(dǎo)致較大
偏差。
3 數(shù)據(jù)的開放性與模糊的所有權(quán)的悖論
毫無(wú)疑問,大數(shù)據(jù)具有巨大的經(jīng)濟(jì)效益,而由于“數(shù)據(jù)”這種經(jīng)濟(jì)資源具有很強(qiáng)的特殊性,如可能涉及個(gè)人隱私、可被輕易復(fù)制和共享等。因此,清晰的所有權(quán)歸屬是大數(shù)據(jù)共享與管理的基礎(chǔ),這既是技術(shù)問題,更是法理問題。我們一旦進(jìn)入網(wǎng)絡(luò)世界,就在產(chǎn)生數(shù)據(jù),在開放的網(wǎng)絡(luò)空間,數(shù)據(jù)看起來也是人人生產(chǎn)、人人可及、人人可用的;然而目前,這些數(shù)據(jù)的所有權(quán)是屬于用戶本身,還是屬于數(shù)據(jù)儲(chǔ)存平臺(tái),抑或是可被共享的公共資源,業(yè)界和學(xué)界都莫衷一是。很多數(shù)據(jù)壟斷方,如國(guó)內(nèi)的百度、騰訊,國(guó)外的谷歌、Facebook等,這些互聯(lián)網(wǎng)巨頭掌握著各種各樣的大數(shù)據(jù),他們是否能將這些轉(zhuǎn)賣給第三方,如廣告商?數(shù)據(jù)訪問權(quán)、使用權(quán)或數(shù)據(jù)共享機(jī)制的界線又在哪里?這些問題都尚待解決。
2014年曝光的Facebook私自對(duì)其70萬(wàn)名用戶進(jìn)行社交媒體情緒的實(shí)驗(yàn)引起了不小的爭(zhēng)議,把很多數(shù)據(jù)實(shí)驗(yàn)卷入社會(huì)道德討論中。這一試驗(yàn)中,有兩點(diǎn)值得注意:其一,很多被試驗(yàn)者對(duì)此毫不知情,F(xiàn)acebook的用戶在未被告知的情況下被當(dāng)成了小白鼠,而大量的用戶數(shù)據(jù)被作為了研究對(duì)象;其二,也是更重要的,為了驗(yàn)證實(shí)驗(yàn)假設(shè)——用戶的情緒會(huì)受到社交網(wǎng)絡(luò)上帖子情緒的影響,F(xiàn)acebook私自修改了用戶的原始數(shù)據(jù)。這種數(shù)字實(shí)驗(yàn)也許能帶來一定的價(jià)值,提高在線服務(wù)的質(zhì)量,但是在面對(duì)大數(shù)據(jù)的市場(chǎng)推銷或研究行為與社會(huì)道德的悖論時(shí),我們首先應(yīng)該尊重當(dāng)事人。
4 內(nèi)容生產(chǎn)的便捷性與工業(yè)化傾向的悖論
大數(shù)據(jù)給媒介內(nèi)容生產(chǎn)帶來了極大的便利,也催生了一些新的媒介生產(chǎn)模式和表現(xiàn)方式,如數(shù)據(jù)新聞。數(shù)據(jù)新聞?dòng)址Q數(shù)據(jù)驅(qū)動(dòng)新聞,“數(shù)據(jù)新聞是一種工作流程……通過反復(fù)抓取、篩選和重組來深度挖掘數(shù)據(jù),聚焦專門信息以過濾數(shù)據(jù),可視化地呈現(xiàn)數(shù)據(jù)并合成新聞故事。”[3]目前我國(guó)很多媒體也開始了數(shù)據(jù)新聞的積極探索,如人民網(wǎng)的圖解新聞?lì)l道、新浪的“圖解新聞”以及搜狐的“數(shù)字之道”等。然而,便捷化的數(shù)據(jù)新聞生產(chǎn)過程也導(dǎo)致了媒介產(chǎn)品的工業(yè)化和傳統(tǒng)新聞價(jià)值的異化,這是大數(shù)據(jù)給媒介實(shí)務(wù)帶來的又一個(gè)悖論。
首先,基于大數(shù)據(jù)技術(shù)的媒介生產(chǎn),喪失了人的主體性。傳統(tǒng)的新聞生產(chǎn)方式把新聞現(xiàn)場(chǎng)作為第一消息源,記者、編輯是信息提供者,他們?cè)谝欢ǖ纳鐣?huì)情境中考察新聞事件,賦予其一定的社會(huì)意義與人文關(guān)懷。但大數(shù)據(jù)把媒介生產(chǎn)變成一種信息集成過程,記者和受眾的角色都被重構(gòu)。美國(guó)利用計(jì)算機(jī)分析撰寫報(bào)道的先例Narrative,“大約每30秒就能夠撰寫出一篇新聞報(bào)道,2011年該軟件通過收集相關(guān)信息寫出了大約40萬(wàn)則關(guān)于少年棒球聯(lián)盟的新聞報(bào)道”[4]。這樣如同工業(yè)流水線的新聞制作,雖然效率驚人,但也必然是千篇一律、缺乏個(gè)性、沒有溫度和質(zhì)感的模式化數(shù)據(jù)呈現(xiàn)。長(zhǎng)此以往,也會(huì)使受眾產(chǎn)生審美疲勞,傳播效果將大打折扣。其次,大數(shù)據(jù)呈現(xiàn)的是數(shù)據(jù)之間的相關(guān)關(guān)系,而不能展現(xiàn)其背后的因果關(guān)系。也就是說,它只能告知我們某些社會(huì)現(xiàn)象或問題,而不能給數(shù)據(jù)賦予背景,深度解釋為何如此,放棄了對(duì)其背后原因的追問和反思,以及對(duì)社會(huì)現(xiàn)實(shí)的否定與批判。表現(xiàn)形式上,雖然數(shù)據(jù)漫畫、數(shù)據(jù)圖表等方式在有些報(bào)道中可以產(chǎn)生形象直觀的效果,但若只是沉溺于表面的形式,而忽視了新聞本身的深度和故事性以及語(yǔ)言文字的豐富性,就是舍本求末了,并與傳統(tǒng)的新聞精神相悖。
5 預(yù)測(cè)的可能與自由意志喪失的悖論
通過對(duì)龐大數(shù)據(jù)進(jìn)行分析、整合,大數(shù)據(jù)技術(shù)使人們可以從歷史的發(fā)展軌跡中得到數(shù)據(jù)或事件之間的相關(guān)性,找出一定的規(guī)律,從而對(duì)未來的發(fā)展傾向作出一定的預(yù)測(cè)。例如,通過對(duì)大量經(jīng)濟(jì)數(shù)據(jù)的分析,預(yù)測(cè)市場(chǎng)走向;通過對(duì)特定新聞事件的分析,預(yù)測(cè)可能的發(fā)展態(tài)勢(shì);通過對(duì)受眾已采取的行為進(jìn)行分析,推測(cè)其興趣及行為偏好??梢哉f,大數(shù)據(jù)不僅幫助我們從宏觀層面對(duì)某一社會(huì)事件進(jìn)行把握,也使得對(duì)特定個(gè)體的行為預(yù)測(cè)成為可能。
但這也正是大數(shù)據(jù)最可怕的地方,它不僅可以全面洞察我們的過去與現(xiàn)在,而且能預(yù)測(cè)我們的行為和未來;數(shù)據(jù)越大,預(yù)測(cè)的準(zhǔn)確性也就越高,其預(yù)測(cè)行為發(fā)生的可能性也就越大。例如,當(dāng)我們長(zhǎng)期關(guān)注的對(duì)象有了新動(dòng)態(tài)時(shí),大數(shù)據(jù)知道我們會(huì)想要了解,于是將有關(guān)的信息推送給我們;比如我們定期購(gòu)買的產(chǎn)品到了一定時(shí)間,會(huì)自動(dòng)彈出相關(guān)廣告;當(dāng)我們搜索某地天氣時(shí),去往該地的機(jī)票酒店等廣告也會(huì)自動(dòng)呈現(xiàn)……此時(shí)的大數(shù)據(jù),已經(jīng)凌駕于人的自由意志和尊嚴(yán)之上,扭曲了人類最本質(zhì)的東西,即理性思維和自由選擇。由大數(shù)據(jù)而變得可預(yù)測(cè)的世界仿佛變成了一個(gè)被隨時(shí)追蹤的黑匣子,我們的生活變成了一個(gè)被安排和被設(shè)計(jì)好的“楚門的世界”,我們的每一步行為則在印證和實(shí)踐著大數(shù)據(jù)的預(yù)測(cè)結(jié)果,而忘記了對(duì)自我和世界的深入探索,這足以讓我們惶恐不安。
6 精準(zhǔn)的廣告服務(wù)與媒介消費(fèi)主義的悖論
大數(shù)據(jù)帶來了廣告模式的變革,實(shí)現(xiàn)了廣告的定向投放和廣告效果的合理評(píng)估。以Facebook為例,目前,F(xiàn)acebook在全球有9億用戶,每天可采集到約500TB碎片化、非結(jié)構(gòu)化的數(shù)據(jù)。Facebook首先對(duì)這些數(shù)據(jù)進(jìn)行集結(jié)和歸類,形成身份類數(shù)據(jù)(注冊(cè)的基本信息)、需求類數(shù)據(jù)(“贊”過的信息、心情狀態(tài)等)和關(guān)系類數(shù)據(jù)(與其他社交網(wǎng)絡(luò)用戶之間的關(guān)系)等多個(gè)數(shù)據(jù)模塊;對(duì)用戶的瀏覽行為、搜索的關(guān)鍵字等的持續(xù)分析,得出用戶的長(zhǎng)期愛好和近期需求;通過對(duì)其朋友圈的分析,可以獲得用戶的教育、工作、收入等諸多信息,從而進(jìn)行精準(zhǔn)的廣告投放[5]。
但另一方面,精準(zhǔn)的廣告投放也大大刺激了我們的消費(fèi)欲望,廣告商通過對(duì)受眾心理的分析和商品符號(hào)意義的構(gòu)建和營(yíng)銷,誘導(dǎo)用戶進(jìn)行符號(hào)消費(fèi);同時(shí),不斷刺激消費(fèi)者欲望,誘導(dǎo)其進(jìn)行超前消費(fèi)。例如,眾多的電子商務(wù)平臺(tái)會(huì)根據(jù)你的瀏覽記錄或興趣偏好,利用大數(shù)據(jù)得出你的興趣圖譜,并預(yù)測(cè)你的購(gòu)買行為,再不斷向你推送“猜你喜歡”板塊。這給企業(yè)帶來了巨大的商業(yè)效益的同時(shí),也使得原本是為受眾提供交流和信息平臺(tái)的媒介逐步淪為商家獲取數(shù)據(jù)資源的渠道,成為各方達(dá)到其目的的橋梁,成為建構(gòu)媒介消費(fèi)主義的一種重要力量。我們的線上生活,不斷被各種消費(fèi)信息充斥,在獲得個(gè)性化產(chǎn)品服務(wù)的同時(shí),也不免被眾多的廣告所打擾。精準(zhǔn)的廣告服務(wù)與媒介消費(fèi)主義盛行之間的悖論由此可見一斑。
7 定向化服務(wù)與信息窄化的悖論
媒體基于對(duì)大數(shù)據(jù)的整合和分析,可以充分洞察受眾的性格、偏好及需求,針對(duì)性地為其提供個(gè)性化的信息服務(wù)。大數(shù)據(jù)在信息的個(gè)性化訂閱和精準(zhǔn)化推動(dòng)方面,優(yōu)化了受眾的媒介體驗(yàn)和信息獲取,但也同樣面臨著“信息繭房效應(yīng)”的悖論。桑斯坦在著作《信息烏托邦》中提出了“信息繭房”的概念:“信息傳播中,因公眾自身的信息需求并非全方位的,公眾只注意自己選擇的東西和使自己愉悅的通訊領(lǐng)域,久而久之,會(huì)將自身桎梏于像蠶繭一般的‘繭房中”[6]。通常情況下,人們更愿意選擇性注意、選擇性理解和選擇性記憶那些對(duì)自己有利的或與自身原有認(rèn)知一致的信息,大數(shù)據(jù)的定向化推動(dòng)更強(qiáng)化了這一機(jī)制。
新媒體的個(gè)性化訂閱和基于用戶興趣的信息推送,本質(zhì)上就是排除一種“信息偶遇”的可能,即你獲得的信息都是你想要的。這類例子有很多:購(gòu)物網(wǎng)站會(huì)根據(jù)你在其網(wǎng)站瀏覽、收藏以及購(gòu)買的商品記錄,不定時(shí)的向你推薦相關(guān)商品;Facebook可以根據(jù)你的關(guān)注興趣和瀏覽記錄,向你推薦相關(guān)好友,使你很容易的找到興趣相投或觀點(diǎn)一致的人或網(wǎng)絡(luò)社區(qū);當(dāng)你瀏覽有關(guān)某一話題的網(wǎng)頁(yè)時(shí),也會(huì)出現(xiàn)各種很多同類話題的鏈接提示。總之,大數(shù)據(jù)會(huì)通過各種方式,把你感興趣的東西和你偏向的觀點(diǎn)都盡可能地聚集在你面前,長(zhǎng)此以往將在無(wú)形中使用戶接收到的信息限制某一偏向中,形成信息的“窄化”,這與桑斯坦提出的“信息繭房”概念如出一轍。而“信息繭房效應(yīng)”的后果,從個(gè)人層面而言,可能阻礙個(gè)人的全方位信息獲取,強(qiáng)化個(gè)人偏見;對(duì)群體來說,“小世界”的意見交流可能產(chǎn)生群體極化現(xiàn)象,甚至衍生出網(wǎng)絡(luò)暴力;而對(duì)整個(gè)社會(huì)而言,“信息繭房”將破壞一個(gè)社會(huì)的基本共識(shí),加劇社會(huì)的分化。
8 結(jié)束語(yǔ)
大數(shù)據(jù)對(duì)媒介實(shí)務(wù)的各個(gè)方面,從新聞內(nèi)容生產(chǎn)到受眾和效果分析,再到媒介經(jīng)營(yíng)與管理,都產(chǎn)生了深遠(yuǎn)的影響。而反過來,各種形態(tài)的媒介又反哺了大數(shù)據(jù)產(chǎn)業(yè),使得大數(shù)據(jù)得以源源不斷地產(chǎn)生和發(fā)展。我們也必須認(rèn)識(shí)到,大數(shù)據(jù)為媒介實(shí)務(wù)帶來巨大價(jià)值的同時(shí),也存在很多的悖論,面臨多方面的困境。機(jī)遇與挑戰(zhàn)并存,我們既不能因噎廢食,否認(rèn)大數(shù)據(jù)的社會(huì)價(jià)值;也不能掉以輕心,忽視大數(shù)據(jù)存在的潛在風(fēng)險(xiǎn)。只有清楚地認(rèn)識(shí)問題,采取正確的態(tài)度,在社會(huì)和經(jīng)濟(jì)效益與個(gè)人利益保護(hù)之間需求平衡,才不會(huì)在大數(shù)據(jù)時(shí)代的轉(zhuǎn)型道路上迷失方向。
參考文獻(xiàn)
[1]Dan Kusnetzky.What is “Big Data?”[EB/OL].[2010-02-16].http://www.zdnet.com/article/what-is-big-data.
[2]Martha L. Stone, Big Data for Media, Reuters Institute for the Study of Journalism Report[R]. 2014.
[3]方潔.全球視野下的“數(shù)據(jù)新聞”:理念與實(shí)踐[J].國(guó)際新聞界,2013(6):74.
[4]彭蘭.大數(shù)據(jù)時(shí)代:新聞業(yè)面臨的新震蕩[J].編輯之友,2013(1):7.
[5]曾凡斌.大數(shù)據(jù)對(duì)媒體經(jīng)營(yíng)管理的影響及應(yīng)對(duì)分析[J].出版發(fā)行研究,2013(2):23-24.
[6]凱斯·R.桑斯坦.信息烏托邦——眾人如何生產(chǎn)知識(shí)[M].畢競(jìng)悅,譯.北京:法律出版社,2008:15.