文/潘綏銘
生活是如何被篡改為數(shù)據(jù)的?
——大數(shù)據(jù)套用到研究人類的“原罪”
文/潘綏銘
近年來(lái),對(duì)于大數(shù)據(jù)已經(jīng)出現(xiàn)了盲目崇拜,就是無(wú)質(zhì)疑、不反思地跟風(fēng)頌揚(yáng)和無(wú)限拔高。本文不涉及任何自然科學(xué)領(lǐng)域中的大數(shù)據(jù)及其應(yīng)用,僅討論一個(gè)根本問(wèn)題:大數(shù)據(jù)能夠套用到對(duì)于人類的研究中嗎?
對(duì)這個(gè)問(wèn)題,我國(guó)學(xué)術(shù)界雖然也出現(xiàn)了一些質(zhì)疑,但是不僅寥若晨星,而且在學(xué)理上也主要是在可操作性的層次上爭(zhēng)論,并沒(méi)有擊中要害。其實(shí),大數(shù)據(jù)最值得質(zhì)疑的,既不是其定義,也不是其功能或意義,還不是方法論層次上的“以相關(guān)分析取代因果分析”,而是“一切皆可量化”這個(gè)核心口號(hào)和基本理論。它表述了大數(shù)據(jù)的三層意思:其一,沒(méi)有量化,就沒(méi)有數(shù)據(jù),更不可能有什么大數(shù)據(jù);其二,物質(zhì)世界當(dāng)然是可以被量化的,但是如果僅限于此,那么所謂的大數(shù)據(jù)就僅僅是數(shù)量的增加,性質(zhì)毫無(wú)改變,純屬炒作;其三,現(xiàn)在的大數(shù)據(jù)之所以被崇拜,要害其實(shí)只有一點(diǎn):把人類的行為及其結(jié)果,也給量化了,而且號(hào)稱無(wú)所不包。
這樣一來(lái),大數(shù)據(jù)的性質(zhì)就變了,從自然科學(xué)侵入到人文社會(huì)研究,從科學(xué)蛻變?yōu)椤拔茖W(xué)主義”。這就不僅僅是一個(gè)研究工具的問(wèn)題,而是一個(gè)認(rèn)識(shí)論的根本問(wèn)題。對(duì)此進(jìn)行批評(píng)的人文社科著作汗牛充棟,本文不再一一列舉,僅在操作的層次上分析一下,人類無(wú)限豐富的生活實(shí)踐,在被“唯科學(xué)主義”改造成“數(shù)據(jù)”的過(guò)程中,究竟發(fā)生了什么。
大數(shù)據(jù)崇拜者極力鼓吹“4V”(規(guī)模大、種類多、高速度、高價(jià)值),卻故意回避了一個(gè)根本的問(wèn)題:在最開(kāi)始,您收集到的,就是可以用來(lái)分析的數(shù)據(jù)嗎?
在社會(huì)學(xué)的問(wèn)卷調(diào)查中,這是有可能做到的;但是在所謂的大數(shù)據(jù)中,卻絕對(duì)不可能。因?yàn)榇髷?shù)據(jù)并不是研究者主動(dòng)去收集的人類行為及其結(jié)果,而是五花八門的所謂“客觀記錄”,是人類生活中微乎其微的那一部分“可獲得信息”,例如上網(wǎng)活動(dòng)所留下的痕跡、監(jiān)控記錄等。
可是盡人皆知,在人類活動(dòng)的全部信息中,可獲得的要遠(yuǎn)遠(yuǎn)少于不可獲得的。后者最典型的就是人類的一切精神活動(dòng)的信息,在可預(yù)見(jiàn)的未來(lái),仍然不但是無(wú)法獲得的,而且根本就是無(wú)法監(jiān)測(cè)的。這樣一來(lái),所謂大數(shù)據(jù)所獲得的信息,首先是極端片面;其次是漫無(wú)邊際;第三是支離破碎;第四是毫無(wú)意義;根本不可能直接用于任何量化的分析。
那么,這樣的信息怎么才能轉(zhuǎn)化為可分析的數(shù)據(jù)呢?首先是必須加以“界定”,就是保留什么和舍棄什么;其次是進(jìn)行“分類”,就是把什么歸屬于什么;第三步是加以“定義”,就是給某類信息賦予特定的人類意義;最后一步則是“賦值”,就是把不同的定義轉(zhuǎn)換為可計(jì)算的數(shù)值。
顯而易見(jiàn),在這個(gè)四部曲的過(guò)程中,完完全全是研究者自己在主觀地、人為地、強(qiáng)制地 “整理”那些“可獲得信息”,把人類生活的痕跡,完完全全地篡改為自己的世界觀和價(jià)值觀所能接受的“數(shù)據(jù)”。往好里說(shuō),這叫做無(wú)可避免地加工;往壞里說(shuō),這就是赤裸裸地偽造。
這就是說(shuō),所謂的大數(shù)據(jù),其實(shí)一點(diǎn)都沒(méi)有超出“小數(shù)據(jù)”原有的局限性:裁剪生活,撕碎人生;非要把整體生存的“人”,視為一堆雜亂的零碎。在實(shí)際生活中,人類絕對(duì)不是,也不可能是這樣來(lái)“量化地”認(rèn)知和行動(dòng)的。因此,大數(shù)據(jù)其實(shí)并不是幫助人類思考,而是企圖取代和控制人類的生活經(jīng)驗(yàn),是人工智能的噩兆。
有人已經(jīng)發(fā)現(xiàn),大數(shù)據(jù)記錄的都是單獨(dú)個(gè)人的行為,無(wú)法發(fā)現(xiàn)不同行為者之間的關(guān)系;于是問(wèn)題就來(lái)了:在這個(gè)現(xiàn)實(shí)世界里,難道真的存在一種與他人毫無(wú)關(guān)系的個(gè)人行為嗎?難道個(gè)人的一切行為,不都是在一定的人際關(guān)系中,才會(huì)產(chǎn)生,才會(huì)帶來(lái)某種結(jié)果嗎?
社會(huì)不是個(gè)人的簡(jiǎn)單集合,而是人們通過(guò)各種關(guān)系有機(jī)地組織起來(lái)的。同時(shí),人們又是在特定的社會(huì)環(huán)境中做出各種行為的,不可能天馬行空,獨(dú)往獨(dú)來(lái)。因此,人類活動(dòng)留下的一切痕跡,必定蘊(yùn)含著無(wú)限豐富的社會(huì)內(nèi)容。如果舍棄之,那么不管什么樣的數(shù)據(jù),不僅是浮光掠影,而且必定是盲人摸象。
尤其是,每一個(gè)人都在特定的社會(huì)中,一點(diǎn)一點(diǎn)地成長(zhǎng)為“此時(shí)此景中的此人”,然后才會(huì)做出“此因此果的此行為”。這就是每個(gè)人的社會(huì)歷史建構(gòu)過(guò)程,其中最重要的就是我們的一切社會(huì)背景、生活狀況和成長(zhǎng)經(jīng)歷。
可是這一切,往往僅僅存在于我們自己的經(jīng)驗(yàn)與記憶之中;往往難于言表,更往往無(wú)法記錄。從“客觀監(jiān)測(cè)”的角度來(lái)說(shuō),根本就是“風(fēng)過(guò)無(wú)痕”。那么,就算毫無(wú)隱私,就算監(jiān)測(cè)可以天羅地網(wǎng),所謂大數(shù)據(jù)的信息源又是從何而來(lái)的呢?因此,對(duì)于了解人類生活而言,大數(shù)據(jù)其實(shí)根本就是空中樓閣。
“大數(shù)據(jù)崇拜者”很可能不知道,或者不敢承認(rèn):在人類生活中還有一種現(xiàn)象,叫做“主體建構(gòu)”。即人們對(duì)于自己的行為所做出的解釋,很可能與監(jiān)測(cè)者的解釋大相徑庭,甚至背道而馳。最常見(jiàn)的就是,一切人際的誤會(huì),蓋源于此。
那么,無(wú)論大數(shù)據(jù)監(jiān)測(cè)到多少人類的行為,它究竟是如何分辨出其中主體建構(gòu)的成分呢?第一,以網(wǎng)購(gòu)的大數(shù)據(jù)為例,即使您收集到全部的上網(wǎng)痕跡,而且全都數(shù)字化地一覽無(wú)余,那您怎么知道人家就真的就是這樣想的呢?這種“客觀測(cè)定”,離礦物學(xué)很近,可是人卻是有主觀意志的啊,您是怎么監(jiān)測(cè)到的?連物理學(xué)還有個(gè)“測(cè)不準(zhǔn)原理”呢,何況對(duì)于人的主觀意愿?第二,您知道人類還會(huì)“自我呈現(xiàn)”嗎?說(shuō)不好聽(tīng)一些,就是表演。如果連測(cè)謊儀的結(jié)果,法律都還不予采信,那么您怎么篩除被監(jiān)測(cè)對(duì)象的表演呢?第三,難道您就不找被監(jiān)測(cè)對(duì)象去核實(shí)一下?在司法審判中,就連證據(jù)確鑿的罪犯,法官也必須聽(tīng)取他的說(shuō)法,才能做出正確的判斷。可是大數(shù)據(jù)崇拜者卻根本漠視主體意愿的存在。這豈不是自欺欺人?第四,您知道除了“動(dòng)機(jī)”,還有“無(wú)意識(shí)”嗎?即使是某些詢問(wèn)對(duì)方意愿而獲得的數(shù)據(jù),也仍然存在著這樣一個(gè)問(wèn)題:對(duì)方是否具有足夠的能力來(lái)表述自己的意愿呢?不應(yīng)該忽視無(wú)意識(shí)行為的廣泛存在,更不應(yīng)該否認(rèn):人類的一切行為痕跡,無(wú)論多么海量,其實(shí)并不能容納和表述人類的生活意義。因此,如果行為者自己都搞不清楚自己是怎么回事,那么您還怎么去核實(shí)呢?根據(jù)什么來(lái)判斷真?zhèn)闻c程度呢?
總而言之,一切試圖用自然科學(xué)或者數(shù)字化來(lái)了解人類及其社會(huì)的嘗試,不是都必然失敗,而是都無(wú)法否定人類“主體建構(gòu)”的重要性,結(jié)果都必然是把真實(shí)的生活給削足適履了。
人文社會(huì)研究的至少兩千年歷史告訴我們:人類的一切行為,不僅蘊(yùn)含著他們的人生意義,而且是為了追求其人生意義而行動(dòng)的。這是人與物的根本區(qū)別。可是,大數(shù)據(jù)所謂的一切“可記錄的痕跡”,如果沒(méi)有獲得對(duì)方的主訴,那么就不可能包含該行為意義的信息。例如一切上網(wǎng)活動(dòng),行為主體都不會(huì)表述自己為了尋求什么才這樣做的,也不可能表達(dá)出這樣做帶來(lái)了什么樣的價(jià)值與意義。
交通監(jiān)控錄像、醫(yī)療記錄、通訊記錄,等等,都足以號(hào)稱自己是“大數(shù)據(jù)”??墒牵羞@些數(shù)據(jù),都僅僅是記錄下了人們生活中的一個(gè)個(gè)零散的側(cè)面。因此,這樣的“大數(shù)據(jù)”再怎么大,也無(wú)法解決以下一系列常識(shí)性的問(wèn)題:首先,人在生活的某個(gè)側(cè)面里的表現(xiàn),與他/她的整個(gè)人格與人生,難道不存在緊密的關(guān)聯(lián)嗎?農(nóng)民工吃20 元的盒飯都嫌貴;富豪買上千萬(wàn)的汽車也不眨眼,這難道僅僅是所謂的“消費(fèi)選擇”嗎?其次,人類生活的各個(gè)側(cè)面之間,難道不是相互影響著的嗎?農(nóng)民工吃20元的盒飯,卻可以搭上200元的禮錢;富豪買上千萬(wàn)的汽車,卻不肯做一點(diǎn)兒慈善,這也僅僅是所謂“購(gòu)買習(xí)慣”嗎?最后,任何一個(gè)人的生活,難道不是被社會(huì)、文化、歷史等因素制約著嗎?農(nóng)民工之所以要吃20元盒飯,絕不僅僅是因?yàn)楣べY低,還因?yàn)樗膿狃B(yǎng)系數(shù)、失業(yè)可能性、職業(yè)風(fēng)險(xiǎn)等等都比富豪要高出很多。這,難道也是“可支配資金”嗎?如此這般,數(shù)據(jù)越大,豈不是錯(cuò)誤越大?
在基督教教義中,原罪不但是與生俱來(lái)的,而且是背負(fù)終身的,不能通過(guò)人自己的救贖而被消除。很可惜,量化研究也是如此。無(wú)論其技術(shù)手段如何發(fā)達(dá),無(wú)論其數(shù)據(jù)多么大,一旦應(yīng)用于人文社會(huì)研究,其缺陷與弊病就根本無(wú)法避免,充其量也不過(guò)是程度的減輕而已。說(shuō)到底,“大數(shù)據(jù)崇拜”,其實(shí)就是“唯科學(xué)主義”在人類歷史面前一敗涂地后的末日哀鳴。如果科學(xué)沒(méi)能阻止希特勒的統(tǒng)治,也沒(méi)能預(yù)測(cè)出此后人類的一切發(fā)展,那么就絕不是“藝不精”的問(wèn)題,而是用錯(cuò)了地方,是越界跑到了自己無(wú)能為力的領(lǐng)域。
當(dāng)然,這并不是說(shuō),量化研究和大數(shù)據(jù)就一定不能用,而是表達(dá)三層意思:首先,它們都不能質(zhì)疑更不能取代各種非量化的人文社會(huì)研究;其次,只有對(duì)這些先天缺陷進(jìn)行深刻反思,并且予以充分展示的量化研究,才有資格在人文社會(huì)研究中保留一席之地;最后,兩種研究就像是兩條鐵軌,缺一不可,但又平行延伸,永不交叉。
(作者系中國(guó)人民大學(xué)性社會(huì)學(xué)研究所教授;摘自《新視野》2016年第3期)