吳澤鵬
摘 要:本文分析了全數(shù)據(jù)模式的實(shí)現(xiàn)困難、相關(guān)性結(jié)果的認(rèn)識論困境、數(shù)據(jù)操縱背后帶來的大眾焦慮三個(gè)大數(shù)據(jù)分析目前面臨的困境及其原因,從語境論的角度下提出了應(yīng)當(dāng)基于限定語境下的“全數(shù)據(jù)”概念、接納處于語境遞進(jìn)鏈上的相關(guān)性結(jié)論、重視社會語境對數(shù)據(jù)操縱的制約作用以解決面臨的困境的思路。
關(guān)鍵詞:大數(shù)據(jù)分析;困境;語境論
中圖分類號:B15 ? 文獻(xiàn)標(biāo)志碼:A ? 文章編號:1002-2589(2020)03-0060-02
大數(shù)據(jù)分析作為一種研究方法,目前已經(jīng)廣泛應(yīng)用于科學(xué)研究與社會服務(wù),以及商業(yè)競爭中。而隨著方法和思維的實(shí)踐,也逐漸開始暴露出一些問題,需要從哲學(xué)層面去分析和嘗試解決。
一、大數(shù)據(jù)分析當(dāng)前遇到的困境
目前來看,大數(shù)據(jù)分析繼續(xù)應(yīng)用和發(fā)展所面臨的主要困境來源于理想全數(shù)據(jù)模式實(shí)現(xiàn)困難、相關(guān)性結(jié)果帶來的反認(rèn)識性質(zhì)和大眾對數(shù)據(jù)操縱的顧慮三個(gè)方面。
1.全數(shù)據(jù)模式的實(shí)現(xiàn)困難。大數(shù)據(jù)分析的出現(xiàn)已經(jīng)在諸多領(lǐng)域改變?nèi)藗兊娜粘I詈腿祟愓J(rèn)識世界的方式,“用數(shù)據(jù)來說話”也已經(jīng)成為人們在研究分析問題時(shí)最常用的口號。究其源頭,大數(shù)據(jù)分析方法仍然是一種統(tǒng)計(jì)學(xué)方法,而其顛覆傳統(tǒng)抽樣統(tǒng)計(jì)思維的收集和分析全體樣本數(shù)據(jù)以實(shí)現(xiàn)全樣分析的全數(shù)據(jù)思維,是大數(shù)據(jù)分析得以應(yīng)用的預(yù)設(shè)思維前提。
然而,這種全數(shù)據(jù)思維下的全樣分析,從技術(shù)實(shí)踐的角度來看,也更多的是一種理想狀態(tài)。具體原因有:第一,受限于當(dāng)前技術(shù)語境,一些本應(yīng)該收集到的數(shù)據(jù)樣本并不能全部收集到。例如在對量子對撞機(jī)的微觀高能粒子對撞的實(shí)驗(yàn)進(jìn)行數(shù)據(jù)結(jié)果收集時(shí),實(shí)際收集到的數(shù)據(jù)可能只占到產(chǎn)生數(shù)據(jù)的1%,一方面是由于數(shù)據(jù)量過于龐大無法全面收集,另一方面尺寸小于一個(gè)普朗克長度的粒子并不能被當(dāng)前人類所擁有的觀測設(shè)備所探測到而無法被收集。第二,受限于法律和倫理道德對數(shù)據(jù)隱私的保護(hù),例如歐盟近來頒布了《一般數(shù)據(jù)保護(hù)條例》來保護(hù)互聯(lián)網(wǎng)用戶個(gè)人數(shù)據(jù)隱私,學(xué)界對數(shù)據(jù)隱私的類似問題也一直討論不休。第三,“數(shù)據(jù)孤島”的存在。“數(shù)據(jù)孤島”的產(chǎn)生一方面是信息共享意識的不普及,數(shù)據(jù)信息之間的共享不及時(shí)、不通暢;更多的原因是來自于團(tuán)體、企業(yè),甚至國家對數(shù)據(jù)潛在價(jià)值的保護(hù),這種“保護(hù)”隨著大數(shù)據(jù)技術(shù)的不斷發(fā)展而不斷加強(qiáng)。
由此可見,全數(shù)據(jù)“理想”的實(shí)現(xiàn)困難重重,甚至難以實(shí)現(xiàn),而隨之出現(xiàn)的則是對大數(shù)據(jù)分析結(jié)果的不信任和對這種研究方法本身的質(zhì)疑,急需回應(yīng)。
2.相關(guān)性結(jié)果的認(rèn)識論困境。舍恩伯格談到過“大數(shù)據(jù)的核心是預(yù)測,而此預(yù)測是基于相關(guān)關(guān)系分析法基礎(chǔ)上的”[1]78“我們知道是什么就夠了,沒有必要知道為什么”[1]67。大數(shù)據(jù)分析的結(jié)果強(qiáng)調(diào)相關(guān)關(guān)系而忽視因果關(guān)系,重視實(shí)用效果而無法做出理論性的原因解釋。由此可見,這種伴隨著大數(shù)據(jù)分析的應(yīng)用而產(chǎn)生的相關(guān)性思維具有一定的反認(rèn)識性質(zhì),與傳統(tǒng)認(rèn)識論的目的相悖。大數(shù)據(jù)經(jīng)驗(yàn)主義者甚至提出了“要相關(guān)不要因果”的口號,認(rèn)為在大數(shù)據(jù)時(shí)代下的分析研究,只需要通過對數(shù)據(jù)的分析得到包含相關(guān)關(guān)系的結(jié)果,知道應(yīng)該怎么去做、怎么去有效利用就可以了,而對于“為什么”這樣的因果性解釋,則完全可以繞過去甚至消除掉。
齊磊磊回應(yīng)了這種大數(shù)據(jù)經(jīng)驗(yàn)主義者的極端觀點(diǎn),他認(rèn)為“消除因果關(guān)系”的想法是片面的,相關(guān)性的結(jié)果中隱含了因果性的解釋,只不過是我們先通過大數(shù)據(jù)分析知道了“是什么”[2]。很多學(xué)者也持類似意見,例如賈向桐批評大數(shù)據(jù)經(jīng)驗(yàn)主義者的極端觀點(diǎn),雖然對大數(shù)據(jù)分析本身持一種實(shí)用和可用的態(tài)度,但質(zhì)疑所謂基于大數(shù)據(jù)分析的“第四范式”和“數(shù)據(jù)驅(qū)動研究模型”能否對目前的科學(xué)研究,特別是理論向的自然科學(xué)研究提供支持[3]。這種認(rèn)識論上的質(zhì)疑,可能是大數(shù)據(jù)分析當(dāng)前面臨的最大困境。
3.數(shù)據(jù)操縱背后帶來的大眾焦慮。這種大眾焦慮來自于大數(shù)據(jù)分析的過度商業(yè)化?!坝脭?shù)據(jù)來說話”的口號已經(jīng)耳熟能詳,“大數(shù)據(jù)”的一連串相關(guān)術(shù)語伴隨著其商業(yè)化迅速被大眾熟知。與此同時(shí),大眾對數(shù)據(jù)背后可能存在的企業(yè)、資本和組織的操縱行為則產(chǎn)生了深深的反感和焦慮情緒,認(rèn)為其可能剝奪人類的批判性思考和認(rèn)識能力。
各種互聯(lián)網(wǎng)媒體和應(yīng)用程序選擇性向用戶推送用戶愿意看到的信息,而過濾掉用戶不愿意看到的相反意見,讓用戶更容易偏執(zhí)地相信自己是正確的。2016年的美國大選就是一個(gè)很好的例子,支持不同候選人的選民,很多都堅(jiān)信自己的支持者會從中勝出,因?yàn)樗麄兘佑|到的都是支持者的正面消息,而最終的結(jié)果讓很多人大跌眼鏡。這種選擇性推送的例子數(shù)不勝數(shù),自亞馬遜公司開此先河起,已被無數(shù)互聯(lián)網(wǎng)公司視作一種經(jīng)典的商業(yè)模式。另一種操縱行為是借助大眾對數(shù)據(jù)的盲目信任,投機(jī)資本造假數(shù)據(jù)的統(tǒng)計(jì)結(jié)果而謀取“注意力經(jīng)濟(jì)”下的暴利。這種模式在過去幾年的中國影視圈屢見不鮮,資本只簡單選取長相姣好的“小鮮肉”打造“流量明星”,用造假的點(diǎn)擊數(shù)據(jù)騙取更高的曝光率以變相強(qiáng)迫消費(fèi)者買單。但隨著消費(fèi)大眾的日益清醒,對數(shù)據(jù)的信任大幅度降低。2019年年初央視以“驚人數(shù)據(jù)的秘密”為專題,曝光了流量明星數(shù)據(jù)造假比例竟高達(dá)80%的真相。同年上映的電影《上海堡壘》被網(wǎng)評“流量明星的末路”和“市場對投機(jī)資本的‘報(bào)復(fù)”,最終黯然收場。
“大數(shù)據(jù)”過度商業(yè)化使大眾產(chǎn)生的反感和焦慮情緒,顯然已經(jīng)成為大數(shù)據(jù)分析所面臨的困境之一,一方面是“數(shù)據(jù)”的可信力下降帶來的可能性問題,另一方面是大眾如何面對可能被操縱的數(shù)據(jù)、如何接受真假難辨的信息。
二、語境論視域下可能的解決思路
大數(shù)據(jù)分析作為一種研究方法,其本身是中性的,也具有自身的局限性,需要理性地被看待。在使用大數(shù)據(jù)分析作為方法的研究行為中,人的思維可能會體現(xiàn)出來一種“數(shù)據(jù)萬能論”和“一切皆可數(shù)據(jù)化”的世界觀和方法論思維傾向,而這種傾向已經(jīng)成為當(dāng)前人類科學(xué)語境和社會語境的一部分,而在此“語境”概念上對大數(shù)據(jù)分析的理性審視將為解決大數(shù)據(jù)分析當(dāng)前遇到的困境提供從哲學(xué)層面上的指導(dǎo)。
1.應(yīng)當(dāng)基于限定語境下的“全數(shù)據(jù)”概念。首先,完全實(shí)現(xiàn)全樣分析的全數(shù)據(jù)理想并不現(xiàn)實(shí),這在上文中已經(jīng)討論過,而過于廣泛沒有限制的“全數(shù)據(jù)”概念才是產(chǎn)生這種現(xiàn)實(shí)落差的原因。事實(shí)上,“全”只是在思維層面的一種追求,是對增加收集數(shù)據(jù)量的技術(shù)進(jìn)步的要求,同時(shí)這也是提升分析精確性的重要途徑,并不是實(shí)現(xiàn)大數(shù)據(jù)分析的必要條件。然后,不論是何種研究方法,對一個(gè)具體問題的分析總是會在一個(gè)相對確定的語境中進(jìn)行,而分析的結(jié)果在這個(gè)語境中也是能達(dá)到相對的確定性的,而這種相對的確定性顯然不是能夠質(zhì)疑大數(shù)據(jù)分析科學(xué)性的充足理由。最后,雖然我們否定實(shí)現(xiàn)“全數(shù)據(jù)”理想的可能性,在具體的實(shí)踐和操作中接受“非全部”的實(shí)際情況,但其理想性依然有其他方面的價(jià)值存在:全數(shù)據(jù)理想和全數(shù)據(jù)思維應(yīng)當(dāng)被視為一種對大數(shù)據(jù)技術(shù)的追求和分析問題時(shí)的整體論態(tài)度,而涉及具體問題時(shí),數(shù)據(jù)的“非全部”也是人的認(rèn)識能力局限于當(dāng)前認(rèn)知語境的一種無奈現(xiàn)實(shí),兩者之間并不矛盾。
2.接納處于語境遞進(jìn)鏈上的相關(guān)性結(jié)論。相對于傳統(tǒng)的認(rèn)識論來說,大數(shù)據(jù)分析得到的相關(guān)性結(jié)論確實(shí)不能被稱為認(rèn)識的結(jié)果,因?yàn)閽仐壛舜_定性的大數(shù)據(jù)知識并不具有解釋事實(shí)的功能。但從語境實(shí)在論的科學(xué)觀來看,知識是一種語境關(guān)系,也隨著語境層次遞進(jìn)而展現(xiàn)出不同的形態(tài)[4]。這意味著,一方面尋求傳統(tǒng)認(rèn)識論要求的單一且確定的因果性必然解釋沒有可能也沒有必要,接納類似于量子力學(xué)哥本哈根這樣的概率解釋并非不可,大數(shù)據(jù)分析得到的相關(guān)性結(jié)論也應(yīng)被寬容對待。另一方面這種相關(guān)性結(jié)論和當(dāng)前層次的語境相關(guān),隨著語境的改變甚至遞進(jìn),將會發(fā)生改變,理論和技術(shù)層面上的突飛猛進(jìn)必然會產(chǎn)生對舊有知識的“新認(rèn)識”,而大數(shù)據(jù)分析帶來相關(guān)性結(jié)論也可能會帶來新的因果性解釋,只不過是超前于當(dāng)前的科學(xué)語境而無法給出而已。從這個(gè)角度看,保持一種實(shí)用的態(tài)度,寬容對待大數(shù)據(jù)分析相關(guān)性結(jié)論的不確定性,是對現(xiàn)代科學(xué)發(fā)展趨勢的順應(yīng)。更進(jìn)一步來看,整個(gè)科學(xué)語境的層次遞進(jìn)也不是只靠一個(gè)研究方法帶來的改變就能完成的,大數(shù)據(jù)分析也僅是眾多研究方法的一種,研究者應(yīng)該根據(jù)不同方法的特點(diǎn)和優(yōu)勢來相應(yīng)地選擇適合方法,萬能的研究方法并不存在。
3.重視社會語境對數(shù)據(jù)操縱的制約作用。我們需要在當(dāng)下的大數(shù)據(jù)思維熱潮中保持理性,辯證看待其帶來的思維轉(zhuǎn)變,認(rèn)真對待其存在的局限性,探尋互補(bǔ)之道,從而在思維層面上更好地適應(yīng)大數(shù)據(jù)時(shí)代的生存和發(fā)展[5]。數(shù)據(jù)操縱帶來的巨大負(fù)面影響是大數(shù)據(jù)分析商業(yè)化過程中不可避免的,但這種不正當(dāng)手段正在被其惡劣影響所制裁。辯證來看,大數(shù)據(jù)分析作為一種研究方法其本身也脫離不開所處的社會語境,一方面是其發(fā)展的動力是技術(shù)革新和社會需求推動,另一方面也處在社會語境之中,受到政治因素、經(jīng)濟(jì)利益、軍事目標(biāo)、社會文化等影響和制約。數(shù)據(jù)操縱產(chǎn)生的負(fù)面影響已經(jīng)反饋到了其所處的社會語境之中,投機(jī)者自食惡果,社會輿論和政府監(jiān)管作用也開始體現(xiàn),社會語境的影響和制約反倒會減少對數(shù)據(jù)的盲目追捧,有利于大數(shù)據(jù)分析作為一種研究方法的良性發(fā)展。對于處于數(shù)據(jù)劣勢方的個(gè)人來說,適應(yīng)當(dāng)前的社會環(huán)境也是必要的,一方面不能掉入“唯數(shù)據(jù)論”的輿論陷阱,另一方面學(xué)會用批判性思維來審視包含數(shù)據(jù)在內(nèi)的所有知識和結(jié)論,提升自我認(rèn)知和判斷的能力。
總而言之,對大數(shù)據(jù)分析這種研究方法進(jìn)行理性的審視,需要結(jié)合當(dāng)前的科學(xué)技術(shù)語境和社會語境,對人和技術(shù)與研究行為之間的互相作用進(jìn)行綜合性判斷。而其在應(yīng)用中所面臨的困難,一方面來自于這種分析方法和方法論傾向本身的局限性,不可能有一種萬能且沒有負(fù)面性的研究方法存在;另一方面,這種已發(fā)現(xiàn)的困難也會促進(jìn)大數(shù)據(jù)分析這一新興研究方法的良性發(fā)展。
參考文獻(xiàn):
[1][英]維克托·邁爾-舍恩伯格,肯尼斯·庫克耶.大數(shù)據(jù)時(shí)代:生活、工作與思維的大變革[M].盛楊燕,周濤,譯.杭州:浙江人民出版社,2013.
[2]齊磊磊.大數(shù)據(jù)經(jīng)驗(yàn)主義——如何看待理論、因果與規(guī)律[J].哲學(xué)動態(tài),2015(7):89-95.
[3]賈向桐.大數(shù)據(jù)背景下“第四范式”的雙重邏輯及其問題[J].江蘇行政學(xué)院學(xué)報(bào),2017(6):14-20.
[4]殷杰.語境主義世界觀的特征[J].哲學(xué)研究,2006(5):94-99.
[5]刁生富,姚志穎.論大數(shù)據(jù)思維的局限性及其超越[J].自然辯證法研究,2017,33(5):87-91.