摘 要:大數(shù)據(jù)的信息性質(zhì)及其對相關(guān)關(guān)系的凸顯,促使人們對相關(guān)關(guān)系及其與因果關(guān)系的關(guān)聯(lián)進行深入反思。因果概念的重新刻畫及其量化展開,展示了物數(shù)據(jù)化中的因果關(guān)系際遇:在獲得量的關(guān)系強度和正負性質(zhì)的同時,喪失了原有的必然性和方向性。相關(guān)關(guān)系是因果派生關(guān)系。相關(guān)關(guān)系的因果派生機制決定了相關(guān)關(guān)系的或然性質(zhì),說明了相關(guān)關(guān)系的因果派生強度和因果派生層次。大數(shù)據(jù)相關(guān)關(guān)系具有深層因果關(guān)系意蘊,它意味著因果時態(tài)的展示,追溯既往的因果關(guān)系量化把握和探向未來的新因果關(guān)系創(chuàng)構(gòu)。
關(guān)鍵詞:大數(shù)據(jù);相關(guān)關(guān)系;因果關(guān)系;因果時態(tài)
中圖分類號:TP311.13-02 文獻標(biāo)識碼:A 文章編號:0257-5833(2017)10-0115-08
作者簡介:王天恩,上海大學(xué)社會科學(xué)學(xué)部教授、博導(dǎo) (上海 200444)
隨著大數(shù)據(jù)對相關(guān)關(guān)系的凸顯,因果關(guān)系和相關(guān)關(guān)系這一久久縈繞人們腦際的復(fù)雜問題,日益顯示出其實踐和理論的雙重意義。大數(shù)據(jù)的發(fā)展,既使這一問題的深入理解更顯迫切,又為這一問題的理解提供了新的重要條件。
無論在哲學(xué)中還是在科學(xué)中,人們似乎都默認:“相關(guān)關(guān)系并不意味著因果關(guān)系”。但無論在科學(xué)中還是在哲學(xué)中,因果關(guān)系和相關(guān)關(guān)系之間始終具有一種持續(xù)的內(nèi)在張力;尤其是在大數(shù)據(jù)基礎(chǔ)之上,因果關(guān)系和相關(guān)關(guān)系成了越來越多領(lǐng)域關(guān)注的重要問題。相關(guān)關(guān)系到底意味著什么?相關(guān)關(guān)系與因果關(guān)系之間究竟是一種什么關(guān)系?有關(guān)大數(shù)據(jù)相關(guān)關(guān)系的這些問題,不僅隨著信息文明的發(fā)展面臨更緊迫的實踐追問,而且隨著對大數(shù)據(jù)的反思日益呈現(xiàn)出更深層次的因果關(guān)系意蘊。
一、因果觀念的困境和相關(guān)關(guān)系的凸顯
自《科學(xué)》雜志1998年首次出現(xiàn)“大數(shù)據(jù)”概念1,《自然》雜志2008年出版“大數(shù)據(jù)”??詠?,“大數(shù)據(jù)”浪潮就以難以想象的勢頭撲面襲來。一系列理性不能不及早深層次面對的時代課題,以空前的速度和讓人始料未及的方式,甚至在許多人的既定理論酣睡中,橫在了哲學(xué)面前。正是大數(shù)據(jù)的物數(shù)據(jù)化,在對傳統(tǒng)因果觀構(gòu)成嚴峻挑戰(zhàn)的同時,提出了深入理解相關(guān)關(guān)系的迫切任務(wù)。
相關(guān)性及其與因果性的關(guān)系問題,無疑是由大數(shù)據(jù)的發(fā)展得以空前凸顯的,但問題的根源卻在于因果描述本身的發(fā)展困境和相關(guān)關(guān)系日漸突出的復(fù)雜性。
1、因果觀念的發(fā)展困境
對于因果性問題來說,20世紀30至50年代是災(zāi)難性的30年。因果論的這種遭遇主要是由量子理論的發(fā)展帶來的,量子描述的或然性和因果時序顛倒說凸顯了因果定性描述的兩方面問題:因果聯(lián)系是必然的還是或然的?前后相繼的還是同時的?
在因果概念的哲學(xué)研究中,因果必然聯(lián)系的觀念與因果概念的規(guī)定內(nèi)在相聯(lián);而在因果關(guān)系的科學(xué)研究中,因果或然聯(lián)系的觀念則與因果關(guān)系的實際應(yīng)用密切相關(guān)。因而問題就在于:因果概念的規(guī)定旨在描述事物過程的確定性環(huán)節(jié),對于人類認識發(fā)展來說,這種描述無論在經(jīng)驗上還是在邏輯上,都是必不可少的;但具有必然性的因果定性描述與科學(xué)實踐中描述的或然性構(gòu)成沖突。這顯然涉及因果概念的內(nèi)在邏輯矛盾,這種內(nèi)在邏輯矛盾在因果時序方面有進一步的表現(xiàn)。
關(guān)于因果時序,“前因后果”說似乎不僅擁有經(jīng)驗的支持,而且具有邏輯上的論據(jù)。在休謨那里,理由很簡單:“如果一個原因和它的結(jié)果是同時的,這個結(jié)果又和它的結(jié)果是同時的,這樣一直推下去。那么顯然就不會有接續(xù)這樣一個現(xiàn)象,而一切對象必然就都是同時存在的了”。因此“原因必須是先于結(jié)果的”。1康德的觀點和根據(jù)與休謨一樣:“原因的因果規(guī)定性(原因的一種狀態(tài))一定先于結(jié)果而存在,……否則在原因和結(jié)果之間就不能設(shè)想出什么時間連續(xù)性來”2。而“因果同時”說則有一個同樣不可置疑的論據(jù):“前因后果”意味著“前因”階段存在無果之因。因果概念與因果規(guī)定的要求不相符合,表明傳統(tǒng)因果概念存在根本問題。這也正是為什么在量子力學(xué)建立之后,必須重新刻畫因果概念。
2、因果概念的重新刻畫及其量化展開
關(guān)于因果概念的規(guī)定,事實上正如休謨所說,如果只是“給原因下一個定義說,它是能夠產(chǎn)生其他東西的一種東西,那他顯然是什么也沒有說”。因為在“產(chǎn)生”這一概念中,這一問題仍然存在。3量子力學(xué)表明,問題的關(guān)鍵在于把因果概念的規(guī)定落實到事物的相互作用上。恩格斯早就指出,“相互作用是事物的真正的終極原因。我們不能比這種相互作用的認識追溯得更遠了,因為在這之后沒有什么要認識的東西了?!挥袕倪@種普遍的相互作用出發(fā),我們才能達到現(xiàn)實的因果關(guān)系”4。而要把因果規(guī)定落實到事物的相互作用過程,關(guān)鍵又在于從原因中分析出參與相互作用過程、構(gòu)成一定原因的“因素”。
在漢語文獻中,最早將“因素”引入因果概念刻畫的是《原因是因素的相互作用過程》5一文,在此基礎(chǔ)上因果結(jié)構(gòu)得以呈現(xiàn)。6在西文文獻中,最早從大衛(wèi)·玻姆開始,不少哲學(xué)家和科學(xué)家使用“causal factor”這一術(shù)語,現(xiàn)在很多文獻都使用“因果因素”,包括格蘭杰。7“因素”和一般事物之間的不同在于:因素是相對于特定因果關(guān)系的事物,即使尚未進入相互作用過程,它們也相對于潛在結(jié)果構(gòu)成一種具有特殊含義的關(guān)系。不與特定因果關(guān)系相聯(lián)系,就不成其為因素關(guān)系而只是一般的事物聯(lián)系。正是由此可以看到,原因是對因素相互作用過程的描述;結(jié)果則是對因素相互作用效應(yīng)及其痕跡累積的描述。
重新刻畫的因果概念,一方面解決了因果概念面臨的上述兩方面問題;另一方面“因素”和“原因”的分化導(dǎo)向?qū)κ挛镞^程必然性和或然性兩個環(huán)節(jié)的合理描述。而因素相互作用效應(yīng)及其累積的區(qū)分則解決了因果時序問題,這與當(dāng)代科學(xué)中因果原理的理解相一致。“同樣的原因或原因集合總是產(chǎn)生同樣的結(jié)果或結(jié)果集合以及原因(原因集合)短暫先于或與結(jié)果(結(jié)果集合)同時發(fā)生。因果原理的上述陳述與科學(xué)中普遍接受的原因和結(jié)果概念相一致?!?這也包括M.邦格的觀點。2而在信息文明時代,重新刻畫的因果概念不僅能解決因果定性描述問題,而且可以走出因果定性描述所帶來的因果觀念困境。endprint
在哲學(xué)和科學(xué)發(fā)展中,不僅因果關(guān)系的定性研究,因果關(guān)系定量分析的發(fā)展也帶來了因果觀念的困境。隨著因果關(guān)系定量研究的興起和發(fā)展,因果性研究在20世紀60年代后迅猛復(fù)興。因果性定量研究的全面復(fù)興,又一次使因果觀念陷入困境,只是這一困境直到大數(shù)據(jù)出現(xiàn)才悄然出場。隨著大數(shù)據(jù)的發(fā)展,物數(shù)據(jù)化使相關(guān)關(guān)系空前凸顯。在爆炸式增長的大數(shù)據(jù)文獻中,相關(guān)關(guān)系大有淹沒因果關(guān)系之勢,只是在傳統(tǒng)概念迷霧中偶爾閃現(xiàn)新的識見:“‘大數(shù)據(jù)用事實向人類宣告:‘知其然不知其所以然,既是電腦望塵人腦的劣勢,也是電腦超越人腦的優(yōu)勢!”3因果關(guān)系的定性研究和定量研究是如此不同,以至有觀點認為,因果關(guān)系是物理的、哲學(xué)的,相關(guān)關(guān)系是數(shù)學(xué)的。而在實踐中,因果定量描述對定性描述的絕對優(yōu)勢則導(dǎo)致以相關(guān)關(guān)系取代因果關(guān)系的傾向。
因果定量描述所帶來的困境反映了因果定量描述和定性描述的矛盾,涉及因果關(guān)系在物數(shù)據(jù)化過程中的因果遭際。
3、物數(shù)據(jù)化中的因果關(guān)系際遇
大數(shù)據(jù)的建立是一個物數(shù)據(jù)化的過程,在這一過程中,對因果關(guān)系來說,有兩方面的事實至關(guān)重要:由因素相互作用過程的數(shù)據(jù)化,可以看到因果關(guān)系的量化蛻變;由因果關(guān)系的量化蛻變,可以看到原有因果關(guān)系方向性的喪失。
(1)因果關(guān)系的量化蛻變。由于原因是對因素相互作用過程的描述,因果關(guān)系量化成為變量之間的關(guān)系后,作為因果關(guān)系的量化反映,只是對因果關(guān)系的量化描述。
在大數(shù)據(jù)中,相關(guān)關(guān)系都表現(xiàn)為不同變量之間的關(guān)聯(lián)。這意味著,物數(shù)據(jù)化過程既具有重要意義,又發(fā)生了一系列重要改變。一方面,只有作為變量之間的關(guān)系,相關(guān)關(guān)系才可能通過量化得以具體體現(xiàn),才可能為我們所精確把握。因果關(guān)系量化的必要性,與相關(guān)關(guān)系的性質(zhì)密切相關(guān)。另一方面,因果關(guān)系成為變量之間的關(guān)系后,由于量化而獲得了量的關(guān)系強度和正負性質(zhì)。在因素相互作用動態(tài)過程中,因果關(guān)系的數(shù)據(jù)化過程具有一個非常重要的性質(zhì):量化蛻變。因果關(guān)系一旦以不同變量之間的關(guān)系表達,就變成了變量之間的相關(guān)關(guān)系。雖然這種變量之間的相關(guān)關(guān)系可以反映因果關(guān)系,但原有因果關(guān)系的一些重要性質(zhì),已經(jīng)在這一過程中因具體條件被量化抽離而改變。因果關(guān)系的量化使其蛻變?yōu)橄嚓P(guān)關(guān)系,就像三維物體的平面投影將三維信息折疊為二維。比如氧化反應(yīng)的數(shù)據(jù)化,物的過程的因果關(guān)系變成數(shù)據(jù)的量的關(guān)系后,成為因果關(guān)系的量化反映。由于因果關(guān)系的量化反映只能是相關(guān)關(guān)系,數(shù)據(jù)化的氧化反應(yīng)表現(xiàn)為數(shù)據(jù)的變量關(guān)系。
(2)因果關(guān)系方向性的喪失。作為凝固的因素相互作用過程,由于因素的作用方式都是確定的,因素相互作用過程不可逆,因果關(guān)系具有明確的方向性,而在因素和潛在結(jié)果之間的關(guān)系中,因素之間的相互作用方式并未確定,因素尚未進入相互作用過程,因而不存在因果聯(lián)系的不可逆性,從而不存在明確的方向性。也就是說,原有的因果關(guān)系由于量化喪失了特有的必然性和方向性4,數(shù)據(jù)化后沒有了因果關(guān)系所特有的方向。
因果關(guān)系的量化正是把因果關(guān)系蛻變?yōu)橐蛩仃P(guān)系的過程,因此作為量化過程,數(shù)據(jù)化就是使因果關(guān)系喪失方向性的過程。由于沒有方向,變量相關(guān)在定量分析中不能區(qū)分原因和結(jié)果。“兩相關(guān)變量遠不足以得到結(jié)論,認為一個變量的變化是另一變量變化的原因?!?盡管被量化的是嚴格的因果關(guān)系,但量化后沒有了原有的方向性,只具有正相關(guān)和負相關(guān)的區(qū)別。既可能正相關(guān),也可能負相關(guān)。
在大數(shù)據(jù)中,由于都是量化的關(guān)系,由于全是定量描述,相關(guān)關(guān)系及其所反映的因果關(guān)系都表現(xiàn)為變量之間的關(guān)系。由于因果關(guān)系量化為相關(guān)關(guān)系,雖然數(shù)據(jù)化前后的關(guān)系性質(zhì)有很大不同,但正是這種量化前后的關(guān)系,表明相關(guān)關(guān)系的根基仍然在因果性,只是傳統(tǒng)因果概念不能展示二者間的內(nèi)在關(guān)聯(lián)。重新刻畫的因果概念不僅能理解物數(shù)據(jù)化和數(shù)據(jù)物化中的因果關(guān)系,而且為理解大數(shù)據(jù)相關(guān)關(guān)系創(chuàng)造了條件。
二、相關(guān)關(guān)系的因果派生及其性質(zhì)
由于與因果關(guān)系之間千絲萬縷的特殊關(guān)聯(lián),相關(guān)關(guān)系的問題必須在與因果關(guān)系的關(guān)聯(lián)中尋找答案。重新刻畫的因果概念為相關(guān)關(guān)系的深入理解提供了理論根據(jù),為這些問題的澄清創(chuàng)造了條件。
1、相關(guān)關(guān)系的因果派生及其機制
從定性的角度看,相關(guān)關(guān)系是一個寬泛的概念,世間事物就呈現(xiàn)為從直接相關(guān)到間接相關(guān)這樣一個無限蔓延的分布。實際上,關(guān)系本身就是對相關(guān)性的描述,而大數(shù)據(jù)相關(guān)關(guān)系則一方面對因果關(guān)系概念提出了挑戰(zhàn);另一方面又使更深入理解和規(guī)定相關(guān)關(guān)系成為可能。
世界上的任何事物都可能相互關(guān)聯(lián),但相關(guān)關(guān)系并不指謂所有這些關(guān)系,大數(shù)據(jù)相關(guān)關(guān)系應(yīng)當(dāng)在因果關(guān)系中找到其定位。在重新刻畫的因果概念中,正好可以找到相關(guān)關(guān)系的對應(yīng)位置。
在重新刻畫的因果關(guān)系中,當(dāng)因素未進入相互作用過程時,構(gòu)成了一種與潛在結(jié)果相聯(lián)系的因素關(guān)系。這種因素關(guān)系顯然不就是因果關(guān)系,而是相對于潛在結(jié)果的一種相互關(guān)系,這就是相關(guān)關(guān)系。它們的生成及其與因果關(guān)系的密切關(guān)聯(lián)表明,相關(guān)關(guān)系是由因果關(guān)系派生出來的,相關(guān)關(guān)系和因果關(guān)系之間是一種派生關(guān)系,即相關(guān)關(guān)系是一種因果派生關(guān)系。由同樣的機制,因果結(jié)構(gòu)可以派生出更多的相關(guān)關(guān)系,除了因素和結(jié)果之間,因素之間和結(jié)果之間的關(guān)系等都是因果派生關(guān)系。重新刻畫的因果關(guān)系表明,由不同的機制可以派生出各種不同的相關(guān)關(guān)系。作為因素相互作用過程與其結(jié)果之間的關(guān)系,因果關(guān)系是由相互作用過程凝固了的因素關(guān)系,而在進入相互作用之前和因素相互作用過程之中,因素之間、結(jié)果之間以及因素和結(jié)果之間所構(gòu)成的一類有特殊意義的關(guān)系,都是相關(guān)關(guān)系。由此可以得到關(guān)于因果關(guān)系和相關(guān)關(guān)系的清晰理解:因果關(guān)系是為因素相互作用所確定的關(guān)系,由于因果關(guān)系事實上是一個過程的兩個方面,所以不構(gòu)成相關(guān)關(guān)系。而相關(guān)關(guān)系則是因果關(guān)系的派生關(guān)系,包括因素之間、結(jié)果之間以及因素和結(jié)果之間的關(guān)系等。2毫無疑問,重新刻畫的因果概念為展示相關(guān)關(guān)系的因果派生關(guān)系提供了理論基礎(chǔ),但真正使得這種派生關(guān)系得以凸顯的,則是大數(shù)據(jù)的發(fā)展。正是大數(shù)據(jù)所帶來的物數(shù)據(jù)化和數(shù)據(jù)物化的對稱發(fā)展,凸顯了相關(guān)關(guān)系的因果派生性質(zhì)。endprint
2、相關(guān)關(guān)系的或然性質(zhì)
正是大數(shù)據(jù)的發(fā)展,使相關(guān)關(guān)系在重新刻畫的因果概念中得以充分凸顯,并使因果關(guān)系得以更充分地展開。將重新刻畫的因果概念加以展開,可以看到相關(guān)關(guān)系的因果派生性質(zhì)。
作為因果派生關(guān)系,相關(guān)關(guān)系具有與因果關(guān)系不同的性質(zhì)。由因果關(guān)系的結(jié)構(gòu)和性質(zhì)可見,作為因素之間、結(jié)果之間以及因素和結(jié)果之間的關(guān)系,相關(guān)關(guān)系的性質(zhì)與因果關(guān)系的最大不同,就是不具有因果關(guān)系的必然性,而具有或然的性質(zhì)。
作為因素相互作用過程凝固了的因果關(guān)系,原因和結(jié)果之間的聯(lián)系是必然的。作為因素相互作用過程,由于“同樣原因永遠產(chǎn)生同樣結(jié)果,同樣結(jié)果也永遠只能發(fā)生于同樣原因”1,原因與結(jié)果的關(guān)系是確定的。與因果關(guān)系不同,因素和結(jié)果之間的關(guān)系則不是完全確定的。特定因素與什么樣的其他因素,以什么樣的方式進入特定的相互作用過程,所形成的結(jié)果可以有很大差異甚至完全不同,因而特定因素與結(jié)果間的關(guān)系只能是相關(guān)而不是必然的,即不是完全確定的。這種不完全確定不僅表現(xiàn)為量的差異,而且可以表現(xiàn)為質(zhì)的不同。這種不確定性不是幾率性關(guān)系意義上的不完全確定,而是關(guān)聯(lián)有無和相關(guān)正負的不確定。即相關(guān)性可強可弱,可正可負,甚至?xí)r有時無。
由于不同的因果派生機制,在不同的因素作用條件下,相關(guān)關(guān)系可以是從接近因果關(guān)系到趨近完全無關(guān)這樣一個連續(xù)區(qū)間,既可以是變量間具有幾近完全確定的聯(lián)系,也可以是幾近完全不確定的聯(lián)系。只是這種完全確定的聯(lián)系不一定是必然關(guān)聯(lián),完全不確定的聯(lián)系也不意味著與因果關(guān)系不相關(guān),因為相關(guān)關(guān)系的因果派生性質(zhì),決定了相關(guān)關(guān)系的強度。
3、相關(guān)關(guān)系的因果派生強度
在因素相互作用過程中,因素具有特定的作用方式和作用距離,間接結(jié)果也相應(yīng)具有不同的生成距離。原則上說,任何因素相互作用過程都涉及復(fù)雜的因素體系,因為在開放的因素體系中,可能參與相互作用的因素有直接因素和間接因素。再簡單的因素體系也涉及復(fù)雜的間接因素,即使是球體靜止于平面的簡單平衡狀態(tài),雖然直接因素相對簡單,但間接因素同樣復(fù)雜。
所謂間接因素,就是其參與特定因素相互作用過程不是直接的,而是通過其他因素——典型的如通過直接因素——起作用的因素,比如殺人案中的教唆者。由此可以構(gòu)成一個作用鏈條,正是這一鏈條構(gòu)成因素的作用距離。直接因素的作用距離最近,越是靠近直接因素的間接因素,其作用距離越近,反之則越遠。由于因素在相互作用中具有特定的地位和作用,由于因素在特定相互作用中的時空關(guān)系不同,因素在相互作用中所具有的特定作用方式和作用距離使量化的相關(guān)關(guān)系有不同的相關(guān)度。越是接近相互作用過程的因素之間的關(guān)系,越是表現(xiàn)為直接的相關(guān)關(guān)系,越具有強相關(guān)度,因而也越接近因果關(guān)系的性質(zhì)。越是遠離相互作用過程的因素之間的關(guān)系,越是具有弱相關(guān)度,或越是具有間接性的相關(guān)關(guān)系。而且,不僅因素有不同的作用方式和作用距離,在因素相互作用生成的系列效應(yīng)及其累積的不同結(jié)果形態(tài)之間,也具有由結(jié)果的間接性所確定的生成距離。越接近相互作用過程的結(jié)果間關(guān)系,越表現(xiàn)為直接的結(jié)果間相關(guān)關(guān)系,越具有強相關(guān)度,反之亦然。因素參與相互作用的方式與相關(guān)關(guān)系的正負值密切相關(guān),而因素的作用距離和結(jié)果的生成距離,則正是相關(guān)關(guān)系強度形成的基礎(chǔ)。
4、相關(guān)關(guān)系的因果派生層次
因素相互作用過程的時間性,構(gòu)成了相關(guān)關(guān)系因果派生的不同層次。作為因果派生關(guān)系,相關(guān)關(guān)系也相應(yīng)存在三個層次,即作為原因的因素相互作用過程后構(gòu)成的相關(guān)關(guān)系、因素相互作用過程中構(gòu)成的相關(guān)關(guān)系以及因素相互作用過程前構(gòu)成的相關(guān)關(guān)系。
因素相互作用過程后和過程中構(gòu)成的相關(guān)關(guān)系,主要是對既定事物中相關(guān)關(guān)系的描述。統(tǒng)計學(xué)、計量經(jīng)濟學(xué)、生物統(tǒng)計學(xué)(Biometrics)和心理測驗學(xué)(Psychometrics)等學(xué)科中的相關(guān)關(guān)系主要是因素相互作用過程中,因素之間、結(jié)果之間以及因素和結(jié)果之間的關(guān)系,這是一種過程中的關(guān)系。由于是過程中的關(guān)系,因此也有系列相關(guān)關(guān)系即所謂“自相關(guān)”(autocorrelation)。自相關(guān)是因素相互作用過程不同階段的相關(guān)關(guān)系,統(tǒng)計學(xué)和計量經(jīng)濟學(xué)等學(xué)科中的自相關(guān)是因素相互作用過程不同階段或因素與序列結(jié)果之間的相關(guān)關(guān)系。這種自相關(guān)實質(zhì)上仍然是因素之間、結(jié)果之間以及因素和結(jié)果之間的相互關(guān)系。在因素相互作用過程中,抽取一定時間段的數(shù)據(jù)就可以獲取某一時段的相關(guān)關(guān)系數(shù)據(jù),而對這一過程的跟蹤觀測,則可以獲得系列數(shù)據(jù)。在因素相互作用過程中,動態(tài)相關(guān)關(guān)系對于了解和調(diào)控對象過程至關(guān)重要。而因素相互作用過程中和過程前構(gòu)成的相關(guān)關(guān)系,則與創(chuàng)構(gòu)活動密切相關(guān)。在大數(shù)據(jù)相關(guān)關(guān)系中,因素相互作用過程前的因素和潛在結(jié)果之間的相關(guān)關(guān)系,對于數(shù)據(jù)物化從而創(chuàng)構(gòu)活動特別重要。
由于因素相互作用體系的復(fù)雜性,相關(guān)關(guān)系的形式復(fù)雜多樣。在相關(guān)關(guān)系的因果派生結(jié)構(gòu)基礎(chǔ)上,這些復(fù)雜的相關(guān)關(guān)系類型就可以得到系統(tǒng)的清晰呈現(xiàn)。
三、大數(shù)據(jù)相關(guān)關(guān)系的深層因果關(guān)系意蘊
大數(shù)據(jù)涉及兩個重要過程:物數(shù)據(jù)化和數(shù)據(jù)物化。大數(shù)據(jù)時代,在物數(shù)據(jù)化的基礎(chǔ)上,作為因果派生關(guān)系,相關(guān)關(guān)系不僅涉及因果關(guān)系理解的重要擴展——最為典型的就是因果時態(tài),而且涉及兩大至關(guān)重要的基本活動:一是基于相關(guān)關(guān)系的因果關(guān)系量化把握,即因果推斷;二是基于數(shù)據(jù)物化的因果關(guān)系創(chuàng)構(gòu)。正因為如此,作為因果派生關(guān)系的相關(guān)關(guān)系同時又具有更深層次的因果關(guān)系意蘊。
1、因果時態(tài)的大數(shù)據(jù)相關(guān)關(guān)系展示
大數(shù)據(jù)使重新刻畫的因果概念及因果結(jié)構(gòu)得以更充分的展開,進一步擴展到因果時態(tài),擴展到因果時序的內(nèi)在結(jié)構(gòu)。作為因素的相互作用過程,原因可以是球體靜止于平面的簡單平衡狀態(tài),也可以是股市般復(fù)雜的因素相互作用體系;可以是物能的,也可以是信息的;既包括物理因素關(guān)系,也包括心理因素關(guān)系。而擴展到內(nèi)在時序結(jié)構(gòu)的因果概念,則不僅可以描述并在一定程度上把握更復(fù)雜的因果關(guān)系,而且可以深入涉及因果關(guān)系與其他關(guān)系的內(nèi)在關(guān)聯(lián)。endprint
因果概念的重新刻畫所帶來的一個重要變化,就是通過對因素相互作用過程的描述,將因素相互作用的時態(tài)納入因果描述模型。
關(guān)于因果關(guān)系,傳統(tǒng)因果概念主要涉及過去時或進行時,而作為因素相互作用過程的描述,因果描述模型則還進一步涉及將來時。原因作為一個過程,使因素相互作用具有不同的時態(tài)。作為因素相互作用過程,原因的過程性使其具有相應(yīng)的時態(tài)。因素的相互作用過程不僅有進行時,而且有過去時和未來時。作為過去時,因素相互作用過程已然凝固;作為進行時,事物的動態(tài)關(guān)系就是一個因素相互作用過程的關(guān)系;而作為將來時,則有一個相對于潛在結(jié)果的因素關(guān)系體系。作為因素相互作用過程的凝固形態(tài),因素相互作用是過去時態(tài);作為因素相互作用過程的動態(tài)展示,因素的相互作用是現(xiàn)在時態(tài);而相對于潛在結(jié)果,因素因未進入相互作用過程而處于未來時態(tài)。因果描述模型的這一時態(tài)擴展,具有非同尋常的意義。
首先,因果描述模型的將來時態(tài)使因果關(guān)系的描述有了真正意義上的因果時態(tài)。大數(shù)據(jù)所帶來的物數(shù)據(jù)化和數(shù)據(jù)物化的對稱發(fā)展,凸顯了因果時態(tài)的對稱發(fā)展,從而因果模型的將來時態(tài),通過現(xiàn)在時這一中點過程構(gòu)成了與過去時態(tài)相對稱的完整因果時態(tài)。
其次,因果時態(tài)使因果描述模型能更合理地描述事物過程,可以不僅對過去和現(xiàn)在,而且還能對將來做因果描述。
最后,納入時態(tài)的因果概念反過來又為大數(shù)據(jù)相關(guān)關(guān)系研究提供了必不可少的因果描述模型。大數(shù)據(jù)相關(guān)關(guān)系所反映的,既不是因果關(guān)系的過去時,也不是現(xiàn)在時,而是將來時。正是大數(shù)據(jù)相關(guān)關(guān)系的時態(tài),不僅為進一步理解因果關(guān)系和相關(guān)關(guān)系概念提供了前提,而且為把握世界事物過程提供了更全面合理的描述模型。
2、追溯既往的因果關(guān)系量化把握
從相關(guān)關(guān)系推斷因果關(guān)系,既是大數(shù)據(jù)基礎(chǔ)上通過數(shù)據(jù)把握因果關(guān)系不可或缺的環(huán)節(jié),同時又是大數(shù)據(jù)為因果關(guān)系的量化把握所提供的重要手段。在物數(shù)據(jù)化過程中,靜態(tài)數(shù)據(jù)反映事物相互作用的瞬時狀態(tài),動態(tài)數(shù)據(jù)則反映事物相互作用的動態(tài)過程。物的相互作用關(guān)系,通過數(shù)據(jù)化變成量化關(guān)系,因而在物的關(guān)系的量化過程中,物相互作用的具體條件在數(shù)據(jù)化過程中因量化而抽離。還原這種因果關(guān)系,必須通過因果推斷。
通過數(shù)據(jù)所反映的相關(guān)關(guān)系還原因果關(guān)系,即因果推斷。在大數(shù)據(jù)時代,因果推斷已經(jīng)成了一個越來越重要的熱門領(lǐng)域。這方面最具代表性的成果就是格蘭杰因果關(guān)系檢驗(Granger Causal Relation Test)。作為因果推斷模型,格蘭杰因果檢驗是對因素和結(jié)果關(guān)系的檢測。
為了判斷Y對X是否存在因果關(guān)系,可以比較“已知上一時刻所有信息”和“已知上一時刻除Y以外的所有信息”。在進行這種比較時,“這一時刻X的概率分布情況”的差別,就是一種典型的檢驗Y是不是結(jié)果X的因素,而不是真正的原因和結(jié)果關(guān)系檢驗。因為Y只是確定X的“所有信息”之一,即整個因素體系中的因素之一。在這種因果檢驗中,雖然預(yù)設(shè)了一個結(jié)構(gòu),但可以排除因素間和結(jié)果間的相關(guān)關(guān)系,因此檢驗是有效的,可用于“預(yù)測”。正因為如此,格蘭杰認為外加結(jié)構(gòu)(the extra structure)的使用方式對因果關(guān)系的定義至關(guān)重要。1只是其所檢測出的不是原因和結(jié)果之間的關(guān)系,而是因素和結(jié)果之間的關(guān)系。所測出的關(guān)系強度也只是該因素或該組因素在作為原因的這一因素相互作用過程中的作用強度。而通過變量之間的相關(guān)關(guān)系強度,只能檢驗出特定因素與結(jié)果之間的因(素和結(jié))果關(guān)聯(lián),而不可能是真正意義上的因果關(guān)系。任何根據(jù)變量關(guān)系檢驗因果關(guān)系都只能檢驗出相關(guān)關(guān)系,而且只是檢驗出因素和結(jié)果間的相關(guān)關(guān)系。
基于大數(shù)據(jù)的因果推斷雖然只是對因素和結(jié)果關(guān)系的檢驗,卻是一種基于相關(guān)關(guān)系的因果關(guān)系量化把握。由于既定因果關(guān)系屬于因素相互作用已經(jīng)凝固了的關(guān)系,因而因果推斷是通過追溯既往的因果關(guān)系的量化把握。由此建立起來的因果推斷模型,無疑是因果描述模型的重要擴展,不僅涉及因果關(guān)系的把握,而且涉及因果觀念理解的進一步深化。作為定性描述模型,因果觀念更屬信念層次的規(guī)定;而作為定量描述模型,因果關(guān)系則更是相關(guān)性把握中的相關(guān)程度。
“因果”不是實體概念,而是對因素相互作用過程的描述。因果關(guān)系的研究經(jīng)歷了一個從實在論因果觀到描述論因果觀的發(fā)展2,而作為因果派生關(guān)系,相關(guān)關(guān)系的理解也應(yīng)當(dāng)有一個從實在論理解到描述論理解的過程。而且,由于相對于因果關(guān)系,相關(guān)關(guān)系具有更明顯的描述性質(zhì),這兩種不同的理解具有更明顯的區(qū)別和更重要的意義。在實在論理解中,所有關(guān)系都是相關(guān)關(guān)系,由此陷入的困境與因果關(guān)系傳統(tǒng)理解中的終極原因困境具有同樣的性質(zhì)。而在描述論理解中,相關(guān)關(guān)系則以量的方式,以關(guān)系強度和正負性質(zhì)的形式與人類學(xué)特性并最終與人的需要聯(lián)系在一起,從而達到了具有實踐意義的更深層次。
3、探向未來的新因果關(guān)系創(chuàng)構(gòu)
與物數(shù)據(jù)化相對應(yīng)的另一基本活動,則是通過數(shù)據(jù)所反映的相關(guān)關(guān)系將數(shù)據(jù)物化。這不僅是一個與物數(shù)據(jù)化相反的過程,而且是一個與因果關(guān)系還原相對稱的過程。在這一過程中,結(jié)果不是既定的,因而既不是由果溯因,也不是一般意義上的由因(素)索果,而是由因(素)構(gòu)果。而這個“果”也不是既存的,而是根據(jù)人們的需要和大數(shù)據(jù)相關(guān)關(guān)系所反映的可能性,以一定的方式使相關(guān)因素進入相互作用過程,所獲得的期望中的潛在結(jié)果。而在特定潛在結(jié)果的觀照中,則會生成新的潛在的因果關(guān)系。這種潛在因果關(guān)系所構(gòu)成的因素體系,在還沒有進入相互作用之前,只具有因素和潛在結(jié)果之間的關(guān)系,這正是大數(shù)據(jù)所構(gòu)成的具有未來時態(tài)的相關(guān)關(guān)系。只有讓相關(guān)因素以一定的方式進入相互作用,生成預(yù)期中的結(jié)果后,因素相互作用過程才構(gòu)成現(xiàn)實的原因,從而生成現(xiàn)實的結(jié)果,形成作為潛在物創(chuàng)構(gòu)過程的因果關(guān)系。這種因果關(guān)系不同于既定物生成的因果關(guān)系。正是由此可以看到描述和創(chuàng)構(gòu)兩個不同的空間和過程,看到兩種不同的認識旨趣形成的必然性和合理性。
創(chuàng)構(gòu)是基于人們的需要,根據(jù)所設(shè)立的潛在結(jié)果,得到與這一潛在結(jié)果相聯(lián)系的因素體系,并確定和控制這些因素的相互作用過程,獲得想得到的結(jié)果的過程。這種具有未來時態(tài)的相關(guān)關(guān)系狀態(tài)給人類創(chuàng)構(gòu)未來提供了無限廣闊的自由度。以過程哲學(xué)研究著稱的懷特海把這一點表述得淋漓盡致:“根據(jù)本體論原則,所有事物在現(xiàn)實中確定地在什么地方,而在潛在中則在任何地方。”1這在基本原理上表明了相關(guān)關(guān)系對于人類創(chuàng)構(gòu)活動及其發(fā)展的深層意蘊。endprint
在這里,一方面是作為既定因素和結(jié)果關(guān)系所反映的相關(guān)關(guān)系;另一方面是作為因素與可能物(潛在結(jié)果)關(guān)系反映的相關(guān)關(guān)系。一方面是作為既定物原因和結(jié)果關(guān)系反映的因果關(guān)系;另一方面是作為可能物原因和結(jié)果關(guān)系反映的因果關(guān)系。兩種關(guān)系構(gòu)成一種對稱,而對稱軸則既是過去和未來的時間軸,更是現(xiàn)實和可能的時空軸。正是大數(shù)據(jù)從量的方面給出更高層次的整體觀照,使我們看到這一前所未有的時空軸對稱的壯觀圖景。
由這一時空軸對稱圖景,不僅可以更清晰地看到因果關(guān)系之于相關(guān)關(guān)系的基礎(chǔ)性地位,更可以看到因果性和相關(guān)性的關(guān)系,看到因果關(guān)系和相關(guān)關(guān)系二者的結(jié)構(gòu),看到相關(guān)關(guān)系及其量化把握為更深入理解因果關(guān)系及相關(guān)哲學(xué)問題所開啟的新前景。
在有人參與的簡單相關(guān)關(guān)系體系中,主客二分的認識框架不僅可以有效用于描述,而且更為簡潔方便,但在復(fù)雜的相關(guān)關(guān)系體系中,尤其是在大數(shù)據(jù)相關(guān)關(guān)系中,有人參與的因素體系至為復(fù)雜,人作為因素不再可能當(dāng)作起支配作用的主體處理。在那里,人作為因素之一,更合理的角色定位是施事者(agent)。
與潛在結(jié)果相聯(lián)系的因素之間的關(guān)系,可以是施事者對因素和可能結(jié)果之間關(guān)系的意識反映。而且對可能結(jié)果的意識可以與施事者的意圖相關(guān)。正是大數(shù)據(jù)對豐富多樣相關(guān)關(guān)系的展示,人們得以從因果關(guān)系深入到因素關(guān)系。也正是通過“相關(guān)”,大數(shù)據(jù)使“因素”這一關(guān)鍵概念得以凸顯,從而導(dǎo)向了與描述不同的創(chuàng)構(gòu)——對新事物的創(chuàng)設(shè)。而創(chuàng)構(gòu)正是在大數(shù)據(jù)基礎(chǔ)上,以數(shù)據(jù)物化為典型形式的基本活動。由于這一基本活動將是人類越來越重要的生活方式,它也將成為哲學(xué)研究越來越重要的主題。
在大數(shù)據(jù)中,因果關(guān)系為相關(guān)關(guān)系提供了哲學(xué)根據(jù)。作為因素相互作用過程確定性關(guān)系的描述,因果性在更深層次關(guān)系到大數(shù)據(jù)的哲學(xué)意蘊。而大數(shù)據(jù)相關(guān)關(guān)系則通過對因果關(guān)系理解的深化,開辟了關(guān)于因果關(guān)系乃至哲學(xué)本身更廣闊的思考空間。從線性到非線性相關(guān),從非線性相關(guān)到人的因素,從人的因素到創(chuàng)構(gòu)活動,從創(chuàng)構(gòu)活動到人的需要,從人的需要到哲學(xué)的最終目的,從抽象普遍性終極追尋到量的整體性具體把握,這些都是大數(shù)據(jù)相關(guān)關(guān)系和因果關(guān)系引出的進一步話題。
(責(zé)任編輯:周小玲)
Correlation in Big Data and Its Deep Causal Meaning
Wang Tianen
Abstract: The informational nature of and the highlights of correlations by big data urge people to reflect deeply on correlations and its connection with causality. The redefinition of the concept of causality and its quantificationally spreading shows the fortune of causality in the process of matter datamation: a loss in terms of in evitability and direction as well as a gain in relationship strength and positive and negative properties. Correlations are causal derivative relationships.The mechanism of causal derivative relationship determines the probabilistic nature of correlation,illustrates the strength and levelof causal derivation of correlation. Correlations in big data has deep causal connotations, it means the reveal of causal tense, the quantifying grasp of the causality back over the past and the creation of new causality towards future.
Keywords: Big Data; Correlation; Causality; Causal Tenseendprint