魏 濤,杜國平
(1.中國社會科學(xué)院大學(xué) 哲學(xué)院, 北京 102488; 2.中國社會科學(xué)院 哲學(xué)所, 北京 100732)
現(xiàn)階段的人工智能是數(shù)學(xué)式的信息處理系統(tǒng),在一定程度上可以回答問題、解決問題,但無法理解問題、思考問題,缺乏可解釋性。而因果性解釋能夠回答為什么的問題,是科學(xué)解釋的主要形式。朱迪亞·珀爾(Judea Pearl)將“為什么”作為科學(xué)解釋的核心問題,認為當(dāng)前的“智能機器缺乏對因果關(guān)系的理解,這也許是妨礙它們發(fā)展出相當(dāng)于人類水平的智能的最大障礙”[1]。基于統(tǒng)計學(xué)的視角,珀爾等人構(gòu)建了一套能夠?qū)㈩A(yù)測、干預(yù)和反事實算法化的因果語言,通過因果模型表征因果知識,給出了因果關(guān)系的形式化、數(shù)學(xué)式的定義。HP定義是一種應(yīng)用性定義,在一定程度上符合因果定義的基本要求:時序性、相關(guān)性和不間斷性;可為人工智能領(lǐng)域表征因果知識提供方法,為確立實際原因提供一般性原則。
20世紀以來,對因果關(guān)系的討論不再局限于哲學(xué)領(lǐng)域,還出現(xiàn)在統(tǒng)計學(xué)、心理學(xué)、物理學(xué)和人工智能等多個學(xué)科領(lǐng)域的研究中,由定性研究轉(zhuǎn)向定量分析,由還原分析轉(zhuǎn)向路徑分析,呈現(xiàn)出學(xué)科結(jié)合的研究趨勢。在哲學(xué)領(lǐng)域中,孔斯(Koons)認為:“近年來因果研究的分野主要來自對事件—類型間因果關(guān)系和事件—殊型間因果關(guān)系的關(guān)注?!盵2]但是,從近幾年的文獻中可以發(fā)現(xiàn),殊型和類型因果關(guān)系的研究并非是涇渭分明的,而是將反事實分析、語境、過程、時間等因素和概率因果論相結(jié)合,多元化地定義因果關(guān)系,并綜合考察事件間因果關(guān)聯(lián)的可能性。根據(jù)定義的不同出發(fā)點可將其分為3種:實質(zhì)性定義、操作性定義和應(yīng)用性定義。
休謨(Hume)認為,人類能夠經(jīng)驗到的是相似物象的恒常匯合,而無法感覺到物象之間的任何紐帶,因此原因與結(jié)果之間不再具有必然性,而是一種或然性。物象出現(xiàn)時,會在心靈上產(chǎn)生一種習(xí)慣性的轉(zhuǎn)移,這種轉(zhuǎn)移實質(zhì)上就是物象間的恒常匯合,也就是因果關(guān)系。由此,休謨給原因下定義為:“所謂原因就是被別物伴隨著的一個物象,在這里我們可以說,凡和第一個物象相似的一切物象都必然被和第二個物象相似的物象所伴隨?;蛘邠Q一句話說,如果第一個物象不曾存在,那第二個物象也必不曾存在?!盵3]休謨雖是在經(jīng)驗范圍內(nèi)追尋因果觀念的本質(zhì),但是并未涉及具體事物的特征、時間、地點等信息,是在類型上定義因果關(guān)系,力圖陳述的是“因果關(guān)系是什么”的問題,希望借助某種方式將物象間的接續(xù)關(guān)系還原到物象的性質(zhì)、事態(tài)上。
在規(guī)則性定義中,休謨開創(chuàng)了反事實定義方法,還原因果關(guān)系的實質(zhì)。而后的大衛(wèi)·劉易斯(David Lewis)明確給出了因果的反事實定義。命題間的依賴關(guān)系包含了兩個條件句:O(c)□→O(e)和﹁O(c)□→﹁O(e),且命題間的反事實依賴關(guān)系可對應(yīng)于事件間的反事實依賴關(guān)系。由此,事件e反事實地依賴于事件c,當(dāng)且僅當(dāng)兩個反事實條件句O(c)□→O(e)和﹁O(c)□→﹁O(e)為真。命題間的真值關(guān)系映射到事件間為(1)若c發(fā)生,則e將發(fā)生;(2)若c不發(fā)生,則e將不發(fā)生。當(dāng)e和c的反事實依賴關(guān)系成立時,則c是e的原因。同時,為堅持因果關(guān)系的傳遞性,將因果關(guān)系定義為殊型事件之間因果依賴的傳遞閉包:“令c、d、e……是殊型事件的有限序列,d依賴于c,c依賴于d,諸如此類等等,這個序列為因果鏈條。一事件是另一事件的原因,當(dāng)且僅當(dāng)存在這樣一個連續(xù)的因果鏈條?!盵4]因果鏈條的定義雖是為說明因果關(guān)系的傳遞性,但為因果關(guān)系的反事實依賴特征提供了有力辯護。
20世紀以來,因果論發(fā)展的主要方向是運用統(tǒng)計學(xué)中的概率刻畫原因和結(jié)果之間的關(guān)系,認為原因可改變結(jié)果發(fā)生的概率。概率的引入使得因果關(guān)系的探討從經(jīng)驗范圍縮小到科學(xué)實驗中,通過觀察、測量變量(可以是事件、數(shù)據(jù)、現(xiàn)象)之間的相關(guān)數(shù)據(jù)變化,運用數(shù)學(xué)公式計算變量間因果關(guān)系的隨機性程度。概率計算的因果關(guān)系不再是一種“有或無”的關(guān)系,而是一種可能性分析。其中,概率因果論的代表性人物薩普斯(Patrick Suppes)追隨休謨,將物象之間的伴隨關(guān)系表示為一種概率關(guān)系,通過定義表面原因(prima cause)給出真實原因(direct cause)的定義,如下:
定義1:Bt′是At的表面原因,當(dāng)且僅當(dāng)
(i)t′﹤t; (t=時間)
(ii)P(Bt′)﹥0;
(iii)P(At/Bt)=P(At)。
定義5:事件Bt′是At的真實原因,當(dāng)且僅當(dāng),Bt′是At的表面原因,且不存在t″和πt″,使得對于πt″的每個Ct″來說,
(i)t′﹤t″﹤t;
(ii)P(Bt′Ct″)﹥0;
(iii)P(At/Ct″Bt′)=P(At/Ct″)[5]。
薩普斯對真實原因的定義所要表達的意思為:若第一個事件的出現(xiàn)被第二個事件以較高的概率跟隨,且無第三個事件存在于第一和第二事件之間,則第一個事件是第二個事件的原因。概率式的分析斷言“X和Y是因果相關(guān)的”:在特定實例中,改變X的值將影響Y的值。這種改變往往發(fā)生在干預(yù)行為中,“相對于一個系統(tǒng)S,X引起Y當(dāng)且僅當(dāng)如果在系統(tǒng)S中發(fā)生了一個干預(yù)I,使得X的值發(fā)生了變化,相應(yīng)的Y值也發(fā)生了變化,并且X與Y之間的這種關(guān)系是穩(wěn)定的”[6]。對此,伍德沃德(James Woodward)從干預(yù)主義出發(fā)定義類型層面的因果關(guān)系:“X是Y的真實原因,當(dāng)且僅當(dāng)X對Y的影響不能被集合V中的任何其他變量所干涉,在下列意義上來說就是:當(dāng)V中所有其他變量賦值與X變化無關(guān)的某固定數(shù)值時,存在對X的可能干涉將改變Y值或者Y的概率分布。”[6]
哈爾彭(Joseph Y.Halpern)和珀爾將反事實依賴擴展為“據(jù)情形的依賴”(contingent dependency)給出了實際因果關(guān)系(殊型因果關(guān)系)的“初版定義”,之后為消除混雜因子,通過增強條件做出微調(diào)得到“最終定義”。“初版定義”(稱為HP定義)如下:
HP定義是方程結(jié)構(gòu)模型式的定義,主要運用于經(jīng)濟學(xué)領(lǐng)域、社會科學(xué)領(lǐng)域和人工智能領(lǐng)域。結(jié)構(gòu)方程模型建立在一般因果關(guān)系的知識基礎(chǔ)上,對特定事件相關(guān)的知識背景進行編碼,選定變量賦值,從而判定特定情形中具體事件的原因。結(jié)構(gòu)方程模型也可稱為因果模型,也是一種預(yù)測模型,通過變量賦值來預(yù)測行為的結(jié)果和干預(yù)的結(jié)果。干預(yù)變量取值可推翻原來的因果關(guān)系結(jié)構(gòu),即在不會干擾其他變量取值的情況下,破環(huán)某個變量的初始取值,計算結(jié)論變量取值,從而發(fā)現(xiàn)真實的因果關(guān)系。模型化或者形式化的定義是一種實踐方法,基于知識和數(shù)據(jù)的組合闡明因果關(guān)系,進行因果推斷,證明、分析因果假設(shè),預(yù)測行為和政策的結(jié)果,評估、解釋觀察到的事件和情形。
因果關(guān)系中的因和果可以是事物、現(xiàn)象、客體、情景等。從邏輯上來看,事物、現(xiàn)象、客體及情景都是關(guān)系者項,不同因果關(guān)系中涉及到不同的項,且可簡單表示為cRe或者R(c,e)。從形式來看,兩個變項c、e之間的因果關(guān)系是一種二元關(guān)系,基于實際中發(fā)生或者不發(fā)生取值0或1。c是e的原因當(dāng)且僅當(dāng)c=1和e=1,往往表示為c?e,即若c為真,則e存在原因,或者是c為e提供一種因果解釋。概率的表示方法為P(E=1|C=1)>P(E=1|C=0),意思為c出現(xiàn)時e出現(xiàn)的概率大于c不出現(xiàn)時e出現(xiàn)的概率。邏輯或者概率的表征方式取決于經(jīng)驗世界中的因果關(guān)系,所以判定變項之間是否具有因果關(guān)系,需要從內(nèi)容方面做出考量。基于事實經(jīng)驗的要求,休謨認為符合通則的對象之間才有可能產(chǎn)生因果關(guān)聯(lián),由此奠定了因果關(guān)系成立的基調(diào):原因先于結(jié)果,原因和結(jié)果之間在空間和時間上是相互接近的。而后,因果定義中引入概率、時間等因素,且與過程、語境相結(jié)合也未能改變休謨的基調(diào)。
從邏輯上來看,時間是多維的,可劃分為3種:先于關(guān)系、同時關(guān)系和后于關(guān)系,即A先于B、A和B同時、A后于B。因果關(guān)系涉及到時間問題,即原因和結(jié)果在時間上的先后問題?!皶r間本來是有方向的,這已往致將來只是根據(jù)于時間固有的方向而說的話,說因致果也是根據(jù)于時間底方向而說的話。”[8]時間的方向性導(dǎo)致因果的方向性,意味著因和果不是同時發(fā)生的,而是有先后順序的,存在時間間隔。這種時間間隔的存在,不僅體現(xiàn)了因到果的一種變化,而且象征著因?qū)淖饔眯枰?jīng)歷一個過程。若因和果無時間上的間隔,二者處于同一時間,或者同時產(chǎn)生,就無法區(qū)分原因和結(jié)果,就無所謂經(jīng)驗上所認為的導(dǎo)致與被導(dǎo)致、引起與被引起的關(guān)系。因此,時間上的先后關(guān)系是定義因果關(guān)系的一種本質(zhì)要求,確保了事件之間的關(guān)系是真實的,而非虛假的。因此,單純從時間上來看,因果關(guān)系是因和果之間的一種連續(xù)或者接續(xù)關(guān)系,這種接續(xù)關(guān)系由時間的一維性所決定。
因果關(guān)系者項是獨立且相關(guān)的兩個事件、現(xiàn)象等。從邏輯上來看,獨立意味著二者之間是不相容的,而相關(guān)性卻非邏輯上的相關(guān),是經(jīng)驗或者事實的相關(guān),這種相關(guān)是由事物的內(nèi)在結(jié)構(gòu)所決定的一種相關(guān)。第一,相關(guān)性是一種質(zhì)上的關(guān)聯(lián),是事物性質(zhì)間具有的某種聯(lián)系。比如,在火柴可以點燃木柴的案例中,涉及到的變項有氧氣、木材和火柴等,三者之間只有具備了一定的化學(xué)或者物理性質(zhì),在一定條件下才能夠產(chǎn)生因果關(guān)系。第二,相關(guān)性還是一種時空的相關(guān)性,要求變項在時間和空間上的間隔是恰當(dāng)?shù)?,作為原因的關(guān)系者項在時間t1上產(chǎn)生的作用經(jīng)過恰當(dāng)?shù)臅r間和空間才能夠形成結(jié)果,若空間距離過大、時間間隔過長,可能無法產(chǎn)生某種結(jié)果。比如,在球擊碎玻璃的事件中,若踢球的力度較小,球飛行一定的距離落地,無法達到窗戶也就不能導(dǎo)致玻璃破碎,球和玻璃之間不存在因果關(guān)系。所以,相關(guān)不一定是因果關(guān)系,但具有因果關(guān)系的事件之間必然具有相關(guān)性。
從原因到結(jié)果會經(jīng)歷一定的時間和空間這樣一個過程。這個過程實質(zhì)上是一個不間斷的鏈條,且無居間事件的存在。若從初始事件到結(jié)果的鏈條中,存在居間事件,即c→c1→c2→…→e,居間事件也可能遮斷初始事件到結(jié)果的關(guān)系。比如,登山者幸存的案例構(gòu)造出的鏈條為:巨石滾落→巨石發(fā)出巨響→登山客驚覺→登山客躲避→登山客幸存,按照此鏈條得到不合常理的結(jié)論是巨石滾落使得登山客幸存。從經(jīng)驗上來看,巨石滾落導(dǎo)致的結(jié)果應(yīng)為登山客受傷,而這種結(jié)果之所以沒發(fā)生,則是“登山客躲避”而打破了原有的因果關(guān)系,而形成了新的因果關(guān)系,即登山客躲避導(dǎo)致登山客幸存。所以,從初始事件到結(jié)果的鏈條中,引發(fā)結(jié)果的不再是初始事件,而是距離結(jié)果最近的前置事件。正如因果模型中所示的,父變量是子變量的原因。在原因到結(jié)果的路徑上,簡單的圖型表示變量間的因果關(guān)系,即C→E,表示從C到E存在一個直接的路徑,C是E的原因。
基于結(jié)構(gòu)方程語言,珀爾等刻畫因果關(guān)系成立的條件,結(jié)果并不總是反事實依賴于原因,而是在一定情形下依賴于原因,將傳統(tǒng)的反事實依賴擴展到依情形而定的依賴,是一種依賴于語境的因果關(guān)系。非本質(zhì)性的定義具有一定的合理性。
1.非時序因果關(guān)系中的時間信息
關(guān)于時序信息,在HP定義中似乎無法直觀獲取。變量間的因果影響是從非時序性的數(shù)據(jù)中獲取的,即一種非時序性的因果關(guān)系。在此,基于統(tǒng)計學(xué)的觀點,時間信息并不是區(qū)分因果關(guān)系的唯一標(biāo)識。但是在定義過程中,對時間信息還是給予關(guān)注。比如,在定義潛在原因(potential cause)和真實原因(genuine cause)時,都包含有時間信息。變量X對Y有潛在因果影響,其中一個基本考量就是變量X早于且臨近于Y才可能是Y的潛在原因或真實原因。結(jié)合時間信息可定義真實因果關(guān)系(genuine causation with temporal information):即變量X對Y有因果影響,若第三個變量Z和語境S,同時先于X發(fā)生,使得1.(ZYS);2.(ZY(S∪X)[10]??山忉尀椋骸盎赯=Yt-2和S={Xt-3,Yt-3},Xt-2作為Xt-1的潛在原因;基于Z=Yt-2和S={Yt-1},Xt-1作為Xt的真實原因?!盵10]關(guān)于這一點,珀爾通過圖1給予說明,圖1可解釋為:在語境S中,若條件X可以將Z和Y之間的依賴關(guān)系轉(zhuǎn)為獨立關(guān)系,則X可調(diào)節(jié)Z和Y之間的依賴性;在Z先于X的情況下,這種調(diào)節(jié)蘊涵X對Y有因果影響。統(tǒng)計意義上談?wù)摰臅r間可以和物理時間相一致或相反,或者對應(yīng)于馬爾可夫鏈中的任何方向。但是,在Z→X→Y鏈條中,作為一種由馬爾可夫鏈所決定的統(tǒng)計時間只有一種,且與物理時間相一致。因此,統(tǒng)計現(xiàn)象必須展現(xiàn)出基本的時序偏差。雖然時間信息并不是因果關(guān)系的唯一標(biāo)識,但是不包含時間信息的概率函數(shù)并不能單獨推出模型中箭頭的方向,而變量間不同的箭頭方向有著不同的本質(zhì)。所以,忽略時間信息所帶來的結(jié)果是無法形成一種確定性的,正如珀爾提到的:“假設(shè)V=0(可觀察變量)但缺乏時間信息,科學(xué)家無法排除基本結(jié)構(gòu)是一種完備的、無環(huán)的和任意秩序的圖型的可能性——一種結(jié)構(gòu)可以模擬任何模型的行為,而不考慮變量排序。”[10]所以,HP定義雖關(guān)于時間信息的討論并不直接,但是持一種認同態(tài)度。
圖1 包含時間信息的真實因果關(guān)系
2.模型中變量的相關(guān)性
HP定義中的因果關(guān)系者項為變量。在構(gòu)建模型的過程中,首先面臨的問題是如何選取變量的問題,而變量選取的基本依據(jù)是相關(guān)性。這種相關(guān)性展現(xiàn)在語境和模型中。在定義中,AC3作為最小條件發(fā)揮了“剃刀”作用,剔除不相關(guān)因素。比如,在查尋森林著火原因的過程中,變量包含F(xiàn)(森林著火)、L(雷擊)和MD(縱火犯扔下點燃的火柴)等,而類似變量O(氧氣充足)則作為隱形條件一般不出現(xiàn)在模型中,不作為原因的考慮因素?;趯嶋H需要而選擇的變量分為外生變量和內(nèi)生變量。在理論上看來,內(nèi)生變量集合V是未知的,可觀察的變量可通過不同因果關(guān)系連結(jié),由此適合已知概率分布的模型有多個甚至是不受限制的。若模型無所限制,就無法對基本現(xiàn)象的結(jié)構(gòu)做出有意義的斷言。因此,需要通過語境來約束變量的選擇及其取值。作為已知項的外生變量,其取值是確定的,構(gòu)成了特定的語境,而內(nèi)生變量作為原因的候選者,其取值由外生變量通過方程決定。若變量X1…Xm是Y的真實原因,則Y通過方程可表示為:Y=FY(X1…Xm),當(dāng)對變量X1…Xm賦值時,將獲得Y的取值,當(dāng)X1…Xm的值變化時,Y的值將發(fā)生變化。所以,方程模型不僅刻畫變量間的因果影響,還可以描述變量之間的依賴關(guān)系及反事實依賴關(guān)系,進而體現(xiàn)變量間的相關(guān)性。
3.因果圖中的“父子關(guān)系”
HP定義建立在因果關(guān)系的表征基礎(chǔ)上。其中,有向無環(huán)因果圖(DAG)是表征因果關(guān)系的主要方式。有向無環(huán)圖是一組有序?qū)?V,E),其中V表示圖中結(jié)點的集合,E是連結(jié)結(jié)點的有向邊集合。從結(jié)點X到結(jié)點Y的有向邊表示X直接導(dǎo)致Y。X是Y的父結(jié)點,即X是Y的真實原因當(dāng)且僅當(dāng)從X到Y(jié)存在一條直接路徑。如圖2中,變量V={X,Y,Z,S,W},在S→X→Y→W的鏈條中,S是父結(jié)點,X是子結(jié)點,從S引箭頭到X表示S是X的直接原因,S的取值對X的取值有因果影響,且S通過其他變量不能產(chǎn)生對X的影響。同樣,在此路徑中,X結(jié)點阻斷了Z到W的路徑,即X遮斷了S和X的子孫之間的聯(lián)系,或者是結(jié)點S和X的子結(jié)點阻斷了結(jié)點S和結(jié)點Y之間的信息流通,導(dǎo)致結(jié)點S和結(jié)點Y不可直接用箭頭連接,S和Y、W是條件獨立的,根據(jù)S的值并不能給Y、W提供其他的信息。這種條件獨立體現(xiàn)在AC2條件中,在因果路徑上,X是Y的原因,X的取值變化時,Y的取值也將發(fā)生變化,在變化過程中其他變量取值并不改變;當(dāng)其他變量的取值變化時,X的取值不變,Y的取值也將不變。Y的取值是否變化與X的取值直接相關(guān),即X和Y之間是一條無居間變量的因果鏈條。
圖2 因果鏈條中的“父子關(guān)系”
“因果關(guān)系的HP定義是與模型相關(guān)的。在一種模型中,A可以是B的原因,但是在另一個模型中卻不是?!盵9]同一情形的因果模型可以是多個,模型不同,因果歸因則不同。哪個模型更符合直觀和實際,面臨著模型選取的問題。造成結(jié)果差異的是變量的劃分:即外生變量和內(nèi)生變量的劃分。“外生變量選擇的不同將導(dǎo)致不同的結(jié)論,雖然看起來似乎準(zhǔn)確地描述了相同的情形?!盵9]從總體上來看,變量取值在一定程度上具有客觀性,但是變量的劃分帶有一定的主觀偏好。一個變量作為哪種性質(zhì)變量出現(xiàn),取決于建模者的需要,即所考慮的語境。比如,一起交通事故的原因,剎車故障、道路設(shè)置的不合理、不嫻熟的駕車技術(shù)、酒駕、心理因素等都可能導(dǎo)致車禍。此時根據(jù)主體需要構(gòu)建出的模型存在差別,車禍的歸因則不同。若律師將醉酒和下雨作為外生變量的話,則剎車壞掉是車禍的原因,即U={D(醉酒),R(下雨)},U={B(剎車),TA(車禍)},若B=1,則TA=1。此模型中結(jié)構(gòu)方程集合為:B=1;TA=1。若將下雨、醉酒這些因素劃分內(nèi)生變量中,則醉酒和下雨都是導(dǎo)致車禍的原因,即若D=1且R=1且B=1,則TA=1。形成的結(jié)構(gòu)方程集合為:D=1;R=1;B=1;TA=1。模型無好與壞的區(qū)分,但責(zé)任劃分卻存在很大區(qū)別。對此,往往是通過增加一個或多個虛擬變量或者是工具變量來結(jié)構(gòu)化情景而區(qū)分模型。比如,當(dāng)D=0且R=0,B=1時即干預(yù)D和R的變量取值,而不改變關(guān)于B方程的取值,測量TA的取值。此構(gòu)造的新模型的結(jié)構(gòu)方程集合為:D=0,R=0,B=1,TA=?而TA的取值依賴統(tǒng)計數(shù)據(jù),比如剎車的測量數(shù)據(jù)、駕駛者的心理因素等。變量間的因果影響的強度由數(shù)據(jù)決定,數(shù)據(jù)是否充分嚴重影響模型的穩(wěn)定性。變量的選擇問題轉(zhuǎn)化了數(shù)據(jù)的充分性問題。此外,添加變量是否會模型變得雜亂或者無意義,也需要做出進一步的考量。