亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        因果推斷三種分析框架及其應用綜述

        2023-01-19 09:41:25馬忠貴徐曉晗劉雪兒
        工程科學學報 2022年7期
        關鍵詞:因果關系對象效應

        馬忠貴,徐曉晗,劉雪兒

        北京科技大學計算機與通信工程學院,北京 100083

        為什么需要研究因果關系?因為有三件事需要在厘清原因的情況下才能更好地做到,那就是:解釋、預測和干預.合理的解釋可以為探索世界提供支撐,準確的預測可以可靠地描述事件結果.有時我們可能需要用一些理由去解釋事件發(fā)生的原因,不僅想知道為什么發(fā)生,更希望可以利用其中某些信息來促進或者避免某些結果的產(chǎn)生,也就是對原本的事件施加干預(可以是一項行動、措施或政策)去得到特定的結果.

        無論是哲學、自然科學還是社會科學領域,研究因果關系一直是人類持之以恒探索的終極目標.從Sabine和Russell[1]對亞里士多德“四因說”中因果概念的論述:事物的出現(xiàn)所必需的條件都被稱為原因;到文獻[2]中所研究的關于確定現(xiàn)象因果聯(lián)系的“穆勒五法”,再到文獻[3]中論述了Hume提出的從“是”能否推出“應該”,也即“事實”命題能否推導出“價值”命題.哲學領域對因果關系相關概念做出了透徹論述,因果關系的哲學思想發(fā)展史縱貫兩千余年,因果推斷的統(tǒng)計方法至今依然在社會學、計量經(jīng)濟學、流行病學等諸多科學領域發(fā)揮余韻,并展現(xiàn)出了巨大的潛力.培根曾提出“真正的知識是根據(jù)因果關系得到的知識”,如何找到一種科學普適的方法探尋事物間的因果關系,隨著人類認知的發(fā)展不斷精深,依舊是一項不小的挑戰(zhàn).

        目前因果推斷的方法主要可以分為基于實證的方法和基于數(shù)據(jù)觀察的方法.其中,實證方法是進行因果關系推斷的黃金標準,其干預決策是隨機的,公認最有效的是隨機對照試驗(Random controlled trials,RCT),也稱為 A/B 測試(A/B Test).隨機對照試驗將參與者隨機分配到對照組或實驗組,并將在試驗中對照組和實驗組唯一的預期差異視為實驗的結果.然而,隨機對照試驗雖然是分析因果關系的絕佳環(huán)境,但其受到倫理限制、個體不依從等因素影響,往往具有不可操作性,其試驗范圍也不可能遍及所有真實場景,因此在很大程度上限制了因果推斷的應用.基于數(shù)據(jù)觀察的觀察性研究(Observational study)也是一種常用方法.研究人員在沒有任何干擾的情況下觀察受試者并得出數(shù)據(jù),從觀測數(shù)據(jù)中得到他們的行動及其結果,但不能得到他們采取特定行動的動機.基于數(shù)據(jù)觀察方法的核心問題就是如何基于已有的觀測數(shù)據(jù)得到反事實結果,這是頗具挑戰(zhàn)性的一項工作,主要原因如下:(1)根據(jù)獲取到的觀測數(shù)據(jù)只能得到事實結果,無從得知其反事實結果;(2)在無干預的觀測環(huán)境中,試驗往往不是隨機分配的,這可能會因觀察對象群體分布不同有較大偏差.為了合理地從數(shù)據(jù)中推斷因果關系,研究者們構建出了基于潛在結果模型和結構因果模型兩種主流方法的分析框架,我們將針對不同的分析框架分別進行介紹.

        本文先介紹因果關系和因果推斷過程中所涉及到的基本概念,以輔助對后文因果推斷的理解;然后我們將分別闡述現(xiàn)階段因果推斷中三種主流分析框架:反事實框架、潛在結果模型和結構因果模型;再介紹因果推斷在各個學科領域的研究應用;最后總結三種分析框架的主要特點,并提出因果推斷未來的應用前景及其巨大潛力.

        1 因果推斷的相關概念

        1.1 相關不是因果

        事物間的因果關系常常是我們經(jīng)常要面對和分析的問題,研究因果的意義在于:在許多領域,我們需要理解數(shù)據(jù)并據(jù)此做出進一步的行動和決策.比如對于我們而言,常常會想要知道“學歷越高就會找到越好的工作嗎?”政府可能想知道“增設離婚冷靜期會對離婚率有影響嗎?”醫(yī)生可能想知道“某種藥劑的使用會增加患者康復的幾率嗎?”這些問題的核心就是因果效應,即:X的變化會對Y造成影響嗎?如果會,Y受影響的程度要如何度量?在研究因果關系的基礎上,還要進一步挖掘因果關系產(chǎn)生的原因及其造成的影響.

        從時間序列的角度,經(jīng)濟學家Granger[4]給出了因果關系的文字描述:如果利用X可以更好地預測Y,那么就可以說X是Y的原因.經(jīng)過后來的研究不難發(fā)現(xiàn),這段描述中存在著一些謬誤;嚴格來說,這句話描述的是相關關系,而非因果關系.那么相關關系和因果關系究竟有何不同?其實,相關表示一種一般關系,即:當兩個變量同時呈現(xiàn)出增加或減少的趨勢時,它們就是相關的;而因果關系中原因會導致結果,結果部分取決于原因.兩個變量之間即便沒有相關關系也可能具有因果關系,反之有相關關系也可能沒有因果關系.例如,一項研究表明,通常吃早飯的人比不吃早飯的人體重輕,因此得出結論:不吃早飯有利于減肥.但事實上,不吃早飯和體重輕之間可能只是相關,而并非因果關系.從事實的角度出發(fā)為這個現(xiàn)象尋求一種解釋,可能只是因為每天吃早飯的人習慣于保持一種健康的生活方式,定期運動、睡眠規(guī)律、飲食健康,最終才擁有了更加理想的體重.在這類情況中,擁有更健康的生活方式是吃早飯和輕體重的共同原因,因此也可以將其視為吃早飯和輕體重之間因果關系的混淆因素.

        因此,相關不是因果.雖然相關關系在統(tǒng)計學中取得了一系列成果,但因果關系可以拓展傳統(tǒng)統(tǒng)計學解決新問題所需的必要內(nèi)容,并可延伸到其他學科,因此更具研究價值.

        1.2 因果推斷的基本概念

        在因果推斷中有一些基本概念,某種程度上在幾類分析框架中是通用的,也是理解因果推斷的基礎,以下將分別進行介紹.

        (1)同一個研究對象(Unit):即在施加干預以研究因果關系時選定的研究對象,可以是一個物理對象也可以是一個對象的集合;在潛在結果模型中,不同時間點下的研究樣本是不同的研究對象.(2)干預(Treatment):干預指對一個樣本采取的行為,用W∈{0,1,2,...,Nw}表示干預,目前大多數(shù)因果推斷采用二元干預,即采用了干預(W=1)的樣本劃為干預組;未進行干預(W=0)劃為對照組.(3)潛在結果(Potential outcome)和事實結果(Observed outcome):在現(xiàn)實世界中,對于每一個研究對象,其在每一種干預下都存在一個可能的結果,即潛在結果;而在真實觀測數(shù)據(jù)中出現(xiàn)的結果稱為事實結果.(4)效應(Effect):效應即評判干預與否所導致結果差別的指標,通過對各個研究對象干預與否的潛在結果的比較得出.(5)分配機制(Assignment mechanism):哪些結果可以被觀察到主要取決于干預的分配機制,即哪些研究對象對應采取了哪些干預.對于一個二值干預,X=1代表干預組,X=0代表對照組,在接受干預分配X=x后結果變量表示為Yx,表示接受相應干預后的潛在結果.

        1.3 因果推斷的分析框架

        近幾十年來,因果推斷一直是許多領域的關鍵性研究課題,在各個領域都涌現(xiàn)出了令人矚目的研究成果.2008年,諾貝爾經(jīng)濟學獎獲得者Heckman[5]提出了政策評價中出現(xiàn)的三個基于因果推斷且極具挑戰(zhàn)性的難題:

        (1)評價歷史上出現(xiàn)的干預對結果的影響;

        (2)預測在一個環(huán)境中曾經(jīng)經(jīng)歷過的干預在其他環(huán)境中的影響;

        (3)預測歷史上從沒有經(jīng)歷過的干預在各種環(huán)境中的影響.

        通常認為,哲學和統(tǒng)計學得益于定量化數(shù)據(jù)記錄對各個學科的普適性以及統(tǒng)計學以數(shù)據(jù)為分析對象的特點,先后提出了三種分析框架,即反事實框架、潛在結果模型和結構因果模型.反事實框架介紹因果效應的起源,潛在結果模型和結構因果模型是在反事實理論的基礎上進一步發(fā)展,并成為了發(fā)現(xiàn)因果關系和評價因果效應時理論最成熟、應用最廣泛的兩種因果推斷分析框架.隨著實證研究方法的不斷創(chuàng)新發(fā)展,對于如何界定因果關系以及推斷事物間的因果關系已經(jīng)有了比較成熟的理論,以下將詳細闡述.

        2 反事實框架

        在因果關系的研究中,對于因果關系的界定幾個世紀以來哲學家們都沒有給出一個明確的定義,這主要是因為因果關系中原因和結果的定義在某種程度上都是以彼此為闡述條件,即需要結果來定義原因,也需要原因來判定結果,使得二者的關系紛繁復雜、撲朔迷離.

        在很長一段時間內(nèi),哲學中關于因果推理的主要范式是遵循“連續(xù)性或相關性的規(guī)律”,將因果推斷看成是一個挖掘事物規(guī)律的過程.無論是Cook等[6]提出的判定因果關系的三項原則,還是Lazarsfeld[7]提出的因果判定方法,都強調因果關系中“規(guī)律性”的影響;隨后,越來越多的學者認識到通過連續(xù)性或相關性的規(guī)律并不一定能得出真正的因果關系,使得哲學中開始出現(xiàn)通過反事實框架(Counterfactual framework)來探究因果關系的方法.Hume[8]于18世紀最早提出基于反事實框架討論因果關系并給出了反事實的文字化闡述,Lewis[9]在Hume的研究基礎上給出了反事實框架的符號化表達,結合可能世界語義學和反事實來刻畫因果依賴性,并形成了“界定可比較相似性→用相似性來說明反事實→用反事實來定義反事實依賴性→用反事實依賴性來闡述因果依賴性→用因果依賴性來解釋因果性”的邏輯鏈條.Lewis提出的因果依賴命題是對Hume因果關系的正式概括—“若事件A沒有發(fā)生,則事件B也不會發(fā)生”,一旦這一反事實命題成立,則可得出“若事件A發(fā)生,則事件B發(fā)生”的命題自然成立.至此,Lewis完成了從因果依賴性向因果性的跨越,他指出:“如果A和B是兩個現(xiàn)實事件且滿足若A不發(fā)生則B不發(fā)生,則可以確定事件A是事件B的原因”,這一結論給出了因果關系中對于原因和結果比較明晰的界定方法,為因果關系的理論思考提供了一種明確的道路.

        3 潛在結果模型

        在因果推斷的理論體系中,潛在結果模型(Potential outcomes framework)是其中最重要的理論模型之一.潛在結果模型由哈佛大學知名統(tǒng)計學者Rubin提出,因此該模型又稱Rubin因果模型.潛在結果模型的核心是對同一個研究對象,比較其接受干預和不接受干預的效應.對于接受干預的研究對象而言,其不接受干預是一種“反事實”狀態(tài),而對于不接受干預的研究對象而言,其接受干預就是一種“反事實”狀態(tài).對于“反事實”框架的概念,Rubin卻并不認同,他認為對于一個研究對象,其結果出現(xiàn)與否主要取決于分配機制(Assignment mechanism),事實上我們只能看到一種結果,但并不意味著另一種結果不存在,這并不是一個非黑即白的概念,因此用潛在結果去描述事件是一種更加恰當?shù)姆绞?

        3.1 基本概念

        潛在結果模型跳脫出因果推理的正統(tǒng)思想,轉而著重哲學中反事實框架的影響,通過借鑒統(tǒng)計學中隨機對照試驗和潛在結果的概念,構建了因果推斷的新分析框架.潛在結果模型的核心假設是“沒有假設就沒有因果”,以下將分別介紹潛在結果模型中涉及到的一些必要概念,以更好地理解這種分析框架.

        潛在結果框架分析中,通常說因果將干預和研究對象聯(lián)系在一起,干預就是原因,干預所導致的結果就是效應.Imbens和Rubin在文獻[10]中提出潛在結果的含義,即:給定一個研究對象和一系列干預,將每一對“干預-結果”界定為一個潛在結果.在潛在結果模型中,文獻[11]將因果效應定義為同一個研究對象潛在結果之差,令Y表示研究對象i接受干預或對照的結果,則因果效應(Individual causal effect,ICE)可定義為ICE(i)=Y1(i)?Y0(i).盡管Rubin等學者清楚地定義了一個研究對象的因果效應,但是通常對于同一個研究對象,不可能既接受干預又接受對照,自然也不能夠同時觀測到兩種結果.統(tǒng)計學中往往關注總體的統(tǒng)計特征,利用潛在結果還可以得到總體的平均因果效應(Average causal effect,ACE).假設所有研究對象都接受干預X=1的平均結果為E(Y1),所有研究對象都接受對照X=0的平均結果為E(Y0),則可通過ACE(i)=E(ICE)=E(Y1?Y0)=E(Y1)?(Y0)來表示平均因果效應的兩個平均結果之差.

        統(tǒng)計學家Fisher給出了識別平均因果效應的方法—隨機對照試驗,即將干預隨機分配給研究對象i.例如,通過拋硬幣決定研究對象i是否接受干預,這個隨機決定的過程與潛在結果無關,可以保證潛在結果(Y1,Y0)與干預分配機制完全獨立,進而得到E(Yx)=E(Y|X=x),平均因果效應可以通過在干預組與對照組中觀測到的結果變量期望之差ACE=E(Y|X=1)?E(Y|X=0)得到,計算式中不再含有潛在結果變量Y1和Y0,可以通過傳統(tǒng)的統(tǒng)計方法分別估計E(Y)=E(Y|X=1)和E(Y)=E(Y|X=0)來推斷平均因果效應.在實際研究中,隨機對照試驗往往需要比較理想的試驗條件.一旦隨機對照試驗條件不成立,這種通過計算干預組與對照組之間差值來得到平均因果關系的方法就面臨著內(nèi)生選擇性偏差[12]、差別化干預效應偏差等問題的困擾.文獻[13]定義了觀察性研究的概念,其不再滿足隨機分配的條件,在此種情形下如果忽略協(xié)變量的作用,僅通過隨機對照試驗方法估計因果效應就會產(chǎn)生偏差,乃至造成統(tǒng)計學悖論.

        3.2 關鍵假設

        在哲學和統(tǒng)計學領域,許多優(yōu)秀的學者為潛在結果模型的研究發(fā)展做出了卓越貢獻,Hume[14]和Mill[15]作為哲學家的典型代表最早從反事實框架的視角討論因果關系;Fisher[16]及Neyman等[17]則各自從統(tǒng)計學家的立場出發(fā),分別提出從潛在結果和隨機的視角來討論因果關系.Fisher提出了“隨機對照試驗”的概念,而Neyman提出了“潛在結果”并將其應用于隨機對照試驗,Rubin在文獻[18]中進一步結合了“潛在結果”和“隨機對照試驗”這兩個概念,系統(tǒng)性地提出了潛在結果模型的理論假設、核心內(nèi)容和推理方法.Neyman利用數(shù)學語言描述了潛在結果框架下的因果效應,Rubin將這一數(shù)學定義推廣到觀察性研究中,潛在結果模型作為一種因果推斷的重要分析框架,其本身需要建立在一些基本假設和前提之上,如果現(xiàn)實情況不能滿足其基本假設,潛在結果的結論就不成立,本節(jié)我們將重點討論潛在結果模型的三個基本假設.

        3.2.1 研究對象干預值穩(wěn)定性假設

        研究對象干預值穩(wěn)定性假設(Stable unit treatment value assumption,SUTVA)是一個先驗假設,從廣義上看,研究對象干預值穩(wěn)定性假設強調兩個要點:(1)研究對象之間不存在相互影響,互相獨立;(2)每種干預的單一性,即不同層次的干預在SUTVA下不能歸因為同一種干預[19].

        Rubin[20]在1986年指出無論分配干預X到研究對象i的分配機制是什么,也無所謂其他研究對象接受干預與否,研究對象i受到干預X影響而得到的結果總是不變的.這一假設中既明確了其他研究對象的決策對參考研究對象接受干預與否沒有影響,也包含了分配機制對潛在結果沒有影響的假設.

        STUVA假設意味著每個研究對象所做出的決策并不受其他研究對象影響,然而在現(xiàn)實中這往往是不現(xiàn)實的,因為其是針對潛在結果模型的不完全假設,完全忽略了研究對象之間相互影響的間接效應.針對STUVA的局限性,Sinclair等[21]提出了部分干擾假設(Partial interference assumption),即對干預分配機制進行兩階段隨機對照設計,第一階段給研究對象隨機分層到不同干預分配策略,第二階段將同層級內(nèi)的研究對象進行隨機干預或對照.實驗表明,當群體在空間、事件或社會性上充分分離的情況下,部分干擾假設可能是合理的.

        3.2.2 可忽略性假設

        觀察性研究僅對觀測數(shù)據(jù)進行觀察,以推斷變量間的因果效應,但這種方法不能由研究者決定是否針對某些研究對象采取干預或對照操作,因此觀察性研究不再滿足隨機對照試驗的條件.

        在可忽略性假設(Ignorability of treatment assignment mechanism)中闡述了干預分配機制的可忽略性;即,在給定協(xié)變量V的條件下,干預X的分配獨立于潛在結果(Y1,Y0)獨立于X|V.可忽略性假設表明了兩點:(1)如果給定兩個研究對象共同的協(xié)變量V,不管他們的分配機制如何,二者的潛在結果應該是相同的;(2)如果給定兩個研究對象共同的協(xié)變量V,無論他們潛在結果的值是什么,它們的干預分配機制應該是相同的.因此,可忽略性假設又被稱為無混雜假設,它意味著在具有相同協(xié)變量的研究對象之間,無論進行干預還是進行對照都不會影響潛在結果,也就是分配機制不會因為研究對象接受干預或者不接受干預的結果產(chǎn)生任何影響.

        3.2.3 正值假設

        如果在給定某些協(xié)變量的情況下,其干預分配機制是固定不變的,那么在這些依據(jù)協(xié)變量所做的分層中,至少有一種潛在結果是無法觀察到的,在這種情況下,是無法通過潛在結果之間的差別來推斷因果關系的.例如,假設有兩種藥物A和B,想要評估藥物A對孕婦的影響,孕中期的孕婦總是被分配服用藥物A,那么在孕中期孕婦這個分組中研究藥物B對其影響是沒有意義的.正值假設可用數(shù)學符號表達為:0<p(X=1|V)<1,表明在基于協(xié)變量的分層中,每個研究對象接受干預或對照的概率都是正值.正值假設表明了分配機制的可變性,這對估計干預效果有著不可忽視的重要意義.

        在文獻[10]中,可忽略性假設和正值假設一起被稱為強可忽略性分配假設(Strongly ignorable treatment assignment).E(Y1?Y0)=E[E(Y1?Y0|V)]=E[E(Y|X=1,V)?E(Y|X=0,V)]即可表示總體可識別平均因果效應,由可忽略性假設和正值假設條件相合得到.可忽略性假設表明了隨機對照試驗和觀察性研究的區(qū)別,當協(xié)變量的分布在干預組和對照組不一致時,就會產(chǎn)生一些偏差,我們將在下一部分進行討論.

        3.3 潛在結果的因果推理方法

        觀察性研究中如果忽略了協(xié)變量的作用,僅使用隨機對照試驗進行因果關系推斷就會產(chǎn)生偏差,我們就將這種影響因果關系估計的變量稱為混雜因素.文獻[22]基于相關關系的度量定義混雜因素為:如果兩個變量之間相關關系的度量受到第三個變量的影響,那么稱第三個變量為混雜因素.文獻[23]從潛在結果出發(fā)定義了混雜因素:p(Y1|X=1)=p(Y1|X=0)且p(Y0|X=1)=p(Y0|X=0),即如果干預總體的潛在結果Y0和Y1的分布與對照總體的潛在結果的分布相同,那么可以說在干預組和對照組之間無因混在因素而產(chǎn)生的混雜偏差.

        本節(jié)將在3.2節(jié)所介紹的潛在結果模型的三個基本假設基礎上,對潛在結果模型中現(xiàn)有的因果推理方法進行延展,根據(jù)其控制混雜因素的方式,我們重點介紹其中三種:匹配法、逆概率加權和分層方法.

        3.3.1 匹配法

        在可忽略性假設中,協(xié)變量在干預組和對照組之間的差別往往對因果推斷的準確性起著舉足輕重的作用,為了消除協(xié)變量分布在兩組研究對象之間的差異,匹配法(Matching methods)常用于觀察性研究中,其目的就是對每一個研究對象匹配一個具有相同或相近協(xié)變量取值的研究對象集合,使得通過匹配得到的數(shù)據(jù)在干預組和對照組之間有著相同的協(xié)變量分布,然后再根據(jù)匹配數(shù)據(jù)進行因果推斷.Cochran和Rubin[24]在1973年提出用一個或多個協(xié)變量構建協(xié)變量集合,但在一些因果關系中,所涉及到的協(xié)變量較多,難以判定根據(jù)哪些協(xié)變量構造的集合做匹配才能得到最準確的結果.因此,文獻[25]中提出了傾向值匹配(Propensity score matching),即將協(xié)變量的傾向值作為參考值來構造匹配集合,并逐漸成為了觀察性研究中最常用的匹配方法;這種方法形式化定義傾向值為給定協(xié)變量時干預的條件概率,并提出如果在給定協(xié)變量的情況下可忽略性假設成立,那么在給定傾向值時可忽略性假設也成立,因此可以用傾向值替代協(xié)變量在因果推斷中進行分層或匹配,從而避免了從眾多協(xié)變量中遴選最適組合的困難.文獻[26]中根據(jù)給定研究對象集合,提出根據(jù)研究對象匹配數(shù)構造匹配集合的方法,并根據(jù)通用匹配估計平均因果效應.如果在實際運算中無從得知真實的傾向值,那么可以首先根據(jù)觀察數(shù)據(jù)進行預先估計,然后再用估計所得的傾向值做匹配,常用的基于傾向值匹配的方法包括回歸[27]和決策樹[28]等.

        3.3.2 逆概率加權

        除匹配法之外,逆概率加權估計方法[29]也是一種基于傾向值的方法.由于混雜因素的存在,干預組和對照組的協(xié)變量分布不同,會導致內(nèi)生選擇性偏差,逆概率加權就是消除內(nèi)生選擇性偏差最有效的方法之一.通過給觀測數(shù)據(jù)中的每個研究對象分配適當?shù)臋嘀兀梢詣?chuàng)建一個干預組與對照組具有相似分布的偽總體.樣本重加權方法涉及到的關鍵概念—均衡得分(Balancing score),經(jīng)均衡得分處理后的協(xié)變量與干預分配機制相獨立,傾向值就是均衡得分中的一種.

        逆概率加權(Inverse propensity weighting, IPW)將權重w分配給每個研究對象:w=X/π(x)+(1?X)/(1?π(x)),其中,X表示 分配機制,π(x)表示傾向值.文獻[30]在重加權后,可以將∑平均因果效應的逆概率加權估計為:文獻[31]表明,經(jīng)不同規(guī)模的研究表明傾向值機制足以消除因協(xié)變量而產(chǎn)生的偏差;然而在實際估計中,逆概率加權的正確性高度依賴傾向值的正確性,一旦傾向值計算出現(xiàn)偏差就會嚴重影響逆概率加權的準確性.

        3.3.3 分層方法

        分層方法(Stratification)又被稱為子分類,是調整混雜因素的代表性方法之一.這種方法通過將整個總體劃分為同質的子分層(Block)來調整因干預組和對照組之間差別造成的偏差.理想狀況下每個子層中干預組和對照組在協(xié)變量前提下的特定觀測值是相似的,因此,同個子層中的研究對象可以看作遵循隨機對照試驗的分配機制,也可以依據(jù)隨機對照試驗中的計算方法計算各子層內(nèi)的平均因果效應.與直接計算干預組和對照組結果差值的估計方法相比,分層方法顯著降低了平均因果估計的偏差,但如何確定分層方式又是另一個研究要點.

        等概率(Equal-frequency)方法[25]通過傾向值對總體進行分層,使得協(xié)變量在每一個子層中具有相等的傾向值,總體的平均因果效應則通過每個子層中平均因果效應的加權平均進行估計.然而這種方法會在某些權重過高或過低的子層中導致較大的方差,針對這類問題,文獻[32]提出了一種對傾向值分層得到的子層進行逆概率加權的估計方法,降低了等概率方法中出現(xiàn)的高方差問題.

        4 結構因果模型

        除潛在結果模型外,因果推斷中使用最多的一類模型就是結構因果模型(Structure causal model,SCM),Pearl[33]闡述了這兩類模型的等價性.相比之下,潛在結果模型更加精確,而結構因果模型更加直觀.結構因果模型可以描述多個變量之間的因果關系,Pearl基于貝葉斯網(wǎng)絡提出了外部干預的概念,并基于外部干預對因果關系形成了一種形式化表達方法,開創(chuàng)了從數(shù)據(jù)中發(fā)掘因果關系和數(shù)據(jù)產(chǎn)生機制的方法.

        4.1 圖形化的因果關系

        圖論作為一種用途廣泛的數(shù)學語言,可以直觀地描述事物之間相互影響的關系,也能夠經(jīng)過簡單運算解決因果問題.在數(shù)學中,有向圖[34]中節(jié)點X和Y之間的路徑是指從X開始到Y結束的一系列由邊首尾相接的節(jié)點,路徑上的第一個節(jié)點稱為該路徑上所有節(jié)點的祖先節(jié)點,其他節(jié)點俱為祖先節(jié)點的后代節(jié)點[35].如果兩個節(jié)點之間的路徑能夠沿著箭頭方向追蹤,那么這條路徑就稱為有向路徑.當圖中存在一個節(jié)點存在回到自身的有向路徑時,這個圖稱為有環(huán)圖,不存在環(huán)的有向圖就是有向無環(huán)圖(Directed acyclic graph,DAGs)[33].

        從因果推斷經(jīng)典問題辛普森悖論[36]可知,某些決策無法僅從數(shù)據(jù)本身獲得有效信息,而是要細究數(shù)據(jù)背后的原因.為了能夠嚴格地處理這些因果關系問題,Pearl尋找出了一種能夠借助圖論這種數(shù)學工具形式化表述數(shù)據(jù)背后因果假設的方法,即結構因果模型(Structural causal model,SCM).其可用于描述現(xiàn)實世界關聯(lián)特征及其相互作用,具體而言,結構因果模型描述了如何為感興趣的變量賦值.

        從形式上看,結構因果模型由一組函數(shù):f={fx:Wx→X|X∈V},和兩個變量集U和V構成,其中U中的變量稱為外生變量,V中的變量稱為內(nèi)生變量,模型中的每一個內(nèi)生變量都至少是一個外生變量的后代;外生變量在圖中表現(xiàn)為一個根節(jié)點,它沒有祖先節(jié)點,特別不能是內(nèi)生變量的后代.如果知道每個外生變量的值,那么利用函數(shù)fx就可以完全確定每個內(nèi)生變量的值.

        我們主要討論基于有向無環(huán)圖的結構因果模型[37],因此可以給出因果關系的圖形化定義:在圖模型中,如果變量X是變量Y的子節(jié)點,那么Y是X的直接原因;如果變量X是變量Y的后代節(jié)點,那么Y是X的潛在原因(非傳遞性的特殊情況此處不予討論).

        在結構因果模型的理論體系中,因果關系的推斷依托于有向無環(huán)圖的三種基本路徑結構,即鏈狀結構、叉狀結構和對撞結構,三種結構具有不同的信息流轉方式,所有因果圖都可以拆解為這三類結構的組合,因此路徑結構在結構因果模型的學習中占據(jù)著舉足輕重的地位.鏈狀結構(Chain)就像一條鏈子一樣,可以表示為:X→Y→Z,表示信息僅可單向流通;叉狀結構(Forks)X←Y→Z表示信息可以從中間分發(fā)到兩端;對撞結構(Collider)X→Y←Z表示中間同時接收兩端節(jié)點的信息.在結構因果模型中不管多么復雜的結構都可以拆分為以上三種結構的組合,三種結構也可能導致不同的偏差.鏈狀結構會導致過度控制偏差,叉狀結構會導致混淆偏差,對撞結構會導致內(nèi)生選擇性偏差;在復雜因果模型的拆解分析中需要考慮全部因果路徑,才能推斷出準確的因果關系.

        4.2 因果關系的三個層級

        因果關系已經(jīng)成為了現(xiàn)代社會最重要的認知工具之一,基于人類認知的發(fā)展,Pearl[33]將因果關系劃分為三個層級:第一個層級是關聯(lián)(Association),它涉及到由數(shù)據(jù)定義的統(tǒng)計相關性,觀察性研究也正是依托于這一層級而實現(xiàn)的統(tǒng)計學方法;第二個層級是干預(Intervention),它不僅表明了通過觀測數(shù)據(jù)能直觀地看到規(guī)律,更想知道如果對觀察對象做出干預行為會導致什么結果;第三個層級是反事實(Counterfactual),這一層級是對過去所發(fā)生的行為的溯因和思考,比如“如果某個研究對象沒有采取A操作,而是采取B操作,與現(xiàn)在得到的結果會有何不同?”人類要想改變世界和創(chuàng)構世界,就要邁上因果之梯的更高層級.

        4.2.1 關聯(lián)

        圖模型不僅能提供對因果關系的直觀表述,還能有效表達聯(lián)合分布.利用結構因果模型可以有效表示n個變量的聯(lián)合分布:通過確定表述變量之間關系的n個函數(shù),以及誤差項的概率分析,就可以得到聯(lián)合分布概率以及各個邊緣概率之間的關聯(lián).對于任何有向無環(huán)圖,模型中變量的聯(lián)合分布可以通過計算條件概率分布P(子節(jié)點|父節(jié)點)的乘積得出,它不再需要創(chuàng)建一個概率表,在海量模型數(shù)據(jù)運算中節(jié)約了大量的時間;因此,圖的深層意義就是將一個高維分布估計問題降維成一個低維分布估計問題.

        但是當我們無法得知變量之間具體的函數(shù)關系,或無法獲取誤差項的分布時,就可以應用下述d-分離法則解決以上問題.實際應用中基于圖模型的因果關系表達往往更加復雜,變量之間可能有多條路徑連接,且每個路徑耦合多個基礎路徑結構;因此,應用貝葉斯網(wǎng)絡中的d-分離方法對一個復雜的因果圖模型做解構.d-分離的判斷方法是一對節(jié)點之間是否存在一條連通路徑,如果存在即為d-連通;如果不存在則為d-分離,也就是這兩個變量相互獨立.d-分離主要分為兩類:①不以特定節(jié)點為條件,只有對撞節(jié)點可以阻斷一條路徑;②以特定節(jié)點為條件,包含鏈狀和叉狀結構的中間節(jié)點以及對撞結構除對撞節(jié)點外的其他節(jié)點.使用d-分離工具研究復雜圖模型的優(yōu)勢在于d-分離是非參數(shù)的,僅需要依托圖模型進行運算,而不需要參考變量之間的函數(shù)關系,并且d-分離僅能實施局部性的檢驗模型,而非進行全局性的檢驗,這使得它可以識別假設模型中有缺陷的特定區(qū)域并對其進行修復完善,從而得到一個全新的模型.

        4.2.2 干預

        關聯(lián)是以觀測數(shù)據(jù)為研究對象進行統(tǒng)計分析,其并未改變數(shù)據(jù)的分布,而干預就是要改變現(xiàn)有的數(shù)據(jù)分布.在理想情況下,隨機對照試驗輸出變量的變化必然是由于輸入變量而引起的.在隨機對照試驗不可行的情況下,研究者們采用觀察性研究方法,但這種方法很難將因果關系從相關關系中識別出來,因此,在實際應用中研究通過干預方法預測干預措施的效果顯得尤為重要.對此,Pearl[38]提出用do運算表達干預.比如P(Y=y|X=x)表示在X=x的條件下Y=y的概率分布,它反映了在X取值都是x的個體上Y的總體分布.而P(Y=y|do(X=x))表示通過干預使X=x時Y=y的概率分布,它反映了將群體中所有個體的X取值都固定為x時Y=y的總體分布.

        因果推斷中的識別性和傳統(tǒng)統(tǒng)計中的識別性定義是一致的.統(tǒng)計學中,如果兩個不同的模型參數(shù)對應不同的觀測數(shù)據(jù)的分布,那么我們稱模型的參數(shù)可以識別.這里,如果因果效應可以用觀測數(shù)據(jù)的分布唯一地表示,那么我們稱因果效應是可以識別的,因果關系可以通過do表達式和圖模型從相關關系中識別出來.在明確因果關系可識別后,就需要通過施加相應的干預來研究其因果效應,結構因果模型中對研究對象施加干預主要依托以下三種手段.

        (1)校正公式:在因果估計中,通過計算平均因果效應以估計接受干預do(X=1)和do(X=0)之間的差別,但是在沒有因果關聯(lián)的情況下,無從直接通過觀測數(shù)據(jù)本身估計因果效應.因此需要通過借助圖模型,以對圖進行處理的方式模擬干預,即對哪個變量進行干預就把指向它的箭頭去掉.在校正公式中使用Pm表示修改后的圖模型的概率,因此也被稱為操縱概率.

        假設X是Y的原因,且Z是X,Y的共因,即因果圖中存在X→Y和X←Z→Y兩條路徑.如果想要通過干預知道P(Y=y|do(X=x))的值,也即是Pm(Y=y|X=x),則將Z指向X的箭頭移除.在經(jīng)過干預后,Z的邊緣分布是不變的,即Pm(Z=z)=P(Z=z),因為移除指向X的箭頭是不影響Z的概率分布的;同時,經(jīng)過干預后,條件概率P(Y=y|Z=z,X=x)也是不變的,因為不管X是自發(fā)變化還是被干預變化,Y對X和Z的響應函數(shù)不變.因模型修改后X與Z是d-分離的,即Pm(Z=z|X=x)=Pm(Z=z)=P(Z=z).

        綜上可知:P(Y=y|do(X=x))=∑zPm(Y=y|X=x,Z=z)Pm(Z=z).最后利用不變性關系,得到一個將干預降維表示的概率公式P(Y=y|do(X=x))=∑zP(Y=y|X=x,Z=z)P(Z=z),這就是校正公式.校正公式對Z的每一個取值z計算了X和Y之間的關系,然后對這些值求平均,這個過程就被稱為“對Z的校正”.

        (2)后門準則:根據(jù)校正公式的討論可以得知,為了確定一個變量對另一個變量的因果效應,需要對該變量的父節(jié)點變量進行校正;但實際上變量往往會受到一些不可觀測的父節(jié)點影響,因此需要找到一個替代變量集合來用于校正.那么這個問題就引發(fā)了另一個深層次的問題:在什么條件下,因果圖足以描述給定數(shù)據(jù)集的因果效應?這就涉及到了計算因果效應的一個重要干預工具—后門準則.

        后門準則[39]的標準定義為:給定一個有向無環(huán)圖G及其中一對有序變量(X,Y),如果變量集合Z中的節(jié)點都不是X的后代節(jié)點,且以Z阻斷了X,Y之間的所有含有指向X的路徑(即后門路徑),那么Z滿足X,Y之間的后門準則,X對Y的因果效應可以通過校正公式進行計算.后門準則的變量集合Z要求:①可以阻斷任何含有指向X的后門路徑,避免使X,Y相關但不傳遞X產(chǎn)生的因果效應;②不以X的后代節(jié)點為條件,避免阻斷X,Y之間的因果路徑;③不以對撞節(jié)點為條件,避免在X,Y之間產(chǎn)生新路徑.

        (3)前門準則:在嘗試采取隨機對照試驗以外的方法估計因果效應時,后門準則提供了一種簡便方法識別需要校正的變量集合,但當變量X,Y之間存在不可觀測變量無法阻斷從X到Y的后門路徑時,其因果效應依然是不可識別的[40].為了處理這種特殊情況,Pearl提出了前門準則:給定一個有向無環(huán)圖G及其中一對有序變量(X,Y),如果變量集合Z中的節(jié)點①切斷了所有X,Y之間的有向路徑;②X到Z之間沒有后門路徑;③所有Z到Y的后門路徑都被X阻斷;那么可以通過前門準則進行校正.

        例如,圖模型G中存在兩條因果路徑:U→Y和U→X→Y→Z.假設U是不可觀測變量,且沒有變量能夠阻斷X←U→Y這條偽路徑,P(Y=y|do(X=x))只能通過兩次后門準則來識別.首先,X到Z之間沒有后門路徑,因此其因果效應可識別P(Z=z|do(X=x))=P(Z=z|X=x);其次,從Z到Y的后門路徑Z←X←U→Y以X為條件阻斷,再將兩部分因果效應連接∑起來獲得的整體因果效應,P(Y=y|do(Z=z))=xP(Y=y|X=x,Z=z)P(X=x)去除do運算得到前門公式,再將兩部分連接起來獲得X,Y的整體因果效應:P(Y=y|do(X=x))=∑zP(Y=y|do(Z=z))P(Z=z|do(X=x)),用以上兩個公∑式替換,去除do運算得到:P(Y=y|do(Z=z))=xP(Y=y|X=x,Z=z)P(X=x),即前門公式.

        基于校正公式的前門準則和后門準則在消除do運算的情況下對因果圖進行干預,僅通過已知的觀測數(shù)據(jù)和變量分布就可以對變量間的因果關系進行推斷.從理論上講,這兩種方法已經(jīng)基本涵蓋了因果推斷中的大部分可能性,但是實際上,我們無法通過觀測數(shù)據(jù)得到所有Z的可能取值,更無法對Z的全部值計算概率再求和,在干預方法導致算力受限時,可以通過逆概率加權方法克服校正方法的實際困難.

        4.2.3 反事實

        基于結構因果模型的反事實推理核心在于:雖然現(xiàn)實情況下X=1,但假如X=0時,Y會發(fā)生怎樣的變化?從上一部分我們知道可以通過do運算對因果圖進行干預從而估計因果關系,但是在反事實中,do運算太過籠統(tǒng),不能明確區(qū)分干預與反事實,因此使用新的表達方式來標記事實結果與反事實結果.

        (1)反事實的定義與形式化表達.

        定義一個完全確定的模型M并用G表達M中的函數(shù)集,已知外生變量集U和內(nèi)生變量集V,其中U=u代表對某個外生變量的賦值.反事實語句“在U=u的情況下,若假設X取值x,則Y會取值y”記作Yx(u)=y,其中X,Y均為V中的任意兩個變量.假設一個結構因果模型M,其中X=aU,Y=bX+U,那么計算反事實Yx(u),即在U=u情況下,假設X取值x,Y的取值情況;用X=x替換掉X=aU得到修改模型Mx,再代入U=u得到Yx(u)=bx+U.將反事實概念推廣到任何結構因果模型M,反事實Yx(u)可形式化定義為:Yx(u)=YMx(u),表示模型M中的反事實Yx(u)定義為修改后的子模型Mx中Y的解.反事實一般遵循如下一致性規(guī)則:如果X=x,則Yx=y.

        反事實因果估計一般分為確定性模型和非確定性模型,針對這兩種因果模型的計算都可以分三步走.其中,針對確定性模型:①溯因(Abduction),用證據(jù)E=e確定外生變量U的值;②行動(Action),修改模型M并用X=x替換掉原來模型中變量X的表達式;③預測(Prediction),使用修正后的模型Mx和U計算反事實結果Y值.從時間出發(fā)對上述計算步驟進行解釋,首先根據(jù)當前證據(jù)e解釋過去U,再通過最低限度的干預來符合假設的X=x,最后根據(jù)對過去的認識和新增的條件來預測未來.類似的,針對非確定性的模型總結的計算步驟為:①溯因,通過證據(jù)更新P(U)獲得P(U|E=e);②行動,修改模型M并用X=x替換掉原來模型中變量X的表達式;③使用修正后的模型Mx和P(U|E=e)計算反事實結果Y值.

        使用do運算表達干預是一種很好的方法,那么能否在反事實中也沿用do運算呢?首先,反事實表達與do運算之間存在著巨大差異:do運算刻畫了干預之下的總體行為,而Yx(u)描述了一個特定研究對象U=u在干預之下的行為,反映了計算總體水平與個體水平之間的差別.do運算不能刻畫反事實問題,即E(do(X=1),Z=1)≠E(YX=1|Z=1).因為前者將Z=1看作干預后的條件在X=1和X=0兩個前提下所滿足的不同研究對象的集合,而后者是在當前世界中定義Z=1的單獨研究對象集合,do運算不能描述后者.因此,do運算可以描述干預后的世界,而反事實既能描述單一世界又能刻畫跨世界的事件概率.

        (2)反事實的圖形化表達.

        反事實作為結構方程的衍生理論,也可以在與模型相關的因果圖中得到表達.如果修改模型M得到子模型Mx,那么Mx中的結果變量Y就是原模型中的反事實Yx.模型修改要求移除所有指向修改變量X的箭頭,也就是說,只有在修改后的模型中,與變量Y相關聯(lián)的節(jié)點替換為與Yx相關聯(lián)才成立.

        事實上,如果變量集Z滿足X→Y的后門條件,那么在給定Z的條件下,對于變量X的所有取值x,反事實結果Yx都與X獨立,即P(Yx|X,Z)=P(Yx|Z).根據(jù)以上∑定理結合一致性規(guī)則便可得到,P(Yx=y)=zP(Yx=y|X=x,Z=z)P(z),這就是熟悉的校正公式.

        4.3 結構因果研究方法

        結構因果模型主要解決的問題是識別變量間的因果效應,其與潛在結果所解決的問題具有一定的相似性,但可以比潛在結果模型更加精準地判斷混雜因素[41].比如,當一個變量與干預對象和結果變量相關時,利用潛在結果方法無法判斷出其是否是混雜因素,但文獻[40]基于結構因果模型方法提出了區(qū)分混雜因素和其他變量的方法文獻[39]提出了基于結構因果模型的前門準則識別方法.相較于潛在結果模型,結構因果模型方法需要知曉現(xiàn)有因果模型,而潛在結果模型無需得知結構模型,但是需要遵循三個基本假設[42].

        SCM是對變量間因果關系的定性分析,將結構因果模型進行參數(shù)化,利用結構方程模型(Structure equation model,SEM)定量描述.在SEM中結果變量Y可以用結構方程表達為Y=f(X,a),其中X是研究對象集合,a是誤差項且獨立于X.文獻[43]提出了當誤差項不滿足高斯分布或結構方程為非線性時,研究對象與誤差項之間的因果關系是可識別的;文獻[44]將潛在混雜因素納入因果推斷的考量范疇,并使用獨立成分分析技術(Independent component analysis,ICA)進行推理模型選擇.針對似然函數(shù)存在的馬爾可夫等價類問題,文獻[45]將SEM引入似然函數(shù)計算框架實現(xiàn)了似然函數(shù)和SEM的結合算法;文獻[46]提出了一種采用分治策略的混合加誤差模型與條件獨立性檢測的因果方向推斷方法.針對存在隱含變量的因果關系推斷,文獻[47]利用探索性因子分析得到相對獨立的各個隱含變量,再使用路徑分析算法估計變量之間的因果關系.針對高斯稀疏圖模型,文獻[48]基于原有圖模型構造了可逆的馬爾可夫鏈,在高維稀疏圖上進行隨機抽樣;文獻[49]提出了一種基于互信息的高維數(shù)據(jù)因果推斷算法,將高維網(wǎng)絡結構學習問題分解為每一個節(jié)點的因果推斷問題.文獻[50]中比較了DAG、SEM、貝葉斯網(wǎng)絡和TAN貝葉斯網(wǎng)絡四種模型在數(shù)據(jù)因果推斷中的原理和應用價值,并為因果推斷模型選型提供了有力的參考依據(jù).

        5 應用

        研究因果關系、挖掘因果關系的科學方法對各個學科領域都具有一定的普適性,因果推斷在計量經(jīng)濟學、計算機科學等領域中都得到了頗為豐碩的研究成果.

        早期計量經(jīng)濟學的主要目標是運用概率統(tǒng)計方法對經(jīng)濟變量之間的因果關系進行定量分析,更加偏重總結、估計和假設檢驗,并不十分關注預測.機器學習則因其實操屬性更加片中預測而非因果推斷.進入大數(shù)據(jù)時代后,二者的聯(lián)系開始加強,傳統(tǒng)計量方法在樣本量少且維度低的數(shù)據(jù)中應用效果較好,但無法很好地處理大規(guī)模和高維異構數(shù)據(jù).大數(shù)據(jù)時代的豐富數(shù)據(jù)為從概率論立場研究因果關系提供了新視角,海量樣本數(shù)據(jù)有助于從根本上克服由于抽樣偏頗所引起的內(nèi)生選擇性偏差,使得對因果關系的檢驗比有限樣本的抽樣數(shù)據(jù)更為文件可靠.2015年,Bareinboim和Pearl[51]提到了因果推斷和數(shù)據(jù)融合問題,提出將機器學習融合到高維數(shù)據(jù)因果推斷中的初步構想.文獻[52]從機器學習與傳統(tǒng)因果推斷計量方法相結合入手,總結機器學習在策略評估和事后分析中的應用.文獻[53]利用機器學習算法循環(huán)將各協(xié)變量劃分成多個子層,計算每個子層內(nèi)的平均因果效應后,再加權得出總體平均因果效應,利用隨機森林估計傾向得分.文獻[54]則引入?yún)f(xié)變量平衡傾向得分,通過模型的干預分配來優(yōu)化協(xié)變量平衡,顯著改善了傾向得分匹配和加權方法的性能.目前大多數(shù)研究都利用機器學習“數(shù)據(jù)驅動”的特點,全面考慮各種模型以進行反事實推斷,如文獻[55]中提出了一種雙重選擇方法,分別篩選與干預分配和結果變量都相關的協(xié)變量,并對兩組協(xié)變量進行最小二乘回歸,相較于簡單正則化回歸,該方法改善了平均因果效應的估計效果.文獻[56]則分別使用決策樹、隨機森林、K近鄰和神經(jīng)網(wǎng)絡來揭示數(shù)據(jù)模式的流程,可以更好地闡明交互作用和非線性效果,作為傳統(tǒng)因果推斷的補充.文獻[57]提出了一種雙穩(wěn)健的交叉擬合估計器以估計平均因果關系,在大樣本場景下具有更好的統(tǒng)計特性.文獻[58]提出了一種新的基于機器學習的無監(jiān)督學習方法—基于視覺常識區(qū)域的卷積神經(jīng)網(wǎng)絡,將學習目標由常規(guī)的似然性轉換為基于因果干預,僅使用特征連接來支持各種高級任務.

        因果推斷在計算機科學中也具有廣泛應用,可與計算機視覺、推薦系統(tǒng)等方向結合.在計算機視覺中,現(xiàn)有的視覺問答(Visual question answering, VQA)更多地傾向于依賴語言而未能充分了解視覺和語言的多模態(tài)知識.文獻[59]以Pearl所構建的概率圖模型為基礎,綜述了現(xiàn)今主流多模態(tài)統(tǒng)計學習方法,利用大數(shù)據(jù)背景下多模態(tài)數(shù)據(jù)對同一對象的描述形式多源異構、內(nèi)在語義一致的特點研究更為有效的跨模態(tài)匹配.文獻[60]根據(jù)因果關系提出基于反事實框架的VQA模型,能夠通過從總因果效應中減去直接語言效應來減少對答案的提問和降低語言偏差的提問.文獻[61]通過建立因果推斷框架尋求輸入樣本造成的直接因果效應,降低了深度學習圖像分類中因長尾效應的存在而導致的結果偏差,可以有效解除矛盾效應并提高識別準確率.文獻[62]在弱監(jiān)督的語義分割中基于圖像背景和階級標簽之間的因果關系,提出上下文調整(CONTA)方法,以消除圖像級分類中的混淆偏差,從而為后續(xù)分割模型提供更好的基礎.在零次學習(ZSL)和開放式識別(OSR)中,常見的挑戰(zhàn)是由已知類別上進行訓練所的結果推廣到未知類別,但已知和未知的類別之間的識別率嚴重不平衡;文獻[63]為ZSL和OSR提出一個反事實框架,有效改善了已知和未知的分類失衡問題,模型在整體性能方面得到顯著提高.針對基于關注的視覺語言模型中的混淆效果難以消除的問題,文獻[64]基于前門準則提出新的因果機制,通過減輕混淆效果提高注意力機制的性能.針對推薦系統(tǒng)存在的選擇偏差,文獻[65]通過提出一種新的域自適應算法,采用小型無偏的數(shù)據(jù)集來糾正選擇偏差.盡管推薦系統(tǒng)能夠產(chǎn)生高質量的建議,但由于使用黑盒預測模型,通常不能提供直觀的解釋;文獻[66]在維持推薦模型的預測準確性的基礎上,將來自用戶交互歷史的因果規(guī)則作為黑盒順序推薦機制的解釋,利用反事實方法提取推薦模型的個性化因果關系,為黑盒推薦模型的行為提供個性化和更有效的解釋.

        6 結論

        通過對反事實框架、潛在結果模型和結構因果模型的分別闡述,不難看出這三類分析框架既有共同點,也存在差異.反事實框架更多的是一種文字描述,所涉及到的符號表達比較有限,更多依賴文字表達因果關系理論,哲學中的反事實更多是對休謨思想的清晰化闡述;但反事實框架基本仍停留在哲學思想層面,即便部分學者使用反事實框架描述因果關系,但其依然是根據(jù)潛在結果模型或結構因果模型來構造.

        潛在結果模型強調對同一研究對象施加干預或不施加干預的效應進行比較從而得出該干預所產(chǎn)生的因果效應,它的成立依賴于三個關鍵假設:第一、研究對象干預值穩(wěn)定性假設,即研究對象之間相互獨立彼此干預與否都不會影響其他研究對象;第二、可忽略性假設,即給定協(xié)變量的前提下,干預分配機制不會對潛在結果產(chǎn)生影響;第三、正值假設,即在基于協(xié)變量的分層中,研究對象接受干預或對照的概率都是正值.基于以上假設,潛在結果模型又有匹配、逆概率加權和分層等因果推斷方法.潛在結果模型將觀察性研究和試驗性研究統(tǒng)一在一個框架下進行結合,在有限的條件下使觀察性研究貼近試驗性研究,也是判斷因果關系的重要標準,是因果理論體系中的重要構成部分.

        結構因果模型基于圖論對多變量之間因果關系進行圖形化表達,其在觀察、干預、反事實三個層級對因果關系進行分析研究,它是一種可以描述數(shù)據(jù)產(chǎn)生機制和外部干預的形式化語言,通過在貝葉斯網(wǎng)絡上引入外部干預,來定義外部干預的因果效應并描述多個變量之間的因果關系.與潛在結果模型相比,結構因果模型不僅能定量評價變量之間的因果效應,還可以定性評價混雜變量,便于從數(shù)據(jù)中挖掘隱含的因果關系,在人工智能不確定性推理方面取得了突破性進展.

        在大數(shù)據(jù)時代,數(shù)據(jù)的收集和分析在越來越多的學科中都日益重要,因果推斷分析框架也在此情景中逐步健全并演化.因果推斷打破了對數(shù)據(jù)相關關系的盲目迷信,強調在數(shù)據(jù)挖掘的基礎上要建立因果模型以提升認知.因果推斷在計量經(jīng)濟學、社會學和計算機科學等諸多學科領域展現(xiàn)出了蓬勃的發(fā)展態(tài)勢.從理論研究角度來看,用數(shù)據(jù)學習因果推斷仍具有較大潛力,如研究在因果推斷中增加或放寬假設限制時如何進行建模交互,并使不同因果推斷模型之間存在形式聯(lián)系;將機器學習和因果推斷進一步融合,使用因果知識改進機器學習算法,包括對黑盒深度學習算法進行因果解釋,及學習更具魯棒性和公平性的因果感知模型.從應用和評估角度來看,需要在更多領域應用中明確對“干預”和“效果”的廣義解釋,整合部分實證研究和觀察性研究得到可解釋結果;利用多模態(tài)數(shù)據(jù)得到具備復用能力的可擴展模型,并使用真實數(shù)據(jù)創(chuàng)建、明確評估指標和目的基準.

        2021年10月11日,Angrist和Imbens因“對因果關系分析的方法學貢獻”而獲得諾貝爾經(jīng)濟學獎.Angrist和Imbens在上世紀90年代中期就論證了自然實驗方法論對因果推斷的準確性.傳統(tǒng)實證方法強調方法的正確使用,而不聚焦數(shù)據(jù)收集;Angrist和Imbens則強調在被動收集數(shù)據(jù)之前是否可以利用自然實驗得到對因果關系的直接判斷.實證研究和因果關系方法論之間密不可分,實證研究是因果關系方法論的試煉場,并大力推動著因果關系的發(fā)展,諾貝爾經(jīng)濟學獎對因果關系方法論的關注也昭示著從挖掘數(shù)據(jù)到真正理解數(shù)據(jù),因果推斷必然會在各個研究領域大放異彩.

        猜你喜歡
        因果關系對象效應
        神秘來電
        睿士(2023年2期)2023-03-02 02:01:09
        鈾對大型溞的急性毒性效應
        玩忽職守型瀆職罪中嚴重不負責任與重大損害后果的因果關系
        南大法學(2021年6期)2021-04-19 12:28:02
        懶馬效應
        做完形填空題,需考慮的邏輯關系
        攻略對象的心思好難猜
        意林(2018年3期)2018-03-02 15:17:24
        應變效應及其應用
        基于熵的快速掃描法的FNEA初始對象的生成方法
        幫助犯因果關系芻議
        區(qū)間對象族的可鎮(zhèn)定性分析
        国精品人妻无码一区免费视频电影| 亚洲av毛片一区二区久久| 你懂的视频网站亚洲视频| 少妇无码av无码专线区大牛影院| 2021久久精品国产99国产精品| 亚洲手机国产精品| 激情一区二区三区视频| av网站在线观看亚洲国产| 久久天堂综合亚洲伊人hd妓女| 国产乱沈阳女人高潮乱叫老| 日本丰满少妇高潮呻吟| 一区二区视频在线国产| 日本最新免费二区三区| 日韩精品无码久久久久久| 国产毛片A啊久久久久| 亚洲本色精品一区二区久久 | 午夜一区二区三区在线观看| 一区二区三区精品少妇| 强行无套内谢大学生初次| 99热门精品一区二区三区无码| 美女被搞在线观看一区二区三区| av一区二区三区在线| 亚洲av无码精品色午夜在线观看| 久久国产成人亚洲精品影院老金| h视频在线观看视频在线| 丰满少妇高潮惨叫久久久| 丰满熟女人妻中文字幕免费| 亚洲成Av人片不卡无码观看| 国产精品久久婷婷免费观看| 国产精品538一区二区在线| 国产一起色一起爱| 国产高清亚洲精品视频| 亚洲av区,一区二区三区色婷婷| 亚洲综合国产一区二区三区| 久久精品一品道久久精品9| 中文字幕人妻av四季| 三年片免费观看影视大全视频| 中文字幕无码不卡免费视频| 视频网站在线观看不卡| 亚洲国产精品一区二区成人av| 精品国产乱码久久久久久影片|