胡純嚴(yán) ,胡良平 ,2*
(1.軍事科學(xué)院研究生院,北京 100850;2.世界中醫(yī)藥學(xué)會(huì)聯(lián)合會(huì)臨床科研統(tǒng)計(jì)學(xué)專(zhuān)業(yè)委員會(huì),北京 100029*通信作者:胡良平,E-mail:lphu927@163.com)
因果圖理論的4個(gè)主要內(nèi)容包括關(guān)聯(lián)的來(lái)源、因果圖模型的統(tǒng)計(jì)性質(zhì)、識(shí)別和調(diào)整以及工具變量,本文在介紹這些理論的基礎(chǔ)上,針對(duì)兩個(gè)實(shí)例,并借助SAS軟件完成用工具變量識(shí)別因果效應(yīng)以及用數(shù)據(jù)區(qū)分不同模型的任務(wù)。
在因果圖過(guò)程中,每個(gè)因果圖模型都必須是有向無(wú)環(huán)圖(Directed acyclic graph,DAG)。由DAG表示的因果圖模型對(duì)信息在底層數(shù)據(jù)生成過(guò)程中的流動(dòng)方式具有明確的定義。該信息流由三個(gè)圖形結(jié)構(gòu)封裝,可用于在DAG中組裝每條路徑[1]。這三個(gè)結(jié)構(gòu)對(duì)應(yīng)因果圖模型中關(guān)聯(lián)的三個(gè)基本來(lái)源(即因果關(guān)系、混淆和內(nèi)生選擇),這些結(jié)構(gòu)如圖1所示。
圖1 關(guān)聯(lián)的3個(gè)基本來(lái)源Figure 1 Three fundamental sources of association
在因果關(guān)系U→V→W中,變量U和W是關(guān)聯(lián)的,這種關(guān)聯(lián)是因果鏈的結(jié)果。如果要對(duì)中介變量V進(jìn)行調(diào)節(jié),那么這將阻塞信息流,從而使變量U和W不再關(guān)聯(lián)。
在混淆的關(guān)系U←V→W中,沒(méi)有與變量U和W相關(guān)的因果路徑,然而,U和W仍然是相關(guān)的,這種關(guān)聯(lián)是由混雜變量V引起的,它是變量U和W的共同父項(xiàng),如果研究者要以共同原因V為條件,那么這將阻塞信息流,從而使變量U和W不再關(guān)聯(lián)。
在內(nèi)生選擇結(jié)構(gòu)U→V←W中,變量U和W共同決定其共同子變量V的值,但變量U和W不相關(guān),然而,如果研究者要以共同的結(jié)果變量V為條件,就可以創(chuàng)建一個(gè)信息流,變量U和W就會(huì)關(guān)聯(lián)起來(lái)[2]。
粗略地說(shuō),如果在因果效應(yīng)分析中有一個(gè)處理變量(如U)和一個(gè)結(jié)果變量(如W),那么目標(biāo)是消除變量U和W之間的非因果關(guān)聯(lián),并保持因果關(guān)聯(lián)不變。因此,這三個(gè)基本圖形結(jié)構(gòu)不僅對(duì)應(yīng)關(guān)聯(lián)的三個(gè)基本來(lái)源,也對(duì)應(yīng)偏差的三個(gè)基本來(lái)源。一般來(lái)說(shuō),當(dāng)研究者有一組處理變量和結(jié)果變量時(shí),如果控制因果路徑上的一個(gè)變量,就會(huì)阻塞流經(jīng)該因果路徑的信息流,這被稱為過(guò)度控制偏差;同樣,如果研究者無(wú)法控制一個(gè)令人困惑的共同原因,那么處理變量和結(jié)果變量之間的一些關(guān)聯(lián)就是混淆的結(jié)果,被稱為混淆偏差;而如果研究者控制變量的共同結(jié)果,就會(huì)在處理變量和結(jié)果變量之間建立非因果關(guān)系的關(guān)聯(lián),被稱為內(nèi)生選擇偏差。
1.2.1 局部馬爾科夫性
有兩種方法可以解釋DAG中的假設(shè):①DAG是“組織有關(guān)外部干預(yù)及其互動(dòng)的一種結(jié)構(gòu)”[3];②DAG定義了一組變量之間的信息流。這兩種解釋在另外兩種假設(shè)下是等效的[1]:①DAG中的變量滿足局部馬爾可夫性;②DAG滿足弱忠實(shí)性屬性。局部馬爾可夫性質(zhì)表明,DAG中的每個(gè)變量在統(tǒng)計(jì)上是獨(dú)立的,取決于它的父變量和非退化變量集[4]。
1.2.2 d分離
如果以下任一條件成立,則DAG中的路徑稱為由一組變量Z形成的d分離:①路徑包含鏈U→V→W或分叉U←V→W,使得V∈Z;②路徑包含一個(gè)碰撞器U→V←W,使得V?Z以及V的后代不在Z中。
1.2.3 阻塞/非阻塞
一條d分離的路徑被稱為阻塞。如果X中的一個(gè)節(jié)點(diǎn)和Y中的一個(gè)節(jié)點(diǎn)之間的每條路徑都被阻塞,則變量集X通過(guò)變量集Z與變量集Y進(jìn)行d分離。阻塞/非阻塞術(shù)語(yǔ)反映了因果圖模型中的信息流,如果路徑被阻塞,則信息不會(huì)流經(jīng)該路徑;如果路徑未被阻塞,則信息可能會(huì)流經(jīng)該路徑。d分離和信息流之間的聯(lián)系體現(xiàn)在弱忠實(shí)性假設(shè)中。弱信度表示,如果一個(gè)DAG中的兩個(gè)變量X和Y不是d分離的,那么這兩個(gè)變量至少依賴于一個(gè)在DAG上分解的分布[5-6]。
1.2.4 全局馬爾科夫性
通過(guò)將因果圖模型解釋為代表變量之間關(guān)聯(lián)流的DAG,可以將DAG背后的因果假設(shè)轉(zhuǎn)化為條件獨(dú)立性。具體來(lái)說(shuō),如果兩個(gè)變量在DAG中由集合Z進(jìn)行d分離,那么這兩個(gè)變量必須在統(tǒng)計(jì)上獨(dú)立于Z。換言之,d分離是一個(gè)全局馬爾可夫性質(zhì)。如果條件獨(dú)立性只包含觀察到的變量,則可以使用觀察到的數(shù)據(jù)執(zhí)行統(tǒng)計(jì)檢驗(yàn),以查看獨(dú)立性是否成立。因此,d分離標(biāo)準(zhǔn)確定了因果圖模型具有可觀測(cè)和可檢驗(yàn)的含義[1]。
事實(shí)上,DAG的全局馬爾可夫性質(zhì)和局部馬爾可夫性質(zhì)在邏輯上是等價(jià)的[4]。如果研究者有一個(gè)局部或全局馬爾可夫性質(zhì)的完整列表,就可以使用semigraphoid公理[7-8]推導(dǎo)出另一個(gè)列表。在CAUSALGRAPH過(guò)程中,可以使用PROC CAUSALGRAPH語(yǔ)句中的IMAP選項(xiàng)來(lái)請(qǐng)求這些屬性的列表。
一對(duì)變量之間的統(tǒng)計(jì)關(guān)聯(lián)可以分為兩個(gè)部分:因果部分和非因果部分(虛假部分)。如果所有虛假關(guān)聯(lián)都能被消除,那么因果關(guān)系就會(huì)被識(shí)別出來(lái)。因此,一種可能的識(shí)別方法是調(diào)整識(shí)別,這是回歸和匹配因果效應(yīng)識(shí)別的基礎(chǔ)[2]。
當(dāng)研究者使用調(diào)整識(shí)別時(shí),會(huì)尋找一個(gè)調(diào)整集,當(dāng)在分析中進(jìn)行控制時(shí),它會(huì)阻塞DAG中的所有非因果路徑,而不會(huì)阻塞任何因果路徑。路徑的因果屬性是從模型中邊的方向繼承的。也就是說(shuō),因果屬性是因果圖模型的屬性,在分析過(guò)程中不會(huì)改變。然而,路徑是否被阻塞不僅取決于代表因果圖模型的DAG結(jié)構(gòu),還取決于調(diào)整集中包含的變量集。因此,研究者必須謹(jǐn)慎地選擇一個(gè)調(diào)整集,以便在不引入任何過(guò)度控制或內(nèi)生選擇偏差的情況下消除所有混淆偏差。
在實(shí)際的醫(yī)學(xué)研究中,一般來(lái)說(shuō),變量可分為自變量、中介變量和因變量(結(jié)果變量)。然而,統(tǒng)計(jì)學(xué)上還提出了一種“工具變量”[9],其定義如下:某個(gè)變量Z與模型中某個(gè)自變量X高度相關(guān),但卻不與隨機(jī)誤差項(xiàng)相關(guān),那么就可以用變量Z與模型中相應(yīng)回歸系數(shù)得到一個(gè)一致估計(jì)量,在模型的參數(shù)估計(jì)過(guò)程中,變量Z被作為一個(gè)工具使用,故稱為工具變量。為了加深對(duì)工具變量的理解,舉例如下[10]:研究者將抽煙的孕婦隨機(jī)分成兩組,試驗(yàn)組接受“減少或停止抽煙”的勸告或鼓勵(lì),而對(duì)照組未接受勸告或鼓勵(lì)。研究者記錄每位受試者兩個(gè)結(jié)果變量的取值,即孕婦在8個(gè)月的孕期內(nèi)每天抽煙支數(shù)(記為S)及其嬰兒的出生體重(記為B)。研究者關(guān)心的是S對(duì)B的因果效應(yīng)(雖然S與B之間的關(guān)聯(lián)可能存在混淆,如對(duì)S可能存在測(cè)量誤差),為了解決S對(duì)B的因果效應(yīng)的估計(jì)問(wèn)題,研究者利用隨機(jī)化方法(R),假設(shè)R可能與S高度相關(guān),但R僅通過(guò)對(duì)S的影響進(jìn)而對(duì)B產(chǎn)生影響(即以S為條件,隨機(jī)化對(duì)B沒(méi)有影響)。在這種情況下,變量R被稱為工具變量。
2.1.1 實(shí)例與背景信息
【例1】沿用文獻(xiàn)[9]中的“Example 34.2”,此例的結(jié)論為:“不可能使用調(diào)整集來(lái)確定持久性全氟烷基物質(zhì)(PFAS)對(duì)母乳喂養(yǎng)持續(xù)時(shí)間(Duration)的因果效應(yīng)”。試問(wèn):原因是什么?如何解決所面臨的問(wèn)題?
【分析與解答】此例采用的是Timmermann等[11]的因果圖模型,研究了法羅群島居民中母親接觸PFAS與Duration之間的關(guān)系。該例表明,研究者無(wú)法構(gòu)建調(diào)整集來(lái)估計(jì)處理變量PFAS對(duì)結(jié)果變量Duration的因果效應(yīng)。這是因?yàn)樘幚碜兞亢徒Y(jié)果變量之間存在混淆偏差,這些混淆來(lái)自未觀察到的變量“行為被認(rèn)為是健康的程度”(HealthBehavior)和“先前是否有母乳喂養(yǎng)經(jīng)驗(yàn)”(PrevBF)。
在許多存在未測(cè)量混淆的情況下,如果愿意假設(shè)因果圖模型中的某些邊具有特定的參數(shù)形式,通過(guò)使用工具變量[12-13],仍然可以估計(jì)因果效應(yīng)。
2.1.2 用SAS實(shí)現(xiàn)因果效應(yīng)分析
2.1.2.1 初步分析
以下語(yǔ)句調(diào)用PROC CAUSALGRAPH過(guò)程列出可用于估計(jì)因果效應(yīng)的工具變量。設(shè)所需要的SAS程序如下;
【SAS輸出結(jié)果及解釋】
輸出結(jié)果為兩類(lèi)變量:第一類(lèi)為“工具變量”,即孩子出生時(shí)母親的年齡(Age);第二類(lèi)為“條件變量”,包括飲酒(Alcohol)、母親孕前體重指數(shù)(BMI)、母親接受初等教育的時(shí)間(Education)、胎次(Parity)和吸煙(Smoking)。
輸出結(jié)果表明:變量Age可用于確定處理變量PFAS對(duì)結(jié)果變量Duration的因果效應(yīng)。
2.1.2.2 改變條件變量再分析
構(gòu)造工具變量時(shí)產(chǎn)生的條件集可能不是最小的。例如,以下檢驗(yàn)表明,如果僅調(diào)整Education和Parity兩個(gè)變量,也可以使用變量Age作為工具變量。
所需要的SAS程序與“2.1.2.1節(jié)”的SAS程序相同,只需要在UNMEASURED語(yǔ)句之后增加以下語(yǔ)句:
testid "Minimal CIV" Age/conditional=(Education Parity);
【SAS程序說(shuō)明】這里的新功能是使用TESTID語(yǔ)句。研究者想調(diào)查當(dāng)條件變量為Education和Parity時(shí),Age是否可以作為因果效應(yīng)分析的工具變量。這組條件變量是之前分析中提出的條件變量的適當(dāng)子集。
【SAS輸出結(jié)果及解釋】
當(dāng)條件變量為Education和Parity時(shí),以Age作為工具變量,研究處理變量PFAS對(duì)結(jié)果變量Duration的因果效應(yīng)是有效的。
2.2.1 實(shí)例與背景信息
【例2】沿用文獻(xiàn)[9]中的“Example 34.3”,研究者設(shè)定了兩個(gè)模型,見(jiàn)圖2、圖3。
圖2 血清尿酸鹽對(duì)心血管疾病風(fēng)險(xiǎn)影響的第一個(gè)可能因果圖模型Figure 2 The first possible causal models of the effect of serum urate on risk of cardiovascular disease
圖3 血清尿酸鹽對(duì)心血管疾病風(fēng)險(xiǎn)影響的第二個(gè)可能因果圖模型Figure 3 The second possible causal models of the effect of serum urate on risk of cardiovascular disease
在圖2中,假設(shè)血壓(PreviousBP)和使用抗高血壓藥物(AntiHypertensiveUse)介導(dǎo)了變量尿酸鹽(Urate)對(duì)心血管疾?。–VD)的影響。在圖3中,因果方向相反,并且假設(shè)使用AntiHypertensiveUse對(duì)Urate直接產(chǎn)生因果效應(yīng)(對(duì)CVD而言,Urate就成了中介變量)。
兩個(gè)模型之間的差異以灰色(特指變量Anti-HypertensiveUse到Urate之間的灰色箭頭)突出顯示。兩個(gè)模型中的處理變量Urate和結(jié)果變量CVD均位于陰影框內(nèi)。注意,變量營(yíng)養(yǎng)(Nutrition)對(duì)應(yīng)于潛在結(jié)構(gòu)(在圖中以虛線框表示),故不進(jìn)行測(cè)量或觀察。還假設(shè)未測(cè)量變量先前血壓(PreviousBP)。當(dāng)研究者有多個(gè)可能的因果圖模型時(shí),若能找到一個(gè)對(duì)所有模型都有效的公共調(diào)整集,便可使用調(diào)整技術(shù)來(lái)估計(jì)數(shù)據(jù)的因果效應(yīng)。
試基于圖2和圖3中設(shè)定的因果圖模型,構(gòu)建它們的公共調(diào)整集。
2.2.2 用SAS實(shí)現(xiàn)因果效應(yīng)分析
以下語(yǔ)句調(diào)用PROC CAUSALGRAPH來(lái)構(gòu)造公共調(diào)整集。設(shè)所需要的SAS程序如下:
【SAS輸出結(jié)果及解釋】
NOTE:沒(méi)有滿足指定準(zhǔn)則的適用于所有模型的調(diào)整設(shè)置。
輸出結(jié)果中的注釋表明,在本例中,未能找到共用調(diào)整集。因此,研究者必須找到單獨(dú)的調(diào)整集,然后使用每個(gè)模型分別估計(jì)因果效應(yīng),或者必須確定最能代表數(shù)據(jù)生成過(guò)程的模型。PROC CAUSALGRAPH語(yǔ)句中的IMAP(條件獨(dú)立性假設(shè))選項(xiàng)可對(duì)模型屬性進(jìn)行分析。
2.3.1 隱含的統(tǒng)計(jì)特性
研究者可以根據(jù)可用數(shù)據(jù)檢驗(yàn)因果圖模型中隱含的統(tǒng)計(jì)特性。如果隱含的統(tǒng)計(jì)特性在數(shù)據(jù)中不存在,則應(yīng)考慮修改或放棄模型。如果有多個(gè)模型,則可以比較這些模型的統(tǒng)計(jì)含義,以找到一個(gè)模型中具有的隱含統(tǒng)計(jì)特性,而不是其他模型中隱含的統(tǒng)計(jì)特性。然后可以在數(shù)據(jù)中檢驗(yàn)此特性,并使用相應(yīng)的檢驗(yàn)結(jié)果來(lái)確定哪個(gè)模型最能代表真實(shí)的數(shù)據(jù)生成過(guò)程。
下面的語(yǔ)句調(diào)用PROC CAUSALGRAPH過(guò)程來(lái)枚舉本例中兩個(gè)模型具有的統(tǒng)計(jì)特性。對(duì)于每個(gè)模型,過(guò)程生成的條件獨(dú)立屬性表由ODS OUTPUT語(yǔ)句保存到一個(gè)數(shù)據(jù)集。與“用數(shù)據(jù)區(qū)分模型”的SAS程序基本相同,下面僅列出不同之處:
proc causalgraph imap=global;
ods output imap=SimpleBPIndep;
proc causalgraph imap=global;
ods output imap=AltBPIndep;
【SAS程序說(shuō)明】PROC CAUSALGRAPH過(guò)程中的IMAP=GLOBAL選項(xiàng)都會(huì)為使用MODEL語(yǔ)句指定的每個(gè)模型生成一個(gè)全局馬爾可夫?qū)傩员怼C總€(gè)全局馬爾可夫?qū)傩杂蓛蓚€(gè)變量組成,這兩個(gè)變量在統(tǒng)計(jì)上獨(dú)立于另一個(gè)變量集(可能為空,在這種情況下,獨(dú)立性是無(wú)條件的)。如果觀察到馬爾可夫?qū)傩灾械拿總€(gè)變量,則可以使用數(shù)據(jù)執(zhí)行統(tǒng)計(jì)檢驗(yàn)(例如可以檢驗(yàn)零偏相關(guān)),以查看該屬性是否可以被修改。而涉及一個(gè)或多個(gè)未測(cè)量變量的獨(dú)立性屬性無(wú)法檢驗(yàn)。
【SAS輸出結(jié)果及解釋】
與圖2對(duì)應(yīng)的輸出結(jié)果顯示,可以找到僅包含變量肥胖(Obesity)的調(diào)整集,而且,它是最小的調(diào)整集。基于變量Obesity,可有效地進(jìn)行Urate對(duì)CVD的因果效應(yīng)分析。
與圖3對(duì)應(yīng)的輸出結(jié)果顯示,可以找到11個(gè)調(diào)整集,因篇幅所限,具體輸出結(jié)果從略。
2.3.2 輸出數(shù)據(jù)集中的觀測(cè)
以下程序輸出每個(gè)模型的前10個(gè)觀察到的條件獨(dú)立性屬性。為了簡(jiǎn)潔起見(jiàn),本例重點(diǎn)介紹前10個(gè)結(jié)果。設(shè)所需要的SAS程序如下:
【SAS輸出結(jié)果及解釋】
因篇幅所限,與模型1(見(jiàn)圖2)和模型2(見(jiàn)圖3)對(duì)應(yīng)的“條件獨(dú)立性屬性”的輸出結(jié)果從略,現(xiàn)概要解釋如下。
對(duì)這兩個(gè)模型進(jìn)行比較,兩個(gè)模型有4個(gè)條件集,使得變量AntiHypertensiveUse的使用在條件上獨(dú)立于變量CVD,并且這4個(gè)條件集對(duì)于兩個(gè)模型都是相同的。因此,研究者無(wú)法通過(guò)檢驗(yàn)變量Anti-HypertensiveUse和CVD之間的條件獨(dú)立屬性來(lái)區(qū)分這兩個(gè)模型。接下來(lái),比較變量肌酐(Creatinine)和CVD的條件獨(dú)立性屬性。Thor12SimpleBP模型(模型1)有4個(gè)這樣的屬性,但Thor12AltBP模型(模型2)有5個(gè)這樣的屬性。Thor12AltBP模型給出了Creatinine和CVD在集合上獨(dú)立的統(tǒng)計(jì)含義(Anti-HypertensiveUse、CurrentBP 及 Obesity),但 Thor12 SimpleBP模型中未給出此含義。
如果研究者要找到變量Creatinine和CVD之間的非零偏相關(guān)(在排除AntiHypertensiveUse、CurrentBP及Obesity后),研究者將有證據(jù)拒絕Thor12AltBP模型。研究者可以繼續(xù)對(duì)兩個(gè)模型中唯一的獨(dú)立屬性進(jìn)行類(lèi)似分析。最好的模型是其條件獨(dú)立性屬性與可用數(shù)據(jù)中的零偏相關(guān)最為匹配的模型。
工具變量在因果效應(yīng)分析中起著重要作用,如果在某個(gè)實(shí)際問(wèn)題中確實(shí)存在一個(gè)或多個(gè)工具變量,它們必將對(duì)其他變量起混雜效應(yīng)。因此,找出全部工具變量,并在其后的統(tǒng)計(jì)分析中充分發(fā)揮其作用(例如工具變量回歸分析[9-10],它有別于通常的回歸分析[14-15]),將有助于獲得正確的統(tǒng)計(jì)結(jié)果和結(jié)論。
本文介紹了因果圖理論的4個(gè)主要內(nèi)容,包括關(guān)聯(lián)的來(lái)源、因果圖模型的統(tǒng)計(jì)性質(zhì)、識(shí)別和調(diào)整以及工具變量;針對(duì)兩個(gè)實(shí)例并基于SAS軟件[9],完成了使用工具變量識(shí)別因果效應(yīng)以及用數(shù)據(jù)區(qū)分不同模型的因果效應(yīng)分析任務(wù)。