濰坊醫(yī)學(xué)院(261053)
田 野 馬 潔 黃 璐 杜澤玉 呂軍城 石福艷 孟維靜 王素珍△ 潘慶忠△
隊列研究是臨床流行病學(xué)重要的研究方法之一,在研究反應(yīng)變量與處理因素之間關(guān)系的因果推斷中,隨機對照試驗(randomized controlled trials,RCT)被視為評價臨床試驗干預(yù)措施的金標(biāo)準(zhǔn)。但在實際的臨床實踐中,由于受樣本量、研究費用、持續(xù)時間以及倫理學(xué)等方面的因素影響,隨機對照試驗的實施受到很大的制約[1]。近年來,非隨機對照研究、隊列研究、臨床數(shù)據(jù)挖掘等臨床流行病學(xué)方法在循證醫(yī)學(xué)領(lǐng)域廣受關(guān)注。觀察性臨床研究不同于RCT臨床試驗可以按照試驗設(shè)計進(jìn)行隨機分組從而減少混雜因素所產(chǎn)生的偏倚。如果在回顧性隊列研究資料進(jìn)行分組后直接比較處理效應(yīng),所做出的統(tǒng)計結(jié)論容易增大犯II類錯誤的概率,當(dāng)協(xié)變量數(shù)目較多且無法精確獲知其對處理分配和生存結(jié)局的影響時,直接估計未調(diào)Kaplan-Meier值及生存曲線會導(dǎo)致偏倚,因此,對于傳統(tǒng)的傾向性評分(propensity score,PS)方法如匹配法、分層法、加權(quán)法等應(yīng)用于生存資料分析時并不容易實現(xiàn)[2]。
基于PS雙穩(wěn)健半?yún)⒛P头ㄊ菍鹘y(tǒng)PS方法的改進(jìn),自20世紀(jì)90年代Scharfstein[3]首次引入雙重穩(wěn)健模型的概念以來,近些年其得到了眾多的關(guān)注和研究[4]。有研究結(jié)果顯示,在生存資料分析時應(yīng)用雙穩(wěn)健模型可以直接估計出處理(暴露)對生存結(jié)局的絕對和相對效應(yīng)[5],最大程度地減小混雜偏倚。本文以乳腺癌患者常用的CAF(環(huán)磷酰胺、多柔比星、氟尿嘧啶)和TAC(多西他賽、多柔比星、環(huán)磷酰胺)兩種化療方案為例,運用基于PS的 IPTW和DRIPTW、SMRW和DRSMRW(IPTW:inverse probability of treatmentweighting;SMRW:Standardized mortality ratio weighting;DRIPTW:Doubly robustinverse probability of treatmentweighting;DRSMRW:Doubly robust Standardized mortality ratio weighting)等多種PS改進(jìn)模型分析不同化療方案對乳腺癌患者的因果效應(yīng)和預(yù)后結(jié)果的影響,從而使研究結(jié)果更接近“真實世界(realword,RW)”的實際干預(yù)效果,最終為臨床實踐提供可靠的循證依據(jù)。
從美國SEER(surveillance,epidemiology,and end results)腫瘤患者縱向數(shù)據(jù)庫中,選擇2000年到2012年12年間的乳腺癌患者作為研究對象,排除無法使用的病例,共計800例,其中CAF組513例,TCA組287例。收集的指標(biāo)有:手術(shù)類型(1:CAF方案,2:TAC方案)、年齡(歲)、婚姻狀況(1:單身,2:已婚,3:離婚,4:喪偶,5:未知)、偏側(cè)化(1:乳房左側(cè),2:乳房右側(cè),3:雙側(cè))、腫瘤性質(zhì)(1:原位癌,2:惡性轉(zhuǎn)移癌)、分期(1:Ⅰ期,2:Ⅱ期,3:Ⅲ期,4:Ⅳ期)、腫瘤大小(mm)、癌胚抗原CEA(1:有,2:無)、糖類抗原CA15-3(1:有,2:無)、生存狀態(tài)(0:生存,1:死亡)、生存時間(月)等。
Rosenbaum和Rubin[6]把PS定義為:在可觀察的協(xié)變量(Xi)條件下,研究對象i(i= 1,2,…,N)接受某種處理(或暴露)因素(Zi=1)而非對照因素(Zi=0)的條件概率,計算公式為:
e(X)=Pr(Z=1|X=Xi)
如果協(xié)變量Xi為分組變量Zi相互獨立,那么對任意Xi,有:
e(X)或者P,即傾向性評分PS。
由公式可得,PS實際上是一個綜合多個協(xié)變量的函數(shù),其值在0和1之間[7]。傾向評分PS方法可以平衡協(xié)變量的影響,在組間協(xié)變量均衡的前提下,對平均因果效應(yīng)(average causal effect,ACE)做出推斷。實際上,傾向評分是用一個函數(shù)表示多個協(xié)變量共同作用的結(jié)果,可以“降維”。經(jīng)過傾向評分調(diào)整后,協(xié)變量均衡可比,只有干預(yù)因素和治療效果不同,出現(xiàn)“事后隨機化”的效果。
傾向性評分加權(quán)法先將主要混雜變量的信息綜合成一個變量傾向評分,然后運用標(biāo)準(zhǔn)化法的原理將所得的傾向評分進(jìn)行加權(quán),通過各對比組中傾向評分分布一致來達(dá)到使各混雜因素在各比較組中分布一致的目的[8]。該方法將每一觀察單位看作一層,不同傾向評分值預(yù)示這一觀察單位在兩組中的概率不同。在假定不存在未識別混雜因素的條件下,加權(quán)調(diào)整是基于在一定條件下的兩種相反事件的對比來對數(shù)據(jù)進(jìn)行調(diào)整的,即假設(shè)使每個觀察對象均接受處理因素和使每個觀察對象均不接受處理因素兩種相反情況。利用傾向評分估計的權(quán)重對各觀察單位加權(quán)產(chǎn)生一個虛擬的標(biāo)準(zhǔn)人群,在虛擬人群中,兩組的混雜因素趨于一致,均近似于某一預(yù)先選定的標(biāo)準(zhǔn)人口分布[8]。
傾向性評分加權(quán)法的關(guān)鍵在于對權(quán)重的計算。IPTW是以所有受試者(試驗組和對照組合并的人群)為“標(biāo)準(zhǔn)人群”進(jìn)行調(diào)整。Robins[9]等給出的加權(quán)方法得到的人群往往與原人群數(shù)量不同,因此虛擬人群各變量的方差大小發(fā)生變化。為了得到與原人群的樣本量相同的標(biāo)準(zhǔn)人群,Hernan[10]等對計算方法進(jìn)行了調(diào)整,將整個研究人群的處理率和非處理率加入公式進(jìn)行調(diào)整得到穩(wěn)定權(quán)重。具體方法是:試驗組觀察單位的權(quán)重Wt=Pt/PS,對照組觀察單位的權(quán)重Wc=(1-Pt)/(1-PS)。Pt為整個人群中接受處理因素的比例。SMRW法是將處理組觀察對象作為“標(biāo)準(zhǔn)人群”進(jìn)行調(diào)整。Sato和Matsuyama[11]給出的加權(quán)系數(shù)計算方法是:試驗組觀察單位的權(quán)重Wt=1,對照組觀察單位的權(quán)重Wc=PS/(1-PS)。同樣,由于對照組得到的人群數(shù)與處理組樣本量一致,而與原對照組樣本量不同,因此需要進(jìn)一步作如下調(diào)整,計算其穩(wěn)定權(quán)重:Wc=[PS(1-Pt)]/[(1-PS)Pt]。
雙穩(wěn)健半?yún)⒛P头ㄊ菍鹘y(tǒng)PS法的改進(jìn),將PS加權(quán)法(邊際結(jié)構(gòu)模型)和半?yún)ox回歸模型相結(jié)合。具體實施步驟:第一步:估計傾向性評分,包括模型和變量的選擇;第二步:計算權(quán)重,包括逆概率處理和標(biāo)化死亡比權(quán)重;第三步:均衡性診斷;第四步:生存結(jié)局的處理效應(yīng)估計,包括相對處理效應(yīng)和絕對處理效應(yīng)。其中,相對處理效應(yīng)是將權(quán)重進(jìn)行加權(quán),后估計經(jīng)加權(quán)調(diào)整樣本的調(diào)整 Kaplan-Meier 估計值(adjusted Kaplan-Meier estimator,AKME)及其方差和加權(quán) log-rank 檢驗;絕對處理效應(yīng)是雙穩(wěn)健半?yún)⒛P头ǖ臉?gòu)建,將Zi和對結(jié)局有影響的基線協(xié)變量與權(quán)重共同納入半?yún)ox回歸模型進(jìn)行分析,估計HR及其置信區(qū)間,起到雙穩(wěn)健的作用。
定性或等級資料采用構(gòu)成比描述,定量資料采用均數(shù)±標(biāo)準(zhǔn)差表示,兩組定性或等級資料比較采用χ2檢驗,兩組定量資料比較采用t檢驗。PS法分別采用匹配法、加權(quán)法和回歸調(diào)整法,匹配法采用卡鉗匹配,卡鉗值設(shè)為0.02;加權(quán)法采用逆概率處理加權(quán)法(IPTW)和標(biāo)準(zhǔn)化死亡比加權(quán)法(SMRW),并對加權(quán)之后的樣本進(jìn)行調(diào)整 Kaplan-Meier估計值及其方差和加權(quán)l(xiāng)og-rank 檢驗,同時,將各個模型分別與Cox回歸模型相結(jié)合進(jìn)行比較。雙穩(wěn)健半?yún)⒛P头ǖ乃薪y(tǒng)計分析均采用SAS 9.4編程完成,以P<0.05為差異有統(tǒng)計學(xué)意義,檢驗水準(zhǔn)均為α=0.05。
原始資料入選的協(xié)變量有:年齡(歲)、婚姻狀況、偏側(cè)化、腫瘤性質(zhì)、腫瘤分期、腫瘤大小(mm)、癌胚抗原CEA、糖類抗原CA153等。在TAC方案組和CAF方案組的基線資料中,兩組乳腺癌患者的年齡、婚姻狀況、腫瘤性質(zhì)在匹配前不均衡(P<0.05),而兩組患者的腫瘤大小、腫瘤偏側(cè)化情況、腫瘤分期、癌胚抗原CEA含量、糖類抗原CA153含量分布均衡(P>0.05)。在匹配和加權(quán)之后,對兩組乳腺癌患者協(xié)變量進(jìn)行檢驗可知,匹配前不均衡的協(xié)變量,如年齡、婚姻狀況、腫瘤性質(zhì)等變量經(jīng)匹配和加權(quán)之后在兩組的分配達(dá)到了平衡(P>0.05),結(jié)果見表1~2。
表1 不同方法處理不同樣本基線資料之間均衡性情況[n(%)]
表2 不同方法處理基線資料組間均衡性比較情況統(tǒng)計量,P值
(1)絕對處理效應(yīng)估計匹配、穩(wěn)定逆概率處理加權(quán)、穩(wěn)定標(biāo)化死亡比加權(quán)后的樣本TAC與CAF組的生存曲線差異均有統(tǒng)計學(xué)意義,見圖1(log-rank檢驗:χ2=25.60,P<0.001;穩(wěn)定逆概率處理加權(quán)l(xiāng)og-rank檢驗:z=2.326,P=0.043;穩(wěn)定標(biāo)化死亡比加權(quán)l(xiāng)og-rank檢驗:z=1.154,P=0.014)。從生存曲線中可以看出,匹配之后的生存曲線相較于加權(quán)調(diào)整之后的曲線,其CAF組生存率下降的更快,TAC組與CAF組生存率曲線間存在較大差異。與之相比,加權(quán)調(diào)整之后的PS-TPTW和PS-SMRT模型中TAC組與CAF組的生存曲線更加穩(wěn)健。
圖1 匹配、穩(wěn)定逆概率處理加權(quán)穩(wěn)定標(biāo)化死亡比加權(quán)后的樣本中TAC與CAF組的生存曲線
(2)相對處理效應(yīng)估計在乳腺癌患者中,以生存結(jié)局為因變量,Zi為自變量,進(jìn)行Cox回歸分析估計θ為0.627。以生存結(jié)局為因變量,以Zi和對結(jié)局有影響的基線協(xié)變量為自變量,進(jìn)行調(diào)整Cox回歸分析,估計的HR及其置信區(qū)間為1.797(1.378,2.344),相對偏倚為0.065;在IPTW樣本和DRIPW樣本中,加權(quán)Cox回歸分析估計的HR及其置信區(qū)間分別為1.725(1.335,2.230)和1.813(1.389,2.366),相對偏倚分別為0.131和0.051。在SMRW樣本和DRSMRW樣本中,加權(quán)Cox回歸分析估計的HR及其置信區(qū)間分別為1.766(1.365,2.285)和1.830(1.430,2.341),相對偏倚分別為0.093和0.037。在匹配之后的樣本中,Cox回歸分析估計的HR及其置信區(qū)間為1.800(1.394,2.324),相對偏倚為0.062。
表3 各種PS模型對TAC方案組和CAF方案組Cox回歸分析
雙穩(wěn)健半?yún)⒛P头ㄗ鳛榭刂苹祀s因素的模型,在臨床流行病學(xué)研究中應(yīng)用越來越廣泛。本研究的主要目的是通過多種PS模型比較對處理效應(yīng)估計的優(yōu)劣,其中均衡性診斷是判斷模型正確性的一個重要方法。雙穩(wěn)健半?yún)⒛P头▽τ赑S模型的指定如果正確,那么在匹配、加權(quán)之后的樣本中試驗組與對照組間基線協(xié)變量分布應(yīng)該相同[12]。本文結(jié)果表明,在原始數(shù)據(jù)中TAC方案組和CAF方案組乳腺癌患者的年齡、婚姻狀況、腫瘤性質(zhì)在匹配前不均衡,在匹配、加權(quán)之后得到均衡,經(jīng)過log-rank檢驗兩組生存曲線之間差別有統(tǒng)計學(xué)意義(P<0.05),且結(jié)果均顯示TAC化療方案治療乳腺癌的效果優(yōu)于CAF化療方案,與趙璐[13-15]等人的研究結(jié)果相同。同時,通過對不同模型之間的比較,利用DRIPTW模型和DRSMRW模型得出的處理效應(yīng)的偏倚顯著減小,且減小偏倚的效果優(yōu)于與之相對的IPTW和SMRW法,同時也優(yōu)于匹配法和回歸調(diào)整法,其中DRSMRW模型法最優(yōu),相對偏倚為0.037。由本次研究得知,在臨床實踐中,TAC方案中將蒽環(huán)類化療藥物聯(lián)合紫杉類化療藥物化療效果更好。
本研究顯示,雙穩(wěn)健半?yún)⒛P头ㄝ^傳統(tǒng)PS法具有明顯的優(yōu)勢。第一,該方法是基于PS加權(quán)(基于個體的標(biāo)準(zhǔn)化法的邊際結(jié)構(gòu)模型),與估計邊際效應(yīng)的PS匹配法相比,適用于數(shù)據(jù)中包含時依性暴露或混雜變量的研究,也可用于更為復(fù)雜的研究設(shè)計[8];第二,該方法與回歸調(diào)整法相比,避免了效應(yīng)估計時參數(shù)過多及共線性的問題所導(dǎo)致的偏倚,易于比較加權(quán)調(diào)整前后的均衡程度[16];第三,該方法相對于傳統(tǒng)分層法而言,其將多個協(xié)變量綜合為一個均衡分值,將每一觀察單位看作一層,避免了協(xié)變量較多或存在連續(xù)變量時無法解決的過度匹配或過度分層問題[5];第四,該方法不要求試驗組的樣本量小于對照組的樣本量等。此外,僅通過計算一次 PS,就可以構(gòu)造一個均衡的加權(quán)樣本,在此樣本中能分析多重結(jié)局。同時,雙穩(wěn)健半?yún)⒛P头ㄒ泊嬖诓蛔阒?第一,該方法依賴于構(gòu)造一個加權(quán)樣本,均衡化原理不如匹配、分層等方法易于理解;第二,該方法對于PS模型錯誤指定更為敏感[17]等。下一步,我們將繼續(xù)針對計算PS模型進(jìn)行比較研究,如利用貝葉斯、隨機森林、神經(jīng)網(wǎng)絡(luò)等提升雙穩(wěn)健半?yún)⒛P偷姆€(wěn)健性。
綜上所述,在回顧性隊列研究中對于基線不均衡的生存分析數(shù)據(jù)而言,隨訪期較長,混雜或處理(暴露)因素中很有可能包括時依性變量,可采用基于PS的雙穩(wěn)健模型法進(jìn)行分析,得到類似于RCTs報告中的相對和絕對處理效應(yīng)結(jié)果。因此,雙穩(wěn)健模型法更適用于生存數(shù)據(jù)的研究。