哈爾濱醫(yī)科大學公共衛(wèi)生學院(150086) 陳永杰 張秋菊 王玉鵬 肖亞明 劉美娜
隨機對照試驗不依從數(shù)據(jù)分析方法的比較研究
哈爾濱醫(yī)科大學公共衛(wèi)生學院(150086) 陳永杰 張秋菊 王玉鵬 肖亞明 劉美娜△
目的比較依從者的平均因果效應(CACE)、意向性分析(ITT)、遵循研究方案分析(PP)和接受干預措施分析(AT),在分析隨機對照試驗不依從數(shù)據(jù)的效果,探索各種方法的適用條件,為實際數(shù)據(jù)分析提供科學依據(jù)。方法通過SAS軟件模擬產生不依從數(shù)據(jù),處理措施的因果效應使用CACE、ITT、PP和AT進行估計,以平均偏倚、均方根誤差、標準誤和檢驗效能作為評價指標,比較各種方法的估計效果。結果在各種參數(shù)組合下,以平均偏倚、均方根誤差和檢驗效能作為評價指標,CACE的估計效果均優(yōu)于ITT、PP和AT。依從率低于50%時,CACE估計的標準誤低于PP,高于ITT和AT;依從率高于50%時,CACE估計的標準誤均低于ITT、PP和AT。結論當滿足CACE模型假設時,CACE估計隨機對照試驗不依從數(shù)據(jù)因果效應的效果優(yōu)于三種傳統(tǒng)分析方法,能夠提供更加穩(wěn)健、無偏的處理效應估計值。
隨機對照試驗 不依從 CACE ITT分析 PP分析 AT分析
隨機對照試驗(random ized controlled trials,RCT)是目前公認的估計干預措施因果效應的金標準[1]。然而,以人為研究對象的隨機對照試驗常遇到兩個主要問題:不依從(non-compliance)和失訪(loss to follow-up)[2-6]。分析帶有不依從現(xiàn)象的隨機對照試驗的傳統(tǒng)方法包括:意向性分析(intention-to-treat analysis,ITT)、接受干預措施分析(as-treated analysis,AT)和遵循研究方案分析(per-protocol analysis,PP)。三種方法均存在不同程度的局限性,ITT保留了隨機化分組,分析的是分配處理的效應,事實上接受處理的效應是研究者感興趣的[7-9];PP分析刪除不依從的個體,當不依從率較高時會高估處理效應,增大Ⅰ類錯誤[10];AT分析按照實際接受處理的情況分析,破壞了隨機化分組,引入選擇偏倚。因此,三種傳統(tǒng)分析方法在估計處理措施的因果效應時并不能給出一個無偏的估計[5-6,11]。本文介紹另一種方法——依從者的平均因果效應(complier average causal effect,CACE)[2,6,12],通過模擬實驗與ITT、PP和AT比較,評價各方法估計隨機對照試驗不依從數(shù)據(jù)因果效應的效果。
1.基本原理
根據(jù)主分層的思想,按照個體分配到的處理(Z)和實際接受的處理(D)把受試者分為四層:依從者(compliers)、從不接受處理者(never-takers)、總是接受處理者(always-takers)和總是接受相反處理者(defiers)[12-13]。CACE主要關注依從者,估計依從者的因果效應,模型表示為:
μ1c是處理組依從者的平均潛在結果,μ0c是對照組依從者的平均潛在結果。
πc表示人群中依從者所占的比例,μ0n是對照組不依從者的平均潛在結果。
由(1)和(2)可得
2.模型假設
隨機對照試驗中,對照組通常是空白對照或者安慰劑對照,個體是否依從于試驗并不能完全觀測到,故公式(3)不可識別。估計CACE時需要建立五個基本假設[13]:
(1)SUTVA假設(stable unit treatment value assumption):指研究個體間不存在關聯(lián)性,即個體A是否接受處理與個體B無關;每個個體僅有一種結果被觀測到,該假設又稱一致性假設(consistency assumption)。
(2)隨機化假設:即隨機分組,此假設在隨機對照試驗中是成立的。
(3)排除限制性假設(exclusive restriction assumption,ER):在隨機分組中,總是接受處理者和從不接受處理者的處理效應為零,同時μ0n=μ1n。
(4)單調性假設(monotonicity assumption):在隨機對照試驗中,總是接受相反處理者不存在。
(5)非零分子假設(nonzero numerator assumption):指研究人群中一定存在依從者。
在五個模型假設成立的前提下,可將總是接受相反處理者排除;由于隨機對照試驗的對照組人群通常不能獲得處理措施,可將總是接受處理者排除。以下分析都是針對依從者(compliers)和從不接受處理者(never-takers)兩層人群。
根據(jù)以上假設CACE表示為:
3.參數(shù)估計
CACE參數(shù)估計通過廣義線性潛在混合模型(generalized linear latent and mixed model,GLLAMM)[14]實現(xiàn)。CACE參數(shù)估計過程如下:
(1)結果模型
yj表示第j個個體的結果測量值;rj為隨機分組變量,rj=1表示第j個個體分到處理組,rj=0表示分到對照組;cj為依從變量,cj=1表示第j個個體為依從者,cj=0表示不依從者;ηj為潛變量,取值1和0。
由公式(1)和(5)可得:
(2)依從模型
通過指示變量d把模型(5)和(7)聯(lián)立
(3)聯(lián)合模型:
通過對模型(8)進行參數(shù)估計得到β1和β2,由公式(6)可得CACE估計值。
不依從現(xiàn)象常伴隨數(shù)據(jù)缺失,在考慮數(shù)據(jù)缺失機制后獲得CACE估計值會更加準確。假設數(shù)據(jù)缺失機制為潛在可忽略(latent ignorability,LI),CACELI參數(shù)估計過程如下:
(1)缺失數(shù)據(jù)模型
通過指示變量d把模型(5),(7),(9)聯(lián)立
(2)聯(lián)合模型:
通過模擬實驗比較CACE、ITT、PP和AT在分析隨機對照試驗不依從數(shù)據(jù)時的優(yōu)劣,從樣本含量、依從率和缺失率三方面觀察每種方法的估計效果,并探索各種方法的適用條件。
1.參數(shù)設置
樣本含量設置為80、150和400;依從率設置為40%、60%和80%;缺失率設置為10%和30%;數(shù)據(jù)缺失機制設置為隨機缺失(m issing at random,MAR);處理效應真實值設置為1;基線測量變量服從N(-0.35,1.462);研究對象以P(Zi=1)=0.5的概率隨機分配到處理組和對照組。
結果變量的生成模型為:Yi=β0+β1xi+β2ZiCi+εi;依從變量的生成模型為:logitPci=ln(Pci/(1-Pci))=β0+βcxi;缺失觀測的生成模型為:logitPmi=ln(Pmi/(1-Pmi))=βm0+βm1xi+βm2Ci。各種參數(shù)組合重復模擬1000次。
2.評價指標
估計效果評價指標包括偏差(bias)、均方根誤差(RMSE)、標準誤和檢驗效能(power)。平均偏倚是估計值和真實值之間差值的平均數(shù),該值越接近0表示估計的偏倚越?。痪礁`差綜合反應估計的方差與偏倚,該值越接近0表示估計越準確;標準誤表示估計的精確度,該值越小表示估計的波動越??;檢驗效能反應估計的把握度,該值越接近100%表示犯Ⅱ類錯誤的概率越小。模擬實驗主要通過SAS9.2和STATA12.0進行,CACE估計通過GLLAMM模型實現(xiàn),ITT、PP和AT通過線性回歸分析實現(xiàn)。
3.結果
表1和表2分別描述了缺失率為10%和30%時的模擬實驗結果,CACE、ITT、PP和AT的平均偏倚和均方根誤差均隨著樣本含量的增加、依從率的增高而逐漸變?。辉诟鞣N參數(shù)組合下,CACE的估計效果均優(yōu)于ITT、PP和AT。
表1 缺失率為10%時各方法的模擬實驗結果
表2 缺失率為30%時各方法的模擬實驗結果
圖1描述了四種方法估計的標準誤隨著樣本含量的增加逐漸變小的趨勢;CACE和PP的標準誤隨著依從率的增高明顯降低,ITT和AT基本保持不變;依從率低于50%時,CACE的估計效果優(yōu)于PP,依從率高于50%時,CACE的估計效果優(yōu)于ITT、PP和AT。
圖1 各參數(shù)組合下每種方法估計值標準誤的模擬實驗結果
圖2描述了四種方法的檢驗效能隨著樣本含量的增加逐漸增大的趨勢,ITT和AT在樣本含量為400時檢驗效能增加明顯;在各種參數(shù)組合下ITT和AT的檢驗效能始終保持一致;樣本含量為80、150和400時,CACE的檢驗效能均優(yōu)于ITT、PP和AT,樣本含量為400時,PP的檢驗效能與CACE接近。
圖2 各參數(shù)組合下每種方法檢驗效能的模擬實驗結果
CACE充分利用不依從和缺失數(shù)據(jù)的信息,通過處理組可觀測的信息推斷對照組不可觀測的信息,利用潛變量進行參數(shù)估計,綜合所有的信息對處理措施的因果效應進行估計,從而得到一個真實可靠的結論。本研究通過模擬實驗證實,在各種參數(shù)組合下CACE的估計效果均優(yōu)于ITT、PP和AT,且每種方法的估計效果隨著樣本含量的增加、依從率的增高而逐漸趨于穩(wěn)健。因此建議在數(shù)據(jù)分析方法選擇時,應優(yōu)先采用CACE對不依從數(shù)據(jù)進行分析。
CACE建立在五個模型假設基礎上,分析實際數(shù)據(jù)時,模型假設是否成立會不同程度影響結果的準確性。隨機對照試驗設計可以保證假設1、2、4和5成立,但假設3成立與否是無法檢驗的。因此,對實際數(shù)據(jù)分析后有必要對模型進行靈敏度分析(sensitivity analysis),檢驗模型假設不成立時參數(shù)的估計結果是否會發(fā)生顯著性變化,對分析結果的準確度有一定的把握[6]。CACE目前主要用于兩組間的比較,多組間的比較只能給出大致的區(qū)間估計[4,7]。因此,CACE多組間比較有待于進一步研究。
本研究通過模擬實驗證實CACE分析不依從數(shù)據(jù)的效果優(yōu)于三種傳統(tǒng)的分析方法,為研究者提供了一種新的分析不依從數(shù)據(jù)的方法。實際中,使用CACE分析隨機對照試驗不依從數(shù)據(jù)的同時,應結合ITT和PP的分析結果,綜合所有的信息對試驗下結論并給出一個令人信服的結果解釋,這樣得到的結論才更加準確可靠,估計的因果效應才更接近處理措施的真實值。
[1]張熙.多重填補方法估計存在不依從與缺失值的隨機對照試驗的因果效應.上海:復旦大學,2012.
[2]Imbens GW,Rubin DB.Bayesian inference for causal effects in randomized experiments with noncompliance.The Annals of Statistics, 1997:305-327.
[3]Frangakis CE,Rubin DB.Addressing complications of intention-totreat analysis in the combined presence of all-or-none treatment-noncompliance and subsequentm issing outcomes.Biometrikam,1999,86(2):365-379.
[4]Cheng J,Small DS.Bounds on causal effects in three-arm trials with non-compliance.Journal of the Royal Statistical Society:Series B(Statistical Methodology),2006,68(5):815-836.
[5]Peng Y,Little RJ,Raghunathan TE.An extended general location model for causal inferences from data subject to noncompliance and m issing values.Biometrics,2004,60(3):598-607.
[6]Jo B.Modelm isspecification sensitivity analysis in estimating causal effects of interventions with non-compliance.Statistics in medicine,2002,21(21):3161-3681.
[7]Little RJ,Long Q,Lin X.A comparison of methods for estimating the causal effect of a treatment in random ized clinical trials subject to noncompliance.Biometrics,2009,65(2):640-649.
[8]Hirano K,ImbensGW,Rubin DB,etal.Assessing the effectof an influenza vaccine in an encouragement design.Biostatistics,2000,1(1):69-688.
[9]Welsh AW.Random ised controlled trials and clinicalmaternity care:moving on from intention-to-treatand other simplistic analyses of efficacy.BMC pregnancy and childbirth,2013,13:15.
[10]Dodd S,White IR,W illiamson P.Nonadherence to treatment protocol in published random ised controlled trials:a review.Trials,2012,13:84.
[11]Schwartz S,Li F,Reiter JP.Sensitivity analysis for unmeasured confounding in principal stratification settings with binary variables.Statistics in medicine,2012,31(10):949-962.
[12]Angrist JD,Imbens GW,Rubin DB.Identification of causal effects using instrumental variables.Journal of the American statistical Association,1996,91(434):444-455.
[13]Jo B,Ginexi EM,Ialongo NS.Handling m issing data in randomized experimentswith noncompliance.Prevention Science,2010,11(4):384-96.
[14]Skrondal A,Rabe-Hesketh S.Some applicationsof generalized linear latent and mixed models in epidemiology:repeated measures,measurement error and multilevelmodeling.Norsk epidem iologi,2003,13(2):265-278.
(責任編輯:郭海強)
Com parison of Methods Analyzing Non-com pliance Data of Random ized Controlled trial
Chen Yongjie,Zhang Qiuju,Wang Yupeng,etal.(DepartmentofBiostatistics,PublicHealthCollege,HarbinMedicalUniversity(150086),Harbin)
ObjectiveTo compare the performance of complier average causal effect(CACE)with thatof intention-totreat analysis(ITT),per-protocol analysis(PP),and as-treated analysis(AT)in estimating treatment effect of random ized controlled trialwith non-compliance,to explore the application conditions of eachmethod,and to provide scientific evidence for analyzing practical data.MethodsNon-compliance data was simulated using SAS.CACE,ITT,PP and AT were used to estimate treatment effect and their performances were evaluated using bias,root mean square error(RMSE),standard error,and power.ResultsFor all combinations of parameters,the performance of CACE was better than that of ITT,PP and AT in bias,RMSE and power.When compliant rate was less than 50%,the performance of CACEwas better than thatof PP in standard error,butworse than that of ITT and AT;when more than 50%,CACE was the best.ConclusionWhen themodel assumptions hold,CACE is better atestimating causal effect than ITT,PP and AT,and can provide an unbiased and robustestimation of treatment effect.
Random ized controlled trial;Non-compliance;Complier average causal effect;Intention-to-treat analysis;Per-protocol analysis;As-treated analysis
△通信作者:劉美娜