陳金寶 邱李斌 王北琪 曾 潔 陳慧林 侯雅文 陳 征△
長(zhǎng)期生存率比較的統(tǒng)計(jì)檢驗(yàn)法*
陳金寶1邱李斌1王北琪1曾 潔1陳慧林1侯雅文2陳 征1△
目的針對(duì)基于生存數(shù)據(jù)的長(zhǎng)期療效分析的問題,特別是兩條生存曲線出現(xiàn)交叉或危險(xiǎn)率不成比例的情況下,比較在特定時(shí)刻點(diǎn)后組間生存率的差異,本文主要介紹組合檢驗(yàn)法ZOLS、ZSP,p和χ2三種檢驗(yàn)的適用情況。方法在兩組危險(xiǎn)率不滿足比例風(fēng)險(xiǎn)假定的前提下,對(duì)生存曲線交叉和后期差異大的兩個(gè)例子,分別使用ZOLS、ZSP,p和χ2三種方法檢驗(yàn)在不同時(shí)刻點(diǎn)之后組間生存率的差異。結(jié)果兩個(gè)例子中,ZOLS檢驗(yàn)與χ2檢驗(yàn)對(duì)不同時(shí)刻點(diǎn)之后的組間生存率差異進(jìn)行檢驗(yàn),均能得出較為一致的結(jié)論,并且與實(shí)際情況符合。而ZSP,p檢驗(yàn)的結(jié)果與前兩種相比有差異。結(jié)論結(jié)合實(shí)例分析,在比較長(zhǎng)期療效或者生存曲線特定時(shí)間點(diǎn)后的生存率時(shí),建議使用ZOLS檢驗(yàn)與χ2檢驗(yàn)。
生存分析 組間生存率比較 非參數(shù)檢驗(yàn) 長(zhǎng)期療效分析
在醫(yī)學(xué)臨床研究中,組間生存率差異的檢驗(yàn)是常見的研究問題之一,經(jīng)典方法如統(tǒng)計(jì)軟件SPSS 22.0采用的log-rank、Breslow和Tarone-Ware檢驗(yàn),均是對(duì)組間生存曲線進(jìn)行整體檢驗(yàn),當(dāng)兩組危險(xiǎn)率不滿足比例風(fēng)險(xiǎn)假定時(shí),這三種檢驗(yàn)[1-4]均不適用。例如在一項(xiàng)評(píng)估兩種治療方法對(duì)腎透析患者療效的臨床研究中[1],兩條生存曲線存在交叉(圖1),并經(jīng) Grambsch-Therneau檢驗(yàn)[2]得到兩組危險(xiǎn)率不滿足比例風(fēng)險(xiǎn)假定(χ2=8.70,P=0.003),因而 log-rank檢驗(yàn)結(jié)果(χ2=2.53,P=0.112)不可靠,外科放置組與皮下放置組的平均感染時(shí)間分別為18.527月和23.649月,結(jié)合圖1發(fā)現(xiàn)10個(gè)月之后兩組間生存率可能有較大的差異。此時(shí)可以使用避免交叉點(diǎn)前后差異相互抵消的two-stage檢驗(yàn)[3-4],從而得到整體上兩組間生存率有統(tǒng)計(jì)學(xué)差異(P=0.025)。但依舊很難給出哪種治療法生存率更高的結(jié)論,因?yàn)榻徊纥c(diǎn)前、后的生存率高低是相反的。陳金寶等[5]建議使用固定點(diǎn)處組間生存率的比較法,但很多時(shí)候更關(guān)注的是哪種治療法在長(zhǎng)期階段有著更高的生存率,如在實(shí)際的臨床研究中,研究者往往對(duì)特定時(shí)間點(diǎn)后的部分(或階段)生存率的差異更感興趣,在上述腎透析研究(圖1)中關(guān)注第5個(gè)月之后或第15個(gè)月之后兩組之間生存率是否有差異等。本文將介紹兩生存曲線在長(zhǎng)期階段(特定時(shí)間點(diǎn)后)生存率比較的三種檢驗(yàn)方法[6],Nelson-Aalen估計(jì)線性組合的ZOLS檢驗(yàn),Kaplan-Meier估計(jì)線性組合的ZSP,p檢驗(yàn)以及二次型形式的χ2檢驗(yàn),并應(yīng)用于兩個(gè)實(shí)例來分析說明。
圖1 腎透析患者分別進(jìn)行外科放置導(dǎo)管和皮下放置導(dǎo)管的生存曲線
本文只考慮兩條生存曲線長(zhǎng)期(特定時(shí)間點(diǎn)后)生存率的比較。假設(shè)第k組有樣本量nk,其中k=0,1,tj表示第j個(gè)個(gè)體的事件發(fā)生時(shí)間,且t1≤t2≤……≤tm,dkj表示第k組在時(shí)間tj發(fā)生的事件數(shù),Ykj表示第k組在時(shí)間tj的風(fēng)險(xiǎn)人數(shù)。Kaplan-Meier估計(jì)生存率率及其方差估計(jì)值分別是
比較長(zhǎng)期(特定時(shí)間點(diǎn)后)生存率的差異,原假設(shè)H0∶{S1(t0)=S0(t0)}∩{λ1(t)=λ0(t),t>t0},其中λk(t)表示第 k組(k=0,1)在時(shí)間點(diǎn) t的危險(xiǎn)率。原假設(shè)包括 H01∶S1(t0)=S0(t0)和 H02∶λ1(t)=λ0(t),t>t0兩個(gè)子假設(shè),其中H01表示在t0時(shí)刻生存率相等,而H02表示時(shí)間點(diǎn)t0后的危險(xiǎn)率無(wú)差異;備擇假設(shè)H1:兩個(gè)子假設(shè)中至少有一個(gè)子假設(shè)不成立。
針對(duì)于特定時(shí)刻后生存率比較,本文介紹組合檢驗(yàn)法中三種檢驗(yàn)統(tǒng)計(jì)量[6]:
(1)子假設(shè)H01的檢驗(yàn)統(tǒng)計(jì)量為 ZNA(t0):利用 Nelson-Aalen法估計(jì)累計(jì)危險(xiǎn)率,設(shè)
(2)子假設(shè) H02的檢驗(yàn)統(tǒng)計(jì)量 ZLR(t0),基于 logrank檢驗(yàn)法。從時(shí)刻點(diǎn) t0開始可設(shè)得 XLR(t0)=差一致性估計(jì)值為dj)/(Yj-1)}dj,其中的 dj和 Yj分別是已發(fā)生事件總?cè)藬?shù)和正處于風(fēng)險(xiǎn)總?cè)藬?shù),則檢驗(yàn)統(tǒng)計(jì)量為:
并且檢驗(yàn)統(tǒng)計(jì)量ZLR(t0)服從標(biāo)準(zhǔn)正態(tài)分布。
為了檢驗(yàn)組合原假設(shè)H0,利用上述檢驗(yàn)統(tǒng)計(jì)量ZNA(t0)和 ZLR(t0),本文主要闡述組合檢驗(yàn)的兩種檢驗(yàn)法,包含三個(gè)檢驗(yàn)統(tǒng)計(jì)量,方法如下:
(1)線性組合檢驗(yàn)
①ZOLS檢驗(yàn)統(tǒng)計(jì)量
假設(shè)在H0成立的條件下,基于Nelson-Aalen估計(jì)法,對(duì) ZNA(t0)和 ZLR(t0)兩個(gè)檢驗(yàn)統(tǒng)計(jì)量進(jìn)行線性組合,則檢驗(yàn)統(tǒng)計(jì)量為:
其中,可以根據(jù)實(shí)際情況合理調(diào)整權(quán)重a和b大小,Logan等[6]通過模擬實(shí)驗(yàn)發(fā)現(xiàn),當(dāng)對(duì)權(quán)重a和b分別賦值a
不錯(cuò),并且此時(shí)統(tǒng)計(jì)量Z(t0)化簡(jiǎn)后表達(dá)式為:
檢驗(yàn)統(tǒng)計(jì)量ZOLS類似于檢驗(yàn)多終點(diǎn)事件的普通最小二乘法(ordinary least squares,OLS),并且服從標(biāo)準(zhǔn)正態(tài)分布。
②ZSP,p檢驗(yàn)統(tǒng)計(jì)量
對(duì)于子假設(shè)H01的檢驗(yàn),基于Kaplan-Meier估計(jì)法來計(jì)算t0時(shí)刻不同組別的生存率的差值及組合樣本的生存率和方差,在估計(jì)生存率差值的方差時(shí)用到組合樣本。類似于部分分組log-rank檢驗(yàn)法,構(gòu)造一種特殊的線性組合檢驗(yàn)(SP,p)統(tǒng)計(jì)量:
并且檢驗(yàn)統(tǒng)計(jì)量ZSP,P(t0)服從標(biāo)準(zhǔn)正態(tài)分布,其中^Sp(t0)表示在t0時(shí)刻組合樣本n0+n1的生存率估計(jì)值。
(2)二次型 χ2檢驗(yàn)法
通過對(duì)組合檢驗(yàn)基本統(tǒng)計(jì)量ZNA和ZLR的構(gòu)造分析,可得(ZNA(t0),ZLR(t0))服從均值為(0,0),方差和協(xié)方差矩陣可由估計(jì)得到的二元正態(tài)分布,二次型檢驗(yàn)法對(duì)二元正態(tài)分布整體進(jìn)行假設(shè)檢驗(yàn),這時(shí)檢驗(yàn)統(tǒng)計(jì)量逼近卡方分布,構(gòu)造得到檢驗(yàn)統(tǒng)計(jì)量為:
在原假設(shè)H0成立的前提下,檢驗(yàn)統(tǒng)計(jì)量χ2(t0)服從自由度為1的卡方分布。
本文給出兩個(gè)例子來說明上述方法的應(yīng)用,一個(gè)兩條生存曲線交叉,另一個(gè)是生存率后期差異大。
在一項(xiàng)評(píng)腎透析患者療效的研究中[1],共有119名患者,其中43人進(jìn)行外科放置導(dǎo)管,76人進(jìn)行皮下放置導(dǎo)管(刪失率分別為65.1%和85.5%)。終點(diǎn)事件為腎功能不全患者初次發(fā)生通道口感染,右刪失為導(dǎo)尿管失效和試驗(yàn)結(jié)束時(shí)終點(diǎn)事件尚未發(fā)生,圖1顯示兩條生存曲線大概在第8個(gè)月左右相交,不滿足比例風(fēng)險(xiǎn)假定。由表1可見,ZOLS檢驗(yàn)結(jié)果顯示在第10、15和20個(gè)月后,兩組間生存率差異均有統(tǒng)計(jì)學(xué)意義,結(jié)合圖1發(fā)現(xiàn)對(duì)應(yīng)時(shí)間段皮下放置導(dǎo)管的生存率均較外科放置導(dǎo)管的高,而在第5個(gè)月后兩組間生存率差異沒有統(tǒng)計(jì)學(xué)意義。ZSP,p檢驗(yàn)結(jié)果與ZOLS檢驗(yàn)結(jié)果完全相反。χ2檢驗(yàn)結(jié)果顯示在第5、10、15和20個(gè)月后,兩組間生存率差異均有統(tǒng)計(jì)學(xué)意義。Logan等[6]通過模擬研究發(fā)現(xiàn),ZOLS檢驗(yàn)與χ2檢驗(yàn)不論I類錯(cuò)誤還是檢驗(yàn)效能都有較好且一致的表現(xiàn),建議綜合ZOLS檢驗(yàn)和χ2檢驗(yàn)結(jié)果來得出結(jié)論。
表1 不同檢驗(yàn)方法在例1上的應(yīng)用結(jié)果
一項(xiàng)關(guān)于萬(wàn)絡(luò)預(yù)防腺性息肉瘤的研究[7]共收集了262例曾患結(jié)腸直腸的患者,其中132例服用昔布類藥物:萬(wàn)絡(luò),130例服用安慰劑,中位生存時(shí)間分別為9.71個(gè)月和10.04個(gè)月,右刪失率為22.0%和37.7%,由于原文數(shù)據(jù)無(wú)法獲得,因此參照Royston和Mahesh[8]的方法模擬產(chǎn)生了本例的數(shù)據(jù)。終點(diǎn)事件是發(fā)生心血管事件(心臟病中風(fēng)),到研究截止時(shí)間尚未發(fā)生終點(diǎn)事件為右刪失,圖2顯示服用萬(wàn)絡(luò)患者比服用安慰劑的患者在18個(gè)月后出現(xiàn)心血管事件的幾率相對(duì)增加,但在18個(gè)月之前兩組患者出現(xiàn)心血管事故的生存率基本一致。由表2可見,log-rank檢驗(yàn)結(jié)果顯示兩組間整體無(wú)統(tǒng)計(jì)學(xué)差異,而且Grambsch-Therneau檢驗(yàn)[2]顯示兩組不滿足風(fēng)險(xiǎn)比例假設(shè)(χ2=4.45,P=0.035),two-stage檢驗(yàn)結(jié)果顯示兩組整體上有統(tǒng)計(jì)學(xué)差異。長(zhǎng)期檢驗(yàn)的ZOLS檢驗(yàn)顯示在第6和12個(gè)月后兩條生存曲線生存率均無(wú)統(tǒng)計(jì)學(xué)差異,而在第18和24個(gè)月后差異均有統(tǒng)計(jì)學(xué)意義。ZSP,p檢驗(yàn)顯示在四個(gè)時(shí)間點(diǎn)后的生存率差異均無(wú)統(tǒng)計(jì)學(xué)意義。χ2檢驗(yàn)顯示在第6個(gè)月后的生存率差異無(wú)統(tǒng)計(jì)學(xué)意義,而在第12、18和20個(gè)月后生存率差異有統(tǒng)計(jì)學(xué)意義。結(jié)合圖2和 Logan等[6]的模擬研究,ZSP,p檢驗(yàn)結(jié)果可能與實(shí)際不符,ZOLS檢驗(yàn)與χ2檢驗(yàn)?zāi)芙o出較為合理的結(jié)果,即患者在使用萬(wàn)絡(luò)一段時(shí)間之后能夠增加心血管事件發(fā)生的概率。
圖2 結(jié)腸直腸腺瘤患者分別服用昔布類藥物和安慰劑的生存曲線
表2 不同檢驗(yàn)方法在例2上的應(yīng)用結(jié)果
兩條生存曲線比較是醫(yī)學(xué)臨床研究中重要的統(tǒng)計(jì)分析方法。當(dāng)兩組危險(xiǎn)率滿足比例風(fēng)險(xiǎn)假定,可采用常規(guī)的log-rank檢驗(yàn)或Breslow檢驗(yàn)等方法,但當(dāng)兩組危險(xiǎn)率不滿足比例風(fēng)險(xiǎn)假定,采用two-stage檢驗(yàn)可以克服常規(guī)方法的不足。以上都是檢驗(yàn)組間整體的生存率差異,然而在實(shí)際臨床研究中,特別是不滿足比例風(fēng)險(xiǎn)時(shí),整體檢驗(yàn)法還是無(wú)法確定生存率誰(shuí)高誰(shuí)低,這時(shí)可以采用某固定時(shí)刻點(diǎn)組間生存率的比較檢驗(yàn)法[5],但這種檢驗(yàn)法只關(guān)注某固定時(shí)刻點(diǎn)上生存率的差異,還是不能做整段的生存率比較,這時(shí)若是對(duì)長(zhǎng)期效果感興趣則可以采用本文介紹的某特定時(shí)刻后生存率長(zhǎng)期比較檢驗(yàn)法,其可以關(guān)注某特定時(shí)刻后組間生存率的差異。Logan等[6]對(duì)長(zhǎng)期檢驗(yàn)的三種檢驗(yàn)統(tǒng)計(jì)量,在不同刪失率下進(jìn)行模擬研究,發(fā)現(xiàn)ZOLS檢驗(yàn)在不同刪失率下均表現(xiàn)出較高的穩(wěn)健性和適用性;χ2檢驗(yàn)在刪失率較低(20%以下)的情況下對(duì)組間差異更加敏感;ZSP,p檢驗(yàn)法不論刪失率的高低,均易得出與實(shí)際情況不相符合的結(jié)果。結(jié)合本文兩個(gè)例子分析結(jié)果,筆者建議在分析之前先繪制生存曲線圖和進(jìn)行成比例假設(shè)檢驗(yàn),也建議采用線性組合檢驗(yàn)法的ZOLS檢驗(yàn),它相對(duì)ZSP,p檢驗(yàn)和χ2檢驗(yàn)具有較好的適用性和穩(wěn)健性。
[1]Klein JP,Moeschberger ML.Survival Analysis:Techniques for Censored and Truncated Data.Second Edition.New York:Springer,2003.
[2]Grambsch P,Therneau T.Proportional hazards tests and diagnostics based on weighted residuals.Biometrics,1994,81(3):515-526.
[3]Li H,Han D,Hou Y,et al.Statistical Inference Methods for Two Crossing Survival Curves:A Comparison of Methods.PLoS ONE,2015,10(1):e0116774.
[4]李慧敏,韓棟,陳征,等.生存曲線交叉時(shí)統(tǒng)計(jì)推斷的比較和選擇.中國(guó)衛(wèi)生統(tǒng)計(jì),2013,30(5):668-672.
[5]陳金寶,邱李斌,王北琪,等.固定點(diǎn)處組間生存率比較的統(tǒng)計(jì)檢驗(yàn)法.中華流行病學(xué)雜志,2015,36(2):186-188.
[6]Logan BR,Klein JP,Zhang M.Comparing Treatments in the Presence of Crossing Survival Curves:An Application to Bone Marrow Transplantation.Biometrics,2008,64(3):733-740.
[7]Bresalier RS,Sandler RS,Quan H,et al.Cardiovascular Events Associated with Rofecoxib in a Colorectal Adenoma Chemoprevention Trial.N Engl JMed,2005,352(11):1092-1102.
[8]Royston P,Mahesh KBP.The use of restricted mean survival time to estimate the treatment effect in random ized clinical trials when the proportional hazards assumption is in doubt.Statistics in Medicine,2011,30(19):2409-2421.
國(guó)家自然科學(xué)基金(81202288)、廣州市科技計(jì)劃(2012J5100023)、廣東省大學(xué)生創(chuàng)業(yè)創(chuàng)新訓(xùn)練計(jì)劃(1212113039)、南方醫(yī)科大學(xué)科研啟蒙計(jì)劃(B1012444)
1.南方醫(yī)科大學(xué)公共衛(wèi)生學(xué)院(廣東省熱帶病研究重點(diǎn)實(shí)驗(yàn)室)生物統(tǒng)計(jì)學(xué)系(510515)
2.暨南大學(xué)經(jīng)濟(jì)學(xué)院統(tǒng)計(jì)學(xué)系
△通信作者:陳征,E-mail:zchen@smu.edu.cn
(責(zé)任編輯:郭海強(qiáng))
中國(guó)衛(wèi)生統(tǒng)計(jì)2016年3期