呂晶晶 巫宏基 侯雅文 陳 征△
【提 要】 目的 競爭風(fēng)險數(shù)據(jù)下,統(tǒng)計分析方法常基于部分分布風(fēng)險率(sub-distribution hazard,SDH)建立,但一般有前提條件SDH成比例,且有時無法對患者的生存情況或組間效應(yīng)量部分分布風(fēng)險率比(sub-distribution hazard ratio,SHR)做出直觀的解釋。因此,為了避免上述基于風(fēng)險率模型的一些限制,本文介紹并研究一種新指標(biāo),限制平均損失時間(restricted mean time lost,RMTL)。方法 首先介紹RMTL的定義和估計方法;其次針對組間RMTL差值構(gòu)造了差值法和權(quán)重法;最后,通過Monte Carlo模擬評價權(quán)重法的性能,并與現(xiàn)有方法進(jìn)行比較。結(jié)果 綜合Monte Carlo模擬得到的Ⅰ類錯誤及檢驗(yàn)效能結(jié)果,本文提出的權(quán)重法綜合性能相對較好,且在多種模擬情形下均具有較高的檢驗(yàn)效能。結(jié)論 在分析競爭風(fēng)險型數(shù)據(jù)時,RMTL的相關(guān)結(jié)果可與SHR一同給出。
競爭風(fēng)險型數(shù)據(jù)是臨床隨訪研究中常見的數(shù)據(jù)類型。在隨訪過程中,患者可能經(jīng)歷多種結(jié)局終點(diǎn)事件,其中主要觀察或研究的事件記為興趣事件,其他可能會阻礙興趣事件發(fā)生的事件即為競爭事件[1]。當(dāng)競爭風(fēng)險存在時,直接將數(shù)據(jù)簡化為單終點(diǎn)的數(shù)據(jù)類型(即競爭事件均作為右刪失處理)進(jìn)行分析將會高估事件的累積發(fā)生率,甚至得出錯誤的結(jié)論[2-3]。類似單終點(diǎn)下Kaplan-Meier生存曲線,競爭風(fēng)險下常用累積發(fā)生函數(shù)(cumulative incidence function,CIF)曲線描述患者的生存狀態(tài)或趨勢;在對組間CIF的比較中,部分分布風(fēng)險率比(sub-distribution hazard ratio,SHR)常常作為效應(yīng)指標(biāo)隨檢驗(yàn)結(jié)果一并給出。但在實(shí)際應(yīng)用中,SHR有一些局限:(1)最常用的Gray檢驗(yàn)[4]具有穩(wěn)健效能的前提是滿足組間SDH成比例假定;(2)Gray檢驗(yàn)是基于部分分布風(fēng)險率(sub-distribution hazard,SDH)構(gòu)造得到,與描述性指標(biāo)CIF所反映的結(jié)果并不直接對應(yīng)[5];(3)SHR是SDH的比值,但在描述時僅包含組1(或組2)相較于組2(或組1)的SHR,而沒有每組的描述信息,即不包含基線組的信息,因而對臨床醫(yī)生或患者而言是一個較為抽象的概念;(4)從指標(biāo)定義角度來看,SDH是基于條件概率估計得到的,因此,對應(yīng)的比值SHR所反映的“風(fēng)險”并不是實(shí)際意義上的死亡風(fēng)險(risk ratio),因而無法直觀解釋患者的生存情況[6-8]。
由于SHR的上述問題,一方面,Calkins等[9]借鑒單終點(diǎn)下限制平均生存時間的概念,將兩個終點(diǎn)事件合并為一個復(fù)合事件,提出競爭風(fēng)險限制平均生存時間(restricted mean survival time under competing risks,RMSTc)。然而,采用簡單的復(fù)合終點(diǎn)作為結(jié)局不一定存在臨床意義[10],且從實(shí)際意義上來說,RMSTc損失了興趣事件單獨(dú)的信息。另一方面,Zhao等[11]提出限制平均損失時間(restricted mean time lost,RMTL)這一指標(biāo)概念,其大小對應(yīng)興趣事件CIF曲線下方的面積,表示患者在限制時間點(diǎn)內(nèi)因興趣事件而損失的平均壽命,但是并未給出相應(yīng)的假設(shè)檢驗(yàn)方法。因此,本文針對競爭風(fēng)險型數(shù)據(jù),介紹了RMTL的估計方法,并基于RMTL差值提出新的假設(shè)檢驗(yàn)方法。
1.RMTL的估計
在興趣事件(j=1)下,第k組的RMTL為[11]
表示患者在限制時間點(diǎn)內(nèi)因興趣事件而損失的平均壽命,對應(yīng)第k組CIF曲線下的面積。
2.假設(shè)檢驗(yàn)
本文首先基于兩組間RMTL差值,構(gòu)造統(tǒng)計量
其中,ρ為不同時刻點(diǎn)間的相關(guān)系數(shù)。Lyu等[12]指出,相關(guān)系數(shù)ρ的估計涉及實(shí)際數(shù)據(jù)中潛在累積發(fā)生率分布的假定,顯得復(fù)雜且難以求解得到,且進(jìn)行敏感性的模擬研究得到ρ=0.5時方法具有穩(wěn)健的I類錯誤。因此,取ρ=0.5作為每個時間點(diǎn)間的相關(guān)系數(shù)估計值。最終得到統(tǒng)計量
本文考慮兩組權(quán)重的選擇方法:
(1)取ω(ti)=1,則統(tǒng)計量中不包含任何權(quán)重,本文記為差值法;
探究上述假設(shè)檢驗(yàn)法的性能,采用Monte Carlo方法比較Gray檢驗(yàn)和RMTL差值法、權(quán)重法的Ⅰ類錯誤和檢驗(yàn)效能,共基于6種模擬情形(圖1):(1)基于原假設(shè);(2)兩CIF曲線滿足組間SDH成比例假定;(3)兩條CIF曲線中期發(fā)散末端收斂;(4)兩條CIF曲線前期發(fā)散后期收斂;(5)兩條CIF曲線前期收斂后期發(fā)散;(6)兩條CIF曲線交叉??紤]樣本均衡(n1,n2均為50、100或150)和不均衡(n1=50,n2=100;n1=50,n2=150)的情形,刪失率設(shè)置為兩組相同,且均約為0、15%、30%、45%。每一種參數(shù)組合下模擬5000次,顯著水平設(shè)為α=0.05。
圖1 假設(shè)檢驗(yàn)?zāi)M下的興趣事件累積發(fā)生率圖
為了評價上述檢驗(yàn)法在不同情形下的綜合性能,本文采用方差分析的方法構(gòu)造Ⅰ類錯誤和綜合檢驗(yàn)效能結(jié)果的評價指標(biāo)[15]。方差分析方法是通過控制單個或者幾個研究因素來評價感興趣因素的變化趨勢,從而匯總分析不同參數(shù)組合下的復(fù)雜結(jié)果,將復(fù)雜結(jié)果變得更簡單直觀。在本文中,共考慮4個影響因素,分別為檢驗(yàn)法(test)、樣本量(n1_n2)、刪失率(cen)和模擬情形(sit),進(jìn)而擬合如下4個模型:
模型1:E(Y)=test×n1_n2+cen+sit
模型2:E(Y)=test×cen+n1_n2+sit
模型3:E(Y)=test×sit+n1_n2+cen
模型4:E(Y)=test+n1_n2+cen+sit
模型1~3分別代表考慮不同樣本量,不同刪失率,不同模擬情形下的各種檢驗(yàn)方法的評價,而模型4則是綜合所有影響因素,對各種檢驗(yàn)方法的評價。其中,用Ⅰ類錯誤的模擬結(jié)果減去所定義的顯著水平0.05,得到平均偏差值,其值越接近0則表示Ⅰ類錯誤越穩(wěn)定;檢驗(yàn)效能的模擬結(jié)果用平均拒絕率評價,檢驗(yàn)效能越高則平均拒絕率越大。
由表1可見,差值法的Ⅰ類錯誤最激進(jìn),Gray檢驗(yàn)的Ⅰ類錯誤最穩(wěn)定,而權(quán)重法的Ⅰ類錯誤相對保守。由于差值法的Ⅰ類錯誤過于激進(jìn),因此不再納入檢驗(yàn)效能的比較中。
表1 各種檢驗(yàn)法的平均偏差值(%)(Ⅰ類錯誤)
檢驗(yàn)效能結(jié)果由平均拒絕率反映(表2)。在模擬情形C、D、F中,即當(dāng)兩條CIF曲線中期發(fā)散或存在前期差異或交叉時,權(quán)重法的檢驗(yàn)效能均顯著高于Gray法的檢驗(yàn)效能。而在模擬情形B和E中,即兩CIF曲線滿足SDH成比例假定或存在后期差異時,權(quán)重法的檢驗(yàn)效能略低于Gray。
表2 各種檢驗(yàn)法的平均拒絕率(檢驗(yàn)效能)
本文選取某一關(guān)于淋巴細(xì)胞白血病患者預(yù)后影響因素的研究作為實(shí)例分析,所有檢驗(yàn)均為雙側(cè)檢驗(yàn),檢驗(yàn)水準(zhǔn)α=0.05。該研究共包含1400例患者,其中,未進(jìn)行放療組的患者1320例,放療組的患者80例,兩組刪失率分別約為27%、36%。興趣事件為死于淋巴細(xì)胞白血病,競爭事件為死于其他原因。至隨訪結(jié)束,共389名患者發(fā)生興趣事件,425名患者發(fā)生競爭事件。經(jīng)檢驗(yàn),該研究數(shù)據(jù)不滿足SDH成比例風(fēng)險假定[16](P=0.009)。
圖2 興趣事件的累積發(fā)生函數(shù)圖(τ=14.9年)
在假設(shè)檢驗(yàn)中(表3),Gray法(P=0.144)和差值法(P=0.052)均未發(fā)現(xiàn)兩組間差異具有統(tǒng)計學(xué)意義,而權(quán)重法得到兩組間差異具有統(tǒng)計學(xué)意義(P=0.026)。
表3 實(shí)例分析結(jié)果
在競爭風(fēng)險型數(shù)據(jù)中,對療效的評價往往更為復(fù)雜[11]。常用的Gray檢驗(yàn)往往受限于組間SDH成比例假定,此外,在實(shí)際應(yīng)用中,CIF曲線圖常常會作為描述指標(biāo)隨檢驗(yàn)結(jié)果一并給出,但Gray檢驗(yàn)是基于SDH構(gòu)造得到,其假設(shè)檢驗(yàn)結(jié)果與描述指標(biāo)CIF并不相互對應(yīng)。因此,本文針對競爭風(fēng)險型數(shù)據(jù),介紹了一個非風(fēng)險率指標(biāo)RMTL,并基于RMTL差值,即兩組CIF曲線下面積的差值,建立了差值法和權(quán)重法。由實(shí)例可見,RMTL可以分別給出兩組間患者的生存情況及其差異,相較于SHR,可以反映更多的患者信息。由模擬結(jié)果可見,權(quán)重法相較于差值法已經(jīng)極大地校正了刪失時Ⅰ類錯誤較大的問題,且在中期發(fā)散、前期發(fā)散和曲線交叉的模擬情形下均具有較高的檢驗(yàn)效能。在截斷點(diǎn)的選擇中,為避免截斷時間點(diǎn)太大或太小所造成方法的偏差[17],本文基于目前常用的截斷點(diǎn)選擇方法,即兩組間最后事件發(fā)生時間的較小值作為截斷時間點(diǎn)。但當(dāng)試驗(yàn)組的事件率較低時,選取該方法作為截斷點(diǎn)會對結(jié)果造成不同程度的影響[18]。在實(shí)際應(yīng)用時,研究者往往事先確定隨訪期長度,若在隨訪期內(nèi)觀察到其中一組的全部終點(diǎn),則研究停止,即得到最終的截斷時間點(diǎn);若直至隨訪期結(jié)束,仍未觀察到全部終點(diǎn),則將隨訪期限作為最終的截斷時間點(diǎn)。
本文所介紹的RMTL可以直觀地展現(xiàn)組間生存情況的差異,相較于SHR可以反映更多的患者信息。因此,在競爭風(fēng)險型數(shù)據(jù)下,為了直觀地反映組間的生存差異情況,建議RMTL的相關(guān)估計結(jié)果應(yīng)隨SHR一并給出。在假設(shè)檢驗(yàn)方面,可考慮使用本文提出的權(quán)重法。