閆俊紅 楊紫荊 侯雅文 陳 征?
【提 要】 目的 當復合終點(事件)中組分結局事件的臨床優(yōu)先級問題存在時,傳統(tǒng)基于風險比的方法常出現一定的估計誤差。本文以急性淋巴細胞白血病患者預后研究為背景,討論能解決該問題的統(tǒng)計方法。方法 介紹在組分事件之間的優(yōu)先級非常重要時,一種新的指標贏率的概念和分析方法;隨后將該方法應用于急性淋巴細胞白血病的預后研究,比較風險比和基于贏率的匹配、不匹配和加權贏率法的差異。結果 研究發(fā)現,贏率法顯示GvHD預防是急性淋巴細胞白血病患者預后的危害因素,而風險比的結果與之相反,這是由于在含有多個優(yōu)先級結局事件的研究中,風險比受第一結局事件的影響,結果往往存在一定的偏差,而贏率能更好的反映實際情況。結論 當組分事件之間的優(yōu)先級很重要時,相對于風險比,贏率是一個更好的統(tǒng)計評價指標。
急性淋巴細胞白血病是一類造血干細胞惡性克隆性疾病,其主要表現為外周血中出現異常的白細胞,失去控制后在骨髓和其他造血組織中大量增殖,導致正常紅細胞和血小板的生成減少。急性淋巴細胞白血病自然病程較短,若不治療,一般多在6個月內死亡。但經過骨髓移植治療后的患者,也會出現復發(fā)、發(fā)生不良事件、死亡等結局事件[1]。這種由多個結局事件組合而成的終點稱為復合終點(composite endpoints),常被用作隨機臨床試驗的主要終點,以提高試驗的效率[2~3]。由于復合終點的事件發(fā)生率相對較高,較易發(fā)現組間差異,從而可以降低試驗所需的樣本量,減少研究時間和成本。另外,以復合終點作為主要終點,也可以避免多重性問題和競爭風險問題[4-5]。但傳統(tǒng)復合終點的應用也存在一定的局限,它通常將所有結局事件視為同等重要,并且只考慮最先發(fā)生的結局事件,如在急性淋巴細胞白血病的臨床研究中,復合終點定義為患者死亡和發(fā)生不良事件,若患者首先發(fā)生不良事件,之后更為重要的該患者是否死亡就被忽略了,也就是說,早期發(fā)生的非致命事件比后來發(fā)生的更嚴重的事件具有更高的優(yōu)先級。因此,當各終點事件對患者的重要性不一致時,對結果的解釋變得尤為困難[6-7]。
為了解決上述問題,Pocock等人[8]提出了“贏率”(win ratio)這一新指標或方法,它在傳統(tǒng)復合終點的基礎上將復合終點組成事件的臨床優(yōu)先級加以考慮,即根據研究目的及臨床意義對組分結局事件的重要性進行排序,優(yōu)先考慮重要性高的事件。本文將基于急性淋巴細胞白血病患者預后研究的實際數據,介紹贏率的定義、估計以及相應的統(tǒng)計推斷方法,并將其與傳統(tǒng)的風險比(hazard ratio,HR)進行比較。
1.研究對象
選用1985年至1998年在歐洲血液和骨髓移植學會(EBMT)注冊的2279例急性淋巴細胞白血病患者數據,所有患者均在初次完全緩解時進行親緣供者異基因骨髓移植術。隨訪期間記錄的事件包括:發(fā)生不良事件、血小板恢復、復發(fā)和死亡。這里的不良事件定義為在移植后100天內出現2級及其以上的移植物抗宿主病。預后信息包括:供受者性別匹配、GvHD預防、移植年份和移植年齡。
2.調查內容
對GvHD預防的臨床益處的進行評估,復合終點定義為患者死亡和發(fā)生不良事件,其中死亡具有較大的優(yōu)先級,而其他狀態(tài)作為右刪失。
3.數據整理及分析
應用R 3.4.3進行數據整理、基線信息描述以及模型建立和估計。
4.研究方法
本研究運用3種贏率法來評估GvHD預防對急性淋巴細胞白血病治療的臨床益處。將進行GvHD預防的患者設為試驗組,對照組由未進行GvHD預防的患者組成,根據患者的風險情況將兩組患者進行兩兩配對,對于任一患者對(試驗和對照組患者各一名),若試驗組患者先發(fā)生終點事件,則該患者稱為“失敗者(loser)”,反之則這個試驗組患者為“獲勝者(winner)”。所有配對中獲勝者總數與失敗者總數之比即為贏率。若贏率等于1,則認為是平局,即兩組療效無差異;大于1時,認為試驗組獲勝,即試驗組療效更好,如贏率等于1.8,其含義是與對照組相比,試驗組的獲勝者多了80%。贏率包括未加權贏率(unweighted win ratio)和加權贏率(weighted win ratio),其中未加權贏率有兩種計算方法,分別是匹配贏率法(matched win ratio)和不匹配贏率法(unmatched win ratio)。同時也應用傳統(tǒng)HR的方法,與上述贏率的方法結果進行對比分析。
(1)匹配贏率
匹配贏率法考慮到患者個體風險,根據試驗組和對照組患者的風險值進行匹配。這里風險值的計算基于Cox比例風險模型h(t|X)=h0(t)exp(β1X1+β2X2+…+βkXk),其中h(t|X)是具有協變量X的個體在t時刻的風險函數,t為生存時間,X=(X1,X2,…,Xk)′是可能影響生存時間的有關因素,也稱協變量。h0(t)是基線風險函數,β=(β1,β2,…,βk)′為模型的回歸系數。根據該模型,計算出每個患者的個體風險值(=β1X1+β2X2+…+βkXk)。若兩組患者數量不等,則首先將樣本量較大的組別的患者隨機剔除,保證兩組患者數相同。然后分別對試驗組和對照組的患者進行風險值排序,兩組中排序數相同的患者兩兩匹配。對每對患者首先研究優(yōu)先重要事件(這里是患者死亡),主要觀察誰最先發(fā)生該事件,若該結果無從得知,則觀察誰先發(fā)生不良事件。圖1說明了在每對患者中進行這種比較所涉及的步驟,可能有以下5種情況:
①試驗組患者先死亡;
②對照組患者先死亡;
③試驗組患者先發(fā)生不良事件;
④對照組患者先發(fā)生不良事件;
⑤以上情況均未出現。
圖1 試驗組和對照組患者的比較
上述5種情況的對子數分別定義為N1、N2、N3、N4和N5,則試驗組的“獲勝者”數量Nw為Nw=N2+N4,“失敗者”的數量Nl為Nl=N1+N3。所以,贏率RW定義為
此時,試驗組“獲勝者”所占的比率PW為
該比率PW的95%可信區(qū)間是
所以贏率的95%可信區(qū)間是
兩組比較時,對于原假設H0:RW=1(試驗組與對照組不存在差異),檢驗統(tǒng)計量Z服從漸近正態(tài)分布。
(2)不匹配贏率
(3)加權贏率
設TH和TD是表示發(fā)生不良事件和死亡時間的兩個隨機變量,TC代表刪失的時間。Y1=TH^TD^TC和Y2=TD^TC(^表示求最小值)。δ1和δ2分別為Y1和Y2的指示變量,如分別觀察到不良事件或死亡,則對應δ1=1或δ2=1;否則,分別為δ1=0或δ2=0。觀測數據(Y1i,Y2i,δ1i,δ2i,Mi),i=1,2…n,是(Y1,Y2,δ1,δ2,M)的獨立同分布樣本,其中M=1代表試驗組,M=0代表對照組;y1,y2分別是該分布上Y1,Y2對應點的期望值。
對于某一患者對,假設患者j來自對照組,患者i來自試驗組。定義W2ij=δ2jI(Y2i≥Y2j)以及W1ij=δ1jI(Y1i≥Y1j)分別表示患者i在死亡事件和發(fā)生不良事件上“獲勝”,L2ij=δ2iI(Y2j≥Y2i)以及L1ij=δ1iI(Y1j≥Y1i)則為“失敗”的情況,因此“平局”分別為Ω2ij=(1-W2ij)(1-L2ij)以及Ω1ij=(1-W1ij)(1-L1ij)。表1給出了該指標變量組合的9種情況。其中,情況W2ijW1ij、W2ijΩ1ij、W2ijL1ij以及Ω2ijW1ij屬于“獲勝”,Ω2ijΩ1ij屬于平局,其余為“失敗”。
表1 輸贏指標變量圖
設G2(·)和G1(·)分別是死亡與不良事件的加權函數,該加權函數可根據研究者的需要定義,通常取
則圖1中①②③④的加權數分別為
所以,加權贏差(weightedwin difference)WD[12]為
WD(G1,G2)={W2(G2)+W1(G1)}-{L2(G2)+
然后,加權贏率為
假設(TH,TD)的聯合分布是連續(xù)的,λDk(y2)=pr(TD=y2|TD≥y2,M=k)為第k組的TD的風險函數,λHk(y2|y2)=pr(TH=y1|TH≥y1,TD≥y2,M=k)為第k組TH的條件風險函數,λCk(y2)=pr(TC=y2|TC≥y2,M=k)為第k組TC的風險函數,其中k=0,1。定義λCT(y2)=λC0(y2)+λC1(y2)為刪失的總風險函數。統(tǒng)計量WD(G1,G2)可用于檢驗原假設H0:WR(G1,G2)=1。這里原假設可分為兩小部分H0=H01∩H02
H01:對于所有的y2,λD1(y2)=λD0(y2),
H02:對于所有的y1≤y2,λH1(y1|y2)=λH0(y1|y2)。
在納入研究的2279例急性淋巴細胞白血病患者中,1496例患者在移植后發(fā)生復合終點事件,這其中有838例患者死亡。發(fā)生死亡事件的患者中位生存時間為3.64年,刪失率約為63.2%;而發(fā)生復合終點事件的患者中位生存時間為0.14年,刪失率約為34.4%。結合各變量的生存曲線圖(圖2)可發(fā)現,對于死亡事件(圖2左側),患者的累積生存率的下降相對較平緩;而對于復合終點事件(圖2右側),患者的累積生存率在隨訪開始階段急劇下降,且最終都已小于50%。因為相較于死亡事件,患者不良事件的發(fā)生一般在隨訪前期。
對于GvHD預防變量進行l(wèi)og-rank檢驗,死亡事件(圖2E)下顯示未進行GvHD預防的患者生存率較高(χ2=11.8,P<0.001),而復合終點(圖2F)給出相反的結論(χ2=4.6,P=0.03)。為探究該現象的原因,對GvHD預防進行臨床益處的評估,見表2。對于匹配贏率法,在549對匹配患者對中,“獲勝者”為未預防組的患者先死亡106對或者先發(fā)生不良事件100對,“失敗者”則為預防組的患者先死亡211對或者先發(fā)生不良事件56對,共473對(86.16%)患者發(fā)生復合終點事件,這反映進行GvHD預防的患者可能有相對較差的預后。相應的贏率值為0.772(Z=2.829,P=0.002),這表示接受GvHD預防的患者的預后情況不如未接受GvHD預防的患者。不匹配贏率法比較每位接受GvHD預防與未接受GvHD預防的患者,所以共有1730×549 = 949770個患者對,其中825108對(86.87%)患者發(fā)生復合終點事件,復合終點的不匹配贏率為0.938(Z=0.994,P=0.320),雖小于1,但無統(tǒng)計學意義(Z=0.994,P=0.320),95%置信區(qū)間也包含1。加權贏率法通過對圖1中①~④四種情況的患者數進行加權,所得數量均比未匹配贏率法大,其復合終點的贏率為0.792,有統(tǒng)計學意義(Z=3.390,P<0.001),且P值較前兩種贏率更小,即更有把握認為GvHD預防是有害因素。對于風險比指標,當僅對死亡事件分析時,HR大于1(Z=11.710,P<0.001)表示GvHD預防是危險因素;而復合終點的HR小于1(Z=4.550,P=0.033),表明GvHD預防是保護因素。因不良事件往往先發(fā)生,所以GvHD預防對死亡率的影響會在復合終點的分析中部分喪失。
圖2 各變量生存曲線圖
匹配贏率不匹配贏率加權贏率HR?HR?①預防組先死亡211317970416261.78/ /②未預防組先死亡106246454320357.62/ /③預防組先發(fā)生嚴重不良事件5610776236596.18//④未預防組先發(fā)生嚴重不良事件10015292238073.29//⑤以上均不是76124662///總對數549949770///點估計0.7720.9380.7921.3000.87895% CI(0.642,0.924)(0.827,1.064)(0.667,0.939)(1.118,1.51)(0.779,0.990)統(tǒng)計量Z2.8290.9943.390 11.7104.550P值0.0020.320<0.001<0.0010.033
?:死亡事件的風險比;*:復合事件的風險比。
隨機對照臨床試驗是目前測試治療策略是否會改變特定結局事件的金標準。為了測試這一假設,研究人員需要建立一個詳細的統(tǒng)計分析計劃,以測定兩種(或更多)治療策略之間觀察到的差異是否歸因于偶然性[13]。當主要終點是死亡,而且問題的關注點在于干預是否改變了患者的生存時間時,傳統(tǒng)的統(tǒng)計框架提供了一個較好的處理方式。但除非目標人群限于那些預后極差的患者,否則主要終點為死亡的試驗很少進行。一個設計良好的臨床試驗前瞻性地將復合終點植入其主要分析計劃中,以便觀測到干預措施極小的影響。然而在隨機試驗中,復合終點的廣泛使用引發(fā)了關于其適用性和結果解釋的爭議[14~16]。
本文共介紹了3種贏率法,當兩組患者數量均衡時,匹配贏率法考慮患者自身的風險因素,能較好的估計干預因素對復合終點的作用,但是若兩組患者的數量相差較大,會導致一大部分的患者被剔除,喪失生存信息,不匹配贏率法以及加權贏率法能彌補這一缺點。當樣本量很大時,不匹配贏率法可信區(qū)間的估計較為費時,加權贏率法能較快的給出結果。
結合本文實例分析結果,復合終點的3種贏率均小于1,顯示GvHD預防是危害因素(雖不匹配贏率法無統(tǒng)計學意義),這是因為GvHD預防通常是采用去除T細胞(TCD)的方法,該法雖可減輕GvHD,但卻減弱了移植物的抗白血病作用,可增加感染和死亡率。當采用贏率法進行分析時,該法給予死亡事件更大的優(yōu)先級,因此“GvHD預防增加死亡率”這一弊端被展現出來。而傳統(tǒng)方法分析的HR將復合終點中的組分事件予以相同的重要性,但不良事件往往發(fā)生于死亡事件之前,因此死亡事件往往被忽略,這就導致復合終點的HR=0.878(Z=4.550,P=0.033),給出GvHD預防是保護因素的錯誤結論。因此,建議在非致命事件較常見的臨床研究中,當組分事件之間的優(yōu)先級很重要時,使用加權贏率法來進行分析,而不是采用風險比的方法。