李 超 梁煊怡 康軼君 朱 妮 Tao Chen Duolao Wang△ 顏 虹△
【提 要】 目的 介紹Win Ratio法在比較兩組生存資料復(fù)合終點(diǎn)數(shù)據(jù)的基本原理及方法。方法 以一項(xiàng)采用整群隨機(jī)化雙盲對(duì)照設(shè)計(jì)的孕期營(yíng)養(yǎng)素干預(yù)研究為實(shí)例,運(yùn)用Win Ratio法分析比較不同營(yíng)養(yǎng)素補(bǔ)充對(duì)子代兩種復(fù)合結(jié)局“孕28周至分娩后4周死亡”及次要不良結(jié)局“低出生體重”的影響,并運(yùn)用Bootstrap法計(jì)算95%CI。比較Win Ratio法及傳統(tǒng)Cox風(fēng)險(xiǎn)回歸模型計(jì)算結(jié)果間的差異。結(jié)果 Win Ratio法與傳統(tǒng)Cox風(fēng)險(xiǎn)回歸所得結(jié)果一致,兩組間差異均無(wú)統(tǒng)計(jì)學(xué)意義。Win Ratio法分析結(jié)果顯示對(duì)照組(孕期補(bǔ)充葉酸)的不良結(jié)局發(fā)生率是干預(yù)組(孕期補(bǔ)充多維營(yíng)養(yǎng)素)的1.07倍,95%CI為(0.85,1.27);傳統(tǒng)Cox風(fēng)險(xiǎn)回歸模型分析的結(jié)果與Win Ratio法相似,即對(duì)照組的不良結(jié)局發(fā)生是干預(yù)組的1.04倍,95%CI為(0.83,1.31)。結(jié)論 相較于傳統(tǒng)的生存分析,Win Ratio法在分析多種結(jié)局的生存資料時(shí),可考慮結(jié)局間的重要性,同時(shí)在保證良好的準(zhǔn)確性和檢驗(yàn)效能的前提下完成對(duì)生存資料的區(qū)間估計(jì)及干預(yù)效應(yīng)的評(píng)價(jià)。
在醫(yī)學(xué)隨訪研究中,常通過(guò)收集時(shí)間-事件數(shù)據(jù)對(duì)兩個(gè)變量對(duì)象的結(jié)局情況進(jìn)行觀察研究,從而評(píng)價(jià)某種干預(yù)的效果。目前常用生存分析的相關(guān)方法來(lái)解決此類(lèi)問(wèn)題,應(yīng)用最多的方法是通過(guò)擬合Cox風(fēng)險(xiǎn)回歸模型進(jìn)行組間比較,并通過(guò)計(jì)算風(fēng)險(xiǎn)比(HR值)及其95%CI評(píng)價(jià)干預(yù)效應(yīng)。但臨床醫(yī)學(xué)研究中,結(jié)局變量常由多種結(jié)果綜合定義,在各結(jié)果成分具有優(yōu)先級(jí)順序的研究中,Cox風(fēng)險(xiǎn)回歸無(wú)法區(qū)分各結(jié)果的主次順序,從而可能導(dǎo)致分析結(jié)果難以解釋。除此之外,Cox風(fēng)險(xiǎn)回歸依賴(lài)于嚴(yán)格的模型假定條件,要求必須滿足比例風(fēng)險(xiǎn)假定(PH假定),導(dǎo)致其在實(shí)際應(yīng)用中具有一定的局限性[1-3]。本文所介紹的Win Ratio法則可以很好地解決上述問(wèn)題,不僅可以對(duì)生存資料進(jìn)行組間比較、評(píng)價(jià)干預(yù)效應(yīng)并估算其95%CI(Bootstrap法),還能對(duì)多種結(jié)局變量劃分優(yōu)先順序后進(jìn)行分析,從而減少因各結(jié)果成分意義不對(duì)等而對(duì)研究結(jié)論產(chǎn)生的影響。由于目前國(guó)內(nèi)尚未出現(xiàn)將Win Ratio法應(yīng)用于復(fù)合終點(diǎn)生存資料分析的報(bào)道,故在此對(duì)該方法作介紹,愿更多科研工作者能夠從中獲益。
1.Win Ratio法的應(yīng)用
本課題組已系統(tǒng)介紹了Win Ratio法的原理[4]。簡(jiǎn)單來(lái)說(shuō),Win Ratio法以每組研究對(duì)象中被稱(chēng)為“winner”和“l(fā)oser”的頻數(shù)作為數(shù)據(jù)分析的基礎(chǔ),winners定義為在兩組研究對(duì)象間可能出現(xiàn)的所有配對(duì)情況中干預(yù)組的干預(yù)效果優(yōu)于對(duì)照組的總頻數(shù)NW;losers定義為兩組研究對(duì)象間所有干預(yù)組的干預(yù)效果劣于對(duì)照組的總頻數(shù)NL;干預(yù)組與對(duì)照組干預(yù)效果相當(dāng)?shù)目傤l數(shù)NT定義為tied[5-6]。
應(yīng)用該方法分析生存資料的原理與先前所述一致,但具體輸贏判定標(biāo)準(zhǔn)有所不同。在比較兩組非正態(tài)分布數(shù)據(jù)時(shí),定義結(jié)局變量數(shù)值大的一方為winner,結(jié)局變量數(shù)值小的一方為loser;在對(duì)生存資料中的單個(gè)結(jié)局變量進(jìn)行兩組間比較時(shí),以干預(yù)組在一定時(shí)間內(nèi)觀察到特定結(jié)局,而對(duì)照組未進(jìn)一步出現(xiàn)與干預(yù)組一致或更優(yōu)的結(jié)局為標(biāo)準(zhǔn)(如對(duì)照組出現(xiàn)特定結(jié)局時(shí)間晚于干預(yù)組、對(duì)照組在干預(yù)組出現(xiàn)特定結(jié)局后中途失訪或?qū)φ战M在研究結(jié)束時(shí)均仍未發(fā)生特定結(jié)局),判定該干預(yù)組研究對(duì)象為winner,對(duì)照組為loser;同理,若對(duì)照組在一定時(shí)間內(nèi)出現(xiàn)特定結(jié)局而干預(yù)組未進(jìn)一步出現(xiàn)一致或更優(yōu)結(jié)局,則判定該對(duì)照組研究對(duì)象為winner,干預(yù)組為loser;若在上述兩種假定下出現(xiàn)有更優(yōu)結(jié)局的情況(如一組在一定時(shí)間內(nèi)出現(xiàn)特定結(jié)局而另一組在前組出現(xiàn)特定結(jié)局之前中途失訪),或干預(yù)組和對(duì)照組在一定時(shí)間內(nèi)均未觀察到特定結(jié)局(如兩組均中途失訪或兩組均在研究結(jié)束時(shí)仍未發(fā)生特定結(jié)局),即兩組干預(yù)效果相當(dāng),判定為tied[7](圖1)。
若兩組生存資料的結(jié)局變量由具有不對(duì)等意義的多個(gè)結(jié)果成分組成,需先依照優(yōu)先級(jí)為多種結(jié)局變量進(jìn)行排序,按照從最主要結(jié)局(最具臨床意義的結(jié)局成分)至最次要結(jié)局(臨床意義最小的結(jié)局成分)的順序進(jìn)行分析,每層結(jié)局的輸贏判定標(biāo)準(zhǔn)與單個(gè)結(jié)局變量的生存資料相同(圖1)。需要注意的是,若兩組對(duì)象在上一結(jié)局判定中表現(xiàn)為tied,則轉(zhuǎn)而比較下一結(jié)局,直至得出“干預(yù)組win”、“對(duì)照組win”、或在最次要結(jié)局水平得出“tied”這三種結(jié)論中的任一種為止,且一組win同時(shí)表示另一組lose[8]。
圖1 單個(gè)結(jié)局變量的生存資料數(shù)據(jù)Win-lose判斷標(biāo)準(zhǔn)
Win Ratio法評(píng)價(jià)干預(yù)效應(yīng)的指標(biāo)為RW值(RW=NW/NL),前期文章中也已對(duì)該指標(biāo)做以詳細(xì)說(shuō)明。在可能出現(xiàn)的所有配對(duì)中,干預(yù)組的干預(yù)效果優(yōu)于對(duì)照組的概率為[RW/(RW+1)]。
2.Win Ratio法的統(tǒng)計(jì)推斷
其假設(shè)檢驗(yàn)為H0:RW=1,兩組間winner的總頻數(shù)相等,差別無(wú)統(tǒng)計(jì)學(xué)意義;H1:RW≠1,兩組間winner的總頻數(shù)不等,差別有統(tǒng)計(jì)學(xué)意義[5-6]。在此依舊采用Bootstrap法對(duì)所得RW值進(jìn)行區(qū)間估計(jì),求得RW值的95%CI。即在原始數(shù)據(jù)經(jīng)驗(yàn)分布的基礎(chǔ)上作有放回的重復(fù)隨機(jī)抽樣(要求重復(fù)抽樣次數(shù)大于1000次[9-11])。此法估計(jì)RW為有偏估計(jì),故需對(duì)RW進(jìn)行對(duì)數(shù)轉(zhuǎn)換,再經(jīng)logRW的偏倚校正法[12-13]求得其置信區(qū)間。若RW值的95%CI內(nèi)不包含1,則拒絕原假設(shè),認(rèn)為兩組間winner的頻數(shù)不等,且差別具有統(tǒng)計(jì)學(xué)意義,反之接受原假設(shè),差別無(wú)統(tǒng)計(jì)學(xué)意義。本研究所有分析均采用SAS 9.4軟件,Win Ratio法分析數(shù)據(jù)的相關(guān)SAS程序可通過(guò)查詢(xún)相應(yīng)參考文獻(xiàn)或聯(lián)系本文作者獲得。
以2002年至2006年我國(guó)陜西省貧困縣孕期營(yíng)養(yǎng)素補(bǔ)充干預(yù)試驗(yàn)為例進(jìn)一步闡釋W(xué)in Ratio法在時(shí)間序列分析領(lǐng)域中的應(yīng)用[14]。該孕期營(yíng)養(yǎng)素補(bǔ)充試驗(yàn)為嚴(yán)格的隨機(jī)對(duì)照雙盲設(shè)計(jì),于2002年8月至2006年1月間納入該地區(qū)符合條件的孕產(chǎn)婦,在孕期對(duì)受試對(duì)象分別補(bǔ)充多種微營(yíng)養(yǎng)素和單純?nèi)~酸,并通過(guò)孕期產(chǎn)檢的各項(xiàng)指標(biāo)及分娩后的隨訪情況進(jìn)行縱向數(shù)據(jù)采集分析。該研究以探究不同營(yíng)養(yǎng)素補(bǔ)充方案對(duì)孕產(chǎn)不良結(jié)局影響的組間差異為目的,起始時(shí)點(diǎn)為末次月經(jīng),終點(diǎn)事件可按結(jié)局成分的主次順序劃分為主要終點(diǎn)子代死亡(死產(chǎn)及新生兒死亡)和次要終點(diǎn)低出生體重。根據(jù)所收集數(shù)據(jù)可知“多微營(yíng)養(yǎng)組”1579人,葉酸組1727人,多微營(yíng)養(yǎng)組子代死亡數(shù)87例,低出生體重?cái)?shù)57例,平均死亡時(shí)間38.70周,平均隨訪時(shí)間43.58周,平均孕周39.77周;葉酸組子代死亡數(shù)91例,低出生體重?cái)?shù)82例,平均死亡時(shí)間37.00周,平均隨訪時(shí)間43.39周,平均孕周39.56周(表1)。假設(shè)多微營(yíng)養(yǎng)組(干預(yù)組)總?cè)藬?shù)為NA,葉酸組(對(duì)照組)總?cè)藬?shù)為NB,則兩組所有可能的配對(duì)數(shù)為NA×NB,且不難得出NA×NB=NW+NL+NT。
表1 兩組間數(shù)據(jù)特征
*:子代死亡包括死產(chǎn)與新生兒死亡;**:平均死亡時(shí)間=(子代死亡日期-末次月經(jīng)日期)/7
基于該干預(yù)研究項(xiàng)目,我們所研究的孕產(chǎn)不良結(jié)局由主要不良結(jié)局“子代死亡”和次要不良結(jié)局“低出生體重”組成。在此實(shí)例中,由于“子代死亡”(指圍生期死亡,包括死胎、死產(chǎn)、新生兒死亡)相較“低出生體重”對(duì)家庭及個(gè)體的不良影響更為嚴(yán)重,所以本研究中“子代死亡”不良結(jié)局程度顯然應(yīng)優(yōu)先于“低出生體重”,而在其他臨床研究中,需根據(jù)不同的結(jié)局制定相應(yīng)的優(yōu)先順序。假設(shè)干預(yù)組對(duì)象i與對(duì)照組對(duì)象j配對(duì),i出現(xiàn)子代死亡,而j未在隨訪時(shí)間內(nèi)觀察到特定結(jié)局或出現(xiàn)子代死亡時(shí)間晚于i,則判定對(duì)象i為winner,對(duì)象j為loser。再假設(shè)干預(yù)組對(duì)象s與對(duì)照組對(duì)象t配對(duì),先比較二者子代死亡情況,對(duì)象s出現(xiàn)子代死亡,而t先于s未觀察到特定結(jié)局(如中途失訪)或?qū)ο髎與對(duì)象t均未在隨訪時(shí)間內(nèi)觀察到特定結(jié)局,即二者作用效果相當(dāng)(undecided),轉(zhuǎn)至比較二者新生兒低出生體重情況,若s出現(xiàn)低出生體重,而t未在隨訪時(shí)間內(nèi)觀察到特定結(jié)局或出現(xiàn)低出生體重的時(shí)間(孕周)晚于s,則判定對(duì)象s為winner,對(duì)象t為loser;若二者再次作用效果相當(dāng),則判定為tied(圖2)。
圖2 多個(gè)結(jié)局變量時(shí)組間win-lose判斷標(biāo)準(zhǔn)
由此可知,運(yùn)用Win Ratio法分析兩組數(shù)據(jù)所能得到的結(jié)果分為5種:
(1)干預(yù)組在評(píng)估“子代死亡”水平win(判定干預(yù)組win),頻數(shù)為Na;
(2)對(duì)照組在評(píng)估“子代死亡”水平win(判定對(duì)照組win),頻數(shù)為Nb;
(3)干預(yù)組在評(píng)估“低出生體重”水平win(判定干預(yù)組win),頻數(shù)為Nc;
(4)對(duì)照組在評(píng)估“低出生體重”水平win(判定對(duì)照組win),頻數(shù)為Nd;
(5)各結(jié)局比較均相當(dāng)(判定為tied),頻數(shù)為Ne。
兩組間所有可能配對(duì)都必須參與比較并得出以上五類(lèi)結(jié)論中的一種,一組獲win的同時(shí)表示另一組lose,且有Na+Nc=NW,Nb+Nd=NL,Ne=NT。
故采用Win Ratio法分析該項(xiàng)生存資料得兩組間所有可能配對(duì)數(shù)共2726933對(duì),每對(duì)隨機(jī)由一名多微營(yíng)養(yǎng)組對(duì)象與一名葉酸組對(duì)象組成,其中多微營(yíng)養(yǎng)組的贏率(winners所占比例)為8.0%(Na+Nc),葉酸組的贏率為7.4%(Nb+Nd),兩組相當(dāng)?shù)谋壤?tied所占比例)為84.6%,多微營(yíng)養(yǎng)組比葉酸組的RW值為1.07,95%CI(0.85,1.27),判斷兩組間干預(yù)效應(yīng)的差異無(wú)統(tǒng)計(jì)學(xué)意義(表2)。
表2 利用Win Ratio法對(duì)兩組間生存資料進(jìn)行比較
采用Cox風(fēng)險(xiǎn)回歸對(duì)兩組數(shù)據(jù)進(jìn)行生存比較,得風(fēng)險(xiǎn)比為1.04,即對(duì)照組的死亡率是干預(yù)組的1.04倍,95%CI為(0.83,1.31),因此認(rèn)為兩組間干預(yù)效應(yīng)的差異無(wú)統(tǒng)計(jì)學(xué)意義(表3)。
表3 利用Cox風(fēng)險(xiǎn)回歸模型對(duì)兩組生存資料進(jìn)行比較
綜上可知,在該實(shí)例分析中Win Ratio法所得結(jié)論與Cox風(fēng)險(xiǎn)回歸一致,均認(rèn)為兩組間干預(yù)效應(yīng)的差異無(wú)統(tǒng)計(jì)學(xué)意義。
本文通過(guò)一個(gè)實(shí)例詳細(xì)闡述了Win Ratio法在對(duì)兩組間復(fù)合終點(diǎn)生存資料進(jìn)行分析的一些基本理論和方法。在比較兩組生存數(shù)據(jù)時(shí),應(yīng)用Win Ratio法可在不改變傳統(tǒng)生存分析研究結(jié)論的基礎(chǔ)上考慮生存資料中多種結(jié)局的優(yōu)先順序,從而解決傳統(tǒng)生存分析中因各結(jié)局成分不對(duì)等而對(duì)研究結(jié)果產(chǎn)生的影響。
在處理縱向數(shù)據(jù)時(shí),傳統(tǒng)的生存分析方法如Cox回歸可用于組間生存資料的比較,計(jì)算出P值判斷組間差異是否具有統(tǒng)計(jì)學(xué)意義,并通過(guò)計(jì)算風(fēng)險(xiǎn)比及其95%CI評(píng)價(jià)干預(yù)效應(yīng),但該方法存在兩個(gè)主要問(wèn)題。一是Cox風(fēng)險(xiǎn)回歸依賴(lài)于嚴(yán)格的假定條件,要求必須滿足PH假定和對(duì)數(shù)線性假定,限制了該方法的應(yīng)用范圍;二是在該方法無(wú)法區(qū)分各結(jié)果的主次順序:當(dāng)結(jié)局具有多個(gè)優(yōu)先級(jí)時(shí),Cox風(fēng)險(xiǎn)回歸無(wú)法區(qū)分各結(jié)果的主次順序,從而可能導(dǎo)致試驗(yàn)結(jié)果難以解釋和/或可存在一定誤導(dǎo)性[1-3]。
而現(xiàn)實(shí)中常有結(jié)局事件由多種結(jié)果復(fù)合而成的情況,通常在臨床和觀察研究中很難用單一的結(jié)果來(lái)描述療效或暴露情況,疾病或事件的發(fā)生往往也難以根據(jù)單一的結(jié)果作為判定依據(jù)。但多種結(jié)果的尺度或臨床意義可能有差別,結(jié)果的不對(duì)等性也會(huì)對(duì)研究結(jié)果產(chǎn)生影響。如本文孕婦分娩的不良結(jié)局事件包括子代死亡及低出生體重兩種成分,但相較于低出生體重,顯然子代死亡對(duì)孕產(chǎn)婦的影響更大,臨床意義更高。在多數(shù)情況下,我們很難解釋所得復(fù)合結(jié)局是由哪一成分主導(dǎo)的,倘若臨床意義小的成分對(duì)結(jié)局的驅(qū)動(dòng)作用與臨床意義大的成分的驅(qū)動(dòng)作用相反,則會(huì)削弱從研究結(jié)果中獲取可靠結(jié)論的能力。若應(yīng)用Cox回歸,則所有結(jié)局指標(biāo)被視為同等意義,無(wú)法考慮復(fù)合結(jié)局中多種結(jié)果成分的不對(duì)等性對(duì)最終研究結(jié)論的影響作用。之前有相關(guān)研究報(bào)道指出,若將多個(gè)結(jié)局視為單一結(jié)局?jǐn)M合Cox回歸模型,或?qū)⒍鄠€(gè)結(jié)局分開(kāi)分別單獨(dú)擬合Cox回歸模型,都將增大回歸系數(shù)的估計(jì)值偏差并降低檢驗(yàn)效能[8]。
本研究介紹的Win Ratio法可以很好地解決上述問(wèn)題。首先,Win Ratio法可通過(guò)計(jì)算RW值及其95%CI完成對(duì)兩組生存數(shù)據(jù)的組間比較并直觀地評(píng)價(jià)組間干預(yù)效應(yīng),能在得出與傳統(tǒng)生存分析方法相一致結(jié)果的同時(shí)保持與傳統(tǒng)生存分析相似的統(tǒng)計(jì)能力[15]。同時(shí)與生存分析一樣,對(duì)生存資料中的截尾數(shù)據(jù)(如失訪等未在隨訪時(shí)間內(nèi)觀察到特定結(jié)局的情況)亦有具體判定方法。相較于傳統(tǒng)生存分析,Win Ratio法不依賴(lài)于假定檢驗(yàn),使得該方法有著廣泛的應(yīng)用前景。在此基礎(chǔ)上,Win Ratio法另一優(yōu)勢(shì)在于關(guān)注結(jié)局變量各復(fù)合成分的相對(duì)臨床重要性,考慮不平等的復(fù)合終點(diǎn)對(duì)研究結(jié)果的限制影響,以“最劣事件”分析的方式,通過(guò)分層分析結(jié)局賦予各優(yōu)先級(jí)結(jié)局成分?jǐn)?shù)據(jù)在數(shù)據(jù)處理過(guò)程中不同的參考權(quán)重。本文介紹的是在存在兩種結(jié)局成分(子代死亡和低出生體重)的縱向數(shù)據(jù)資料分析中Win Ratio法的應(yīng)用,而在其他必要情況下,Win Ratio法還可應(yīng)用于存在更多終點(diǎn)事件成分的時(shí)間序列分析中,其基本理論與方法和本文中所介紹一致。
需要指出的是,即便Win Ratio法有上述優(yōu)點(diǎn),我們還應(yīng)注意到該分析方法的局限性。Win Ratio法本身目前尚無(wú)公認(rèn)有效的協(xié)變量控制方法,雖然Win Ratio法可以根據(jù)分層分析校正分層變量的影響,然而該方法只能控制單一因素的影響,故難以在實(shí)際科研工作中校正不同混雜因素對(duì)結(jié)果的影響,且該方法缺少樣本量及樣本率估算公式。Win Ratio法的使用范圍亦有限制。首先,Win Ratio法難以應(yīng)用于小樣本數(shù)據(jù)或缺少公認(rèn)輸贏評(píng)判策略的數(shù)據(jù)分析中。與此同時(shí),Win Ratio法不能分析比較縱向數(shù)據(jù)中不同時(shí)間節(jié)點(diǎn)的組間效應(yīng)差異,故限制了其在重復(fù)測(cè)量設(shè)計(jì)數(shù)據(jù)中的應(yīng)用。
基于以上局限性與不足之處,Win Ratio法只適用于嚴(yán)格控制組間混雜因素的臨床試驗(yàn)數(shù)據(jù)分析中,至于更為廣泛的生存資料分析,目前只能作為生存分析的輔助或補(bǔ)充方法。誠(chéng)然,Win Ratio法的性質(zhì)和應(yīng)用還有待進(jìn)一步探索,亦為廣大科研工作者提供了Win Ratio未來(lái)發(fā)展的研究方向。因國(guó)內(nèi)尚未出現(xiàn)將Win Ratio法應(yīng)用于生存資料分析的報(bào)道,故借此文對(duì)應(yīng)用Win Ratio處理生存資料數(shù)據(jù)的方法作以介紹,愿更多科研工作者能夠了解Win Ratio法并將該方法運(yùn)用到臨床研究的生存資料處理工作中。