馬 燕 王小欽,2
與二分類變量結(jié)局分析不同,時間-事件結(jié)局分析由于受試者隨訪數(shù)據(jù)的刪失而存在局限性。時間-事件分析通常是指生存分析,其中生存時間是指到結(jié)局事件(如死亡)發(fā)生的時間。常用的分析方法包括Kaplan-Meier、Log-rank檢驗和Cox多因素風(fēng)險回歸模型。時間-事件結(jié)局通常指生存率,定義為到特定時間點受試者沒有發(fā)生結(jié)局事件的概率。最常用的效應(yīng)評價指標(biāo)是風(fēng)險比(HR),可以通過Cox多因素風(fēng)險回歸模型獲得。
時間-事件分析一個核心的特點是需要考慮刪失。如圖1所示,一種是受試者隨訪結(jié)束時未觀察到研究結(jié)局(獨立刪失,圖1中的患者1和5);一種是受試者失訪導(dǎo)致時間-事件結(jié)局的刪失(非獨立刪失,圖1中的患者3和4)。獨立刪失的受試者和余下的受試者有相同的發(fā)生結(jié)局事件的可能性,非獨立刪失的受試者則直接從研究中退出。
還需要考慮以下特殊情況:①由于干預(yù)措施的生理和心理不良反應(yīng)使受試者撤回知情同意;②由于疾病進(jìn)展更換了治療方法而退出;③研究者無法聯(lián)系上受試者。刪失數(shù)據(jù)需要納入分析,從而提高時間-事件分析的有效性。刪失數(shù)據(jù)報道的不足會影響系統(tǒng)評價作者對研究的準(zhǔn)確評估,報道的不足包括:研究結(jié)局的定義,隨訪的頻率和持續(xù)時間,統(tǒng)計模型建立的細(xì)節(jié)等。作者經(jīng)常沒有對刪失的發(fā)生和原因進(jìn)行準(zhǔn)確地說明,忽略了發(fā)生刪失的受試者數(shù)量和未闡明發(fā)生刪失的原因。
因此,對于時間-事件研究的報道內(nèi)容有相應(yīng)的要求,從而保證系統(tǒng)評價和指南制作者對研究可能存在的偏倚風(fēng)險進(jìn)行評估。
圖1 刪失的類型
獨立刪失數(shù)據(jù)會導(dǎo)致研究結(jié)果(如生存率)的高估或者低估,非獨立刪失數(shù)據(jù)會影響HR。建議通過以下方法來評估研究的風(fēng)險偏倚:在評估前收集所有可以獲得的刪失原因;RCT中在兩個試驗組中保持一致的獨立刪失分布;在生存曲線中標(biāo)出刪失的時間,從而反映出是早期還是晚期刪失。如果研究無法提供刪失的時間分布、程度和原因,評估是無法完成的。
評估者建議遵循以下GRADE的原則進(jìn)行風(fēng)險偏倚的評估:①如果證據(jù)大部分來源于低風(fēng)險偏倚的研究,則研究無嚴(yán)重局限性;②如果證據(jù)大部分來源于高風(fēng)險偏倚的研究,則研究有嚴(yán)重的局限性;③如果證據(jù)大部分來源于極高風(fēng)險偏倚的研究,則研究有極嚴(yán)重的局限性(證據(jù)級別下降2個水平);④如果研究的風(fēng)險偏倚參差不齊,研究結(jié)果在風(fēng)險低和風(fēng)險高的研究間有差異,評估者需要基于低風(fēng)險偏倚研究的最佳證據(jù)總結(jié)進(jìn)行評估。特別是在相對大型的研究中,如果失訪造成的潛在風(fēng)險偏倚在各個研究間有差異,評估者首先需要進(jìn)行敏感性分析,從而決定風(fēng)險低和風(fēng)險高的研究間是否有差異。如果確實有差異,評估者應(yīng)當(dāng)從低風(fēng)險偏倚的研究中得出最佳預(yù)估。
如果審閱者和指南制作者對刪失的原因、時間點和分布都不了解,則可能對證據(jù)質(zhì)量的評價產(chǎn)生偏倚。如果刪失的數(shù)量、原因和時間點都可以獲取的話,審閱者和指南制作者可以通過GRADE方法學(xué)解釋性文件4[1]和17[2]中二分類結(jié)果分析的方法進(jìn)行證據(jù)質(zhì)量評價(表1)。
例1:在一項比較肺癌患者通過網(wǎng)絡(luò)介導(dǎo)的隨訪和常規(guī)方法隨訪的RCT中[3],主要研究終點為總生存率,定義為從隨機分配后到死亡或者最后一次評估(如果患者出現(xiàn)刪失)。兩組之間的HR使用Cox比例風(fēng)險模型計算。133例受試者被隨機分組,隨機后發(fā)現(xiàn)不合格的受試者12例剔除,最后60例和61例受試者分別在干預(yù)組(網(wǎng)絡(luò)隨訪)和對照組(常規(guī)方法隨訪)中進(jìn)行修改后的意向治療分析(modified intention-to-treat analyses)。兩組報告的死亡人數(shù)分別為11例和26例,復(fù)發(fā)人數(shù)為34例和36例,HR=0.32(95%CI:0.15~0.67),P=0.002。這項研究根據(jù)獨立數(shù)據(jù)監(jiān)測委員會的建議,在中期分析后提前結(jié)束。刪失的程度在整個研究中沒有報告,然而生存曲線結(jié)果顯示干預(yù)組中受試者發(fā)生了更多的刪失,尤其是在早期隨訪期間。盡管受試者是隨機化的,但是由于兩組失訪刪失存在嚴(yán)重不平衡,導(dǎo)致偏倚的高風(fēng)險。假設(shè)失訪的受試者比沒有失訪的受試者在研究終點后更快死亡,這項研究中風(fēng)險比顯示的生存獲益可能被夸大,甚至可能不存在,這時會懷疑研究結(jié)果偏倚的風(fēng)險很高。如果證據(jù)體中只有一項研究或者其他納入的研究也有類似的不平衡,由于研究總體生存的局限性,我們會考慮將評級下調(diào)。
表1 如何評價刪失引起的偏倚風(fēng)險
例2:ExteNET研究是一項隨機、雙盲、安慰劑對照研究[4],HER2陽性乳腺癌患者接受標(biāo)準(zhǔn)的局部治療、曲妥珠單抗和化療后,比較采用來那替尼或安慰劑輔助治療的療效。主要研究終點為5年無進(jìn)展生存期,定義為從隨機化到首次發(fā)生侵襲性疾病和復(fù)發(fā)或全因死亡的時間,用Cox比例風(fēng)險模型計算HR。刪失定義為:當(dāng)受試者在最后一次體檢時未再次接受進(jìn)一步隨訪,隨訪2年內(nèi)未發(fā)生疾病復(fù)發(fā)。1 420例受試者被隨機分入試驗組(來那替尼)和安慰劑組,并納入意向治療分析。雖然研究報告中沒有具體說明刪失的比例和原因,但是生存曲線顯示兩組間刪失的數(shù)量嚴(yán)重失衡(圖2)。試驗組刪失的個體數(shù)量明顯多于安慰劑組,尤其是在早期觀察期。所以,本研究存在失訪刪失,因此判斷存在高偏倚風(fēng)險是合理的。假設(shè)證據(jù)體中只有上述一項研究結(jié)果,由于研究存在局限性,會考慮將評級下調(diào)。
圖2 乳腺癌中來拿替尼和安慰劑比較的Kaplan-Meier生存曲線圖
為進(jìn)一步推動GRADE在預(yù)后因素評估中的應(yīng)用,本文提出以下建議。
2.1 根據(jù)不同的研究目標(biāo)開展更多預(yù)后因素研究 可分為3種類型:①總體預(yù)后研究,旨在建立廣泛定義人群中的典型風(fēng)險;②預(yù)后因素研究,旨在確立特定患者特征如何影響風(fēng)險;③結(jié)局(或風(fēng)險)預(yù)測模型,旨在開發(fā)一個完整的預(yù)后模型,同時考慮一些預(yù)后因素將患者劃分為不同的風(fēng)險等級[1]。
2.2 提高預(yù)后研究報告的完整性 預(yù)后研究的GRADE分級依賴更多的信息,例如研究人群特征、多因素分析方法等。建議研究者在報告預(yù)后研究時參考加強流行病學(xué)觀察性研究的報告(STROBE)聲明[6]和對個人預(yù)后或診斷的多變量預(yù)測模型的透明化報告(TRIPOD)聲明[7]等報告規(guī)范,保證提供全面的分級信息。
2.3 培訓(xùn)預(yù)后因素的GRADE分級方法 建議針對已掌握干預(yù)類研究GRADE分級方法人員進(jìn)行培訓(xùn),快速增加掌握預(yù)后因素分級的專業(yè)人員,以適應(yīng)GRADE方法快速更新的現(xiàn)狀[8]。