付文杰,何倩,許楊鵬,陶圓,張超,牛玉明,4
· 循證理論與實踐 ·
基線風險變化與二分類數(shù)據(jù)效應(yīng)量選擇
付文杰1,2,何倩1,2,許楊鵬1,2,陶圓1,3,張超1,牛玉明1,4
目的 探討在二分類數(shù)據(jù)Meta分析中效應(yīng)量的選取。方法 通過結(jié)合已發(fā)表實例數(shù)據(jù),在考慮基線風險變化模型下,就二分類數(shù)據(jù)中常見的四種效應(yīng)量指標即比值比(OR),危險差(RD),相對獲益危險度[RR(B)]和相對有害危險度[RR(H)]進行比較。結(jié)果 當預(yù)測基線風險變化時,在絕對獲益治療效應(yīng)指標中的RR(B)與RR(H)的結(jié)果也會隨之改變。單純依據(jù)異質(zhì)性的大小來作為效應(yīng)量的選取標準,將會導致觀察結(jié)果與真實結(jié)果間存在偏差。結(jié)論 效應(yīng)量的選取很大程度上受基線風險變化的影響,而單純性依賴于異質(zhì)性進行判定往往會導致結(jié)果偏差,與此同時,還需綜合考慮經(jīng)驗證據(jù)及臨床資料特征等相關(guān)因素。
Meta分析;效應(yīng)量;基線風險;二分類數(shù)據(jù)
證據(jù)是循證醫(yī)學的核心,系統(tǒng)評價/Meta分析是當前公認的最高級別證據(jù)。基于Meta分析合并的證據(jù)總是通過一定的效應(yīng)量來表示,例如常見臨床上隨機對照試驗(randomized controlled trial,RCT)中二分類數(shù)據(jù)通常采用的效應(yīng)量有比值比(odds ratio,OR),相對危險度(risk ratio,RR)及危險差(risk difference,RD)。據(jù)相關(guān)研究[1]報道:由系統(tǒng)評價/Meta分析制作者水平良莠不齊等因素導致現(xiàn)已發(fā)表Meta分析研究中,就效應(yīng)量的選取問題仍存在一定的理解與解釋性偏差。本文結(jié)合已發(fā)表實例數(shù)據(jù),就存在基線風險前提下結(jié)合經(jīng)驗證據(jù)信息與臨床數(shù)據(jù)特征,來挑選最佳效應(yīng)量以求獲取最接近真實預(yù)期效益結(jié)果。
在Meta分析中,通常效應(yīng)量被作為匯總及描述試驗中所觀察到干預(yù)療效的統(tǒng)計量。如RCT中的二分類數(shù)據(jù),通常采取效應(yīng)量OR、RR和RD,其中OR與RR應(yīng)用較為常見。
OR,即比值比或優(yōu)勢比,是測量疾病與暴露聯(lián)系強度的重要指標,為兩組間某事件的比值之比。RR,即相對危險度,是反映暴露(干預(yù))與事件關(guān)聯(lián)的最有用的指標,為兩組的事件率之比。RD,即危險差,是指暴露(干預(yù))組和對照組結(jié)局事件發(fā)生概率的絕對差值。
效應(yīng)量計算公式:
OR或RR=1時,表示兩組間比較效益相當;若研究為有利事件時,OR或RR>1表示暴露組可能改善結(jié)局;若研究為不利事件時,OR或RR<1表示暴露組可能會降低結(jié)局風險。RD=0時,兩組間比較效益相當;若研究結(jié)果為不利事件時,RD<0表示干預(yù)組可降低結(jié)局風險;若研究結(jié)果為有利事件時,RD>0表示干預(yù)組可改善結(jié)局。
Meta分析[2]是對來自多個單一研究資料進行合并的統(tǒng)計學方法。1985年Greenland與Robins[3]提出:若研究間異質(zhì)性較理想時,選擇固定效應(yīng)模型,包括Mantel-Haenszel法(M-H法),Peto法和倒方差法(generic inverse variance,I-V法);若研究間異質(zhì)性不理想時,選擇隨機效應(yīng)模型,通常采用Dersimonian-Laird法(D-L法)。同時,當研究臂中出現(xiàn)0事件時,基于模型統(tǒng)計功效考慮,相應(yīng)標準校正系數(shù)0.5將會給予相應(yīng)調(diào)整。
異質(zhì)性(heterogeneity)是由于納入同一個Meta分析中所有研究間存在差異,因此將Meta分析中不同研究間的各種變異稱之為異質(zhì)性,即不相似。其在統(tǒng)計學層面上,決定了當前納入研究是否能夠直接進行合并。考慮到自由度干擾,同時,基于數(shù)據(jù)的數(shù)學特性,選取不同效應(yīng)量會直接導致異質(zhì)性評估效能,本研究將采用Cochran異質(zhì)性的Q檢驗為檢測標準。
本文將采用4個例子來剖析效應(yīng)量選取中可能存在的問題。為了更好比較各效應(yīng)量間優(yōu)劣,本研究所有實例均采用OR,RD,RR(B)與RR(H)4種效應(yīng)量予以展示,且同時使用固定效應(yīng)模型(M-H法)與隨機效應(yīng)模型(D-L法)。實例軟件操作采用Stata中的metan命令完成[4]。
3.1 多糖疫苗防治A型腦膜炎 本例[5]系統(tǒng)性回顧了接種多糖腦膜炎疫苗與不接種疫苗(或僅接種安慰劑)兩種治療方案,在對預(yù)防A型腦膜炎隨訪12個月間的療效比較。7組試驗中腦膜炎的發(fā)病率各不相同,其中5個試驗在流行地區(qū)進行,年發(fā)病率為每1萬人中發(fā)生1.0~5.3。然而另外2個正值流行地區(qū)進行的試驗,年發(fā)病率為每1萬人發(fā)生35~57。結(jié)果見表1,顯示該疫苗是非常有效的。由于事件是罕見的,分析OR和RR結(jié)果相似,若將RD轉(zhuǎn)換為RR則有可能大幅度增加異質(zhì)性的風險。
3.2 在非潰瘍性消化不良根除幽門螺桿菌 幽門螺桿菌是公認導致非潰瘍性消化不良的致病菌之一。表1給出了根除幽門螺桿菌在非潰瘍性消化不良試驗的Meta分析[6]。由于事件發(fā)生率較低,因此,小的效應(yīng)量結(jié)果對效應(yīng)量的選取較敏感。例如:對根治12個月消化不良實例中,一篇[7]選RR有意義,而另一篇[8]選OR,則無統(tǒng)計學意義。由此可見,效應(yīng)量選取會直接影響到最終的匯總結(jié)果。
3.3 600~650 mg單劑阿司匹林治療急性疼痛 實例匯總了64例外科手術(shù)[9]中使用單劑阿司匹林和安慰劑治療急性疼痛的比較。結(jié)果顯示50%的患者疼痛得到緩解。本次的二分類數(shù)據(jù)是基于疼痛量表轉(zhuǎn)換結(jié)果進行估計,且所有的分析結(jié)果顯示治療是有效的(表1)。
3.4 拉莫三嗪附加療法用于治療癲癇 本例[10]納入了10組拉莫三嗪輔助治療耐藥性局部癲癇的所有年齡段患者安慰劑對照試驗,其結(jié)果顯示癲癇發(fā)作頻率減少50%。該研究9組試驗在成人中進行,其安慰劑的平均回應(yīng)率為8.1%,另1組試驗在兒童中進行,顯示安慰劑回應(yīng)率高達15.8%。
表1 4個Meta分析研究中OR、RD、RR(B)和RR(H)的結(jié)果
4.1 實例的圖形剖析 L’Abbe圖通常用于定性估計Meta分析異質(zhì)性。其主要是依據(jù)單個研究的干預(yù)組事件發(fā)生率與對照組事件的發(fā)生率所作的散點圖。圖1分別選取不同效應(yīng)量繪制了OR、RD、RR(B)和RR(H)時,試驗組事件發(fā)生率與對照組事件發(fā)生率的變化關(guān)系。其中,RR=1,OR=1和RD=0所繪制的線條(即圖中對角線)為無效線,表示兩者治療效果相當;實線表示干預(yù)組可降低事件發(fā)生率;虛線表示干預(yù)組可增加事件發(fā)生率。無論哪種情況,線條離無效線越遠,治療效果越顯著。
圖1 效應(yīng)量固定時,試驗組事件發(fā)生率與對照組事件發(fā)生率的變化關(guān)系圖注:該圖形繪制了當OR、RD、 RR(B)和RR(H)一定時,試驗組事件發(fā)生率與對照組事件發(fā)生率的變化關(guān)系。設(shè)RR和OR為0.2,0.4,0.6,0.8,1,1.25,1.67,2.5和5,RD為-0.8,-0.6,-0.4,-0.2,0,0.2,0.4,0.6和0.8。
通常干預(yù)措施旨在防止發(fā)生不良的結(jié)果(如復發(fā)、疾病惡化或者死亡)。其最理想的效果是降低總的不良事件發(fā)生率,在本文中被稱為預(yù)防性的干預(yù)措施。圖2中描繪了預(yù)防性干預(yù)措施的治療效果。其中基線風險(PBR)為安慰劑治療的事件發(fā)生率。治療的絕對獲益事件率減少的計算公式如下(1a-1d):
而干預(yù)措施旨在增加有利的結(jié)果(如緩解、恢復或治愈),其最理想的效果是增加總的有利事件發(fā)生率,在本文中被稱為治療性的干預(yù)措施。圖3中描繪了治療性干預(yù)措施的效果。其中,基線風險(PBR)為安慰劑的期望事件的發(fā)生率(在安慰劑對照試驗中通過安慰劑反應(yīng)率估計)。治療的絕對獲益事件率增加的計算公式如下(2a-d)。
圖2 預(yù)防類措施效應(yīng)的變化與基線風險的變化關(guān)系圖注:該圖形表示在預(yù)防性干預(yù)試驗中,設(shè)OR,RD,RR(H)和RR(B)為定值,預(yù)防措施所減少的效應(yīng)(圖中描述為試驗組每一百例中減少的患病數(shù))與基線風險(圖中描述為對照組中每一百例的患病數(shù))的變化關(guān)系。試驗結(jié)果不可能落在陰影部分。設(shè)OR為1、0.91、0.8、0.67、0.5和0.33;RD為 0、-0.01、-0.02、-0.05、-0.1和-0.2;RR(H)為1、0:91、0:8、0:67、0:5和0:33;RR(B)為1、1.1、1.25、1.5、2和3。其中,RR=1,OR=1和RD=0所繪制的線條(即圖中水平線)為無效線,表示兩者治療效果相當。無論哪種情況,線條離無效線越遠,預(yù)防效果越顯著。
其中,RR=1,OR=1和RD=0所繪制的線條(即圖中水平線)為無效線,表示兩者治療效果相當。無論哪種情況,線條離無效線越遠,效果越顯著。治療的絕對獲益(有時被稱為療效),常被臨床醫(yī)生作為研究應(yīng)用中的首選結(jié)局[11,12]。如果對照組事件發(fā)生率被理解為患者的基線風險的估計值,假定Meta分析中的治療效果被直接用于特定患者,圖2和圖3可被用來解釋效應(yīng)量估計特定Meta分析絕對獲益的預(yù)測。此外,上圖還顯示了調(diào)整基線風險對預(yù)測絕對獲益的影響關(guān)鍵取決于效應(yīng)量的選擇。
圖4分別描繪了4個實例中絕對風險差異與對照組事件發(fā)生率的關(guān)系。腦膜炎疫苗療效的例子是減少不良事件的發(fā)生率的預(yù)防性干預(yù)。因該事件的發(fā)生率較低,圖中顯示OR和RR(H)基本一致,兩者在研究異質(zhì)性方面也具有較好的一致性,同時,而RD與RR(B)的異質(zhì)性通常比OR與RR(H)的異質(zhì)性大(表1)。
圖3 治療干預(yù)類措施療效的變化與基線風險的變化關(guān)系圖注:該圖形表示在治療性干預(yù)試驗中,設(shè)OR,RD,RR(H)和RR(B)為定值,治療措施所增加的效應(yīng)(圖中描述為試驗組中每一百例中增加的事件數(shù))與基線風險(圖中描述為對照組中每一百例的事件發(fā)生數(shù))的變化關(guān)系。試驗結(jié)果不可能落在陰影部分。設(shè)OR為1、1.1、1.25、1.5、2和3;RD為 0、0.01、0.02、0.05、0.1和0.2;RR(B)為1、1.1、1.25、1.5、 2和3;RR(H)為1、 0:91、 0:8、 0:67、0:5 和 0:33。其中,RR=1,OR=1和RD=0所繪制的線條(即圖中水平線)為無效線,表示兩者治療效果相當。無論哪種情況,線條離無效線越遠,治療效果越顯著。
圖4 絕對風險差異與對照組事件發(fā)生率的關(guān)系圖注:該圖形為第三部分所描述的四個案例的絕對風險差異與對照組事件發(fā)生率的關(guān)系圖,其OR、RR、RD值在表1中給出,試驗結(jié)果不可能落在陰影部分??梢娫趫Da中,表示OR與RR(H),RD與RR(B)的線條是重疊的。并且,案例1多糖疫苗防治A型腦膜炎為預(yù)防性干預(yù)試驗,而其他三個案例均為治療性干預(yù)試驗,故圖a的坐標軸標簽與其他各圖不同。
另3個例子均為治療性干預(yù)。在消除幽門螺桿菌治療消化不良實例中,顯示絕對獲益隨著安慰劑事件率的增加而減少,因此,該情形適合于獲得較差干預(yù)療效的人群。該試驗結(jié)果在最適擬合線的兩個極端,所以治療性RR不適用于該數(shù)據(jù),同時臨床上已經(jīng)對所觀察到的趨勢提出解釋。首先,具有較高的安慰劑療效很可能來自于壓力性相關(guān)消化不良;其次,通常不遵醫(yī)囑療效與安慰劑相似,且很難達到理想的根治性療效。僅依據(jù)這5個試驗尚不能提供充足的理由來選擇RR為預(yù)測剩余消化不良絕對獲益的模型。
4.2 四個統(tǒng)計效應(yīng)量局限性 效應(yīng)量主要受預(yù)測值和邊界值兩方面的限制。OR模型在對照組事件發(fā)生率為0或100%時預(yù)測絕對獲益是受約束的(見等式1a和1d),這限制了其作為效應(yīng)量的適用性。臨床上會存在對照組中沒有患者治愈或未經(jīng)治療的所有患者惡化的情況。對于上述兩種特殊情形,若采用OR效應(yīng)量進行Meta分析合并時,可能會產(chǎn)生錯誤的預(yù)測結(jié)果。相比之下,RR模型只受到0事件的約束。對于預(yù)防性的干預(yù)而言,當RR(H)模型中對照組事件發(fā)生率為0時(見公式1c)或RR(B)模型中對照組事件發(fā)生率為100%時(見公式1c),預(yù)測絕對獲益總為0。對治療性的干預(yù)而言,當RR(H)模型中對照組事件發(fā)生率為0時(見公式2c)或RR(B)模型中對照組事件發(fā)生率為100%時(見公式2d),預(yù)測絕對獲益總為0。
圖形中陰影部分表示為預(yù)測的邊界。與RD相交的陰影區(qū)域表示在確定的對照組中是不可預(yù)測的(預(yù)測治療后的事件發(fā)生率低于0%或超過100%)。對采用預(yù)防性干預(yù)中的RR(B)與治療性干預(yù)中的RR(H)的效應(yīng)量來觀察有效性的治療措施時,兩者效應(yīng)區(qū)間存在區(qū)域性功能重疊,其他所有情況基本符合RR的邏輯預(yù)測。在實踐中,如果基線風險僅發(fā)生在無界區(qū)域內(nèi),那么RR和RD的邊界可能并不重要,可以將事件轉(zhuǎn)換為RR模型來避免邊界問題的發(fā)生。
4.3 基線風險絕對獲益的理論模型 對于預(yù)防性干預(yù)而言,流行病學家已經(jīng)提出了在處理風險結(jié)果中治療的最大獲益[13,14]。正如對RR(H)模型(圖2c)假設(shè)為對照組事件發(fā)生率增加時其獲益也隨之增加。這種模型已經(jīng)作為推測試驗或特定風險組的系統(tǒng)評價結(jié)果的技術(shù)(計算需要治療的人數(shù)或風險的絕對差異)。相關(guān)研究通過增加對照組事件發(fā)生率來增加獲益的模型的方法,且試驗中按風險組進行分層分析[13-15]。
對于治療性干預(yù)而言,0事件對OR和RR(B)限制性的假設(shè)通常是不合理的,主要由于沒有理由相信不會有絕對獲益發(fā)生在無安慰劑組中。相反,當對照組的回應(yīng)為100%時,0約束的絕對獲益是合理的,支持RR(B)的潛在使用。RR(H)模型(圖3d)的假定又一次提出了最大的絕對獲益可以通過治療組最可能差的結(jié)果來實現(xiàn)。然而與預(yù)防性干預(yù)措施不同的是,尚未發(fā)表經(jīng)驗證據(jù)支持這一假定。而其他方案可以被認為在沒有采用安慰劑時,0事件對治療絕對獲益的約束是合理的。如某治療在癌癥早期是有效的,但對于晚期患者而言,無論緩解率還是治療獲益都是非常低的,因此選擇合理的治療性干預(yù)的效應(yīng)量,可能會隨臨床背景的變化而受影響。
毋庸置疑,在臨床上或科研中,通過事后分析與比較來推理理想的效應(yīng)量為當前最佳方法。通常,效應(yīng)量應(yīng)依據(jù)基線風險與治療療效中不同數(shù)據(jù)模型特性來進行選取,可以通過圖2和圖3進行解釋。對照組事件發(fā)生率的變化反映了系統(tǒng)回顧試驗中患者之間特征差異,對照組采用措施,結(jié)局的定義與評估,研究質(zhì)量及隨訪時長等相關(guān)研究特征。
若研究中可以確定對照組事件發(fā)生率差異的原因或者可以從圖形中觀察到事件發(fā)生率與治療療效間的關(guān)系,這樣便有可能選出與模型最接近的效應(yīng)量。相反,若僅依據(jù)個人系統(tǒng)主觀判定通常是無法完成的,其主要原因可能來自于數(shù)據(jù)的缺乏、基線風險的多重干擾因素以及模型過度擬合等。相關(guān)研究[16,17]已就對照組事件發(fā)生率間存在差異性問題制定了正確估計相應(yīng)的措施[18-20]。盡管,圖1中展示了對照組事件發(fā)生率的治療效應(yīng)(圖2~4),但本研究在選取最佳效應(yīng)量[OR,RR(H),RR(B)或RD]時,并沒有采用相應(yīng)的回歸方法,同時也未考慮對照組事件發(fā)生率變化。本研究方法僅處理各方面具有穩(wěn)定可比性的差異情形,如對照組事件發(fā)生率穩(wěn)定,即回避了估計治療效果與基線風險之間影響。綜上所述,對于最佳效應(yīng)量的選取除了結(jié)合經(jīng)驗證據(jù)和臨床資料特征外,還需考慮基線風險對絕對獲益效應(yīng)量模型的影響。
[1] Higgins JPT,Green S,Katsuyama K,et al. Effect of a human urinary protease inhibitor (Ulinastain) on respiratory function in pediatric patients undergoing cardiopulmonary bypass[J]. J Cardiovasc Surg (Torino),2002,43(4):437-40.
[2] Deeks JJ,Altman DG,Bradburn MJ. Statistical methods for examining heterogeneity and combining results from several studies in metaanalysis.In Systematic Reviews in Health Care: Meta-Analysis in Context, Egger M, Davey Smith G, Altman DG (eds)[M]. BMJ Books: London,2001.
[3] Greenland S,Robins JM. Estimation of a common effect parameter from sparse follow-up data[J]. Biometrics,1985,41(1):55-68.
[4] Bradburn MJ,Deeks JJ,Altman DG. sbe24: metan-an alternative metaanalysis command[J]. Stata Technical Bulletin,1998,8(44):4-15.
[5] Patel M,Lee CK. Polysaccharide vaccines for preventing serogroup A meningococcal meningitis[J]. Cochrane Database Syst Rev,2005,25(1):CD001093.
[6] Moayyedi P,Soo S,Deeks J,et al. Eradication of Helicobacter Pylori for non-ulcer dyspepsia[J]. Cochrane Database Syst Rev,2011,16(2): CD002096.
[7] Moayyedi P,Soo S,Deeks J,et al. Systematic review and economic evaluation of Helicobacter pylori eradication treatment for non-ulcer dyspepsia.Dyspepsia Review Group[J]. BMJ,2000, 321(7262):659-64.
[8] Laine L,Schoenfeld P,Fennerty MB. Therapy for Helicobacter pylori in patients with nonulcer dyspepsia.A meta-analysis of randomized, controlled trials[J]. Ann Intern Med,2001,134(5):361-9.
[9] Edwards JE,Oldman A,Smith L,et al. Single dose oral aspirin for acute pain[J]. Cochrane Database Syst Rev,2000,(2):CD002067.
[10] Ramaratnam S,Marson AG,Baker GA. Lamotrigine add-on for drug-resistant partial epilepsy[J]. Cochrane Database Syst Rev,2002,12(3)85-6.
[11] Laupacis A,Sackett DL,Roberts RS. An assessment of clinically useful measures of the consequences of treatment[J]. N Engl J Med, 1988,318(26):1728-33.
[12] McGettigan P,Sly K,O'Connell D,et al. The effects of information framing on the practices of physicians[J]. J Gen Intern Med,1999,14(10):633-42.
[13] Lubsen J,Tijssen JG. Large trials with simple protocols: indications and contraindications[J]. Control Clin Trials,1989,10(4 Suppl):151S-60S.
[14] Davey Smith G,Egger M. Who benefits from medical interventions? Treating low risk patients can be a high risk strategy[J]. British Medical Journal,1994,308(6921):72-4.
[15] Davey Smith G,Song F,Sheldon TA. Cholesterol lowering and mortality: the importance of considering initial level of risk[J]. BMJ, 1993,306(6889):1367-73.
[16] Sharp SJ,Thompson SG,Altman D. The relation between treatment benefit and underlying risk in meta-analysis[J]. BMJ,1996,313(7059): 735-8.
[17] Senn S. Importance of trends in the interpretation of an overall odds ration in the meta-analysis of clinical trials[J]. Stat Med,1994,13(3):293-6.
[18] McIntosh MW. The population risk as an explanatory variable in research synthesis of clinical trials[J]. Stat Med,1996,15(16):1713-28.
[19] Thompson SG,Smith TC,Sharp SJ. Investigating underlying risk as a source of heterogeneity in meta-analysis[J]. Stat Med,1997,16(23):2741-58.
[20] Walter SD. Variation in baseline risk as an explanation of heterogeneity in meta-analysis[J]. Stat Med,1997,16(24):2883-900.
本文編輯:姚雪莉
Relationship between variation baseline risk and selection of effect size of binary data
FU Wen-jie*, HE Qian, XU Yang-peng, TAO Yuan, ZHANG Chao, NIU Yu-ming.*Center for Evidence-Based Medicine, Taihe Hospital, Hubei University of Medicine, Shiyan 442000, China.
Objective To explore the selection of effect size of binary data in Meta-analysis. Methods Combining with the reported data, and considering the pattern of variable baseline risk, four indexes of effect size, including odds ratios (OR); risk differences (RD), risk ratios of benefit [RR(B)]; and relative risk of harmful [RR(H)] were selected and compared in binary data. Results When the predicted baseline risk changes, the results of RR(B) and RR(H) will change in absolute benefit indexes of treatment effect. There will be deviations between observed results and actual results when the size of heterogeneity is taken alone as the selective criteria of effect size. Conclusion The selection of effect size is influenced by the changes of baseline risk to a large extent, and heterogeneity is depended alone will lead to result deviations. At the same time, empirical evidence and clinical data features should be taken into consideration.
Meta-analysis; Effect size; Baseline risk; Binary data
R4
A
1674-4055(2016)11-1291-05
湖北省教育廳重點項目(D20142102)
1442000 十堰,十堰市太和醫(yī)院(附屬湖北醫(yī)藥學院)循證醫(yī)學中心;2442000 十堰,湖北醫(yī)藥學院口腔醫(yī)學院12級;3442000十堰,湖北醫(yī)藥學院影像醫(yī)學院12級;4442000 十堰,十堰市太和醫(yī)院(附屬湖北醫(yī)藥學院)口腔科
牛玉明,E-mail:niuyuming@yeah.net
共同一作:付文杰,何倩
10.3969/j.issn.1674-4055.2016.11.04