付文杰,吳君怡,許楊鵬,張倩,張歡,吳迪,張超
Meta分析中二分類數(shù)據(jù)效應(yīng)量的選取
付文杰1,2,吳君怡1,2,許楊鵬1,2,張倩1,2,張歡1,2,吳迪1,2,張超1
目的 基于實(shí)例研究,探討Meta分析中二分類數(shù)據(jù)最佳效應(yīng)量的選取。方法 通過系統(tǒng)回顧551篇系統(tǒng)評價及114篇Meta分析,對比值比(OR)、危險差(RD)、相對獲益危險度[RR(B)]及相對有害危險度[RR(H)]4個效應(yīng)指標(biāo)進(jìn)行分析比較。結(jié)果 經(jīng)系統(tǒng)回顧551篇Meta所提供的證據(jù)顯示:在表示結(jié)果優(yōu)越性方面上,RR與OR較RD具有更好功效;同時,與RR相比,OR可能會夸大Meta分析定量的合并結(jié)果,甚至產(chǎn)生定性上的不一致。來自于114篇Meta分析結(jié)果分析表明,對于預(yù)防不良事件的干預(yù)試驗(yàn),基線風(fēng)險發(fā)生率越大絕對獲益功效越大,此時應(yīng)優(yōu)選RR(H)。結(jié)論 效應(yīng)量的選取需要綜合考慮基線風(fēng)險變化原因、效應(yīng)量可解釋性及其數(shù)學(xué)特性等多方面因素,對于特殊情形下,臨床試驗(yàn)特征也是作為效應(yīng)量選取因素之一。
Meta分析;效應(yīng)量;基線風(fēng)險;二分類數(shù)據(jù)
Meta分析是對具有相同試驗(yàn)特征且相互獨(dú)立的多個研究結(jié)果進(jìn)行系統(tǒng)性綜合評價及定量分析的一種研究方法。來自Meta分析的證據(jù)通常采用相應(yīng)的效應(yīng)量表示。不同的學(xué)者針對二分類變量Meta分析合并統(tǒng)計(jì)量的選取,仍存在一定爭議,其主要表現(xiàn)為:①效應(yīng)的一致性[1];②結(jié)果解釋的難度[2,3];③數(shù)學(xué)特性[4,5]。只有綜合考慮多方面因素,所選擇的效應(yīng)量才能更精確的顯示Meta分析的結(jié)果。作者已就基線風(fēng)險變化對二分類數(shù)據(jù)效應(yīng)量的選取問題作了相關(guān)闡述,然而對于最佳效應(yīng)量的選取除了結(jié)合經(jīng)驗(yàn)證據(jù)和臨床資料特征外,還需考慮基線風(fēng)險對絕對獲益效應(yīng)量模型的影響。因此,本研究旨在于全面深入探討二分類各效應(yīng)量的意義,以期為合理擇選最佳效應(yīng)量作一概述。
1.1OR、RR、RD效應(yīng)量的比較 有實(shí)證調(diào)查顯示大樣本的Meta分析學(xué)派,可用于評估對比值比(OR),相對危險度(RR),危險差(RD)的一致性。1997年發(fā)表在Cochrane Library上的551篇文章中(每篇至少包含5個試驗(yàn))通過大樣本論述了上述結(jié)論[6,7]。Meta分析中RD、RR、OR數(shù)據(jù)處理均使用M-H法。RR是通過作者選取的一次研究中事件發(fā)生率計(jì)算得出。采用統(tǒng)計(jì)量Q檢驗(yàn)整體試驗(yàn)一致性,并對分析中3個效應(yīng)量的意義進(jìn)行比較。
圖1分別對RR與OR(圖a),RR與RD(圖b)的異質(zhì)性檢驗(yàn)P值進(jìn)行了比較。在551篇Meta分析中,RR比OR異質(zhì)性高(即QRR>QOR)的僅182篇(33.0%)?;?0%的顯著水平,其中僅有9篇(1.6%)Meta分析RR顯示有異質(zhì)性而OR未顯示,和13篇(2.4%)Meta分析OR顯示存在異質(zhì)性而RR未顯示。RR(4.99)的異質(zhì)性中位數(shù)比OR(5.36)的低。
圖1 分別對RR 與OR(a),RR與RD(b)的異質(zhì)性檢驗(yàn)P值進(jìn)行比較(數(shù)據(jù)來源于Cochrane Library的551篇Meta分析,原文均使用RR進(jìn)行分析。在對角線以下的點(diǎn)表示OR或RD的異質(zhì)性大于RR的異質(zhì)性。需要注意的是,坐標(biāo)軸的刻度是反序的)
其中384篇(69.7%)Meta分析中RD的異質(zhì)性要比RR的高(即QRD>QOR)。有79篇(14.3%)具有統(tǒng)計(jì)學(xué)意義的Meta分析RD顯示異質(zhì)而RR顯示同質(zhì),僅有10篇(1.8%)Meta分析RR存在顯著異質(zhì)性而RD未顯示。
該研究RD得出一致性的效能較OR差(即QRD>QOR)。在442篇(73.0%)Meta分析中異質(zhì)性有所增加。70篇(12.7%)Meta分析中當(dāng)OR顯示為同質(zhì)性時RD為顯著異質(zhì)性,僅有5篇(0.9%)當(dāng)RD顯示為同質(zhì)性時OR為顯著異質(zhì)性。
研究發(fā)現(xiàn)OR和RR相對一致性的三個理論顯示:
①當(dāng)對照事件發(fā)生率極低時(有學(xué)者認(rèn)為結(jié)局事件發(fā)生率≤10%時),RR和OR具有良好的一致性,RR或OR均可采用。其中對于某些發(fā)生率極低的結(jié)局事件,如不良反應(yīng)或并發(fā)癥,常推薦采用OR進(jìn)行計(jì)算。當(dāng)對照事件發(fā)生率增加時,OR夸大結(jié)果效應(yīng)也會隨之明顯。在一定程度上,可能伴有結(jié)局性質(zhì)的不一致。對于納入研究中出現(xiàn)結(jié)局事件發(fā)生率為100%時,不宜選用OR。
②當(dāng)對照事件發(fā)生率所在范圍越大就有更大的檢驗(yàn)效能,即可檢驗(yàn)出OR、RR存在異質(zhì)性。
③在療效方面RR較OR(二者無效線均為1)能更好的檢出異質(zhì)性。如表1所示,OR與RR較RD具有更好的一致性。在療效方面,相對效應(yīng)量較絕對效應(yīng)量更易得出一致性的結(jié)論,當(dāng)納入研究各隨機(jī)對照試驗(yàn)人群的基線風(fēng)險具有較好的一致性時,可以選擇RD為效應(yīng)量。當(dāng)結(jié)局事件發(fā)生率為0或100%時,此時OR(或RR)不能計(jì)算或者為0,一般選擇RD為效應(yīng)量。
1.2事件轉(zhuǎn)化為危險比的影響 大多數(shù)衛(wèi)生保健干預(yù)旨在降低不利結(jié)果或增加有利結(jié)果的發(fā)生。通常將干預(yù)類型分為預(yù)防性干預(yù)與治療性干預(yù)。
表1 Meta分析的異質(zhì)性匯總統(tǒng)計(jì)
參照研究[8]中的實(shí)例,其中分別為用抗生素根除幽門螺桿菌來治療消化不良[9],使用阿司匹林緩解疼痛[10]和拉莫三嗪減少癲癇發(fā)作[11]。這些干預(yù)的目的均為改善患者的狀態(tài)。如果事件為患者被治愈或病情改善,則可以最直觀地表示為有利結(jié)局的相對危險比[本文定義為RR(B)]。例如,RR(B)可以直觀地指出,21%以上的消化不良患者在使用抗生素后痊愈,而7%以下的患者在治療結(jié)束時仍為消化不良。選擇RR(B)作為有利結(jié)局指標(biāo)的潛在缺點(diǎn)是(a)當(dāng)存在大量自發(fā)治療(如同對照組所描述的事件發(fā)生率)時,觀測者會過高的估計(jì)其療效(b)當(dāng)基線響應(yīng)率為0的時候,絕對獲益量也會局限為0。
預(yù)防性干預(yù)試驗(yàn)的參加者隨著試驗(yàn)的進(jìn)行,可能會出現(xiàn)患病,病情加重甚至死亡等情況。在使用疫苗預(yù)防腦膜炎[8]實(shí)例中,可直觀地定義為不利結(jié)果的相對危險比[即RR(H)]。疫苗的功效被定義為通過接種疫苗防止患病的比例——在接種疫苗后可避免0.07%~93%的腦膜炎發(fā)生率。RR值為1.0003并不能直觀地表示出試驗(yàn)組和對照組各自事件的發(fā)生率,甚至?xí)谏w真實(shí)的疫苗療效。使用不利結(jié)局指標(biāo)還意味著RR可能與有效性治療無關(guān)。
在這兩種情況下,使用RR(H)和RR(B)哪種與真實(shí)RR值更接近?目前,存在3種觀點(diǎn):
①當(dāng)需直接觀察結(jié)局利弊時,在治療性干預(yù)中使用RR(B),在預(yù)防性干預(yù)中使用RR (H);
②當(dāng)存在結(jié)局最差而有最大獲益時,RR (H)可以用于任何情況;
③當(dāng)RR反映的至少有一個共同結(jié)局指標(biāo)(事件或非事件),此時一致性最好。
在1998年~2000年間,第一次發(fā)表于Cochrane圖書館的114篇系統(tǒng)評價中,第一個結(jié)果指標(biāo)(二分類變量)是由5個或5個以上試驗(yàn)合并而來。這些Meta分析根據(jù)干預(yù)類型分為預(yù)防性與治療性,即結(jié)局指標(biāo)根據(jù)是否符合期望分為有利結(jié)局和不利結(jié)局。
圖2顯示了114篇Meta分析的異質(zhì)性檢驗(yàn)的結(jié)果。其中有51篇沒有顯示顯著異質(zhì)性(P>0.1),36篇有意義,8篇對于有利結(jié)果更一致,19篇對于不利結(jié)果(McNemar檢驗(yàn),P=0.05)更一致。
圖2 分別對預(yù)防性干預(yù)試驗(yàn)的RR(B)與RR(H) (a),OR與RR(H)(b)以及治療性干預(yù)實(shí)驗(yàn)的RR(B)與RR(H) (c),OR與RR(H)(d)進(jìn)行異質(zhì)性比較(數(shù)據(jù)來源于114篇Cochrane系統(tǒng)評價。各圖對角線上方的點(diǎn)表示RR(H)的異質(zhì)性較小。需要注意的是,坐標(biāo)軸的刻度是反序的)
表2 Meta分析的異質(zhì)性匯總結(jié)果及RR(B)與RR(H)
平均對照組的事件發(fā)生率與干預(yù)是預(yù)防或治療相關(guān):91%的預(yù)防性干預(yù)措施出現(xiàn)不良事件的發(fā)生率不到50%,在所有干預(yù)中,預(yù)后不良率超過80%為治療性干預(yù)(表2)。
在治療性和預(yù)防性的干預(yù)措施中,當(dāng)不良事件發(fā)生率不到50%時,RR(H)顯示更加一致。但當(dāng)不良事件發(fā)生率大于50%時,該模式仍存在分歧。
2.1研究效應(yīng)量中權(quán)重的變化 參照研究中(表1)[8]阿司匹緩解急性疼痛的數(shù)據(jù)可發(fā)現(xiàn),在四個統(tǒng)計(jì)量模型中,除了OR模型,其他模型均有顯著異質(zhì)性。圖4(c)明確顯示當(dāng)對照組事件發(fā)生率很低時,OR并沒有給出合適的預(yù)測。系統(tǒng)回顧中有8個零安慰劑反應(yīng)的試驗(yàn),均證明了乙酰氨基酚的顯著療效,然而這些實(shí)驗(yàn)的OR模型和RR(B)模型的預(yù)測值為0,得出了更為合理的預(yù)測值的RD模型和RR(H)模型卻存在較大的異質(zhì)性。
表3給出了系統(tǒng)回顧中10組對照組事件發(fā)生率較低試驗(yàn)的權(quán)重。這里有兩種權(quán)重:一種是M-H法的加權(quán)百分比,它反應(yīng)了在所有結(jié)果中每個點(diǎn)的影響力:另一種是倒方差法的絕對加權(quán),它適用用于計(jì)算Cochrane異質(zhì)性Q檢驗(yàn)。
在M-H法中,當(dāng)對照事件發(fā)生率過低時,OR模型和RR(B)模型給予非常小的權(quán)重,RD模型和RR(H)模型的權(quán)重遠(yuǎn)高于前兩個模型的20倍。
然而在倒方差法中,不同統(tǒng)計(jì)量之間這種權(quán)重的差異要更極端, RD模型和RR(B)模型的權(quán)重比OR模型和RR(H)模型的權(quán)重高出了幾個量級,這時計(jì)算Q值就會得到一個十分荒謬的結(jié)果。雖然RD模型和RR(B)模型比OR模型和RR (H)模型的預(yù)測值看起來更為合理,實(shí)際上,前者的擬合度遠(yuǎn)不如后者。
四個模型給予不同研究的權(quán)重存在顯著的差異,因此不同模型間及不同研究間Q值的比較是混亂的,用Q值來判斷模型的擬合度是否合理廣受爭議。有時候某個模型給出一個低的Q值,不是因?yàn)樵撃P蛯@組試驗(yàn)結(jié)果的預(yù)測更接近觀察到的結(jié)果,而是因?yàn)樗o了存在異常值的試驗(yàn)較低的權(quán)重,不論是在計(jì)算平均效應(yīng)值還是擬合度方面。
2.2隱蔽的臨床異質(zhì)性來源 雖然Meta分析的目的是計(jì)算干預(yù)效果,但在臨床實(shí)際中治療的有效性取決于多種因素而不僅是基線風(fēng)險,如患者的特征等。系統(tǒng)回顧中有關(guān)異質(zhì)性來源的探究可能會給出這些患者的分組,并提供每個患者的效應(yīng)估計(jì)值。如果普遍采用具有最小異質(zhì)性的統(tǒng)計(jì)量,那么理論上我們極易忽視某些重要的異質(zhì)性來源,在系統(tǒng)綜述試驗(yàn)中異質(zhì)性來源和基線風(fēng)險之間存在偶然關(guān)系,所以當(dāng)僅使用某一種統(tǒng)計(jì)量進(jìn)行分析時,這樣的臨床異質(zhì)性來源就會被忽略。
在拉莫三嗪治療具有部分耐藥性癲癇患者的系統(tǒng)評價[11]的療效分析中,對10個以安慰劑作為對照的試驗(yàn)結(jié)果進(jìn)行了合并,其中僅RR(H)模型的分析顯示有顯著的統(tǒng)計(jì)學(xué)異質(zhì)性。根據(jù)患者是成人還是兒童進(jìn)行分層分析(表4),結(jié)果顯示成人試驗(yàn)中沒有顯著的異質(zhì)性。然而當(dāng)采用RD或RR(H)模型時,成人和兒童間存在顯著差異,這種差異可以被解釋為真正的療效異質(zhì)性。當(dāng)用OR或RR(B)模型分析時,沒有檢測到差異,這樣的結(jié)論極有可能遮蓋了該療法對兒童患者的療效。仍需要進(jìn)一步的臨床研究來證實(shí)該分析方法的結(jié)論的正確性。
在實(shí)例[11]中,異質(zhì)性只會因?yàn)榻y(tǒng)計(jì)量的改變而失去統(tǒng)計(jì)學(xué)意義,它不會隨著統(tǒng)計(jì)量的改變而消失。在成人組與兒童組比較的結(jié)果中,沒有統(tǒng)計(jì)學(xué)意義的相對OR值(relative OR=0.62)和相對RR(B)值[relative RR(B)=1.31]實(shí)際上與有統(tǒng)計(jì)學(xué)意義的相對RR(H)值[relative RR(H)=0.77]相差并不大(表4),這種統(tǒng)計(jì)學(xué)意義的不同是因?yàn)槠浞讲畈煌皇且驗(yàn)槠漕A(yù)測值的不同。
表3 10組罕見事件試驗(yàn)的異質(zhì)性Q檢驗(yàn)的相對和絕對加權(quán)結(jié)果對比
表4 實(shí)例[11](拉莫三嗪附加療法治療癲癇)中兒童和成人的亞組分析OR,RD,RR(H)和RR(B)的Meta分析試驗(yàn)結(jié)果
在實(shí)例[11]中的預(yù)防干預(yù)措施產(chǎn)生了類似的結(jié)果,即具有統(tǒng)計(jì)學(xué)意義異質(zhì)性的是RR(H)而不是RR(B)。在這五個試驗(yàn)中,其中一個試驗(yàn)招募了一個不同的病患組,并且在使用藥物時采用了完全不一樣的劑量方案。因此在進(jìn)行分析時,需除去該試驗(yàn)才能消除異質(zhì)性。
本文提供了一個可供選擇的研究方法即通過大量Meta分析來尋找通用模型的證據(jù)。從551篇經(jīng)驗(yàn)主義的Meta分析所提供的數(shù)據(jù)顯示,OR和RR比RD具有更好的一致性,而且兩者在一致性方面沒有差異。
該調(diào)查還顯示,選擇用RR分析事件獲取一致性的假定是至關(guān)重要的。因?yàn)槟P椭袑φ战M和試驗(yàn)組事件發(fā)生率的聯(lián)系不同,所以在實(shí)質(zhì)上RR (B)和RR(H)最好考慮單獨(dú)獨(dú)立的模型。拒絕使用效應(yīng)量RR僅僅是因?yàn)槠洳粚ΨQ性是不合理的——兩個模型在描述臨床上可能發(fā)生的情況時有潛在的用處。第二個實(shí)證調(diào)查發(fā)現(xiàn),干預(yù)是為了防止不良結(jié)果的發(fā)生,此時使用RR更為一致。但沒有明確的模型用于描述病情好轉(zhuǎn)的情況。
因此,實(shí)證調(diào)查給預(yù)防性干預(yù)措施[使用RR (H)或OR]在選擇效應(yīng)量方面提供一個指南。除RD外沒有通用的指南用于治療性的干預(yù)。
值得注意的是,在115篇Meta分析調(diào)查中,Schmid等[12]研究發(fā)現(xiàn)基線風(fēng)險和治療效應(yīng)之間的聯(lián)系是最常見的,當(dāng)將治療效應(yīng)用相對效應(yīng)量表示時,相比于31%的RD,僅13%使用RR和14%使用OR進(jìn)行Meta分析時顯示存在顯著聯(lián)系。在Meta分析中,絕對效應(yīng)量需謹(jǐn)慎使用,因各個研究人群的基線風(fēng)險常常存在差異,限制了絕對效應(yīng)量的臨床推廣性。
RR被認(rèn)為是衡量暴露與事件關(guān)聯(lián)強(qiáng)度最有用的指標(biāo),當(dāng)試驗(yàn)中事件發(fā)生率變化時,相對效應(yīng)量OR和RR均能滿足研究者最直觀地需求并易于理解。此外,RR與OR已經(jīng)被作為描述RCTs結(jié)果和個體患者M(jìn)eta分析的模型基礎(chǔ)。RR較差的數(shù)學(xué)特性并沒有妨礙其使用。
大量研究表明,雖然OR和RR在定性方向上總是一致的,但在定量數(shù)值上可能差異巨大。OR難于理解且經(jīng)常被解釋為RR。如果OR被解釋為RR,其總會高估干預(yù)效應(yīng)[13]:當(dāng)小于1時,OR總比RR??;當(dāng)大于1時,OR總比RR大。因此,把OR解釋為RR常常會產(chǎn)生誤導(dǎo),讓人相信干預(yù)的效應(yīng)尺度大于實(shí)際的情況。
雖然OR有強(qiáng)大的擁護(hù)者,但統(tǒng)計(jì)學(xué)家和流行病學(xué)家認(rèn)為,OR通常在匯總統(tǒng)計(jì)隨機(jī)試驗(yàn)的結(jié)果和系統(tǒng)回顧中不是最合適的效應(yīng)量[14-16]。Finney曾評價說,沒有證據(jù)(通過亞組的恒定效應(yīng))的OR平均值是沒有多大意義的。流行病學(xué)家使用OR需要合理的流行病學(xué)理論或?qū)嶒?yàn)證據(jù),不僅僅是為了統(tǒng)計(jì)方便[17]。本文提出的實(shí)證研究中沒有任何證明OR優(yōu)于RR的有利證據(jù)。相反的,在進(jìn)行OR估計(jì)時一個附加的干預(yù)顯示:基線風(fēng)險兩端的絕對獲益規(guī)模預(yù)測為0。
M-H法和Peto法僅用于分類資料的計(jì)算,其中,M-H法運(yùn)用了分層分析的思想[18];Peto法采用倒方差的思想[19]。兩者都用于固定效應(yīng)模型,即在不存在顯著異質(zhì)性的情況下。Peto法主要用于小概率事件的合并效應(yīng)量的計(jì)算。
調(diào)查還顯示,相對效應(yīng)量不受基線風(fēng)險的影響,具有較好的一致性,但某些情況下相對效應(yīng)量并不能反映關(guān)注事件的真實(shí)風(fēng)險情況,容易夸大效應(yīng)。絕對效應(yīng)量結(jié)果容易被醫(yī)生和患者所理解,但其臨床重要性取決于觀察事件發(fā)生風(fēng)險的高低。絕對效應(yīng)量的臨床適用性常因患者基線風(fēng)險的差異而受限,即很難將結(jié)果應(yīng)用于其他患者和醫(yī)療環(huán)境。Meta分析的過程常存在效應(yīng)量的選擇錯誤和解釋錯誤。正如所討論的,不會出任何情況下,都適合的最優(yōu)模型。若將RR(B)或RR (H)用于原始研究將產(chǎn)生不同的結(jié)果。
也有人指出,在異質(zhì)性統(tǒng)計(jì)中使用標(biāo)準(zhǔn)化方法計(jì)算,權(quán)重的不同取決于效應(yīng)量的的選擇,雖然在所有情況下統(tǒng)計(jì)量被視為近似于自由度為K-1的卡方分布(其中,K為Meta分析納入研究的數(shù)目)。本文未明確指出使用不同的權(quán)重合并所有結(jié)果的影響。因?yàn)橘x予權(quán)重一個值更能反映調(diào)查結(jié)果的一致性,故應(yīng)謹(jǐn)慎對待對照事件發(fā)生率和選擇效應(yīng)量間的聯(lián)系。
本文關(guān)于Meta分析中效應(yīng)量的選擇已經(jīng)從考慮數(shù)學(xué)特性,討論不斷變化的對照組事件發(fā)生率(基線風(fēng)險)的四個絕對獲益模型和Meta分析應(yīng)用于臨床實(shí)踐的影響上發(fā)生轉(zhuǎn)移。選擇效應(yīng)量不可避免的要對相關(guān)基線風(fēng)險獲益的模型進(jìn)行假設(shè)。效應(yīng)量的選擇不應(yīng)該僅基于對數(shù)學(xué)特性的偏愛,更應(yīng)從模型的動態(tài)全方面考慮,在特殊的臨床情況下模型的選擇可能是估計(jì)治療獲益最一致的方法。在不理解Meta分析結(jié)果的情況下應(yīng)用時需謹(jǐn)慎。本文報道的兩個經(jīng)驗(yàn)調(diào)查,結(jié)合其他地方提供的數(shù)據(jù),給出了一些在特殊情況下選擇可能最一致的模型的指導(dǎo)。對一些不確定情況的效應(yīng)量的選取,仍有待于進(jìn)一步研究。
[1] Breslow NE,Day NE. The Analysis of Case-control Studies[M]. Statistical Methods in Cancer Research. IARC: Lyon,1980.
[2] Sackett DL,Deeks JJ,Altman D. Down with odds ratios[J]. Evid Based Med,1996,1:164-7.
[3] Deeks J. When can odds ratios mislead? Odds ratios should be used only in case-control studies and logistic regression analyses[J]. BMJ,1998,317(7166):1155-6.
[4] Brumback B,Berg A. On effect-measure modification: Relationships among changes in the relative risk, odds ratio, and risk difference[J]. Stat Med,2008,27(18):3453-65.
[5] Higgins JPT,Green S. Cochrane handbook for systematic reviews of interventions version 5.1.0 [updated March 2011]. The Cochrane Collaboration, 2011. Available at: www.cochrane-handbook.org.
[6] Deeks JJ,Altman DG,Dooley G,et al. Choosing an appropriate dichotomous effect measure for meta-analysis: empirical evidence of the appropriateness of the odds ratio and relative risk[J]. Control Clin Trials,1997,18(3):S84-S85.
[7] Deeks JJ,Altman DG. Systematic Reviews in Health Care: Meta-Analysis in Context[M]. London: BMJ Books, 2001.
[8] 付文杰,何倩,許楊鵬,等. 基線風(fēng)險變化與二分類數(shù)據(jù)效應(yīng)量選擇間關(guān)系簡介[J]. 中國循證心血管醫(yī)學(xué)雜志,2016,In Press.
[9] Moayyedi P,Soo S,Deeks J,et al. Eradication of Helicobacter Pylori for non-ulcer dyspepsia[J]. Cochrane Database Syst Rev,2000,(2): CD002096.
[10] Edwards JE,Oldman A,Smith L,et al. Single dose oral aspirin for acute pain[J]. Cochrane Database Syst Rev,2000,(2):CD002067.
[11] Ramaratnam S,Marson AG,Baker GA. Lamotrigine add-on for drugresistant partial epilepsy[J]. Cochrane Database Syst Rev,2000,(3): CD001909.
[12] Schmid CH,Lau J,McIntosh MW,et al. An empirical study of the effect of the control rate as a predictor of treatment effcacy in metaanalysis of clinical trials[J]. Stat Med,1998,17(17):1923-42.
[13] Alman DG,Deeks JJ,Sackett DL. Odds ratios should be avoided when events are common[J]. BMJ,1998,317(7168):1318.
[14] Fleiss J. Statistical Methods for Rates and Proportions[M]. 2nd ed. Wiley: New York, 1981.
[15] Feinstein AR. Indexes of contrast and quantitative significance for comparisons of two groups[J]. Stat Med,1999,18(19):2557-81.
[16] Sinclair JC,Bracken MB. Clinically useful measures of effects in binary analyses of randomized trials[J]. J Clin Epidemiol,1994,47(8): 881-9.
[17] Walter SD. Choice of effect measure for epidemiological data[J]. J Clin Epidemiol,2000,53(9):931-9.
[18] Mantel N,Haenszel W. Statistical aspects of the analysis of data from retrospective studies in disease[J]. J Natl Cancer Inst,1959,22(4):719-48.
[19] Yusuf S,Peto R,Lewis J,et al. Beta blockade during and after myocardial infarction: an overview of the randomized trials[J]. Prog Cardiovasc Dis,1985,27(5):335-71.
本文編輯:田國祥
Selection of effect size from binary data in Meta-analysis
FU Wen-jie*, WU Jun-yi, XU Yang-peng, ZHANG Qian, ZHANG Huan, WU Di, ZHANG Chao. *Center for Evidence-Based Medicine, Taihe Hospital, Hubei University of Medicine, Shiyan 442000, China.
ZHANG Chao, E-mail: zhangchao0803@126.com
Objective To investigate the selection of the best effect size from binary data in Meta-analysis based on case study. Methods Through systematic retrospective of 551 reviews and 114 Meta-analysis documents,4 effective indexes were analyzed and compared including odds ratio (OR), risk difference (RD), relative risk of benefit [RR (B)] and relative risk of harmful [RR (H)]. Results The evidence from 551 reviews showed that RR and OR had better efficacy than RD in the aspect of outcome superiority. Meanwhile, OR had an inclination to overestimate the pooled results, even leaded to a qualitative inconsistency in the Meta-analysis. The results of 114 Meta-analysis documents showed that for intervention aimed at preventing reverse events, the highest incidence rate of baseline risk would induce the greatest absolute benefit effect, and RR (H) was optimized at this moment. Conclusion The multiple factors should be considered including cause of baseline risk variation,effect size interpretability and mathematical properties in the selection of effect size. For some special cases, the characteristics of clinical trials should also be taken as one of factors in selecting effect size.
Meta-analysis; Effect size; Baseline risk; Binary categorical data
R4
A
1674-4055(2016)01-0007-05
湖北省教育廳重點(diǎn)項(xiàng)目(D20142102)
1442000 湖北十堰,湖北醫(yī)藥學(xué)院附屬太和醫(yī)院循證醫(yī)學(xué)中心;2442000 湖北十堰,湖北醫(yī)藥學(xué)院口腔醫(yī)學(xué)院12級
10.3969/j.issn.1674-4055.2016.01.02
張超,E-mail:zhangchao0803@126.com.