鄭文靜 么鴻雁 孫謹(jǐn)芳 亓?xí)?王琦琦
?
·流行病學(xué)與統(tǒng)計學(xué)方法·
Meta分析方法在結(jié)核病領(lǐng)域的應(yīng)用及常見誤區(qū)解析
鄭文靜 么鴻雁 孫謹(jǐn)芳 亓?xí)?王琦琦
Meta分析是對原始研究的二次綜合分析與評價,實施過程中需要合理的研究選題、全面的文獻搜集、準(zhǔn)確的入選標(biāo)準(zhǔn)、研究的質(zhì)量評價、必要的異質(zhì)性檢驗和敏感度分析、努力發(fā)現(xiàn)偏倚和重視整個過程的質(zhì)量控制。作者通過總結(jié)結(jié)核病相關(guān)Meta分析文章中的常見錯誤,以期引起大家對Meta分析方法質(zhì)量控制的重視,更好地促進Meta分析及其方法在結(jié)核病控制工作中的應(yīng)用。
結(jié)核; Meta分析(主題); 統(tǒng)計學(xué); 問題解決
Meta分析是近些年來應(yīng)用較多的對文獻統(tǒng)計結(jié)果進行綜合、分析的研究方法,已被廣泛應(yīng)用于公共衛(wèi)生相關(guān)研究領(lǐng)域。筆者通過閱讀結(jié)核病領(lǐng)域已發(fā)表的Meta分析文章,總結(jié)Meta分析方法使用過程中的一些常見誤區(qū),目的是讓大家更好地認(rèn)識和更恰當(dāng)?shù)厥褂肕eta分析方法,避免以后的工作中出現(xiàn)類似的錯誤,更好地促進Meta分析方法在結(jié)核病控制工作中的應(yīng)用。
Meta分析的思想起源于20世紀(jì)30年代。60年代應(yīng)用于教育、心理等社會科學(xué)領(lǐng)域,1976年由Glass命名為術(shù)語“Meta-analysis”,其意為“more comprehensive”,即更加全面或超常規(guī)的綜合,國內(nèi)一般譯為元分析或者薈萃分析,但實際應(yīng)用中多使用“Meta分析”一詞[1]。Meta分析是應(yīng)用特定的設(shè)計和統(tǒng)計學(xué)方法,對已有的多個獨立研究資料進行合并分析,客觀、真實地反映業(yè)已存在的研究結(jié)果,以獲得對某一研究問題定量的綜合性結(jié)論[2]。
Meta分析的步驟如下:(1)找出與主題相關(guān)的所有研究;(2)制定研究納入標(biāo)準(zhǔn),按照標(biāo)準(zhǔn)選擇合適的研究,其中可能出現(xiàn)納入標(biāo)準(zhǔn)偏倚、選擇偏倚及質(zhì)量偏倚,應(yīng)采取相應(yīng)的措施予以降低;(3)復(fù)習(xí)每個研究并進行質(zhì)量評價;(4)提取信息,填寫信息摘錄表,建立數(shù)據(jù)庫;(5)檢驗各研究效應(yīng)的異質(zhì)性;(6)選擇合適的統(tǒng)計模型,估計合并的總效應(yīng)量的大??;(7)如存在異質(zhì)性,應(yīng)對其存在的原因進行合理解釋;(8)進行敏感度分析,驗證合并總效應(yīng)量的大小是否會隨著納入研究的不同而產(chǎn)生較大的變化。
Meta分析在醫(yī)學(xué)科研中的作用主要體現(xiàn)在如下幾方面:(1)提高統(tǒng)計分析效能。由于把許多具有可比性的單個研究結(jié)果進行合并分析,提高了對初步結(jié)論的論證強度和效應(yīng)的分析評估力度。(2)分析多個同類研究的分歧和原因。當(dāng)多個臨床試驗結(jié)果不盡一致或存在分歧時,通過同質(zhì)性或齊性檢驗和合并分析可以尋找有關(guān)原因,便于做出更科學(xué)的結(jié)論。(3)引出新見解?;卮饐蝹€臨床試驗中尚未提及或是不能回答的問題,尋求新的假說。(4)節(jié)省研究費用。Meta分析比大規(guī)模臨床試驗代價低廉甚至更為可行。(5)Meta分析是循證的重要方法,高質(zhì)量Meta分析得出的結(jié)論可以作為決策的依據(jù)[3]。
對于結(jié)核病預(yù)防與控制問題的研究,Meta分析可以彌補現(xiàn)場研究的不足,能夠在較短的時間內(nèi)對現(xiàn)有信息進行全面綜合分析,為結(jié)核病的控制提供更全面和可靠的科學(xué)依據(jù),為決策服務(wù)。目前,Meta 分析方法主要應(yīng)用于結(jié)核病控制策略效果評價、結(jié)核病治療藥物療效和安全性的評價、結(jié)核病發(fā)生危險因素的探討、結(jié)核病新的診斷方法的評價、患者發(fā)現(xiàn)方法和方式,以及督導(dǎo)化療效果的評價等領(lǐng)域。
張永剛等[4]分析發(fā)現(xiàn):結(jié)核領(lǐng)域Meta分析發(fā)表論文數(shù)量在2005年以前增長緩慢;從2006年開始每年發(fā)表的Meta分析論文數(shù)量逐年增加,說明結(jié)核病研究領(lǐng)域Meta分析越來越成為國際研究的熱點,仍處于上升趨勢。研究還發(fā)現(xiàn)我國結(jié)核病研究領(lǐng)域Meta分析研究雖起步晚,但發(fā)展迅速。近年來,隨著循證醫(yī)學(xué)及其方法學(xué)在中國的普及和公共衛(wèi)生研究的不斷發(fā)展,中國結(jié)核病研究領(lǐng)域的Meta分析文獻數(shù)量也逐年增多,已居全球第一。
盡管國內(nèi)已發(fā)表的結(jié)核病領(lǐng)域Meta分析文獻數(shù)量日益增多,但對其方法學(xué)質(zhì)量和報告質(zhì)量缺乏嚴(yán)格的評價。Meta分析作為高質(zhì)量證據(jù)的來源,能為衛(wèi)生服務(wù)提供者、利用者及決策者提供重要信息,然而低質(zhì)量的Meta分析必會影響研究結(jié)果的價值,從而誤導(dǎo)決策。
筆者以“結(jié)核病”和“Meta”為關(guān)鍵詞,檢索萬方數(shù)據(jù)庫,共檢出311篇文獻,仔細(xì)閱讀其中的相關(guān)文獻,發(fā)現(xiàn)Meta分析方法使用過程中存在以下常見的誤區(qū)。
1.文獻檢索不全面:Meta分析文獻檢索的基本原則是查全,收集所有發(fā)表和未發(fā)表的研究,不漏檢。但是總結(jié)已發(fā)表的Meta分析文章,很大一部分文章只檢索了相關(guān)的電子期刊數(shù)據(jù)庫,有的甚至只檢索了中文數(shù)據(jù)庫,這樣勢必造成很大程度的漏檢。Meta分析是基于已有研究的二次分析,如果納入的資料不全面,有可能導(dǎo)致假陽性的結(jié)果,使其結(jié)論具有較大可能存在偏倚。
因此,在搜集結(jié)核病研究相關(guān)文獻時,正確的做法是,除了檢索電子資源數(shù)據(jù)庫,還應(yīng)該手工檢索結(jié)核病相關(guān)的專業(yè)期刊,同時注意參考文獻的追溯,以及會議專題論文、未發(fā)表的學(xué)位論文、制藥工業(yè)的報告等未正式發(fā)表的文獻;另外還應(yīng)通過結(jié)核病研究領(lǐng)域內(nèi)的專家來獲取重要的文獻信息。
2.納入的研究設(shè)計類型不統(tǒng)一:檢索已發(fā)表的Meta分析文章,發(fā)現(xiàn)有的文章對納入的研究設(shè)計類型避而不談,有的文章將臨床隨機對照試驗(RCT)和病例-對照研究、隊列研究等觀察性研究納入一起合并分析。
Cochrane手冊[5]建議,不同研究設(shè)計,或者說RCT和觀察性研究的結(jié)果不建議合并進行Meta分析。但是也有研究證明,將RCT和觀察性研究合并進行Meta分析,比單獨合并隨機對照試驗得出的結(jié)論更可靠[6]。但這種合并是有一定條件的,比如低概率事件、目前研究證據(jù)稀缺,同時觀察性研究質(zhì)量很高的情況下,可以合并,類似的Meta分析也不乏發(fā)表在頂尖專業(yè)雜志上的案例。
因此,筆者建議,如果有足夠數(shù)量的高質(zhì)量的RCT,建議不納入觀察性研究。如果遇到將RCT和觀察性研究同時納入的情況,合理的處理方式是把現(xiàn)有的證據(jù)呈現(xiàn)出來,未必一定要合并,即使合并,也不應(yīng)將關(guān)注點放在總的合并結(jié)果上,而應(yīng)在完成主要的合并分析后,按照文獻類型做亞組分析,并對其中的異質(zhì)性進行合理的討論。同時要注意,在文獻質(zhì)量評價階段要分別使用RCT和觀察性研究相對應(yīng)的質(zhì)量評價工具。
3.濫用隨機效應(yīng)模型:有的文章在進行Meta分析異質(zhì)性處理時,只要異質(zhì)性檢驗結(jié)果顯示為研究間存在異質(zhì)性,就選用隨機效用模型進行合并。這種方式不可取。若要避免這種情況的出現(xiàn),首先需要搞清楚兩個問題:隨機效應(yīng)模型的理論原理是什么;何種情況下才可以選用隨機效應(yīng)模型。
目前,隨機效應(yīng)模型多采用D-L法(DerSimonian & Laird法),即通過增大小樣本資料的權(quán)重,減少大樣本資料的權(quán)重來處理資料間的異質(zhì)性,但這種處理存在著較大風(fēng)險。小樣本資料由于往往難以避免機遇的作用(偶然性),偏倚較大;而大樣本資料往往偶然性較小,代表性好,更接近真實。因此,經(jīng)隨機效應(yīng)模型處理的結(jié)果可能削弱了質(zhì)量好的大樣本信息,增大了質(zhì)量可能較差的小樣本信息,故對隨機效應(yīng)模型的結(jié)論應(yīng)該慎重解釋。
當(dāng)異質(zhì)性檢驗結(jié)果表明納入研究間存在異質(zhì)性時,首先要從臨床異質(zhì)性和方法學(xué)異質(zhì)性的角度探討異質(zhì)性的來源,從根本上解決同質(zhì)性研究才能合并效應(yīng)量的問題。比如根據(jù)不同的設(shè)計方案、研究質(zhì)量、參加人群的特征如年齡、性別、病情嚴(yán)重程度、疾病分期、干預(yù)的時間和強度等進行亞組分析,或者考慮協(xié)變量的影響進行Meta回歸分析,以解釋異質(zhì)性的來源。若存在輕度的異質(zhì)性,但合并資料仍然具有實際意義,則可采用隨機效應(yīng)模型,但要謹(jǐn)慎解釋研究結(jié)果。
4.錯誤選擇和解釋效應(yīng)指標(biāo):Meta分析過程中常存在效應(yīng)指標(biāo)的選擇錯誤和解釋錯誤。這樣會得出錯誤的結(jié)論甚至完全相反的結(jié)果。已發(fā)表的文章中最常見的是RR值[兩組發(fā)病概率之比稱為危險度比(risk ratio)]和OR值的錯誤使用。
對于OR值和RR值的正確選擇和使用方面:(1)如果是隨機對照試驗(randomized controlled trial, RCT)或隊列研究的Meta分析,二分類變量首選RR值;只有當(dāng)干預(yù)組和對照組事件發(fā)生率較低(一般認(rèn)為≤20%)的時候,OR值與RR值的差異較小,此時也可以選用OR值。(2)當(dāng)合并效應(yīng)值<1時,OR值總是小于RR值;同樣,當(dāng)合并效應(yīng)值>1時,OR值總是大于RR值(如圖1,2中的合并結(jié)果)。所以,當(dāng)事件發(fā)生率較高時,如果選用OR值,計算得出的效應(yīng)值往往被夸大,大于真實情況,并且隨著事件發(fā)生率的逐漸增高,OR值和RR值的差異也逐漸增大,OR值的夸大效應(yīng)也越來越明顯。(3)如果納入病例-對照研究,就只能選擇OR值作為效應(yīng)指標(biāo)。
5.未對Meta分析得出的結(jié)論進行質(zhì)量評價:證據(jù)是循證的核心。Meta分析的目的之一是通過全面的檢索和嚴(yán)格的評價,最終得出可供決策者參考的證據(jù)。因此,證據(jù)質(zhì)量的高低直接影響到?jīng)Q策者做出決策的正確與否。閱讀分析已經(jīng)發(fā)表的Meta分析論文,作者主要對納入的單個文獻進行質(zhì)量評價,并對同質(zhì)研究進行合并。在對合并后的結(jié)果進行解讀時,由于沒有綜合考慮合并后的結(jié)果的質(zhì)量,也就是說未對Meta分析得出的證據(jù)質(zhì)量進行評價,因此可能產(chǎn)生誤導(dǎo)性的指導(dǎo)意見。
GRADE是由2000年建立的GRADE工作組創(chuàng)立的一套證據(jù)評級系統(tǒng),于2004年正式推出,代表了當(dāng)前對研究證據(jù)進行分類分級的國際最高水平,意義和影響重大。包括WHO 和Cochrane 協(xié)作網(wǎng)在內(nèi)的28 個國際組織、協(xié)會已采納GRADE 標(biāo)準(zhǔn)。
GRADE 系統(tǒng)將證據(jù)質(zhì)量分為“高、中、低和極低”4個等級。與其他的證據(jù)質(zhì)量分級系統(tǒng)一樣,GRADE分級方法始于研究設(shè)計。在GRADE 分級方法中,無嚴(yán)重缺陷的RCT為高質(zhì)量證據(jù),無突出優(yōu)勢或有嚴(yán)重缺陷的觀察性研究屬于低質(zhì)量證據(jù)。但與其他分級系統(tǒng)不同的是,GRADE 系統(tǒng)詳細(xì)描述了影響證據(jù)質(zhì)量的因素并給出了分級的定量標(biāo)準(zhǔn),如果RCT中存在可能降低證據(jù)質(zhì)量的因素,則降為中等質(zhì)量;如觀察性研究中有增加證據(jù)質(zhì)量的因素,則上升為中等質(zhì)量,但觀察性研究中如有降低證據(jù)質(zhì)量的因素,則降為極低質(zhì)量[7]。
圖1 某藥治療耐多藥肺結(jié)核3個月后痰菌陰轉(zhuǎn)的Meta分析—OR值
圖2 某藥治療耐多藥肺結(jié)核3個月后痰菌陰轉(zhuǎn)的Meta分析—RR值
有研究摘錄了某雜志2012—2013年發(fā)表的部分未采用GRADE分級的系統(tǒng)評價,對其進行GRADE分級,并就結(jié)論進行解讀[8]。研究顯示,由于時間有限和無法獲取全文,臨床醫(yī)生會根據(jù)論文摘要中的結(jié)論指導(dǎo)臨床實踐。以上系統(tǒng)評價的摘要結(jié)論極易在臨床中造成誤導(dǎo)。進一步考察這些系統(tǒng)評價全文中的結(jié)論部分,發(fā)現(xiàn)均未能綜合考慮所有的降級因素,盡管結(jié)尾部分給出了“受納入研究數(shù)量和質(zhì)量限制,還需要開展更多高質(zhì)量的多中心隨機雙盲對照試驗進一步驗證”此類的說法,但對臨床醫(yī)生全面理解該系統(tǒng)評價提供的證據(jù)的可信程度仍非常有限。
結(jié)核病領(lǐng)域的研究結(jié)果被期望能為結(jié)核病預(yù)防控制提供決策依據(jù),如果在Meta分析得出合并結(jié)果后,對得出的結(jié)論進行GRADE評級,清楚的注明是高質(zhì)量、中等質(zhì)量、低質(zhì)量或者極低質(zhì)量證據(jù),則有助于使用者準(zhǔn)確理解和正確應(yīng)用該Meta分析提供的證據(jù)來做出正確的決策或指導(dǎo)。
Meta分析是對既往研究結(jié)果的回顧,實際上是一種觀察性研究,它不僅不能排除原始研究中存在的偏移,當(dāng)研究質(zhì)量不高時,合并的結(jié)果會遭受“垃圾進,垃圾出 ”的質(zhì)疑。因此,要正確的認(rèn)識Meta分析,在Meta分析實施過程中需要合理的研究選題、全面的文獻搜集、準(zhǔn)確的入選標(biāo)準(zhǔn)、對納入研究的質(zhì)量評價、必要的異質(zhì)性檢驗和敏感性分析、努力發(fā)現(xiàn)偏倚和重視整個過程的質(zhì)量控制,切忌為了Meta分析而進行Meta分析。
[1] 但漢雷, 白楊, 張亞歷, 等. Meta分析方法及其醫(yī)學(xué)科研價值與評價. 中華醫(yī)學(xué)科研管理雜志, 2003, 16(1): 12-15.
[2] 么鴻雁, 施侶元. Meta分析的某些爭議和質(zhì)量保證措施. 藥物流行病學(xué)雜志, 2002, 11(3): 143-144.
[3] 么鴻雁, 劉劍君. Meta分析方法在結(jié)核病預(yù)防控制工作中的應(yīng)用. 中國防癆雜志, 2005, 27(2): 120-122.
[4] 張永剛, 王妍亭, 彭媛玲, 等. 結(jié)核研究領(lǐng)域系統(tǒng)評價/Meta分析Web of Science收錄論文現(xiàn)狀調(diào)查. 中國循證醫(yī)學(xué)雜志, 2015, 15(2): 165-169.
[5] Higgins J, Green S. Cochran handbook for systematic reviews of interventions[EB/OL].(2011-03)[2017-05-05]. http://handbook.cochrane.org/.
[6] Shrier I, Boivin JF, Steel RJ, et al. Should meta-analyses of interventions include observational studies in addition to randomized controlled trials? A critical examination of underlying principles. Am J Epidemiol, 2007, 166(10): 1203-1209.
[7] 曾憲濤, 冷衛(wèi)東, 李勝, 等. 如何正確理解及使用GRADE系統(tǒng). 中國循證醫(yī)學(xué)雜志, 2011, 11(9): 985-990.
[8] 陳耀龍, 姚亮, Susan Norris, 等. GRADE在系統(tǒng)評價中應(yīng)用的必要性及注意事項. 中國循證醫(yī)學(xué)雜志, 2013, 13(12): 1401-1404.
(本文編輯:李敬文)
Application and common mistakes of Meta-analysis in tuberculosis control
ZHENGWen-jing,YAOHong-yan,SUNJin-fang,QIXiao,WANGQi-qi.
OfficeofEpidemiology,ChineseCenterforDiseaseControlandPrevention,Beijing102206,China
YaoHong-yan,Email:yaohy@chinacdc.cn
Meta-analysis is the process of synthesizing data from a series of original studies, including selecting the reasonable topic, collecting the comprehensive literature, setting the accurate inclusion criteria of studies, evaluating the quality of included studies, performing necessary heterogeneity analysis and sensitivity analysis, and paying emphasis on the quality control of the whole process. This paper summarizes common mistakes in the tuberculosis-related Meta-analyses, in order to draw attention on quality control of methodology in this field and to refine its application in tuberculosis control.
Tuberculosis; Meta-analysis as topic; Statistics; Problem solving
10.3969/j.issn.1000-6621.2017.06.003
102206 北京,中國疾病預(yù)防控制中心流行病學(xué)辦公室
么鴻雁,Email:yaohy@chinacdc.cn
2017-04-17)
注:《中國防癆雜志》編輯委員會-中國疾病預(yù)防控制中心流行病學(xué)辦公室方法學(xué)協(xié)作組供稿