李柄輝,訾 豪,李路遙,,王朝陽(yáng),,任學(xué)群,郭 毅,譯
1. 武漢大學(xué)中南醫(yī)院循證與轉(zhuǎn)化醫(yī)學(xué)中心(武漢 430071)
2. 武漢大學(xué)中南醫(yī)院泌尿外科(武漢 430071)
3. 河南大學(xué)循證醫(yī)學(xué)與臨床轉(zhuǎn)化研究院(河南開(kāi)封 475000)
在20世紀(jì),著名教授Cochrane A、Guyatt GH和Chalmers IG[1-3]的開(kāi)創(chuàng)性工作使我們進(jìn)入了循證醫(yī)學(xué)(evidence-based medicine,EBM)時(shí)代。在這個(gè)時(shí)代,如何檢索、評(píng)價(jià)和使用最佳證據(jù)非常重要。系統(tǒng)評(píng)價(jià)與Meta分析是科學(xué)總結(jié)一次研究數(shù)據(jù)最常用的方法[4-6],也是制定臨床實(shí)踐指南(clinical practice guideline,CPG)的基礎(chǔ)[7]。因此,為了進(jìn)行系統(tǒng)評(píng)價(jià)和/或Meta分析,評(píng)估原始研究的方法學(xué)質(zhì)量非常重要。當(dāng)然,在使用系統(tǒng)評(píng)價(jià)/Meta分析前評(píng)估其自身的方法學(xué)質(zhì)量亦是關(guān)鍵。質(zhì)量包括內(nèi)部真實(shí)性和外部真實(shí)性,而方法學(xué)質(zhì)量通常是指內(nèi)部真實(shí)性[8-9]。內(nèi)部真實(shí)性也被Cochrane協(xié)作網(wǎng)稱為“偏倚風(fēng)險(xiǎn)(risk of bias,RoB)”[9]。
目前有三種類型的質(zhì)量評(píng)價(jià)工具:量表、清單和條目[10-11]。2015年,Zeng等[11]研究了用于隨機(jī)對(duì)照試驗(yàn)(randomized controlled trial,RCT)、非隨機(jī)臨床干預(yù)研究、隊(duì)列研究、病例-對(duì)照研究、橫斷面研究、病例系列、診斷準(zhǔn)確性研究(也稱為診斷準(zhǔn)確性試驗(yàn);diagnostic test accuracy,DTA)、動(dòng)物實(shí)驗(yàn)、系統(tǒng)評(píng)價(jià)與Meta分析、以及CPG的方法學(xué)質(zhì)量工具。由于,現(xiàn)有評(píng)價(jià)工具可能會(huì)發(fā)生一些變化、新工具也可能會(huì)出現(xiàn),近年來(lái)也開(kāi)發(fā)了新的研究方法,因此,有必要系統(tǒng)地研究用于評(píng)估方法學(xué)質(zhì)量的常用工具,尤其是用于經(jīng)濟(jì)學(xué)評(píng)價(jià)、臨床預(yù)測(cè)規(guī)則/模型和質(zhì)性研究的工具。
本綜述介紹了截至2019年12月的一次和二次醫(yī)學(xué)研究的相關(guān)方法學(xué)質(zhì)量(包括“RoB”)評(píng)價(jià)工具,表1列出了基本特征。希望本綜述可以幫助證據(jù)的生產(chǎn)者、使用者和研究者。
表1 方法學(xué)質(zhì)量(偏倚風(fēng)險(xiǎn))評(píng)價(jià)工具的基本特征Table 1. Basic characteristics of methodological quality (deviation risk) evaluation tools
續(xù)表1
第一個(gè)RCT由Hill BA(1897-1991)設(shè)計(jì),并成為迄今為止實(shí)驗(yàn)研究設(shè)計(jì)的“金標(biāo)準(zhǔn)”[12-13]。如今,隨機(jī)試驗(yàn)的Cochrane偏倚風(fēng)險(xiǎn)工具(于2008年制定并于2011年3月20日進(jìn)行修訂)是RCT中最常用的質(zhì)量評(píng)價(jià)工具[9,14],被稱為“RoB”。2019年8月22日(于2016年制定)發(fā)布了此工具的隨機(jī)試驗(yàn)中評(píng)估RoB的修訂版(RoB 2.0)[15]。RoB 2.0工具適用于個(gè)體隨機(jī)、平行組和整群隨機(jī)試驗(yàn),可從專用網(wǎng)站https://www.riskofbias.info/welcome/rob-2-0-tool上獲取。RoB 2.0工具包含五個(gè)偏倚領(lǐng)域,與原始Cochrane RoB工具相比有很大變化(附表1-A-B列出了這兩個(gè)版本的主要條目)。
物理治療證據(jù)數(shù)據(jù)庫(kù)(PEDro)量表是專門用于RCT物理治療的一種方法學(xué)評(píng)價(jià)工具[16-17],可在http://www.pedro.org.au/english/downloads/pedroscale/獲取,內(nèi)容涉及11個(gè)條目(附表1-C)。照護(hù)的有效實(shí)踐與組織(EPOC)是一個(gè)Cochrane評(píng)審小組,該小組開(kāi)發(fā)了一種用于復(fù)雜干預(yù)隨機(jī)試驗(yàn)的工具(稱為“EPOC RoB工具”)。該工具有9個(gè)條目(附表1-D),可在https://epoc.cochrane.org/resources/epoc-resources-reviewauthors獲取。文獻(xiàn)嚴(yán)格評(píng)價(jià)項(xiàng)目(CASP)是牛津大學(xué)三重價(jià)值醫(yī)療保健中心(3V)的一部分,該產(chǎn)品組合提供資源以及學(xué)習(xí)和發(fā)展機(jī)會(huì),以支持文獻(xiàn)嚴(yán)格評(píng)價(jià)的發(fā)展(https://www.casp-uk.net/)[18-20]。RCT的CASP清單由三個(gè)部分組成,涉及11個(gè)條目(附表1-E)。美國(guó)國(guó)立衛(wèi)生研究院(NIH)還開(kāi)發(fā)了質(zhì)量評(píng)價(jià)工具,用于對(duì)照干預(yù)研究(附表1-F),以評(píng)估RCT的方法學(xué)質(zhì)量(https://www.nhlbi.nih.gov/health-topics/studyquality-assessment-tools)。
喬安娜·布里格斯學(xué)院(JBI)是一家獨(dú)立的、國(guó)際性的、非營(yíng)利性研究與開(kāi)發(fā)組織,總部位于南澳大利亞州阿德萊德大學(xué)健康與醫(yī)學(xué)學(xué)院(https://joannabriggs.org/)。它制定了許多重要的評(píng)估清單,涉及醫(yī)療保健干預(yù)措施的可行性、適當(dāng)性、有意義性和有效性。附表1-G列出了針對(duì)RCT的JBI嚴(yán)格評(píng)估清單,其中包括13個(gè)條目。
蘇格蘭國(guó)家指南小組(SIGN)成立于1993年(https://www.sign.ac.uk/)。其目標(biāo)是通過(guò)減少實(shí)踐和結(jié)果的差異,基于當(dāng)前證據(jù)的有效實(shí)踐制定和傳播國(guó)家臨床指南,來(lái)提高蘇格蘭患者的衛(wèi)生保健質(zhì)量。它還制定了許多重要的評(píng)估清單,以評(píng)估包括RCT(附表1-H)在內(nèi)的不同研究類型的方法學(xué)質(zhì)量。
此外,Jadad量表[21]、改良的Jadad量表[22-23]、Delphi列表[24]、Chalmers量表[25]、英國(guó)國(guó)家健康和臨床優(yōu)化研究所(NICE)方法學(xué)清單[11]、Downs & Black清單[26],以及West等在2002年總結(jié)的其他工具[27],如今并不常用或不被被推薦使用。
在開(kāi)展臨床試驗(yàn)之前,通常在動(dòng)物模型中測(cè)試新藥的安全性和有效性[28],因此動(dòng)物研究被視為臨床前研究,具有重要意義[29-30]。同樣,動(dòng)物研究的方法學(xué)質(zhì)量也需要評(píng)估[30]。1999年,最初的“美國(guó)卒中治療學(xué)術(shù)產(chǎn)業(yè)圓桌會(huì)議小組(STAIR)”推薦了他們?cè)u(píng)估卒中動(dòng)物研究質(zhì)量的標(biāo)準(zhǔn)[31],該工具也稱為“STAIR”。2009年,STAIR小組更新了標(biāo)準(zhǔn),并制定了“確保高質(zhì)量科學(xué)研究的推薦意見(jiàn)”[32]。此外,Macleod等[33]在2004年提出了一種基于STAIR的工具來(lái)評(píng)估動(dòng)物研究的方法學(xué)質(zhì)量,總分為10分,也稱為“CAMARADES(實(shí)驗(yàn)研究動(dòng)物數(shù)據(jù)的Meta分析和評(píng)價(jià)的協(xié)作方法)”;其中“S”以前代表“卒中(Stroke)”,現(xiàn)在代表“研究(Studies)”(http://www.camarades.info/)。在CAMARADES工具中,每個(gè)條目的最高得分為1分,而該工具的總得分最高為10分(附表1-J)。
2008年,荷蘭動(dòng)物實(shí)驗(yàn)系統(tǒng)評(píng)價(jià)研究中心(SYRCLE)成立,該團(tuán)隊(duì)基于原始的Cochrane RoB工具[34]開(kāi)發(fā)并發(fā)布了用于動(dòng)物干預(yù)性研究的RoB工具——SYRCLE的RoB工具。這個(gè)新工具包含10個(gè)條目,目前已成為評(píng)價(jià)動(dòng)物干預(yù)性研究方法學(xué)質(zhì)量最為推薦的工具(附表1-I)。
在臨床研究中,RCT并不總是可行的[35]。因此,非隨機(jī)設(shè)計(jì)仍然很重要。在非隨機(jī)研究(也稱為準(zhǔn)實(shí)驗(yàn)研究)中,研究者控制參與者的分組,但未采用隨機(jī)分組[36],包括隨訪研究。根據(jù)是否進(jìn)行比較,非隨機(jī)臨床干預(yù)研究可以分為比較和非比較兩種亞型,非隨機(jī)研究的偏倚風(fēng)險(xiǎn)—干預(yù)性(ROBINS-I)評(píng)價(jià)工具[37]是首選推薦工具。開(kāi)發(fā)此工具的目的是評(píng)估非隨機(jī)干預(yù)性研究的偏倚風(fēng)險(xiǎn),這類研究評(píng)估干預(yù)措施的相對(duì)有效性(損害或獲益),但未采用隨機(jī)方法將受試者(個(gè)體或整群)分配給各組。此外,JBI嚴(yán)格評(píng)估清單包括9個(gè)項(xiàng)目,也適用于準(zhǔn)實(shí)驗(yàn)研究(非隨機(jī)實(shí)驗(yàn)研究)。非隨機(jī)研究的方法學(xué)指標(biāo)(MINORS)[38]工具也可以被用于評(píng)價(jià)非隨機(jī)研究,該工具共包含12個(gè)得分點(diǎn);前8個(gè)條目可以用于非比較研究和比較研究,而后4個(gè)條目則適用于兩組或多組的研究。每個(gè)項(xiàng)目的得分都從0到2,總體質(zhì)量得分為16或24分。附表1-K-L-M分別列出了這三個(gè)工具的主要條目。
具有單獨(dú)對(duì)照組的非隨機(jī)研究也可以稱為臨床對(duì)照試驗(yàn)或前后對(duì)照研究。對(duì)于這種設(shè)計(jì)類型,EPOC RoB工具是合用的(附表1-D)。使用此工具時(shí),“隨機(jī)序列生成”和“分配隱藏”應(yīng)記為“高風(fēng)險(xiǎn)”,而其他項(xiàng)目的評(píng)分可能與隨機(jī)試驗(yàn)的評(píng)分相同。
沒(méi)有單獨(dú)對(duì)照組的非隨機(jī)研究可以是前后對(duì)照研究、病例系列(非對(duì)照縱向研究)或間斷時(shí)間序列研究。病例系列研究通常描述了一系列個(gè)體,接受相同的干預(yù),并且沒(méi)有對(duì)照組[9]。有幾種工具可以評(píng)估病例系列研究的方法學(xué)質(zhì)量。最新的一個(gè)工具是在2012年由Moga C等[39]使用加拿大衛(wèi)生經(jīng)濟(jì)學(xué)研究所(IHE)研發(fā)的改良德?tīng)柗萍夹g(shù)開(kāi)發(fā)的,因此,也被稱為“IHE質(zhì)量評(píng)價(jià)工具”(附表1-N)。此外,NIH也為病例系列研究開(kāi)發(fā)了質(zhì)量評(píng)價(jià)工具,其中包括9個(gè)項(xiàng)目(附表1-O)。對(duì)于間斷時(shí)間序列研究,建議使用“EPOC間斷時(shí)間序列研究RoB工具”(附表1-P);對(duì)于前后研究,建議使用NIH無(wú)對(duì)照組的前后研究質(zhì)量評(píng)價(jià)工具(附表1-Q)。
此外,對(duì)于非隨機(jī)干預(yù)性研究,Reisch工具(治療研究評(píng)估清單)[11,40]、Downs & Black清單[26]以及Deeks等總結(jié)的其他工具[36],如今已不常用或不被推薦使用。
觀察性研究包括隊(duì)列研究、病例-對(duì)照研究、橫斷面研究、病例系列、病例報(bào)告和比較效果研究[41],可分為分析性研究和描述性研究[42]。
隊(duì)列研究包括前瞻性隊(duì)列研究、回顧性隊(duì)列研究和雙向性隊(duì)列研究[43]。有一些評(píng)估隊(duì)列研究質(zhì)量的工具,例如CASP隊(duì)列研究清單(附表2-A)、SIGN隊(duì)列研究清單(附表2-B)、NIH觀察性隊(duì)列研究和橫斷面研究質(zhì)量評(píng)價(jià)工具(附表2-C),用于隊(duì)列研究的紐卡斯?fàn)?渥太華量表(NOS,附表2-D)和用于隊(duì)列研究的JBI清單(附表2-E)。但是,Downs&Black清單[26]和NICE清單[11]現(xiàn)已不常使用或不被推薦使用。
NOS量表[44-45]由澳大利亞紐卡斯?fàn)柎髮W(xué)和加拿大渥太華大學(xué)之間合作研發(fā),是目前評(píng)價(jià)隊(duì)列研究最常用的工具,使用者可以根據(jù)特定主題進(jìn)行修改。
病例-對(duì)照研究根據(jù)是否存在特定疾病或狀況選擇受試者,并尋找可能導(dǎo)致疾病或結(jié)局的早期暴露因素[42]。相比隊(duì)列研究,它的優(yōu)勢(shì)在于不會(huì)出現(xiàn)受試者“脫落”或“失訪”的問(wèn)題。目前,有一些可評(píng)估病例-對(duì)照研究方法學(xué)質(zhì)量的工具,包括CASP病例-對(duì)照研究清單(附表2-F)、SIGN病例-對(duì)照研究清單(附表2-G)、NIH病例-對(duì)照研究質(zhì)量評(píng)價(jià)工具(附表2-H),JBI病例-對(duì)照研究清單(附表2-I)和NOS病例-對(duì)照研究量表(附表2-J)。其中,NOS也是當(dāng)今最常用于評(píng)價(jià)病例-對(duì)照研究的工具,并且可以根據(jù)特定的主題進(jìn)行修改。
此外,Downs&Black清單[26]和NICE清單[11]現(xiàn)已不常用或不被推薦使用。
橫斷面研究是用來(lái)提供某個(gè)時(shí)間點(diǎn)特定人群中疾病和其他變量的研究。它可以分為分析性和描述性。描述性橫斷面研究?jī)H描述特定人群在某個(gè)時(shí)間點(diǎn)或一段時(shí)間內(nèi)的病例或事件的數(shù)量;而分析性橫斷面研究可用于推斷疾病與其他變量之間的關(guān)系[46]。
為了評(píng)估分析性橫斷面研究的質(zhì)量,目前推薦的工具有NIH質(zhì)量評(píng)價(jià)工具(附表2-C),JBI分析性橫斷面研究評(píng)估清單(附表2-K)和橫斷面研究評(píng)價(jià)工具(appraisal tool for cross-sectional studies,AXIS工具,附表2-L)[47]。AXIS工具是一項(xiàng)評(píng)估研究設(shè)計(jì)和報(bào)告質(zhì)量以及偏倚風(fēng)險(xiǎn)的工具,該工具于2016年開(kāi)發(fā),包含20個(gè)條目。在這三種工具中,JBI清單是最常用的一種。
通常使用描述性橫斷面研究來(lái)描述疾病的患病率和發(fā)病率。因此,用于分析性橫截面研究的評(píng)價(jià)工具并不適用。只有很少的質(zhì)量評(píng)價(jià)工具適用于描述性橫斷面研究,例如用于報(bào)告流行率數(shù)據(jù)研究的JBI量表[48](附表2-M),美國(guó)衛(wèi)生保健質(zhì)量和研究機(jī)構(gòu)(AHRQ)用于評(píng)估橫斷面研究/患病率研究的方法學(xué)量表(附表2-N),以及Crombie用于評(píng)估橫斷面研究質(zhì)量的條目[49](附表2-O)。其中,JBI工具是最新的。
與上述干預(yù)性病例系列不同,病例報(bào)告和病例系列用于報(bào)告新發(fā)疾病或獨(dú)特發(fā)現(xiàn)[50]。因此,它們屬于描述性研究。僅有JBI清單這一種工具用于病例報(bào)告的方法學(xué)質(zhì)量評(píng)價(jià)(附表2-P)。
比較效果研究(comparative effectiveness research,CER)比較了某醫(yī)療條件的替代治療方案真實(shí)世界情況下的結(jié)果[51]。它的關(guān)鍵要素包括效果的研究(在真實(shí)世界中的效果),而不是效力(理想效果),以及替代策略之間的比較[52]。2010年,比較效果的優(yōu)良研究(GRACE)團(tuán)隊(duì)成立并制定了相關(guān)原則,以幫助醫(yī)療保健提供者、研究人員、期刊讀者和編輯者評(píng)估觀察性比較效果研究的質(zhì)量[41]。2016年,發(fā)布了GRACE清單5.0版(附表2-Q),用于評(píng)估CER的質(zhì)量。
臨床醫(yī)生使用診斷試驗(yàn)(也稱為“診斷準(zhǔn)確性試驗(yàn),DTA”)來(lái)確定患者是否存在某種狀況,從而制定適當(dāng)?shù)闹委熡?jì)劃[53]。DTA在設(shè)計(jì)方面具有一些獨(dú)特的特征,這些特征不同于標(biāo)準(zhǔn)的干預(yù)性研究和觀察性研究。2003年,Whiting等[53-54]開(kāi)發(fā)了一種評(píng)估DTA質(zhì)量的工具,即診斷準(zhǔn)確性研究質(zhì)量評(píng)估(quality assessment of diagnostic accuracy studies,QUADAS)工具。2011年,推出了修訂的“QUADAS-2”工具(附表2-R)[55-56]。此外,該領(lǐng)域常用的評(píng)價(jià)工具有CASP診斷清單(附表2S)、SIGN診斷研究清單(附表2-T)、JBI診斷準(zhǔn)確性試驗(yàn)評(píng)估清單(附表2-U)和Cochrane診斷準(zhǔn)確性試驗(yàn)偏倚風(fēng)險(xiǎn)評(píng)估工具(附表2-V)。
其中,Cochrane偏倚風(fēng)險(xiǎn)工具(https://meth ods.cochrane.org/sdt/) 基 于QUADAS工 具, 而SIGN清單和JBI清單則基于QUADAS-2工具。目前QUADAS-2工具是最為推薦的工具。在2004年Whiting等[53]綜述中提及的其他相關(guān)工具如今已不再使用。
衛(wèi)生經(jīng)濟(jì)學(xué)評(píng)價(jià)研究比較了替代干預(yù)措施的資源使用、成本和健康影響[57]。它著重于確定、衡量、評(píng)估和比較兩種或多種替代干預(yù)方案的資源使用、成本和效益/效果[58]。如今,衛(wèi)生經(jīng)濟(jì)學(xué)研究越來(lái)越受歡迎。當(dāng)然,其方法學(xué)質(zhì)量也需要在使用之前進(jìn)行評(píng)估。Drummond和Jefferson在1996年開(kāi)發(fā)了第一個(gè)進(jìn)行此類評(píng)估的工具[59],之后,許多工具根據(jù)Drummond的條款或其修訂版[60]被開(kāi)發(fā)出來(lái)。例如SIGN經(jīng)濟(jì)學(xué)評(píng)價(jià)清單(附表3-A),CASP經(jīng)濟(jì)學(xué)評(píng)價(jià)清單(附表3-B)、JBI經(jīng)濟(jì)學(xué)評(píng)價(jià)清單(附表3-C)和NICE用于經(jīng)濟(jì)學(xué)評(píng)價(jià)的方法清單(附表3-D)等。
我們認(rèn)為綜合健康經(jīng)濟(jì)評(píng)估報(bào)告標(biāo)準(zhǔn)(consolidated health economic evaluation reporting standards,CHEERS)聲明[61]屬于報(bào)告工具,而不是方法學(xué)質(zhì)量評(píng)價(jià)工具,因此不建議使用它來(lái)評(píng)估衛(wèi)生經(jīng)濟(jì)學(xué)評(píng)價(jià)研究的方法學(xué)質(zhì)量。
在醫(yī)療保健領(lǐng)域,質(zhì)性研究旨在理解和解釋個(gè)人經(jīng)歷、行為、互動(dòng)和社會(huì)環(huán)境,以解釋感興趣的現(xiàn)象,例如患者和臨床醫(yī)生的態(tài)度、信念和觀點(diǎn),照顧者與患者之間的人際關(guān)系,疾病經(jīng)歷,以及患者痛苦的影響[62]。與定量研究相比,用于質(zhì)性研究的評(píng)價(jià)工具更少。如今,CASP質(zhì)性研究清單(附表3-E)是最常用的工具。此外,JBI質(zhì)性研究清單[63-64](附表3-F)和英國(guó)國(guó)家社會(huì)研究中心的質(zhì)性研究評(píng)估框架[65](附表3-G)也同樣適用。
臨床預(yù)測(cè)研究包括預(yù)測(cè)因子發(fā)現(xiàn)(預(yù)后因素)研究,預(yù)測(cè)模型研究(研發(fā)、驗(yàn)證以及擴(kuò)展或更新)和預(yù)測(cè)模型影響研究[66]。對(duì)于預(yù)測(cè)因子發(fā)現(xiàn)研究,可以使用預(yù)后研究質(zhì)量(quality in prognosis studies,QIPS)工具[67]評(píng)估其方法學(xué)質(zhì)量(附表3-H)。對(duì)于預(yù)測(cè)模型影響研究,如果使用隨機(jī)比較設(shè)計(jì),則可以使用RCT評(píng)價(jià)工具,如RoB 2.0工具。如果使用非隨機(jī)比較設(shè)計(jì),則可以使用非隨機(jī)研究工具,如ROBINS-I工具。對(duì)于診斷和預(yù)后預(yù)測(cè)模型研究,可以使用預(yù)測(cè)模型偏倚風(fēng)險(xiǎn)評(píng)價(jià)工具(prediction model risk of bias assessment tool,PROBAST;附表3-I)[68]和CASP臨床預(yù)測(cè)規(guī)則清單(附表3-J)。
基于文獻(xiàn)和專家觀點(diǎn)的證據(jù)(也稱為“非研究證據(jù)”)來(lái)自各種期刊、雜志、專著和報(bào)告中出現(xiàn)的專家觀點(diǎn)、共識(shí)、論述、評(píng)論以及假說(shuō)[69-71]。如今,只有JBI清單可用于評(píng)估文獻(xiàn)和專家觀點(diǎn)的質(zhì)量(附表3-K)。
結(jié)果測(cè)量工具用于收集測(cè)量結(jié)果。“工具”一詞涵蓋的范圍很廣,可以指問(wèn)卷(例如患者報(bào)告的生活質(zhì)量結(jié)果、觀察(例如臨床檢查的結(jié)果)、量表(例如視覺(jué)模擬量表)、實(shí)驗(yàn)室檢查(例如血液檢查)和影像學(xué)(例如超聲或其他醫(yī)學(xué)成像)[72-73]。測(cè)量可以是主觀的或客觀的,可以是一維的(例如態(tài)度)或多維的。目前,只有基于共識(shí)標(biāo)準(zhǔn)選擇健康測(cè)量工具(COSMIN)偏倚風(fēng)險(xiǎn)量表[74-76](https://www.cosmin.nl/)這一種工具適合評(píng)估結(jié)果測(cè)量工具的方法學(xué)質(zhì)量,附表3-L列出了其主要項(xiàng)目,包括患者報(bào)告結(jié)果測(cè)量(patient-reported outcome measure,PROM)的發(fā)展(附表3-LA)、內(nèi)容真實(shí)性(附表3-LB)、結(jié)構(gòu)真實(shí)性(附表3-LC)、內(nèi)部一致性(附表3-LD)、跨文化真實(shí)性/測(cè)量不變性(附表3-LE)、信度(附表3-LF)、測(cè)量誤差(附表3-LG)、校標(biāo)真實(shí)性(附表3-LH)、結(jié)構(gòu)真實(shí)性假設(shè)檢驗(yàn)(附表3-LI)和反應(yīng)度(附表3-LJ)。
系統(tǒng)評(píng)價(jià)與Meta分析是總結(jié)當(dāng)前醫(yī)學(xué)文獻(xiàn)的科學(xué)方法[4-6],其最終目的和價(jià)值在于促進(jìn)醫(yī)療保健[6,77-78]。Meta分析是一個(gè)將多項(xiàng)研究結(jié)果合并的統(tǒng)計(jì)過(guò)程,通常是系統(tǒng)評(píng)價(jià)的一部分[11]。當(dāng)然,在使用系統(tǒng)評(píng)價(jià)與Meta分析之前,必須進(jìn)行嚴(yán)格的評(píng)價(jià)。
1988年,Sacks等開(kāi)發(fā)了第一個(gè)評(píng)估基于RCT的Meta分析的質(zhì)量工具——Sack質(zhì)量評(píng)估清單(sack’s quality assessment checklist,SQAC)[79];1991年,Oxman和Guyatt開(kāi)發(fā)了另一個(gè)工具——概述質(zhì)量評(píng)估問(wèn)卷(overview quality assessment questionnaire,OQAQ)[80-81]。為了克服這兩個(gè)工具的缺點(diǎn),2007年,基于這兩個(gè)工具開(kāi)發(fā)了一種評(píng)估系統(tǒng)評(píng)價(jià)的評(píng)價(jià)工具(a measurement tool to assess systematic reviews,AMSTAR)[82](https://www.amstar.ca/)。但是,初始版本的AMSTAR工具并未包含對(duì)非隨機(jī)研究偏倚風(fēng)險(xiǎn)的評(píng)估,專家組認(rèn)為修訂應(yīng)針對(duì)系統(tǒng)評(píng)價(jià)的所有方面。因此,2017年發(fā)布了用于評(píng)價(jià)隨機(jī)和非隨機(jī)研究的新工具——AMSTAR 2[83],附表4-A列出了其主要項(xiàng)目。
此外,CASP的系統(tǒng)評(píng)價(jià)清單(附表4-B)、SIGN的系統(tǒng)評(píng)價(jià)與Meta分析評(píng)價(jià)清單(附表4-C)、JBI的系統(tǒng)評(píng)價(jià)與研究整合評(píng)價(jià)清單(附表4-D)、NIH的系統(tǒng)評(píng)價(jià)與Meta分析質(zhì)量評(píng)價(jià)工具(附表4-E)、英國(guó)約克大學(xué)決策支持單位(decision support unit,DSU)網(wǎng)狀Meta分析(NMA)方法學(xué)清單(附表4-F)和系統(tǒng)評(píng)價(jià)偏倚風(fēng)險(xiǎn)(risk of bias in systematic review,ROBIS)[84]工具(附表4-G)都可用于系統(tǒng)評(píng)價(jià)與Meta分析的質(zhì)量評(píng)價(jià)。其中,最常用的是AMSTAR 2、最常建議使用的是ROIBS。
在這些工具中,AMSTAR 2適用于評(píng)估隨機(jī)或非隨機(jī)干預(yù)性研究的系統(tǒng)評(píng)價(jià)和Meta分析,DSU-NMA方法清單適用于網(wǎng)狀Meta分析,而ROBIS適用于干預(yù)性研究、診斷準(zhǔn)確性試驗(yàn)、臨床預(yù)測(cè)和預(yù)后研究的Meta分析。
CPG很好地融入了臨床醫(yī)生和專業(yè)臨床組織的觀念或經(jīng)驗(yàn)[85-87];并將科學(xué)證據(jù)納入臨床實(shí)踐[88]。但是,并非所有的CPG都是基于證據(jù)的[89-90],其質(zhì)量也參差不齊[91-93]。到目前為止,已經(jīng)開(kāi)發(fā)了20多種評(píng)價(jià)工具[94]。其中,指南研究與評(píng)價(jià)工具(AGREE)可作為開(kāi)發(fā)臨床途徑評(píng)價(jià)工具的基礎(chǔ)[94]。AGREE工具于2003年首次發(fā)布[95],并于2009年更新為AGREE II工具[96](https://www.agreetrust.org/)?,F(xiàn)在,AGREE II工具是用于評(píng)價(jià)CPG最為推薦的工具(附表4-H)。
此外,基于AGREE II,開(kāi)發(fā)了AGREE全球 評(píng) 級(jí) 量 表(agree global rating scale,AGREE GRS)工具[97],作為評(píng)估CPG質(zhì)量和報(bào)告的簡(jiǎn)要工具。
目前,循證醫(yī)學(xué)已被廣泛接受,醫(yī)護(hù)人員的主要注意力在于“從證據(jù)到建議”[98-99]。因此,在使用之前對(duì)證據(jù)進(jìn)行嚴(yán)格的評(píng)價(jià)是該過(guò)程的關(guān)鍵[100-101]。1987年,Mulrow CD[102]指出,醫(yī)學(xué)綜述需要常規(guī)使用科學(xué)的方法來(lái)識(shí)別、評(píng)估和綜合信息。故在使用研究結(jié)果之前,必須對(duì)研究進(jìn)行方法學(xué)質(zhì)量評(píng)估。盡管自第一個(gè)質(zhì)量評(píng)價(jià)工具問(wèn)世以來(lái)已經(jīng)過(guò)去了20多年,但許多用戶仍然誤解了方法學(xué)質(zhì)量和報(bào)告質(zhì)量。其中,有人使用報(bào)告清單來(lái)評(píng)估方法學(xué)質(zhì)量,例如使用報(bào)告臨床試驗(yàn)的統(tǒng)一標(biāo)準(zhǔn)(consolidated standards of reporting trials,CONSORT)聲明[103]來(lái)評(píng)估RCT的方法學(xué)質(zhì)量,使用流行病學(xué)觀察性研究增強(qiáng)報(bào)告(strengthening the reporting of observational studies in epidemiology,STROBE)評(píng)價(jià)隊(duì)列研究方法學(xué)質(zhì)量[104]。這種現(xiàn)象表明,需要對(duì)醫(yī)學(xué)生和專業(yè)人員進(jìn)行更多的臨床流行病學(xué)普及教育。
方法學(xué)質(zhì)量工具應(yīng)根據(jù)不同研究類型的特征開(kāi)發(fā)。本文中,我們使用“methodological quality”“risk of bias”“critical appraisal”“checklist”“scale”“items”和“assessment tool”在 NICE 網(wǎng)站、SIGN網(wǎng)站、Cochrane圖書館網(wǎng)站和JBI網(wǎng)站中進(jìn)行搜索。在此基礎(chǔ)上,在PubMed中檢索了“systematic review”“meta-analysis”“overview”和“clinical practice guideline”。與本團(tuán)隊(duì)之前的系統(tǒng)評(píng)價(jià)[11]相比,我們發(fā)現(xiàn)一些工具仍被推薦和使用,某些工具仍在使用但未被推薦,而有些則被淘汰[10,29-30,36,53,94,105-107]。這些工具極大地推動(dòng)了臨床實(shí)踐的發(fā)展[108-109]。
此外,相較本團(tuán)隊(duì)既往研究成果[11],本文列出了更多的工具,尤其是2014年之后開(kāi)發(fā)的新工具和最新修訂版。當(dāng)然,我們還調(diào)整了研究類型分類的方法。首先,2014年,NICE提供了7個(gè)方法學(xué)檢查清單,但現(xiàn)在僅保留和更新了經(jīng)濟(jì)學(xué)評(píng)價(jià)清單。此外,Cochrane RoB 2.0工具、AMSTAR 2工具、CASP清單和大多數(shù)JBI清單都是最新修訂版;NIH的質(zhì)量評(píng)價(jià)工具、ROBINS-I工具、EPOC RoB工具、AXIS工具、GRACE清單、PROBAST、COSMIN偏倚風(fēng)險(xiǎn)清單和ROBIS工具都是新發(fā)布的工具。其次,本文還介紹了用于評(píng)價(jià)網(wǎng)狀Meta分析、結(jié)果測(cè)量工具、文獻(xiàn)和專家觀點(diǎn)、預(yù)測(cè)研究、質(zhì)性研究、衛(wèi)生經(jīng)濟(jì)學(xué)評(píng)估和CER的工具。第三,我們將干預(yù)研究分為隨機(jī)和非隨機(jī)兩種亞型,然后將非隨機(jī)研究進(jìn)一步分為有對(duì)照組和無(wú)對(duì)照組;此外,還將橫斷面研究分為分析性和描述性兩種亞型,病例系列分為干預(yù)性和觀察性兩種亞型。這些分類更加客觀和全面。
顯然,適用于RCT的評(píng)價(jià)工具數(shù)量最多,其次是隊(duì)列研究。JBI的適用范圍最廣[63-64],CASP緊隨其后。但是,仍需進(jìn)一步努力來(lái)開(kāi)發(fā)評(píng)價(jià)工具。對(duì)于某些研究類型,僅有一種適用的評(píng)價(jià)工具,例如CER、結(jié)果測(cè)量工具、文獻(xiàn)和專家觀點(diǎn)、病例報(bào)告和CPG。此外,對(duì)于許多研究類型,例如概述、遺傳關(guān)聯(lián)研究和細(xì)胞研究,都沒(méi)有合適的評(píng)價(jià)工具。而且現(xiàn)有些工具尚未被學(xué)界完全認(rèn)可。將來(lái),如何開(kāi)發(fā)公認(rèn)的工具仍然是一項(xiàng)具有重要意義的工作[11]。
本綜述可以幫助系統(tǒng)評(píng)價(jià)、Meta分析、指南和證據(jù)使用者等專業(yè)人員在產(chǎn)生或使用證據(jù)時(shí)選擇最佳工具。而且,方法學(xué)家可以獲得開(kāi)發(fā)新工具的研究主題。最重要的是,我們必須明白,所有評(píng)價(jià)工具都是主觀的,使用這些工具時(shí)會(huì)受到用戶的技能和知識(shí)水平的影響。因此,用戶必須接受正規(guī)培訓(xùn)(必須具備相關(guān)的流行病學(xué)知識(shí)),具有嚴(yán)謹(jǐn)?shù)膶W(xué)術(shù)態(tài)度,并且至少應(yīng)由兩名獨(dú)立的審閱者參與評(píng)估和交叉檢查,以最大限度地避免出現(xiàn)實(shí)施偏倚[110]。
附表中文版位置說(shuō)明
附表1:干預(yù)性研究評(píng)估工具及其主要組成部分
附表2:觀察性研究和診斷研究評(píng)估工具及其主要組成部分
附表3:醫(yī)學(xué)領(lǐng)域其他的一次研究評(píng)估工具及其主要組成部分
附表4:醫(yī)學(xué)二次醫(yī)學(xué)研究評(píng)估工具及其主要組成部分
讀者可自《醫(yī)學(xué)新知》官網(wǎng)(http://www.jnewmed.com/)相對(duì)應(yīng)文章中獲取。