醫(yī)學(xué)領(lǐng)域一次研究和二次研究的方法學(xué)質(zhì)量（偏倚風(fēng)險(xiǎn)）評(píng)價(jià)工具

2021-03-03 04:25:38李柄輝李路遙王朝陽(yáng)任學(xué)群

醫(yī)學(xué)新知 2021年1期

李柄輝，訾豪，李路遙，，王朝陽(yáng)，，任學(xué)群，郭毅，譯

1. 武漢大學(xué)中南醫(yī)院循證與轉(zhuǎn)化醫(yī)學(xué)中心（武漢 430071）

2. 武漢大學(xué)中南醫(yī)院泌尿外科（武漢 430071）

3. 河南大學(xué)循證醫(yī)學(xué)與臨床轉(zhuǎn)化研究院（河南開(kāi)封 475000）

在20世紀(jì)，著名教授Cochrane A、Guyatt GH和Chalmers IG[1-3]的開(kāi)創(chuàng)性工作使我們進(jìn)入了循證醫(yī)學(xué)（evidence-based medicine，EBM）時(shí)代。在這個(gè)時(shí)代，如何檢索、評(píng)價(jià)和使用最佳證據(jù)非常重要。系統(tǒng)評(píng)價(jià)與Meta分析是科學(xué)總結(jié)一次研究數(shù)據(jù)最常用的方法[4-6]，也是制定臨床實(shí)踐指南（clinical practice guideline，CPG）的基礎(chǔ)[7]。因此，為了進(jìn)行系統(tǒng)評(píng)價(jià)和/或Meta分析，評(píng)估原始研究的方法學(xué)質(zhì)量非常重要。當(dāng)然，在使用系統(tǒng)評(píng)價(jià)/Meta分析前評(píng)估其自身的方法學(xué)質(zhì)量亦是關(guān)鍵。質(zhì)量包括內(nèi)部真實(shí)性和外部真實(shí)性，而方法學(xué)質(zhì)量通常是指內(nèi)部真實(shí)性[8-9]。內(nèi)部真實(shí)性也被Cochrane協(xié)作網(wǎng)稱為“偏倚風(fēng)險(xiǎn)（risk of bias，RoB）”[9]。

目前有三種類型的質(zhì)量評(píng)價(jià)工具：量表、清單和條目[10-11]。2015年，Zeng等[11]研究了用于隨機(jī)對(duì)照試驗(yàn)（randomized controlled trial，RCT）、非隨機(jī)臨床干預(yù)研究、隊(duì)列研究、病例-對(duì)照研究、橫斷面研究、病例系列、診斷準(zhǔn)確性研究（也稱為診斷準(zhǔn)確性試驗(yàn)；diagnostic test accuracy，DTA）、動(dòng)物實(shí)驗(yàn)、系統(tǒng)評(píng)價(jià)與Meta分析、以及CPG的方法學(xué)質(zhì)量工具。由于，現(xiàn)有評(píng)價(jià)工具可能會(huì)發(fā)生一些變化、新工具也可能會(huì)出現(xiàn)，近年來(lái)也開(kāi)發(fā)了新的研究方法，因此，有必要系統(tǒng)地研究用于評(píng)估方法學(xué)質(zhì)量的常用工具，尤其是用于經(jīng)濟(jì)學(xué)評(píng)價(jià)、臨床預(yù)測(cè)規(guī)則/模型和質(zhì)性研究的工具。

本綜述介紹了截至2019年12月的一次和二次醫(yī)學(xué)研究的相關(guān)方法學(xué)質(zhì)量（包括“RoB”）評(píng)價(jià)工具，表1列出了基本特征。希望本綜述可以幫助證據(jù)的生產(chǎn)者、使用者和研究者。

表1 方法學(xué)質(zhì)量（偏倚風(fēng)險(xiǎn)）評(píng)價(jià)工具的基本特征Table 1. Basic characteristics of methodological quality (deviation risk) evaluation tools

續(xù)表1

1 干預(yù)性研究

1.1 隨機(jī)對(duì)照試驗(yàn)（個(gè)體或整群）

第一個(gè)RCT由Hill BA（1897-1991）設(shè)計(jì)，并成為迄今為止實(shí)驗(yàn)研究設(shè)計(jì)的“金標(biāo)準(zhǔn)”[12-13]。如今，隨機(jī)試驗(yàn)的Cochrane偏倚風(fēng)險(xiǎn)工具（于2008年制定并于2011年3月20日進(jìn)行修訂）是RCT中最常用的質(zhì)量評(píng)價(jià)工具[9,14]，被稱為“RoB”。2019年8月22日（于2016年制定）發(fā)布了此工具的隨機(jī)試驗(yàn)中評(píng)估RoB的修訂版（RoB 2.0）[15]。RoB 2.0工具適用于個(gè)體隨機(jī)、平行組和整群隨機(jī)試驗(yàn)，可從專用網(wǎng)站https://www.riskofbias.info/welcome/rob-2-0-tool上獲取。RoB 2.0工具包含五個(gè)偏倚領(lǐng)域，與原始Cochrane RoB工具相比有很大變化（附表1-A-B列出了這兩個(gè)版本的主要條目）。

物理治療證據(jù)數(shù)據(jù)庫(kù)（PEDro）量表是專門用于RCT物理治療的一種方法學(xué)評(píng)價(jià)工具[16-17]，可在http://www.pedro.org.au/english/downloads/pedroscale/獲取，內(nèi)容涉及11個(gè)條目（附表1-C）。照護(hù)的有效實(shí)踐與組織（EPOC）是一個(gè)Cochrane評(píng)審小組，該小組開(kāi)發(fā)了一種用于復(fù)雜干預(yù)隨機(jī)試驗(yàn)的工具（稱為“EPOC RoB工具”）。該工具有9個(gè)條目（附表1-D），可在https://epoc.cochrane.org/resources/epoc-resources-reviewauthors獲取。文獻(xiàn)嚴(yán)格評(píng)價(jià)項(xiàng)目（CASP）是牛津大學(xué)三重價(jià)值醫(yī)療保健中心（3V）的一部分，該產(chǎn)品組合提供資源以及學(xué)習(xí)和發(fā)展機(jī)會(huì)，以支持文獻(xiàn)嚴(yán)格評(píng)價(jià)的發(fā)展（https://www.casp-uk.net/）[18-20]。RCT的CASP清單由三個(gè)部分組成，涉及11個(gè)條目（附表1-E）。美國(guó)國(guó)立衛(wèi)生研究院（NIH）還開(kāi)發(fā)了質(zhì)量評(píng)價(jià)工具，用于對(duì)照干預(yù)研究（附表1-F），以評(píng)估RCT的方法學(xué)質(zhì)量（https://www.nhlbi.nih.gov/health-topics/studyquality-assessment-tools）。

喬安娜·布里格斯學(xué)院（JBI）是一家獨(dú)立的、國(guó)際性的、非營(yíng)利性研究與開(kāi)發(fā)組織，總部位于南澳大利亞州阿德萊德大學(xué)健康與醫(yī)學(xué)學(xué)院（https://joannabriggs.org/）。它制定了許多重要的評(píng)估清單，涉及醫(yī)療保健干預(yù)措施的可行性、適當(dāng)性、有意義性和有效性。附表1-G列出了針對(duì)RCT的JBI嚴(yán)格評(píng)估清單，其中包括13個(gè)條目。

蘇格蘭國(guó)家指南小組（SIGN）成立于1993年（https://www.sign.ac.uk/）。其目標(biāo)是通過(guò)減少實(shí)踐和結(jié)果的差異，基于當(dāng)前證據(jù)的有效實(shí)踐制定和傳播國(guó)家臨床指南，來(lái)提高蘇格蘭患者的衛(wèi)生保健質(zhì)量。它還制定了許多重要的評(píng)估清單，以評(píng)估包括RCT（附表1-H）在內(nèi)的不同研究類型的方法學(xué)質(zhì)量。

此外，Jadad量表[21]、改良的Jadad量表[22-23]、Delphi列表[24]、Chalmers量表[25]、英國(guó)國(guó)家健康和臨床優(yōu)化研究所（NICE）方法學(xué)清單[11]、Downs & Black清單[26]，以及West等在2002年總結(jié)的其他工具[27]，如今并不常用或不被被推薦使用。

1.2 動(dòng)物實(shí)驗(yàn)

在開(kāi)展臨床試驗(yàn)之前，通常在動(dòng)物模型中測(cè)試新藥的安全性和有效性[28]，因此動(dòng)物研究被視為臨床前研究，具有重要意義[29-30]。同樣，動(dòng)物研究的方法學(xué)質(zhì)量也需要評(píng)估[30]。1999年，最初的“美國(guó)卒中治療學(xué)術(shù)產(chǎn)業(yè)圓桌會(huì)議小組（STAIR）”推薦了他們?cè)u(píng)估卒中動(dòng)物研究質(zhì)量的標(biāo)準(zhǔn)[31]，該工具也稱為“STAIR”。2009年，STAIR小組更新了標(biāo)準(zhǔn)，并制定了“確保高質(zhì)量科學(xué)研究的推薦意見(jiàn)”[32]。此外，Macleod等[33]在2004年提出了一種基于STAIR的工具來(lái)評(píng)估動(dòng)物研究的方法學(xué)質(zhì)量，總分為10分，也稱為“CAMARADES（實(shí)驗(yàn)研究動(dòng)物數(shù)據(jù)的Meta分析和評(píng)價(jià)的協(xié)作方法）”；其中“S”以前代表“卒中（Stroke）”，現(xiàn)在代表“研究（Studies）”（http://www.camarades.info/）。在CAMARADES工具中，每個(gè)條目的最高得分為1分，而該工具的總得分最高為10分（附表1-J）。

2008年，荷蘭動(dòng)物實(shí)驗(yàn)系統(tǒng)評(píng)價(jià)研究中心（SYRCLE）成立，該團(tuán)隊(duì)基于原始的Cochrane RoB工具[34]開(kāi)發(fā)并發(fā)布了用于動(dòng)物干預(yù)性研究的RoB工具——SYRCLE的RoB工具。這個(gè)新工具包含10個(gè)條目，目前已成為評(píng)價(jià)動(dòng)物干預(yù)性研究方法學(xué)質(zhì)量最為推薦的工具（附表1-I）。

1.3 非隨機(jī)研究

在臨床研究中，RCT并不總是可行的[35]。因此，非隨機(jī)設(shè)計(jì)仍然很重要。在非隨機(jī)研究（也稱為準(zhǔn)實(shí)驗(yàn)研究）中，研究者控制參與者的分組，但未采用隨機(jī)分組[36]，包括隨訪研究。根據(jù)是否進(jìn)行比較，非隨機(jī)臨床干預(yù)研究可以分為比較和非比較兩種亞型，非隨機(jī)研究的偏倚風(fēng)險(xiǎn)—干預(yù)性（ROBINS-I）評(píng)價(jià)工具[37]是首選推薦工具。開(kāi)發(fā)此工具的目的是評(píng)估非隨機(jī)干預(yù)性研究的偏倚風(fēng)險(xiǎn)，這類研究評(píng)估干預(yù)措施的相對(duì)有效性（損害或獲益），但未采用隨機(jī)方法將受試者（個(gè)體或整群）分配給各組。此外，JBI嚴(yán)格評(píng)估清單包括9個(gè)項(xiàng)目，也適用于準(zhǔn)實(shí)驗(yàn)研究（非隨機(jī)實(shí)驗(yàn)研究）。非隨機(jī)研究的方法學(xué)指標(biāo)（MINORS）[38]工具也可以被用于評(píng)價(jià)非隨機(jī)研究，該工具共包含12個(gè)得分點(diǎn)；前8個(gè)條目可以用于非比較研究和比較研究，而后4個(gè)條目則適用于兩組或多組的研究。每個(gè)項(xiàng)目的得分都從0到2，總體質(zhì)量得分為16或24分。附表1-K-L-M分別列出了這三個(gè)工具的主要條目。

具有單獨(dú)對(duì)照組的非隨機(jī)研究也可以稱為臨床對(duì)照試驗(yàn)或前后對(duì)照研究。對(duì)于這種設(shè)計(jì)類型，EPOC RoB工具是合用的（附表1-D）。使用此工具時(shí)，“隨機(jī)序列生成”和“分配隱藏”應(yīng)記為“高風(fēng)險(xiǎn)”，而其他項(xiàng)目的評(píng)分可能與隨機(jī)試驗(yàn)的評(píng)分相同。

沒(méi)有單獨(dú)對(duì)照組的非隨機(jī)研究可以是前后對(duì)照研究、病例系列（非對(duì)照縱向研究）或間斷時(shí)間序列研究。病例系列研究通常描述了一系列個(gè)體，接受相同的干預(yù)，并且沒(méi)有對(duì)照組[9]。有幾種工具可以評(píng)估病例系列研究的方法學(xué)質(zhì)量。最新的一個(gè)工具是在2012年由Moga C等[39]使用加拿大衛(wèi)生經(jīng)濟(jì)學(xué)研究所（IHE）研發(fā)的改良德?tīng)柗萍夹g(shù)開(kāi)發(fā)的，因此，也被稱為“IHE質(zhì)量評(píng)價(jià)工具”（附表1-N）。此外，NIH也為病例系列研究開(kāi)發(fā)了質(zhì)量評(píng)價(jià)工具，其中包括9個(gè)項(xiàng)目（附表1-O）。對(duì)于間斷時(shí)間序列研究，建議使用“EPOC間斷時(shí)間序列研究RoB工具”（附表1-P）；對(duì)于前后研究，建議使用NIH無(wú)對(duì)照組的前后研究質(zhì)量評(píng)價(jià)工具（附表1-Q）。

此外，對(duì)于非隨機(jī)干預(yù)性研究，Reisch工具（治療研究評(píng)估清單）[11,40]、Downs ＆ Black清單[26]以及Deeks等總結(jié)的其他工具[36]，如今已不常用或不被推薦使用。

2 觀察性研究和診斷研究

觀察性研究包括隊(duì)列研究、病例-對(duì)照研究、橫斷面研究、病例系列、病例報(bào)告和比較效果研究[41]，可分為分析性研究和描述性研究[42]。

2.1 隊(duì)列研究

隊(duì)列研究包括前瞻性隊(duì)列研究、回顧性隊(duì)列研究和雙向性隊(duì)列研究[43]。有一些評(píng)估隊(duì)列研究質(zhì)量的工具，例如CASP隊(duì)列研究清單（附表2-A）、SIGN隊(duì)列研究清單（附表2-B）、NIH觀察性隊(duì)列研究和橫斷面研究質(zhì)量評(píng)價(jià)工具（附表2-C），用于隊(duì)列研究的紐卡斯?fàn)?渥太華量表（NOS，附表2-D）和用于隊(duì)列研究的JBI清單（附表2-E）。但是，Downs＆Black清單[26]和NICE清單[11]現(xiàn)已不常使用或不被推薦使用。

NOS量表[44-45]由澳大利亞紐卡斯?fàn)柎髮W(xué)和加拿大渥太華大學(xué)之間合作研發(fā)，是目前評(píng)價(jià)隊(duì)列研究最常用的工具，使用者可以根據(jù)特定主題進(jìn)行修改。

2.2 病例-對(duì)照研究

病例-對(duì)照研究根據(jù)是否存在特定疾病或狀況選擇受試者，并尋找可能導(dǎo)致疾病或結(jié)局的早期暴露因素[42]。相比隊(duì)列研究，它的優(yōu)勢(shì)在于不會(huì)出現(xiàn)受試者“脫落”或“失訪”的問(wèn)題。目前，有一些可評(píng)估病例-對(duì)照研究方法學(xué)質(zhì)量的工具，包括CASP病例-對(duì)照研究清單（附表2-F）、SIGN病例-對(duì)照研究清單（附表2-G）、NIH病例-對(duì)照研究質(zhì)量評(píng)價(jià)工具（附表2-H），JBI病例-對(duì)照研究清單（附表2-I）和NOS病例-對(duì)照研究量表（附表2-J）。其中，NOS也是當(dāng)今最常用于評(píng)價(jià)病例-對(duì)照研究的工具，并且可以根據(jù)特定的主題進(jìn)行修改。

此外，Downs＆Black清單[26]和NICE清單[11]現(xiàn)已不常用或不被推薦使用。

2.3 橫斷面研究（分析性或描述性）

橫斷面研究是用來(lái)提供某個(gè)時(shí)間點(diǎn)特定人群中疾病和其他變量的研究。它可以分為分析性和描述性。描述性橫斷面研究?jī)H描述特定人群在某個(gè)時(shí)間點(diǎn)或一段時(shí)間內(nèi)的病例或事件的數(shù)量；而分析性橫斷面研究可用于推斷疾病與其他變量之間的關(guān)系[46]。

為了評(píng)估分析性橫斷面研究的質(zhì)量，目前推薦的工具有NIH質(zhì)量評(píng)價(jià)工具（附表2-C），JBI分析性橫斷面研究評(píng)估清單（附表2-K）和橫斷面研究評(píng)價(jià)工具（appraisal tool for cross-sectional studies，AXIS工具，附表2-L）[47]。AXIS工具是一項(xiàng)評(píng)估研究設(shè)計(jì)和報(bào)告質(zhì)量以及偏倚風(fēng)險(xiǎn)的工具，該工具于2016年開(kāi)發(fā)，包含20個(gè)條目。在這三種工具中，JBI清單是最常用的一種。

通常使用描述性橫斷面研究來(lái)描述疾病的患病率和發(fā)病率。因此，用于分析性橫截面研究的評(píng)價(jià)工具并不適用。只有很少的質(zhì)量評(píng)價(jià)工具適用于描述性橫斷面研究，例如用于報(bào)告流行率數(shù)據(jù)研究的JBI量表[48]（附表2-M），美國(guó)衛(wèi)生保健質(zhì)量和研究機(jī)構(gòu)（AHRQ）用于評(píng)估橫斷面研究/患病率研究的方法學(xué)量表（附表2-N），以及Crombie用于評(píng)估橫斷面研究質(zhì)量的條目[49]（附表2-O）。其中，JBI工具是最新的。

2.4 病例系列和病例報(bào)告

與上述干預(yù)性病例系列不同，病例報(bào)告和病例系列用于報(bào)告新發(fā)疾病或獨(dú)特發(fā)現(xiàn)[50]。因此，它們屬于描述性研究。僅有JBI清單這一種工具用于病例報(bào)告的方法學(xué)質(zhì)量評(píng)價(jià)（附表2-P）。

2.5 比較效果研究

比較效果研究（comparative effectiveness research，CER）比較了某醫(yī)療條件的替代治療方案真實(shí)世界情況下的結(jié)果[51]。它的關(guān)鍵要素包括效果的研究（在真實(shí)世界中的效果），而不是效力（理想效果），以及替代策略之間的比較[52]。2010年，比較效果的優(yōu)良研究（GRACE）團(tuán)隊(duì)成立并制定了相關(guān)原則，以幫助醫(yī)療保健提供者、研究人員、期刊讀者和編輯者評(píng)估觀察性比較效果研究的質(zhì)量[41]。2016年，發(fā)布了GRACE清單5.0版（附表2-Q），用于評(píng)估CER的質(zhì)量。

2.6 診斷性研究

臨床醫(yī)生使用診斷試驗(yàn)（也稱為“診斷準(zhǔn)確性試驗(yàn)，DTA”）來(lái)確定患者是否存在某種狀況，從而制定適當(dāng)?shù)闹委熡?jì)劃[53]。DTA在設(shè)計(jì)方面具有一些獨(dú)特的特征，這些特征不同于標(biāo)準(zhǔn)的干預(yù)性研究和觀察性研究。2003年，Whiting等[53-54]開(kāi)發(fā)了一種評(píng)估DTA質(zhì)量的工具，即診斷準(zhǔn)確性研究質(zhì)量評(píng)估（quality assessment of diagnostic accuracy studies，QUADAS）工具。2011年，推出了修訂的“QUADAS-2”工具（附表2-R）[55-56]。此外，該領(lǐng)域常用的評(píng)價(jià)工具有CASP診斷清單（附表2S）、SIGN診斷研究清單（附表2-T）、JBI診斷準(zhǔn)確性試驗(yàn)評(píng)估清單（附表2-U）和Cochrane診斷準(zhǔn)確性試驗(yàn)偏倚風(fēng)險(xiǎn)評(píng)估工具（附表2-V）。

其中，Cochrane偏倚風(fēng)險(xiǎn)工具（https://meth ods.cochrane.org/sdt/）基于QUADAS工具，而SIGN清單和JBI清單則基于QUADAS-2工具。目前QUADAS-2工具是最為推薦的工具。在2004年Whiting等[53]綜述中提及的其他相關(guān)工具如今已不再使用。

3 其他類型一次研究

3.1 衛(wèi)生經(jīng)濟(jì)學(xué)評(píng)價(jià)

衛(wèi)生經(jīng)濟(jì)學(xué)評(píng)價(jià)研究比較了替代干預(yù)措施的資源使用、成本和健康影響[57]。它著重于確定、衡量、評(píng)估和比較兩種或多種替代干預(yù)方案的資源使用、成本和效益/效果[58]。如今，衛(wèi)生經(jīng)濟(jì)學(xué)研究越來(lái)越受歡迎。當(dāng)然，其方法學(xué)質(zhì)量也需要在使用之前進(jìn)行評(píng)估。Drummond和Jefferson在1996年開(kāi)發(fā)了第一個(gè)進(jìn)行此類評(píng)估的工具[59]，之后，許多工具根據(jù)Drummond的條款或其修訂版[60]被開(kāi)發(fā)出來(lái)。例如SIGN經(jīng)濟(jì)學(xué)評(píng)價(jià)清單（附表3-A），CASP經(jīng)濟(jì)學(xué)評(píng)價(jià)清單（附表3-B）、JBI經(jīng)濟(jì)學(xué)評(píng)價(jià)清單（附表3-C）和NICE用于經(jīng)濟(jì)學(xué)評(píng)價(jià)的方法清單（附表3-D）等。

我們認(rèn)為綜合健康經(jīng)濟(jì)評(píng)估報(bào)告標(biāo)準(zhǔn)（consolidated health economic evaluation reporting standards，CHEERS）聲明[61]屬于報(bào)告工具，而不是方法學(xué)質(zhì)量評(píng)價(jià)工具，因此不建議使用它來(lái)評(píng)估衛(wèi)生經(jīng)濟(jì)學(xué)評(píng)價(jià)研究的方法學(xué)質(zhì)量。

3.2 質(zhì)性研究

在醫(yī)療保健領(lǐng)域，質(zhì)性研究旨在理解和解釋個(gè)人經(jīng)歷、行為、互動(dòng)和社會(huì)環(huán)境，以解釋感興趣的現(xiàn)象，例如患者和臨床醫(yī)生的態(tài)度、信念和觀點(diǎn)，照顧者與患者之間的人際關(guān)系，疾病經(jīng)歷，以及患者痛苦的影響[62]。與定量研究相比，用于質(zhì)性研究的評(píng)價(jià)工具更少。如今，CASP質(zhì)性研究清單（附表3-E）是最常用的工具。此外，JBI質(zhì)性研究清單[63-64]（附表3-F）和英國(guó)國(guó)家社會(huì)研究中心的質(zhì)性研究評(píng)估框架[65]（附表3-G）也同樣適用。

3.3 預(yù)測(cè)研究

臨床預(yù)測(cè)研究包括預(yù)測(cè)因子發(fā)現(xiàn)（預(yù)后因素）研究，預(yù)測(cè)模型研究（研發(fā)、驗(yàn)證以及擴(kuò)展或更新）和預(yù)測(cè)模型影響研究[66]。對(duì)于預(yù)測(cè)因子發(fā)現(xiàn)研究，可以使用預(yù)后研究質(zhì)量（quality in prognosis studies，QIPS）工具[67]評(píng)估其方法學(xué)質(zhì)量（附表3-H）。對(duì)于預(yù)測(cè)模型影響研究，如果使用隨機(jī)比較設(shè)計(jì)，則可以使用RCT評(píng)價(jià)工具，如RoB 2.0工具。如果使用非隨機(jī)比較設(shè)計(jì)，則可以使用非隨機(jī)研究工具，如ROBINS-I工具。對(duì)于診斷和預(yù)后預(yù)測(cè)模型研究，可以使用預(yù)測(cè)模型偏倚風(fēng)險(xiǎn)評(píng)價(jià)工具（prediction model risk of bias assessment tool，PROBAST；附表3-I）[68]和CASP臨床預(yù)測(cè)規(guī)則清單（附表3-J）。

3.4 文獻(xiàn)和專家觀點(diǎn)

基于文獻(xiàn)和專家觀點(diǎn)的證據(jù)（也稱為“非研究證據(jù)”）來(lái)自各種期刊、雜志、專著和報(bào)告中出現(xiàn)的專家觀點(diǎn)、共識(shí)、論述、評(píng)論以及假說(shuō)[69-71]。如今，只有JBI清單可用于評(píng)估文獻(xiàn)和專家觀點(diǎn)的質(zhì)量（附表3-K）。

3.5 結(jié)局測(cè)量工具

結(jié)果測(cè)量工具用于收集測(cè)量結(jié)果。“工具”一詞涵蓋的范圍很廣，可以指問(wèn)卷（例如患者報(bào)告的生活質(zhì)量結(jié)果、觀察（例如臨床檢查的結(jié)果）、量表（例如視覺(jué)模擬量表）、實(shí)驗(yàn)室檢查（例如血液檢查）和影像學(xué)（例如超聲或其他醫(yī)學(xué)成像）[72-73]。測(cè)量可以是主觀的或客觀的，可以是一維的（例如態(tài)度）或多維的。目前，只有基于共識(shí)標(biāo)準(zhǔn)選擇健康測(cè)量工具（COSMIN）偏倚風(fēng)險(xiǎn)量表[74-76]（https://www.cosmin.nl/）這一種工具適合評(píng)估結(jié)果測(cè)量工具的方法學(xué)質(zhì)量，附表3-L列出了其主要項(xiàng)目，包括患者報(bào)告結(jié)果測(cè)量（patient-reported outcome measure，PROM）的發(fā)展（附表3-LA）、內(nèi)容真實(shí)性（附表3-LB）、結(jié)構(gòu)真實(shí)性（附表3-LC）、內(nèi)部一致性（附表3-LD）、跨文化真實(shí)性/測(cè)量不變性（附表3-LE）、信度（附表3-LF）、測(cè)量誤差（附表3-LG）、校標(biāo)真實(shí)性（附表3-LH）、結(jié)構(gòu)真實(shí)性假設(shè)檢驗(yàn)（附表3-LI）和反應(yīng)度（附表3-LJ）。

4 二次研究

4.1 系統(tǒng)評(píng)價(jià)與Meta分析

系統(tǒng)評(píng)價(jià)與Meta分析是總結(jié)當(dāng)前醫(yī)學(xué)文獻(xiàn)的科學(xué)方法[4-6]，其最終目的和價(jià)值在于促進(jìn)醫(yī)療保健[6,77-78]。Meta分析是一個(gè)將多項(xiàng)研究結(jié)果合并的統(tǒng)計(jì)過(guò)程，通常是系統(tǒng)評(píng)價(jià)的一部分[11]。當(dāng)然，在使用系統(tǒng)評(píng)價(jià)與Meta分析之前，必須進(jìn)行嚴(yán)格的評(píng)價(jià)。

1988年，Sacks等開(kāi)發(fā)了第一個(gè)評(píng)估基于RCT的Meta分析的質(zhì)量工具——Sack質(zhì)量評(píng)估清單（sack’s quality assessment checklist，SQAC）[79]；1991年，Oxman和Guyatt開(kāi)發(fā)了另一個(gè)工具——概述質(zhì)量評(píng)估問(wèn)卷（overview quality assessment questionnaire，OQAQ）[80-81]。為了克服這兩個(gè)工具的缺點(diǎn)，2007年，基于這兩個(gè)工具開(kāi)發(fā)了一種評(píng)估系統(tǒng)評(píng)價(jià)的評(píng)價(jià)工具（a measurement tool to assess systematic reviews，AMSTAR）[82]（https://www.amstar.ca/）。但是，初始版本的AMSTAR工具并未包含對(duì)非隨機(jī)研究偏倚風(fēng)險(xiǎn)的評(píng)估，專家組認(rèn)為修訂應(yīng)針對(duì)系統(tǒng)評(píng)價(jià)的所有方面。因此，2017年發(fā)布了用于評(píng)價(jià)隨機(jī)和非隨機(jī)研究的新工具——AMSTAR 2[83]，附表4-A列出了其主要項(xiàng)目。

此外，CASP的系統(tǒng)評(píng)價(jià)清單（附表4-B）、SIGN的系統(tǒng)評(píng)價(jià)與Meta分析評(píng)價(jià)清單（附表4-C）、JBI的系統(tǒng)評(píng)價(jià)與研究整合評(píng)價(jià)清單（附表4-D）、NIH的系統(tǒng)評(píng)價(jià)與Meta分析質(zhì)量評(píng)價(jià)工具（附表4-E）、英國(guó)約克大學(xué)決策支持單位（decision support unit，DSU）網(wǎng)狀Meta分析（NMA）方法學(xué)清單（附表4-F）和系統(tǒng)評(píng)價(jià)偏倚風(fēng)險(xiǎn)（risk of bias in systematic review，ROBIS）[84]工具（附表4-G）都可用于系統(tǒng)評(píng)價(jià)與Meta分析的質(zhì)量評(píng)價(jià)。其中，最常用的是AMSTAR 2、最常建議使用的是ROIBS。

在這些工具中，AMSTAR 2適用于評(píng)估隨機(jī)或非隨機(jī)干預(yù)性研究的系統(tǒng)評(píng)價(jià)和Meta分析，DSU-NMA方法清單適用于網(wǎng)狀Meta分析，而ROBIS適用于干預(yù)性研究、診斷準(zhǔn)確性試驗(yàn)、臨床預(yù)測(cè)和預(yù)后研究的Meta分析。

4.2 臨床實(shí)踐指南

CPG很好地融入了臨床醫(yī)生和專業(yè)臨床組織的觀念或經(jīng)驗(yàn)[85-87]；并將科學(xué)證據(jù)納入臨床實(shí)踐[88]。但是，并非所有的CPG都是基于證據(jù)的[89-90]，其質(zhì)量也參差不齊[91-93]。到目前為止，已經(jīng)開(kāi)發(fā)了20多種評(píng)價(jià)工具[94]。其中，指南研究與評(píng)價(jià)工具（AGREE）可作為開(kāi)發(fā)臨床途徑評(píng)價(jià)工具的基礎(chǔ)[94]。AGREE工具于2003年首次發(fā)布[95]，并于2009年更新為AGREE II工具[96]（https://www.agreetrust.org/）?，F(xiàn)在，AGREE II工具是用于評(píng)價(jià)CPG最為推薦的工具（附表4-H）。

此外，基于AGREE II，開(kāi)發(fā)了AGREE全球評(píng) 級(jí) 量表（agree global rating scale，AGREE GRS）工具[97]，作為評(píng)估CPG質(zhì)量和報(bào)告的簡(jiǎn)要工具。

5 結(jié)語(yǔ)

目前，循證醫(yī)學(xué)已被廣泛接受，醫(yī)護(hù)人員的主要注意力在于“從證據(jù)到建議”[98-99]。因此，在使用之前對(duì)證據(jù)進(jìn)行嚴(yán)格的評(píng)價(jià)是該過(guò)程的關(guān)鍵[100-101]。1987年，Mulrow CD[102]指出，醫(yī)學(xué)綜述需要常規(guī)使用科學(xué)的方法來(lái)識(shí)別、評(píng)估和綜合信息。故在使用研究結(jié)果之前，必須對(duì)研究進(jìn)行方法學(xué)質(zhì)量評(píng)估。盡管自第一個(gè)質(zhì)量評(píng)價(jià)工具問(wèn)世以來(lái)已經(jīng)過(guò)去了20多年，但許多用戶仍然誤解了方法學(xué)質(zhì)量和報(bào)告質(zhì)量。其中，有人使用報(bào)告清單來(lái)評(píng)估方法學(xué)質(zhì)量，例如使用報(bào)告臨床試驗(yàn)的統(tǒng)一標(biāo)準(zhǔn)（consolidated standards of reporting trials，CONSORT）聲明[103]來(lái)評(píng)估RCT的方法學(xué)質(zhì)量，使用流行病學(xué)觀察性研究增強(qiáng)報(bào)告（strengthening the reporting of observational studies in epidemiology，STROBE）評(píng)價(jià)隊(duì)列研究方法學(xué)質(zhì)量[104]。這種現(xiàn)象表明，需要對(duì)醫(yī)學(xué)生和專業(yè)人員進(jìn)行更多的臨床流行病學(xué)普及教育。

方法學(xué)質(zhì)量工具應(yīng)根據(jù)不同研究類型的特征開(kāi)發(fā)。本文中，我們使用“methodological quality”“risk of bias”“critical appraisal”“checklist”“scale”“items”和“assessment tool”在 NICE 網(wǎng)站、SIGN網(wǎng)站、Cochrane圖書館網(wǎng)站和JBI網(wǎng)站中進(jìn)行搜索。在此基礎(chǔ)上，在PubMed中檢索了“systematic review”“meta-analysis”“overview”和“clinical practice guideline”。與本團(tuán)隊(duì)之前的系統(tǒng)評(píng)價(jià)[11]相比，我們發(fā)現(xiàn)一些工具仍被推薦和使用，某些工具仍在使用但未被推薦，而有些則被淘汰[10,29-30,36,53,94,105-107]。這些工具極大地推動(dòng)了臨床實(shí)踐的發(fā)展[108-109]。

此外，相較本團(tuán)隊(duì)既往研究成果[11]，本文列出了更多的工具，尤其是2014年之后開(kāi)發(fā)的新工具和最新修訂版。當(dāng)然，我們還調(diào)整了研究類型分類的方法。首先，2014年，NICE提供了7個(gè)方法學(xué)檢查清單，但現(xiàn)在僅保留和更新了經(jīng)濟(jì)學(xué)評(píng)價(jià)清單。此外，Cochrane RoB 2.0工具、AMSTAR 2工具、CASP清單和大多數(shù)JBI清單都是最新修訂版；NIH的質(zhì)量評(píng)價(jià)工具、ROBINS-I工具、EPOC RoB工具、AXIS工具、GRACE清單、PROBAST、COSMIN偏倚風(fēng)險(xiǎn)清單和ROBIS工具都是新發(fā)布的工具。其次，本文還介紹了用于評(píng)價(jià)網(wǎng)狀Meta分析、結(jié)果測(cè)量工具、文獻(xiàn)和專家觀點(diǎn)、預(yù)測(cè)研究、質(zhì)性研究、衛(wèi)生經(jīng)濟(jì)學(xué)評(píng)估和CER的工具。第三，我們將干預(yù)研究分為隨機(jī)和非隨機(jī)兩種亞型，然后將非隨機(jī)研究進(jìn)一步分為有對(duì)照組和無(wú)對(duì)照組；此外，還將橫斷面研究分為分析性和描述性兩種亞型，病例系列分為干預(yù)性和觀察性兩種亞型。這些分類更加客觀和全面。

顯然，適用于RCT的評(píng)價(jià)工具數(shù)量最多，其次是隊(duì)列研究。JBI的適用范圍最廣[63-64]，CASP緊隨其后。但是，仍需進(jìn)一步努力來(lái)開(kāi)發(fā)評(píng)價(jià)工具。對(duì)于某些研究類型，僅有一種適用的評(píng)價(jià)工具，例如CER、結(jié)果測(cè)量工具、文獻(xiàn)和專家觀點(diǎn)、病例報(bào)告和CPG。此外，對(duì)于許多研究類型，例如概述、遺傳關(guān)聯(lián)研究和細(xì)胞研究，都沒(méi)有合適的評(píng)價(jià)工具。而且現(xiàn)有些工具尚未被學(xué)界完全認(rèn)可。將來(lái)，如何開(kāi)發(fā)公認(rèn)的工具仍然是一項(xiàng)具有重要意義的工作[11]。

本綜述可以幫助系統(tǒng)評(píng)價(jià)、Meta分析、指南和證據(jù)使用者等專業(yè)人員在產(chǎn)生或使用證據(jù)時(shí)選擇最佳工具。而且，方法學(xué)家可以獲得開(kāi)發(fā)新工具的研究主題。最重要的是，我們必須明白，所有評(píng)價(jià)工具都是主觀的，使用這些工具時(shí)會(huì)受到用戶的技能和知識(shí)水平的影響。因此，用戶必須接受正規(guī)培訓(xùn)（必須具備相關(guān)的流行病學(xué)知識(shí)），具有嚴(yán)謹(jǐn)?shù)膶W(xué)術(shù)態(tài)度，并且至少應(yīng)由兩名獨(dú)立的審閱者參與評(píng)估和交叉檢查，以最大限度地避免出現(xiàn)實(shí)施偏倚[110]。

附表中文版位置說(shuō)明

附表1：干預(yù)性研究評(píng)估工具及其主要組成部分

附表2：觀察性研究和診斷研究評(píng)估工具及其主要組成部分

附表3：醫(yī)學(xué)領(lǐng)域其他的一次研究評(píng)估工具及其主要組成部分

附表4：醫(yī)學(xué)二次醫(yī)學(xué)研究評(píng)估工具及其主要組成部分

讀者可自《醫(yī)學(xué)新知》官網(wǎng)（http://www.jnewmed.com/）相對(duì)應(yīng)文章中獲取。

亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放