周 奇 張 淵 楊 楠 陳耀龍
臨床決策不僅要考慮研究的證據(jù)質(zhì)量,還需要考慮結(jié)局指標(biāo)的重要性、患者偏好與價(jià)值觀、利弊平衡、資源使用、公平性、可接受性、可行性等因素,最后綜合上述因素給出臨床決策最佳的方向和強(qiáng)度[1,2]。
本文重點(diǎn)解讀GRADE工作組推出的系列文章的第19篇中的偏倚風(fēng)險(xiǎn)和間接性進(jìn)行可靠性分級(jí)的原理[3]。由于結(jié)局指標(biāo)重要性也可表述為患者偏好與價(jià)值觀,下文統(tǒng)一簡(jiǎn)稱(chēng)為“結(jié)局重要性”。需要說(shuō)明的是,在解讀中以文獻(xiàn)[4]為例,深化理解GRADE在結(jié)局重要性上的運(yùn)用,以期更清晰地理解和正確使用GRADE。
基于前期的文獻(xiàn)回顧、具體實(shí)例運(yùn)用和專(zhuān)家線上咨詢(xún)等主要過(guò)程,GRADE工作組形成了針對(duì)“結(jié)局重要性”進(jìn)行證據(jù)質(zhì)量分級(jí)的方法學(xué)指導(dǎo)。該方法學(xué)指導(dǎo)于2017年4月的GRADE工作組會(huì)議上被正式通過(guò)[3,5]。該方法學(xué)指導(dǎo)與此前干預(yù)性研究的證據(jù)體分級(jí)原理類(lèi)似,在進(jìn)行結(jié)局重要性證據(jù)分級(jí)時(shí),所有研究設(shè)計(jì)的證據(jù)都從“高質(zhì)量”開(kāi)始,然后基于5個(gè)降級(jí)因素[6-11]的考量,最終給出綜合性證據(jù)等級(jí):高、中等、低或極低質(zhì)量。本文將解讀如何基于“偏倚風(fēng)險(xiǎn)”和“間接性”2個(gè)降級(jí)因素對(duì)結(jié)局重要性進(jìn)行證據(jù)分級(jí);“不一致性”、“不精確性”及“發(fā)表偏倚”降級(jí)因素在GRADE指南20[12]中解讀。
1.1 偏倚風(fēng)險(xiǎn) GRADE工作組確定了4個(gè)影響“結(jié)局重要性”研究偏倚風(fēng)險(xiǎn)的領(lǐng)域(表1):①受試者遴選領(lǐng)域:指入選的研究樣本在多大程度上反映預(yù)期人群,如果不同的人群特征與結(jié)局重要性有關(guān),不恰當(dāng)?shù)臉颖具x擇將導(dǎo)致對(duì)結(jié)局重要性的估計(jì)出現(xiàn)偏差。②數(shù)據(jù)完整性領(lǐng)域:指應(yīng)答者和未應(yīng)答者在多大程度上相似,隨訪過(guò)程中的高失訪率或橫斷面研究的低回復(fù)率可能導(dǎo)致參與者與未參與者在結(jié)局重要性上存在系統(tǒng)差異。③測(cè)量工具領(lǐng)域:指多大程度上選擇了有效的工具測(cè)量結(jié)局重要性,并且測(cè)量結(jié)果得到管理。④數(shù)據(jù)分析領(lǐng)域:是指估計(jì)值在多大程度上被不恰當(dāng)?shù)臄?shù)據(jù)分析扭曲,而分析中的調(diào)整、分層和模型選擇能否避免混雜因素造成的結(jié)果扭曲。
針對(duì)偏倚風(fēng)險(xiǎn)的4個(gè)評(píng)價(jià)領(lǐng)域,評(píng)價(jià)者需要對(duì)7個(gè)標(biāo)志性問(wèn)題進(jìn)行回答,每個(gè)標(biāo)志性問(wèn)題回答結(jié)果為“是”(Y)、“可能是”(PY)、“可能不是”(PN)或“不是”(N),基于回答結(jié)果對(duì)各個(gè)領(lǐng)域給出偏倚風(fēng)險(xiǎn)的程度——“低偏倚風(fēng)險(xiǎn)”、“中等偏倚風(fēng)險(xiǎn)”、“高偏倚風(fēng)險(xiǎn)”、“極高偏倚風(fēng)險(xiǎn)”。最終基于4個(gè)領(lǐng)域的偏倚風(fēng)險(xiǎn)程度,給出總體的偏倚風(fēng)險(xiǎn),即低、中等、高、極高偏倚風(fēng)險(xiǎn)(表1)。
1.2 間接性 在間接性方面,GRADE工作組提出2個(gè)影響結(jié)局重要性的領(lǐng)域(表2)。①PICO的間接性:如果納入證據(jù)體的研究人群、干預(yù)方案和測(cè)量結(jié)局與研究問(wèn)題所關(guān)注的研究人群、干預(yù)方案和測(cè)量結(jié)局不一樣,勢(shì)必會(huì)降低對(duì)證據(jù)體結(jié)果的可靠程度[13]。例如:關(guān)注的臨床問(wèn)題是“糖尿病患者最關(guān)心哪些預(yù)后結(jié)局?”,此時(shí)針對(duì)該臨床問(wèn)題系統(tǒng)評(píng)價(jià)納入的人群中,有20%左右的人群是高血糖人群,那么在“P”這個(gè)層面上,證據(jù)體存在一定的間接性,通常需要降級(jí)。②方法學(xué)的間接性:用于形成結(jié)局重要性的方法也可能作為間接性的來(lái)源。例如,研究人員使用間接測(cè)量工具(即多屬性效用量表)來(lái)衡量結(jié)局的效用,而這些工具的開(kāi)發(fā)和映射算法,一般是基于其他人群樣本,因此會(huì)存在間接性[14]。
表1 偏倚風(fēng)險(xiǎn)評(píng)價(jià)領(lǐng)域和標(biāo)志性問(wèn)題
針對(duì)間接性的2個(gè)評(píng)價(jià)領(lǐng)域,評(píng)價(jià)者需要對(duì)4個(gè)標(biāo)志性問(wèn)題進(jìn)行回答?;诨卮鸾Y(jié)果,綜合得出證據(jù)體需要降級(jí)的級(jí)數(shù)。
表2 間接性評(píng)價(jià)領(lǐng)域和標(biāo)志性問(wèn)題
文獻(xiàn)[4]中針對(duì)靜脈血栓栓塞性疾病管理的系列結(jié)局進(jìn)行了重要性證據(jù)分級(jí),本文節(jié)選了其中“預(yù)防性使用醫(yī)療裝置的治療負(fù)擔(dān)”和“不良事件”兩個(gè)結(jié)局,對(duì)偏倚風(fēng)險(xiǎn)和間接性的分級(jí)進(jìn)行實(shí)例解讀(表3)。
表3 VTE管理重要性結(jié)局的偏倚風(fēng)險(xiǎn)與間接性分級(jí)
2.1 預(yù)防性使用醫(yī)療裝置的治療負(fù)擔(dān) 3篇橫斷面研究[15-17]評(píng)估了預(yù)防性使用醫(yī)療裝置的治療負(fù)擔(dān)的重要性,其分級(jí)結(jié)果顯示:在偏倚風(fēng)險(xiǎn)方面,在測(cè)量工具領(lǐng)域均存在不同程度的偏倚,尤其是文獻(xiàn)[17]研究者直接采用詢(xún)問(wèn)的方式獲取受試者更喜歡的給藥途徑,而沒(méi)有采用合理的測(cè)量工具。除此之外,研究者也沒(méi)有核查受試者是否理解工具的含義,同時(shí)也沒(méi)有描述治療后的可能結(jié)局。因此,基于3篇中等或高偏倚風(fēng)險(xiǎn)的研究,在偏倚風(fēng)險(xiǎn)方面降1級(jí)。在間接性方面,3篇研究在PICO方面存在間接性,文獻(xiàn)[16]評(píng)估的是順序壓縮裝置和血栓彈力襪干預(yù)的效果,而文獻(xiàn)[15,17]評(píng)估的是足泵裝置的干預(yù)效果??紤]到足泵裝置干預(yù)與研究問(wèn)題所關(guān)注的干預(yù)措施有所差異,因此在間接性方面也需要降1級(jí)。
2.2 治療相關(guān)的不良事件 4篇橫斷面研究[18-21]評(píng)估了治療相關(guān)不良事件的重要性,其分級(jí)結(jié)果顯示:在偏倚風(fēng)險(xiǎn)方面,僅文獻(xiàn)[19]為低偏倚風(fēng)險(xiǎn),文獻(xiàn)[18,21]未闡述受試者人群的回復(fù)率,文獻(xiàn)[20]未給出明確的抽樣方法,文獻(xiàn)[18,20]直接采用詢(xún)問(wèn)方式獲取受試者更喜歡的給藥途徑,而未采用合理的測(cè)量工具。綜合4篇研究,在偏倚風(fēng)險(xiǎn)方面降1級(jí)。在間接性方面,基于對(duì)4個(gè)標(biāo)志性問(wèn)題判定后,4篇研究在PICO和方法學(xué)上均未發(fā)現(xiàn)相關(guān)的間接性,故不降級(jí)。
3.1 結(jié)局重要性評(píng)價(jià)并非結(jié)局測(cè)量工具 結(jié)局重要性是患者或受試者對(duì)結(jié)局的價(jià)值觀偏好,此前尚無(wú)專(zhuān)門(mén)的評(píng)價(jià)工具,而原文作者首次提出了結(jié)局重要性研究偏倚風(fēng)險(xiǎn)的評(píng)估工具。結(jié)局測(cè)量工具是對(duì)結(jié)局的定義和量化,可以采用基于共識(shí)的衛(wèi)生測(cè)量工具選擇標(biāo)準(zhǔn)(COSMIN)進(jìn)行評(píng)估[22],因此兩者在本質(zhì)上的使用是有所差異的。
3.2 結(jié)局重要性的偏倚風(fēng)險(xiǎn)評(píng)價(jià)與干預(yù)性研究判斷類(lèi)似 每個(gè)領(lǐng)域的偏倚風(fēng)險(xiǎn)對(duì)結(jié)局重要性研究估計(jì)值的影響大小分為低、中等、高、極高,只有所有領(lǐng)域?yàn)榈推酗L(fēng)險(xiǎn)時(shí),該研究才為低偏倚風(fēng)險(xiǎn),而只要有1個(gè)領(lǐng)域?yàn)闃O高偏倚風(fēng)險(xiǎn),研究即為極高偏倚風(fēng)險(xiǎn)。結(jié)局重要性的證據(jù)體根據(jù)有偏倚風(fēng)險(xiǎn)的研究對(duì)證據(jù)體的貢獻(xiàn)評(píng)為不嚴(yán)重、嚴(yán)重或非常嚴(yán)重,分別選擇不降級(jí)、降1級(jí)和降2級(jí)[23]。
3.3 系統(tǒng)評(píng)價(jià)和指南對(duì)間接性的判斷有所差異 在大多數(shù)情況下,系統(tǒng)評(píng)價(jià)作者只納入符合PICO納入標(biāo)準(zhǔn)的研究,保證直接性,僅有少數(shù)情況在人群和結(jié)局測(cè)量方面存在間接性[10]。指南評(píng)價(jià)結(jié)局重要性的目的相比系統(tǒng)評(píng)價(jià)更為具體,因此證據(jù)的間接性判斷更為普遍。例如,對(duì)于比較出血風(fēng)險(xiǎn)重要性的系統(tǒng)評(píng)價(jià)而言,服用阿司匹林后發(fā)生的出血與服用華法林后發(fā)生的出血相比不存在間接性,但在指南制定中,患者服用華法林帶來(lái)的出血風(fēng)險(xiǎn)相比阿司匹林帶來(lái)的出血風(fēng)險(xiǎn)顯得更為重要。
結(jié)局指標(biāo)重要性的證據(jù)分級(jí)原理雖然相對(duì)于以往干預(yù)性、診斷性研究證據(jù)分級(jí)而言有所差異,但整體上都是圍繞5個(gè)降級(jí)因素進(jìn)行的。盡管結(jié)局重要性評(píng)估對(duì)指南決策具有重要意義,但調(diào)查研究顯示中國(guó)指南和WHO指南應(yīng)用GRADE的比例(9.5%vs81.3%)和報(bào)告結(jié)局遴選的比例(9.9%vs81.3% )都低[24-26]。為進(jìn)一步改善我國(guó)指南對(duì)結(jié)局重要性評(píng)估的推廣與應(yīng)用,國(guó)內(nèi)已成立的蘭州大學(xué)GRADE中心、寧波諾丁漢 GRADE中心、北京GRADE中心、復(fù)旦大學(xué)GRADE中心應(yīng)聯(lián)合起來(lái),未來(lái)就結(jié)局重要性研究的開(kāi)展、患者參與指南制定、結(jié)局重要性分級(jí)方法的使用等優(yōu)先主題開(kāi)展相應(yīng)的方法學(xué)研究。