王 瑞 張 媛 武睿婕 陳佳齊 王 澤 李雨菲 呂 明, 張崇凡
在GRADE方法學體系中,檢驗試驗(診斷、篩查和病程監(jiān)測)準確性結果是替代指標。制定有關檢驗試驗的推薦意見時,需要考慮從3個方面進行評估:①敏感度和特異度,②基于檢驗試驗結果選擇的干預措施,③干預措施對患者重要結局的影響。理想情況下,應納入直接評估檢驗試驗對患者重要結局影響的研究進行證據(jù)綜合,但此類研究并不多見,因此,需要借助具有間接性的關聯(lián)證據(jù),即可以間接說明基于檢驗試驗結果選擇的干預措施對患者重要結局影響的證據(jù)。GRADE工作組提出,可將檢驗準確性證據(jù)和關聯(lián)證據(jù)作為兩個獨立的證據(jù)體進行合并,對總體證據(jù)質量進行評價,并同時提供了3種方法(系統(tǒng)評價、情境描述和現(xiàn)有證據(jù)綜合),指導指南制定人員結合患者重要結局制定有關檢驗試驗的推薦意見。
2.1 關聯(lián)證據(jù) 一般會使用檢驗試驗準確性研究中的特異度和敏感度來判斷檢驗試驗的影響,但若基于特異度和敏感度評估檢驗試驗對患者重要結局的影響,則需要借助假設和建模來闡述檢驗試驗對假陰性和真陽性患者的利弊。假陰性患者會出現(xiàn)并發(fā)癥或受疾病自然進展的影響,可使用預后研究或治療試驗中的對照組作為關聯(lián)證據(jù),評估檢驗試驗對假陰性患者重要結局的影響。對于真陽性患者,可使用RCT或其他評價治療措施影響的研究作為關聯(lián)證據(jù),結合檢驗試驗真陽性結果的預期絕對效應值評估檢驗試驗對患者重要結局的影響。
2.2 關聯(lián)證據(jù)的類型 研究證據(jù)不足,需要臨床專家根據(jù)經(jīng)驗提供估計值時,應使用決策分析模型,建立決策樹,基于結局發(fā)生的可能性進行預測,構建檢驗準確性、干預措施選擇和健康結局之間的關系。
2.2.1 系統(tǒng)評價 系統(tǒng)評價是有關干預利弊和自然病程的最佳關聯(lián)證據(jù)。比如,WHO宮頸上皮內瘤樣病變(CIN)2/3級的篩查和治療指南中[1],對HPV檢測和VIA檢查2種篩查手段,基于篩查結果選擇的干預措施進行了對比(表1)。評估冷凍療法的影響時,使用了一項基于觀察性研究的系統(tǒng)評價作為關聯(lián)證據(jù),其系統(tǒng)評價結果顯示冷凍治療可使相對危險度降低61%[2]。
表1 基于HPV和VIA篩查結果的干預措施的結局比較
2.2.2 情境描述 基于文獻綜述和專家經(jīng)驗對基線風險和可能的結局進行描述。比如,確定是否應推薦使用皮膚點刺試驗診斷牛奶過敏時[4,5],為了理解皮膚點刺試驗在高驗前概率人群中的假陰性結果預期絕對效應值(264/1 000例)產生的影響,指南工作組在綜合文獻結果和專家經(jīng)驗后,做出了情境描述(表2):疑似牛奶過敏的兒童回家后對牛奶產生過敏反應,父母對此倍感焦慮,可能會在兒童的飲食中剔除多種食物,導致無法得知出現(xiàn)疑似癥狀的真正原因,兒童可能會因此接受不必要的檢查和治療。
表2 基于皮膚點刺和口服食物激發(fā)試驗對治療IgE介導的牛奶過敏結局的影響
2.2.3 現(xiàn)有證據(jù)綜合 可使用其他指南中已有的相關證據(jù)體作為關聯(lián)證據(jù)。比如,根據(jù)WHO血清學檢測診斷肺結核的指南[7],血清學檢測的敏感度為59%,特異度為91%,驗前概率為10%時,假陰性結果和假陽性結果的預期絕對效應值分別為41例/1 000例和81例/1 000例。WHO指南工作組使用肺結核治療指南中已經(jīng)完成的證據(jù)綜合作為關聯(lián)證據(jù),建立診斷結果與后續(xù)治療及其影響之間的關聯(lián),并同時對可能存在藥物不良反應和對醫(yī)療資源的不必要消耗等進行評估(表3)。
表3 血清學檢測和痰液顯微鏡下檢查對診斷肺結核的假陰性和假陽性結果的影響
2.3 證據(jù)質量評價 因無法獲得檢驗試驗對患者重要結局影響的直接證據(jù),而需要使用關聯(lián)證據(jù)時[8],應將檢驗準確性證據(jù)和關聯(lián)證據(jù)視為兩個獨立的證據(jù)體分別進行證據(jù)質量評價,在此基礎上對總體證據(jù)質量進行判定。①使用GRADE方法對檢驗準確性研究的證據(jù)質量進行評價,并在結果總結表中呈現(xiàn)預期絕對效應值。②關聯(lián)證據(jù)的質量評價需要著重關注檢驗準確性估計值與患者重要結局之間的直接相關性程度,即GRADE證據(jù)質量降級標準中的間接性。
對總體證據(jù)質量進行判斷時,首先要找出對推薦意見的制定具有重要意義的1個或多個關聯(lián)證據(jù)體,其中最低的證據(jù)質量級別即為總體證據(jù)質量。比如,WHO CIN2/3級篩查和治療指南中,HPV檢測和VIA檢查2種篩查手段的對比,雖然2種篩查手段的檢驗準確性證據(jù)均為高質量,但指南工作組認為疾病的自然進展和冷凍療法的效果是重要的考量內容,且關聯(lián)證據(jù)體的質量評級為極低,合并后的總體證據(jù)質量則為極低。
制定有關檢驗試驗的推薦意見時,應使用關聯(lián)證據(jù)對敏感度、特異度、和基于檢驗試驗結果選擇的干預措施及其對患者重要結局的利弊影響進行綜合考慮。關聯(lián)證據(jù)具有一定的間接性,所以總證據(jù)體的GRADE質量評價結果為低或極低,推薦意見的制定需結合患者重要結局進行審慎考量,借助GRADE針對診斷問題的決策框架表清晰透明地呈現(xiàn)關聯(lián)關系,確定推薦意見的方向和強度。