羅雙紅
評價受試者結局數(shù)據(jù)缺失(簡稱缺失數(shù)據(jù))相關的偏倚風險在多大程度上降低對證據(jù)體某特定結果的信心,即缺失數(shù)據(jù)對證據(jù)質量的影響,是系統(tǒng)評價中的關鍵問題之一。Cochrane手冊應對這一問題的方案側重于判斷單個研究缺失數(shù)據(jù)偏倚風險的“高”、“低”或“不清楚”,并鼓勵在針對證據(jù)體某特定結局指標統(tǒng)計的Meta分析中基于不同假設進行敏感性分析。但是這種方案難以評價單個研究缺失數(shù)據(jù)偏倚風險對整個證據(jù)體證據(jù)質量的影響,就如何在Meta分析中基于不同假設進行敏感性分析也無具體指導,這涉及考慮缺失數(shù)據(jù)多少、干預組和對照組中的事件發(fā)生率、缺失數(shù)據(jù)的分布以及數(shù)據(jù)缺失的原因等多種現(xiàn)實因素。
為給系統(tǒng)評價中證據(jù)體二分類變量和連續(xù)性變量缺失數(shù)據(jù)相關的偏倚風險判斷提供方法學指導,GRADE 工作組組織有豐富的系統(tǒng)評價工作經驗的臨床流行病學、方法學和生物統(tǒng)計學家組成研究小組,進行系統(tǒng)的文獻調查[1-3],復習和評價目前所有的Meta分析時處理缺失數(shù)據(jù)的可能方法,迭代式討論并在已有的系統(tǒng)評價案例中測試評價過的方法,篩選出最合理的處理缺失數(shù)據(jù)的方法[4-6],并通過2次會議對前期研究贊同的方法再次評價和修訂,最終產生判斷證據(jù)體缺失數(shù)據(jù)相關偏倚風險的GRADE方法[7]。為幫助臨床醫(yī)生理解GRADE方法,以便更好地理解臨床實踐循證指南的證據(jù)質量,現(xiàn)將其介紹并解讀如下。
2.1 方法的應用范圍及相關定義 該方法用于臨床試驗數(shù)據(jù)的Meta分析,不適用于系統(tǒng)評價人員可獲得的個體水平數(shù)據(jù)的Meta分析;且僅用于處理缺失數(shù)據(jù)相關偏倚風險的判斷,不涉及系統(tǒng)評價中的其他偏倚風險判斷。
在GRADE方法中,“缺失數(shù)據(jù)”指系統(tǒng)評價人員不能獲得的受試者結局數(shù)據(jù),包含兩類數(shù)據(jù):①原始研究人員無法獲得的數(shù)據(jù);②原始研究人員可以獲得,但既未發(fā)表也未能提供給系統(tǒng)評價人員的數(shù)據(jù)。處理缺失數(shù)據(jù)首先需確定一組受試者是否有缺失數(shù)據(jù)(例如,撤回同意或違反治療方案的受試者),而困難在于原始研究作者有時不清楚應如何報告并在統(tǒng)計分析中處理缺失數(shù)據(jù)(例如,排除缺失數(shù)據(jù)的受試者或對缺失數(shù)據(jù)做出假設)。因此GRADE工作組強調在進行受試者結局數(shù)據(jù)缺失相關偏倚風險評估前應盡一切可能從原始研究作者那里獲得未報告但可能可用的結局數(shù)據(jù),或者至少了解他們是如何處理缺失數(shù)據(jù)的。
GRADE方法中專門指出“缺失數(shù)據(jù)的處理”不同于意向性分析(ITT)。其理由如下:ITT強調按被隨機分配的組別分析受試者數(shù)據(jù),其就“受試者數(shù)據(jù)分析”的定義存在不同。有人認為ITT分析只在沒有失訪的情況下才可能實現(xiàn);有人認為ITT分析需要填補缺失數(shù)據(jù);還有人認為ITT分析應僅限于分析有可用數(shù)據(jù)的受試者,而缺失數(shù)據(jù)應作為一個單獨的問題來處理。GRADE工作組是將缺失數(shù)據(jù)作為一個單獨的問題放在敏感性分析中解決。
2.2 方法的基本思想/邏輯
2.2.1 確定主分析 GRADE方法只納入有數(shù)據(jù)的受試者進行Meta分析的主分析;如果對缺失數(shù)據(jù)相關偏倚的方向和大小很有把握,也可以將直接填補后的結果作為主分析。
2.2.2 數(shù)據(jù)填補及敏感性分析 對于主分析顯示試驗組干預措施有益且統(tǒng)計學上效果顯著的結果,敏感性分析的目的是檢測“針對某特定的結局指標,試驗組干預措施確實有益且效果顯著”這一推斷的穩(wěn)定性。具體方法是在納入的原始研究中進行一系列逐步嚴格的缺失數(shù)據(jù)填補,即假設缺失數(shù)據(jù)受試者的結果比數(shù)據(jù)可用受試者的結果更不利于顯示試驗組干預措施有效,且這種傾向性逐步增高,則逐次對經不同傾向性填補后的各項研究進行Meta分析,觀察不同傾向性數(shù)據(jù)填補對Meta分析結果點估計和區(qū)間估計的影響。
對于主分析顯示試驗組干預措施有害且統(tǒng)計學上效果顯著的結果,可以進行類似的敏感性分析檢測“針對某特定的結局指標,試驗組干預措施確實有害且效果顯著”這一推斷的穩(wěn)定性。即假設試驗組缺失數(shù)據(jù)受試者不良事件的發(fā)生率比同組數(shù)據(jù)可用受試者更低,和/或對照組缺失數(shù)據(jù)受試者不良事件的發(fā)生率比同組數(shù)據(jù)可用受試者更高,且這種傾向性逐步增高,則逐次對經不同傾向性填補后的各項研究進行Meta分析,觀察不同傾向性數(shù)據(jù)填補對Meta分析結果點估計和區(qū)間估計的影響。
依此類推,可以通過假設試驗組缺失數(shù)據(jù)受試者中不良事件發(fā)生率高于同組數(shù)據(jù)可用受試者,和/或假設對照組缺失數(shù)據(jù)受試者中不良事件發(fā)生率低于同組數(shù)據(jù)可用受試者的敏感性分析來檢測“干預措施無害”推斷的穩(wěn)定性;假設試驗組缺失數(shù)據(jù)受試者中有益事件的發(fā)生率高于數(shù)據(jù)可用受試者,和/或對照組缺失數(shù)據(jù)受試者中有益事件的發(fā)生率低于數(shù)據(jù)可用受試者的敏感性分析來檢測“干預措施無益”推斷的穩(wěn)定性。
2.3 二分類變量結果缺失數(shù)據(jù)的處理 傳統(tǒng)的缺失數(shù)據(jù)處理采用極端估計值填補與最差情況演示分析的方法,因缺乏合理性,可適用的臨床問題有限。在前述基本思想的基礎上,GRADE工作組采用“按率填補”(imputations using ratios)的方式來填補缺失數(shù)據(jù)并進行敏感性分析,該方式涉及使用RIMPD/FU代表缺失數(shù)據(jù)填補傾向性的大小,其定義如下:
舉例說明如下,并可依此類推。
若以不良事件發(fā)生率(如:艱難梭菌感染)為結局指標的主分析顯示試驗組干預措施(如:益生菌)有益(如:預防接受抗生素治療患者艱難梭菌感染),則試驗組缺失數(shù)據(jù)按照RIMPD/FU=1.5、2.0、2.5、3.0、···、5.0依次填補,即試驗組缺失數(shù)據(jù)受試者不良事件發(fā)生率依次按試驗組數(shù)據(jù)可用受試者不良事件發(fā)生率的1.5、2.0、2.5、3.0、···、5.0倍進行填補;和/或對照組缺失數(shù)據(jù)按照RIMPD/FU=0.7、0.6、0.5、0.4、···、0.1依次填補,即對照組缺失數(shù)據(jù)受試者不良事件發(fā)生率依次按對照組數(shù)據(jù)可用受試者不良事件發(fā)生率的0.7、0.6、0.5、0.4、···、0.1倍進行填補。逐次對不同RIMPD/FU策略填補缺失數(shù)據(jù)后的研究進行Meta分析,觀察隨試驗組RIMPD/FU不斷遞增和/或對照組RIMPD/FU不斷遞減,以不良事件發(fā)生率為結局指標計算的“試驗組干預措施有益”的效應值(如RR值)結果(包括點估計和區(qū)間估計)是否會被反轉,并結合臨床實際討論這種反轉的情況是否可能出現(xiàn),以檢測“試驗組干預措施有益”這一推斷的穩(wěn)定性。若結果穩(wěn)定,則證據(jù)質量不因數(shù)據(jù)缺失的相關偏倚風險而降級,否則應降低證據(jù)質量等級。
若以有害事件發(fā)生率(如:心肌梗死、腦梗死等并發(fā)癥)為結局指標的主分析顯示試驗組干預措施(如:某種治療慢性阻塞性肺病的藥物)有害(如:增加慢性阻死性肺病患者心肌梗死、腦梗死等并發(fā)癥風險),則試驗組缺失數(shù)據(jù)按照RIMPD/FU=0.7、0.6、0.5、0.4、···、0.1依次填補,即試驗組缺失數(shù)據(jù)受試者有害事件發(fā)生率依次按試驗組數(shù)據(jù)可用受試者有害事件發(fā)生率的0.7、0.6、0.5、0.4、···、0.1倍進行填補;和/或對照組缺失數(shù)據(jù)按照RIMPD/FU=1.5、2.0、2.5、3.0、···、5.0依次填補,即對照組缺失數(shù)據(jù)受試者有害事件發(fā)生率依次按對照組數(shù)據(jù)可用受試者有害事件發(fā)生率的1.5、2.0、2.5、3.0、···、5.0倍進行填補。逐次對不同RIMPD/FU策略填補缺失數(shù)據(jù)后的研究進行meta分析,觀察隨試驗組RIMPD/FU不斷遞減和/或對照組RIMPD/FU不斷遞增,以有害事件發(fā)生率為結局指標計算的“試驗組干預措施有害”的效應值(如RR值)結果(包括點估計和區(qū)間估計)是否會被反轉,并結合臨床實際討論這種反轉的情況是否可能出現(xiàn),以檢測“試驗組干預措施有害”這一推斷的穩(wěn)定性。若結果穩(wěn)定則證據(jù)質量不因數(shù)據(jù)缺失的相關偏倚風險而降級,否則應降低證據(jù)質量等級。
特別說明,RIMPD/FU=5.0是GRADE工作組二次研究發(fā)現(xiàn)現(xiàn)有研究同一組別中缺失數(shù)據(jù)受試者相比數(shù)據(jù)可用受試者事件發(fā)生率的最大倍數(shù)[8]。
設計意圖: 讓學生參與教具的拼裝,既幫助學生加深對相關知識的理解,還鍛煉了學生的動手能力。同時,模擬抽獎轉盤的游戲教學,增強了教學的趣味性,調動了學生的學習熱情,打破了傳統(tǒng)課堂教學中的沉悶氣氛,寓教于樂,有助于活躍課堂氣氛。
2.4 連續(xù)性變量結果缺失數(shù)據(jù)的處理
2.4.1 所有原始研究均采用相同方法測量同一結局指標的情況
2.4.1.1 只納入數(shù)據(jù)可用受試者進行主分析 當合并估計值具有統(tǒng)計顯著性并據(jù)此得出某種推斷時,則進行敏感性分析,以檢測缺失數(shù)據(jù)對該推斷穩(wěn)定性的影響。連續(xù)性變量結果缺失數(shù)據(jù)處理的難點是需同時估算均值和標準差(SDs)。
2.4.1.2 填補缺失數(shù)據(jù)均值最具合理性的5類數(shù)據(jù)源 A.所有納入試驗的試驗組中的最佳均值;B.所有納入試驗的對照組中的最佳均值;C.本試驗對照組的均值;D.所有納入試驗的試驗組中的最差均值;E.所有納入試驗的對照組中的最差均值。
2.4.1.3 填補缺失數(shù)據(jù)標準差的數(shù)據(jù)源 GRADE工作組測試了許多用于填補缺失數(shù)據(jù)標準差的來源,發(fā)現(xiàn)填補后產生的結果非常相似,因此GRADE工作組提出所有缺失數(shù)據(jù)的標準差均采用所有納入試驗對照組標準差中的中位數(shù),這樣最為簡單、合理。
2.4.1.4 敏感性分析中缺失數(shù)據(jù)均值的填補策略 針對某特定的結局指標,若因試驗組結果值大于對照組且具有統(tǒng)計學顯著性,依據(jù)結局指標的定義,可能得出試驗組干預措施有益、有害、無益或無害的推斷,進行敏感性分析時,在納入的原始研究中進行一系列逐步嚴格的缺失數(shù)據(jù)填補,圖1顯示,即假設試驗組缺失數(shù)據(jù)傾向于干預措施產生的結果值小,并且這種傾向性逐步增高,和/或對照組缺失數(shù)據(jù)傾向于對照措施產生的結果值大,并且這種傾向性逐步增高,具體數(shù)據(jù)填補策略如下(表1)。策略1使用數(shù)據(jù)C填補試驗組和對照組中的缺失數(shù)據(jù);策略2使用數(shù)據(jù)D填補試驗組中的缺失數(shù)據(jù),使用數(shù)據(jù)B填補對照組中的缺失數(shù)據(jù)。策略3使用數(shù)據(jù)E填補試驗組中的缺失數(shù)據(jù),使用數(shù)據(jù)B填補對照組中的缺失數(shù)據(jù);策略4使用數(shù)據(jù)E填補試驗組數(shù)據(jù)缺失,使用數(shù)據(jù)A填補對照組數(shù)據(jù)缺失。
圖1 連續(xù)性變量結局指標中試驗組結果值顯著大于對照組缺失數(shù)據(jù)填補策略圖示
表1 連續(xù)性變量結局指標中試驗組結果值顯著大于對照組缺失數(shù)據(jù)填補策略
圖2和表2顯示,針對某特定的結局指標,若因試驗組結果值小于對照組且效果具有統(tǒng)計學顯著性,依據(jù)結局指標的定義,可能得出顯示“試驗組干預措施有益、有害、無益或無害”的推斷時,進行敏感性分析時,在納入的原始研究中進行一系列逐步嚴格的缺失數(shù)
圖2 連續(xù)性變量結局指標中試驗組結果值顯著小于對照組缺失數(shù)據(jù)填補策略圖示
表2 連續(xù)性變量結局指標中試驗組結果值顯著小于對照組的缺失數(shù)據(jù)填補策略
數(shù)據(jù)填補,即假設試驗組缺失數(shù)據(jù)傾向于干預措施產生的結果值大,并且這種傾向性逐步增高;和/或對照組缺失數(shù)據(jù)傾向于對照措施產生的結果值小,并且這種傾向性逐步增高,具體數(shù)據(jù)填補策略如下。策略1使用數(shù)據(jù)C填補試驗組和對照組中的缺失數(shù)據(jù);策略2使用數(shù)據(jù)A填補試驗組中的缺失數(shù)據(jù),使用數(shù)據(jù)E填補對照組中的缺失數(shù)據(jù)。策略3使用數(shù)據(jù)A填補試驗組中的缺失數(shù)據(jù),策略4使用數(shù)據(jù)B填補試驗組數(shù)據(jù)缺失,使用數(shù)據(jù)D填補對照組數(shù)據(jù)缺失。
逐次對經不同傾向性填補后的各項研究進行Meta分析,觀察該結局指標的效應值結果(包括點估計和區(qū)間估計)是否會被反轉,并結合臨床實際討論這種反轉的情況是否可能出現(xiàn),以檢測“試驗組干預措施有益、有害、無益或無害”等推斷的穩(wěn)定性。若結果穩(wěn)定,則證據(jù)質量不因數(shù)據(jù)缺失的相關偏倚風險而降級,否則應降低證據(jù)質量等級。
2.4.1.5 具體計算公式:
5nXTi=nFTi+nLTi
6nXCi=nFCi+nLCi
上述公式中,“M”表示均值,“SD”表示標準差,“n”表示組內人數(shù),“X”表示合并估計,“F”表示組內的數(shù)據(jù)完整受試者,“L”表示組內數(shù)據(jù)缺失受試者,“T”表示干預組,“C”表示對照組,“i”表示納入分析的試驗。
2.4.2 原始研究采用不同方法測量同一結局指標的情況 選擇單一的參考測量工具,將不同工具的效應值轉換為參考工具的單位,然后如前所述方法進行缺失值的填補和分析。選擇參考測量工具要考慮的兩個關鍵標準:使用頻率高和測量性能好。選擇參考測量工具后,必須將所有結果轉換為該工具的測量單位。
2.5 數(shù)據(jù)缺失偏倚風險判斷與證據(jù)質量降級的閾值 GRADE工作組強調證據(jù)質量降級的閾值不應單憑統(tǒng)計學顯著性的消失作為判斷標準,還應結合臨床情景進行分析,因為閾值的選擇不僅是事實問題(有效/無效),還涉及價值判斷,需考慮具有臨床意義或臨床顯著性的閾值。
對于數(shù)據(jù)缺失率不清楚的情況,如原始研究的作者并未報告有無缺失數(shù)據(jù),GRADE工作組建議使用所有納入系統(tǒng)評價中試驗的中位數(shù)據(jù)缺失率來處理缺失問題。如果有人認為這一假設過于嚴格,可以在上述基礎上再次進行敏感性分析,即假設該原始研究試驗組和對照組缺失數(shù)據(jù)率均為零。對于僅報告總缺失數(shù)據(jù)而未報告具體每個組別缺失數(shù)據(jù)的試驗,GRADE工作組建議假設干預組和對照組的缺失數(shù)據(jù)率相同。對于僅報告一種數(shù)據(jù)填補后分析結果的試驗,GRADE工作組建議將該結果用于系統(tǒng)評價的主分析和敏感性分析,并在討論數(shù)據(jù)缺失相關敏感性分析結果時,承認這種局限性。
證據(jù)體中數(shù)據(jù)缺失相關偏倚風險評估的GRADE方法是一種結構化、透明且相對更具可操作性的方法,該方法重點強調數(shù)據(jù)填補需兼顧嚴格性和合理性,以確定數(shù)據(jù)缺失的程度是否足以降低對一個證據(jù)體中某特定結果的確定性。