亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

COSMIN 方法介紹：結(jié)合一項系統(tǒng)評價實例進行解讀

2021-05-15 09:11:58陳祎婷沈藍君余桂星

護理研究 2021年9期

陳祎婷，彭健，2，沈藍君，3，胡雁，2，余桂星，李錚，2*

1.復(fù)旦大學(xué)護理學(xué)院，上海200032；2.復(fù)旦大學(xué)循證護理中心；3.復(fù)旦大學(xué)附屬華東醫(yī)院；4.廈門大學(xué)附屬翔安醫(yī)院

由荷蘭、美國、西班牙等研究機構(gòu)的心理測量學(xué)專家組成的指導(dǎo)委員會提出了基于共識選擇健康測量工具的標(biāo)準(zhǔn)（Consensus-Based Standards for the Selection of Health Measurement Instruments，COSMIN）[1]，闡述了如何制作規(guī)范的患者報告結(jié)局測量工具（Patient Reported Outcome Measures，PROMs）系統(tǒng)評價并形成最終推薦意見，以指導(dǎo)研究者與臨床實踐者選擇最合適的PROMs[2]。本研究以Lee 等[3]于2019 年發(fā)表的一篇關(guān)于情緒自評量表（Depression Anxiety Stress Scale-21，DASS-21）的系統(tǒng)評價為例，對COSMIN 系統(tǒng)評價制作方法的流程進行解讀，旨在促進國內(nèi)研究者與臨床實踐者的深入理解和正確使用、規(guī)范系統(tǒng)評價的制作，為最佳PROMs 的選擇提供科學(xué)參考依據(jù)。

1 階段一：進行文獻檢索

階段一包括步驟1～步驟4，該階段與常規(guī)系統(tǒng)評價基本一致，主要內(nèi)容為明確系統(tǒng)評價目的、制定納入和排除標(biāo)準(zhǔn)、實施文獻檢索、獲取與篩選文獻。

1.1 步驟1：明確系統(tǒng)評價目的在制作PROMs 系統(tǒng)評價時，首先需要明確PROMs 的4 個關(guān)鍵要素，即PROMs 所測構(gòu)念、目標(biāo)人群、PROMs 類型及感興趣的測量屬性。Lee 等[3]在文章的方法部分，明確提出該系統(tǒng)評價關(guān)注的PROMs 是情緒自評量表（DASS-21），所測的構(gòu)念為抑郁、焦慮與壓力，目標(biāo)人群為健康人、慢性病病人與精神病病人，評價所有測量屬性。其實，PROMs 系統(tǒng)評價中并不一定要包括所有種類的測量屬性（理論上每種測量屬性都可以單獨制作系統(tǒng)評價），根據(jù)研究興趣和文章篇幅，研究者可以決定一篇PROMs 系統(tǒng)評價中應(yīng)該包含幾種測量屬性。比如PROMs 內(nèi)容效度的評價過程較為復(fù)雜，可以獨立于其他測量屬性單獨制作系統(tǒng)評價。例如Chiarotto 等[4]僅對17 個可測量腰背痛的PROMs 進行內(nèi)容效度的系統(tǒng)評價。

1.2 步驟2：制定納入和排除標(biāo)準(zhǔn) 根據(jù)系統(tǒng)評價的目的制定了4 個納入標(biāo)準(zhǔn)。第一，納入研究所含的PROMs 必須符合研究者關(guān)注的構(gòu)念；第二，研究樣本能夠代表目標(biāo)人群（如超過50%的樣本為目標(biāo)人群）；第三，納入的研究應(yīng)為患者報告結(jié)局測量工具；第四，納入研究的目的應(yīng)是評價PROMs 的測量屬性或是對PROMs 的研發(fā)與可解釋性的說明等。由于Lee 等[3]的目標(biāo)是評價DASS-21 所有測量屬性在健康人、慢性病病人與精神病病人人群中的應(yīng)用情況，故其制定的納入與排除標(biāo)準(zhǔn)比較有針對性，納入標(biāo)準(zhǔn)包括研究關(guān)注DASS-21 測量屬性，關(guān)注的目標(biāo)人群是健康人、慢性病病人與精神病病人，且是已發(fā)表并可獲得全文的英文文獻；排除標(biāo)準(zhǔn)也遵循COSMIN 原則，包括排除將DASS-21 作為結(jié)果測量工具的研究（如干預(yù)性研究）或作為另一種PROMs 效度檢驗標(biāo)準(zhǔn)的研究，且考慮到在14 歲以下人群中DASS-21 的效度無法驗證，故排除14 歲以下這一年齡段人群。

1.3 步驟3：實施文獻檢索 COSMIN 建議至少檢索MedLine 與EMbase 數(shù)據(jù)庫，是否檢索其他數(shù)據(jù)庫可由研究者自行選擇。除MedLine 與EMbase 數(shù)據(jù)庫外，Lee 等[3]還檢索了CINAHL 數(shù)據(jù)庫。國內(nèi)研究者與臨床工作者在制作系統(tǒng)評價時，可根據(jù)具體情況檢索中英文數(shù)據(jù)庫，以盡可能全面地檢索到相關(guān)文獻。檢索詞應(yīng)該包括相關(guān)的主題詞與自由詞，并需包含前文提及的4 個關(guān)鍵要素（所測構(gòu)念、目標(biāo)人群、PROMs 類型與測量屬性）。Lee 等[3]根據(jù)關(guān)鍵要素擬定了檢索詞“depression AND anxiety AND stress”“Depression Anxiety Stress Scale”“DASS”，但其缺少了目標(biāo)人群的檢索詞，應(yīng)補充完整，且該文章檢索的數(shù)據(jù)庫與檢索式過于簡單，在制作系統(tǒng)評價時應(yīng)將檢索過程更完整地呈現(xiàn)給讀者。

此外，Lee 等[3]參考COSMIN 建議，應(yīng)用了牛津大學(xué)PROM 小組開發(fā)的檢索過濾器（http://phi.uhce.ox.ac.uk）與Terwee 等[5]開發(fā)的檢索過濾器進行檢索，以盡可能檢索全面。

1.4 步驟4：獲取與篩選文獻檢索完成后，Lee 等[3]遵循COSMIN 方法，雙人獨立使用EndNote 文獻管理工具對文獻進行查重與篩選，針對存在的疑問與不一致的意見，采取咨詢第三方專家的方法，并追溯參考文獻進行人工檢索與納入。提取每篇研究的數(shù)據(jù)信息，如樣本含量、人群類別、國家/地區(qū)、使用場所等。文獻的篩選流程圖與數(shù)據(jù)提取表在最終完成的系統(tǒng)評價中有清晰的呈現(xiàn)。

2 階段二：評價PROMs 測量屬性

COSMIN 推薦先評價PROMs 內(nèi)容效度，再評價PROMs 內(nèi)部結(jié)構(gòu)，最后評價其他測量屬性，分別對應(yīng)步驟5～步驟7。PROMs 的測量屬性評價一般分為3 個部分（除內(nèi)容效度外）：①應(yīng)用COSMIN 偏倚風(fēng)險清單評價每項研究的偏倚風(fēng)險；②應(yīng)用COSMIN 質(zhì)量準(zhǔn)則評價PROMs 每種測量屬性的證據(jù)質(zhì)量；③匯總PROMs 測量屬性的評價結(jié)果，運用GRADE 系統(tǒng)形成證據(jù)等級。Lee 等[3]應(yīng)用COSMIN 偏倚風(fēng)險清單對每項研究的偏倚風(fēng)險進行評價，采用“很好（very good）”“良好（adequate）”“模糊（doubtful）”“不良（inadequate）”4 級評分，并以最低計分原則來確定。并應(yīng)用COSMIN 質(zhì)量準(zhǔn)則評價PROMs 每種測量屬性的證據(jù)質(zhì)量，匯總后運用改良版GRADE 系統(tǒng)形成證據(jù)等級。

Lee 等[3]在應(yīng)用COSMIN 偏倚風(fēng)險清單評價每項研究的偏倚風(fēng)險這部分的內(nèi)容未呈現(xiàn)，且目前已發(fā)表文章中尚未檢索到應(yīng)用更新后的COSMIN 偏倚風(fēng)險清單評價納入文獻方法學(xué)質(zhì)量的，為幫助未來的研究者更好地應(yīng)用COSMIN 工具，本研究對此部分做簡要介紹。PROMs 測量屬性研究的偏倚風(fēng)險與PROMs 的質(zhì)量不能相混淆，偏倚風(fēng)險是指單個研究在設(shè)計、實施和分析過程中產(chǎn)生的偏倚，若測量屬性研究的偏倚風(fēng)險很高，那么其研究結(jié)果可能就不可信[6]。COSMIN 設(shè)計了偏倚風(fēng)險清單，并有一套使用順序：評估相關(guān)性（根據(jù)研究關(guān)注的測量屬性選擇不同的框目）、評價PROMs 內(nèi)容效度、評價PROMs 內(nèi)部結(jié)構(gòu)與評價PROMs 其他測量屬性，具體評價方式可見本系列其他文章。

2.1 步驟5：評價內(nèi)容效度內(nèi)容效度是最重要的測量屬性，因此，必須先弄清PROMs 條目內(nèi)容在所測構(gòu)念與目標(biāo)人群條件下是相關(guān)的、全面的且可理解的。內(nèi)容效度的評價分為3 步：第1 步是評價PROMs 開發(fā)過程的偏倚風(fēng)險，第2 步是評價PROMs 內(nèi)容效度研究的偏倚風(fēng)險，第3 步是綜合所有證據(jù)，并考慮評價者對PROMs 本身的判斷，使用COSMIN 提出的評分系統(tǒng)來評價PROMs 的內(nèi)容效度。但Lee 等[3]未呈現(xiàn)偏倚風(fēng)險評價部分，只匯報了第3 步。其首先根據(jù)COSMIN開發(fā)的PROMs 內(nèi)容效度的10 項質(zhì)量準(zhǔn)則（相關(guān)性、全面性、可理解性）對每項研究中的PROMs 內(nèi)容效度進行評價。每項準(zhǔn)則均可以被評為“充分（+）”、“不足（-）”或“不確定（？）”。“充分（+）”是指≥85%PROMs（或子量表）的條目符合準(zhǔn)則；“不足（-）”是指＜85%PROMs（或子量表）的條目符合準(zhǔn)則；“不確定（?）”是指沒有足夠的信息或者研究的偏倚風(fēng)險被評為“不良”（質(zhì)量準(zhǔn)則具體可見本系列其他文章）。然后，以GRADE 方法進行證據(jù)評級，發(fā)現(xiàn)DASS-21 內(nèi)容效度的全面性為“充分（+）”，高質(zhì)量證據(jù)；可理解性為“充分（+）”，中質(zhì)量證據(jù)；相關(guān)性為“充分（+）”，極低質(zhì)量證據(jù)。故最終對內(nèi)容效度屬性評價為“充分（+）”，GRADE 證據(jù)等級評價為“中等”。內(nèi)容效度的評估需研究者的主觀判斷，具體評估方法可參考Terwee 等[7]的研究。若有高質(zhì)量證據(jù)證明某PROMs 的內(nèi)容效度不良，則可跳過步驟6～步驟8，直接在步驟9 中對該PROMs 提出推薦建議。

2.2 步驟6：評價內(nèi)部結(jié)構(gòu) 內(nèi)部結(jié)構(gòu)的評價分為3 步：第1 步是應(yīng)用COSMIN 偏倚風(fēng)險清單評價每項關(guān)于PROMs 內(nèi)部結(jié)構(gòu)研究的偏倚風(fēng)險，第2 步是應(yīng)用COSMIN 質(zhì)量準(zhǔn)則評價PROMs 內(nèi)部結(jié)構(gòu)測量屬性的證據(jù)質(zhì)量，第3 步是匯總PROMs 內(nèi)部結(jié)構(gòu)測量屬性的評價結(jié)果，運用GRADE 系統(tǒng)形成證據(jù)等級。Lee 等[3]未呈現(xiàn)內(nèi)部結(jié)構(gòu)研究的偏倚風(fēng)險評價部分，只匯報了證據(jù)質(zhì)量和GRADE 分級。

2.2.1 結(jié)構(gòu)效度 COSMIN 對結(jié)構(gòu)效度評價的質(zhì)量準(zhǔn)則見表1。Lee 等[3]在這部分使用了其他標(biāo)準(zhǔn)，因為COSMIN 質(zhì)量準(zhǔn)則中不包括結(jié)構(gòu)效度的探索性因素分析（EFA）（“+”，至少50% 的方差可被解釋）或Pearson 相關(guān)系數(shù)（“+”，r≥0.80）的可靠性。這提示COSMIN 質(zhì)量準(zhǔn)則仍有待補充與完善，但Lee 等[3]并未說明該標(biāo)準(zhǔn)的來源。Lee 等[3]結(jié)合定性總結(jié)最終評價得出DASS-21 的三因子模型結(jié)構(gòu)效度為“充分（+）”，中質(zhì)量證據(jù)；雙因子模型結(jié)構(gòu)效度為“充分（+）”，高質(zhì)量證據(jù)。

表1 COSMIN 對結(jié)構(gòu)效度評價的質(zhì)量準(zhǔn)則

2.2.2 內(nèi)部一致性 COSMIN 對內(nèi)部一致性評價的質(zhì)量準(zhǔn)則見表2。Lee 等[3]評價發(fā)現(xiàn)，DASS-21 的抑郁、焦慮、壓力三因子模型的Cronbach's α 值分別為0.83～0.94,0.66～0.87 和0.79～0.91，最終評價為“充分（+）”，中質(zhì)量證據(jù)；雙因子模型Omega 系數(shù)分別為0.89～0.97（總分）、0.86～0.99（抑郁）、0.82～0.99（焦慮）和0.85～0.99（壓力），Cronbach's α 值分別0.90～0.95（總分），0.82～0.92（抑郁），0.74～0.88（焦慮）和0.76～0.90（壓力），且有證據(jù)對DASS-21 的結(jié)構(gòu)效度進行說明，最終評價為“充分（+）”，高質(zhì)量證據(jù)。

表2 COSMIN 對內(nèi)部一致性評價的質(zhì)量準(zhǔn)則

2.2.3 跨文化效度/測量不變性 COSMIN 對跨文化效度/測量不變性評價的質(zhì)量準(zhǔn)則見表3。Lee 等[3]發(fā)現(xiàn)共有6 項研究報告了DASS-21 的跨文化效度/測量不變性，其中5 項基于三因子模型，其余1 項基于雙因子模型。5 項研究的質(zhì)量評級不一致，且無法尋求合適的理由給予解釋，故按性別、種族、國家和疾病狀況劃分亞組。按性別劃分的亞組分析發(fā)現(xiàn)，DASS-21 跨文化效度/測量不變性的相關(guān)研究結(jié)果不一致。其他3 個亞組僅包括1 項研究，故無法匯總分析，不給予等級評價。提示在無法為不一致性尋求合適解釋時，可以進行分組討論來分析結(jié)果。

表3 COSMIN 對跨文化效度/測量不變性評價的質(zhì)量準(zhǔn)則

2.3 步驟7：評價其他測量屬性步驟7 需要評價其他測量屬性，包括穩(wěn)定性、測量誤差、效標(biāo)效度、假設(shè)檢驗效度和反應(yīng)度。與步驟6 中的內(nèi)部結(jié)構(gòu)不同，這些測量屬性反映的是PROMs 整體質(zhì)量，而非條目的質(zhì)量。其他測量屬性的評價分為3 步：第1 步是應(yīng)用COSMIN 偏倚風(fēng)險清單評價每項關(guān)于PROMs 其他測量屬性研究的偏倚風(fēng)險，第2 步是應(yīng)用COSMIN 質(zhì)量準(zhǔn)則評價PROMs 其他測量屬性的證據(jù)質(zhì)量，第3 步是匯總PROMs 其他測量屬性的評價結(jié)果，運用GRADE系統(tǒng)形成證據(jù)等級。Lee 等[3]未呈現(xiàn)內(nèi)部結(jié)構(gòu)研究的偏倚風(fēng)險評價部分，只匯報了證據(jù)質(zhì)量和GRADE 分級。Lee 等[3]基于COSMIN 方法采用質(zhì)量準(zhǔn)則對DASS-21 的穩(wěn)定性、測量誤差、效標(biāo)效度、假設(shè)檢驗效度和反應(yīng)度進行逐一評價，并對匯總的證據(jù)使用改良版GRADE 方法進行等級評級。

2.3.1 穩(wěn)定性 COSMIN 對穩(wěn)定性評價的質(zhì)量準(zhǔn)則見表4。Lee 等[3]發(fā)現(xiàn)，有5 項研究報告了DASS-21 的穩(wěn)定性，但僅有1 項研究評估了組內(nèi)相關(guān)系數(shù)（intraclass correlation coefficient，ICC），其余研究結(jié)果并不充分，結(jié)果不足的原因可能是間隔期管理存在問題。在剔除兩項間隔3～6 個月的研究后，Lee 等[3]定性總結(jié)了3 項研究，其中2 項研究的Pearson 相關(guān)系數(shù)分別為0.75～0.78(抑郁)、0.64～0.73(焦慮)與0.64～0.65(壓力)。由于存在嚴重的偏倚風(fēng)險和嚴重的不一致性，故總體評價為“不充分（-），”為低質(zhì)量證據(jù)。

表4 COSMIN 對穩(wěn)定性評價的質(zhì)量準(zhǔn)則

2.3.2 測量誤差 COSMIN 對測量誤差評價的質(zhì)量準(zhǔn)則見表5。Lee 等[3]檢索發(fā)現(xiàn)，沒有對DASS-21 測量誤差進行評價的研究，故標(biāo)明“無可用信息”。為每項研究計算最小可測變化（smallest detectable change，SDC）或一致性限度（limits of agreement，LoA），如果SDC 或LoA 小于最小有意義變化（minimal important change，MIC），則認為研究對測量誤差這一測量屬性評價是充足的。

表5 COSMIN 對測量誤差評價的質(zhì)量準(zhǔn)則

2.3.3 效標(biāo)效度 COSMIN 對效標(biāo)效度評價的質(zhì)量準(zhǔn)則見表6。Lee等[3]發(fā)現(xiàn)，有3項研究報告了DASS-21的效標(biāo)效度。將美國精神障礙診斷與統(tǒng)計手冊（DSM-Ⅳ）軸Ⅰ診斷用定式臨床檢查手冊(Structured Clinical Interview for DSM-ⅣAxis 1 Diagnoses，SCID)中的抑郁和焦慮部分作為DASS-21 的金標(biāo)準(zhǔn)，結(jié)果顯示，DASS-21 抑郁、焦慮分量表與SCID 抑郁、SCID 焦慮的受試者工作特征曲線（ROC）下與坐標(biāo)軸圍成的面積即曲線下面積（area under curve，AUC）分別為0.77～0.91，0.60～0.83。因此，DASS-21 的抑郁分量表的效標(biāo)效度為“充分（+）”，為高質(zhì)量證據(jù)，而DASS-21 的焦慮分量表的效標(biāo)效度為“不充分（-）”，中質(zhì)量證據(jù)。

表6 COSMIN 對效標(biāo)效度評價的質(zhì)量準(zhǔn)則

2.3.4 假設(shè)檢驗效度 COSMIN 對假設(shè)檢驗效度評價的質(zhì)量準(zhǔn)則見表7。Lee 等[3]對DASS-21 抑郁分量表與Beck 抑郁量表（Beck Depression Inventory，BDI）、醫(yī)院焦慮抑郁量表（Hospital Anxiety and Depression Scale ,HADS）抑郁分量表、正性負性情緒量表(Positive and Negative Affect Schedule，PANAS)負性情緒分量表的相關(guān)性，DASS-21 焦慮分量表與貝克焦慮量表（Beck Anxiety Inventory，BAI）、醫(yī)院焦慮抑郁量表焦慮分量表、正性負性情緒量表負性情緒分量表的相關(guān)性，以及DASS-21 壓力分量表與正性負性情緒量表負性情緒分量表的相關(guān)性進行定量總結(jié)，結(jié)果發(fā)現(xiàn)，DASS-21 抑郁分量表與BDI(r=0.73)、HADS抑郁分量表（r=0.69）、PANAS 負性情緒分量表（r=0.56），DASS-21 焦慮分量表與BAI(r=0.75)、HADS焦慮分量表(r=0.66)、PANAS 負性情緒分量表(r=0.55)，DASS-21 壓力分量表與PANAS 負性情緒分量表（r=0.66），均有較高相關(guān)性。鑒于以上結(jié)果，假設(shè)檢驗效度評價為“充分（+）”，為高質(zhì)量證據(jù)。

5 項研究評估了已知組別效度，對所有包括已診斷為精神病病人在內(nèi)的已知組別效度進行比較，DASS-21 抑郁和焦慮分量表的結(jié)果完全與假設(shè)相一致，DASS-21 壓力分量表的結(jié)果80%都符合假設(shè)。因此，DASS-21 的假設(shè)檢驗效度總體評價為“充分（+）”，為高質(zhì)量證據(jù)。

表7 COSMIN 對假設(shè)檢驗效度評價的質(zhì)量準(zhǔn)則

2.3.5 反應(yīng)度 COSMIN 對效標(biāo)效度評價的質(zhì)量準(zhǔn)則見表8。Lee 等[3]發(fā)現(xiàn)，2 項研究報告了DASS-21 的反應(yīng)度，其比較了入院/出院前和出院后病人的DASS-21評分，發(fā)現(xiàn)在出院后病人的DASS-21 抑郁與壓力維度評分有顯著性改變，這與DASS-21 抑郁、壓力分量表的假設(shè)相一致，但考慮到研究存在嚴重的偏倚風(fēng)險（運用t 檢驗分析反應(yīng)度是不恰當(dāng)?shù)模?，故總體評價為“充分（+）”，為低質(zhì)量證據(jù)。焦慮分量表反應(yīng)度的相關(guān)研究由于使用配對t 檢驗導(dǎo)致各個研究之間的結(jié)果不一致，故總體評價為“不充分（-）”，為極低質(zhì)量證據(jù)。

表8 COSMIN 對反應(yīng)度評價的質(zhì)量準(zhǔn)則

3 階段三：選擇PROMs

此部分包括描述PROMs 的可解釋性和適用性，形成最終推薦意見，并呈現(xiàn)系統(tǒng)評價報告。

3.1 步驟8：描述可解釋性和適用性可解釋性是指PROMs 的定量分數(shù)（或分數(shù)變化）被賦予定性意義（如臨床意義）的能力。適用性是指PROMs 在限制時間或資金等條件下是否易于使用，如完成PROMs 的時間、PROMs 的花費、PROMs 的內(nèi)容長度及回答的形式與難易度等。Lee 等[3]在系統(tǒng)評價報告的討論部分提及DASS-21 尚未明確臨床臨界值，關(guān)于量表的最佳臨界值需要進一步研究。關(guān)于量表的適用性，描述了量表含有3 個維度、21 個條目，內(nèi)容相對較短，花費時間較少，且DASS-21 可免費獲得，實用性較好?？山忉屝院瓦m用性并非PROMs 的測量屬性，但他們是選擇最佳PROMs 的重要考慮因素之一。若有兩項PROMs 的質(zhì)量難分上下，那么建議在選擇時考慮二者的實際適用性（如時間和預(yù)算限制等）。

3.2 步驟9：形成PROMs 推薦建議針對研究人群與目的，研究者還需要提出在該領(lǐng)域選擇最佳PROMs 的建議，COSMIN 建議將PROMs 分為3 類：①A 類PROMs 為內(nèi)容效度“充分”（任何等級證據(jù)），且內(nèi)部一致性充分（至少為低質(zhì)量證據(jù)），被推薦使用，使用此類PROMs 的研究結(jié)果是可信的；②B 類PROMs 為不屬于A 類或C 類的PROMs，被認為具有可應(yīng)用的潛力，但需要進一步的研究來評價其質(zhì)量；③C 類PROMs 為具有高質(zhì)量證據(jù)證明其測量屬性“不充分”的PROMs，不建議使用。Lee 等[3]雖僅對DASS-21這一種PROMs 做了系統(tǒng)評價，沒有對多種PROMs 做出種類劃分，但也需要對DASS-21 做一個推薦級別評價，以便其他研究者與臨床工作者參考使用。注意：若目前只含有B 類PROMs，那么在其他更佳證據(jù)出現(xiàn)前，內(nèi)容效度最好的B 類PROMs 可推薦使用。此外，最終推薦意見中還應(yīng)說明將PROMs 歸于某個類別的原因，并提出對該PROMs 未來測量屬性研究方向的建議。Lee 等[3]在討論部分對DASS-21 未來測量屬性研究給出了自己的建議，如尚未有研究評價DASS-21的測量誤差，有待進一步研究與探討。

3.3 步驟10：報告系統(tǒng)評價 Lee 等[3]報告的系統(tǒng)評價基本包含了COSMIN 所建議的內(nèi)容，如①檢索策略、檢索結(jié)果、篩選過程與流程圖；②納入PROMs 的信息，如PROMs 的名稱、所測構(gòu)念、測量屬性、語言版本、研究對象群體、使用情境、量表或子量表數(shù)量、條目數(shù)量、回答選項、回憶期、可解釋性與適用性；③納入研究人群的信息，如地域、語言、疾病特征、目標(biāo)人群、樣本量、年齡、性別與國籍等；④用結(jié)果總結(jié)表的形式呈現(xiàn)最終推薦意見（包含測量屬性的質(zhì)量評價與證據(jù)質(zhì)量等級），但缺少更詳細的檢索策略以及每項PROMs測量屬性研究的偏倚風(fēng)險評估單，有待進一步補充。

4 小結(jié)

本研究選取2019 年Lee 等[3]根據(jù)COSMIN 方法制作的一篇系統(tǒng)評價，其制作流程基本符合要求，但是過程中的一些細節(jié)與最終系統(tǒng)評價的呈現(xiàn)方面仍有待改進?；诖舜螌嵗庾x，本研究建議：系統(tǒng)評價制作者在制定系統(tǒng)評價前應(yīng)該制定計劃書并進行注冊登記；對COSMIN 方法進行系統(tǒng)學(xué)習(xí)與研究（可參考本系列其他文章）；在制作系統(tǒng)評價前明確感興趣的PROMs所測構(gòu)念、目標(biāo)人群、PROMs 類型及其測量屬性4 個要素，并制定恰當(dāng)?shù)奈墨I納入與排除標(biāo)準(zhǔn)；接受系統(tǒng)的檢索培訓(xùn)，掌握全面的檢索方法，選擇合適的國內(nèi)外數(shù)據(jù)庫與中英文檢索式，學(xué)會恰當(dāng)?shù)乩脵z索過濾器進行文獻查找；遵循雙人獨立篩選文獻的原則，無法達成共識時征詢第三方專家意見，采用追溯參考文獻及專家咨詢的方式盡可能全面地獲取相關(guān)研究。評價PROMs 測量屬性時，需遵循COSMIN 偏倚風(fēng)險清單、質(zhì)量準(zhǔn)則及改良版GRADE 方法，逐步且恰當(dāng)?shù)剡M行評價，在系統(tǒng)評價最終呈現(xiàn)時亦要有完整且全面的體現(xiàn)；當(dāng)研究間不一致、結(jié)果無法解釋時，可采取亞組分析的方法進行討論。在評價PROMs 各測量屬性后，需要描述PROMs 的可解釋性與適用性，并形成最終推薦意見，為最佳PROMs 的選擇提供參考信息。最后，在做系統(tǒng)評價的呈現(xiàn)與報告時，包含的內(nèi)容要全面、準(zhǔn)確，圖表要完整無誤、清晰直觀。

應(yīng)用COSMIN 方法制作系統(tǒng)評價的整個過程科學(xué)且流暢，能夠全面、系統(tǒng)地評價PROMs 的每個測量屬性與整體質(zhì)量。但是制作過程耗時較長，評價條目較多，工作量較大，對評審者的要求也較高。此外，COSMIN 方法也仍有待補充與完善。