徐園 朱麗筠 王鈺 孫建華 王曉杰 鄧海波 王磊 安然遜 馬玉芬
隨著醫(yī)學的進步,越來越多的研究證實臨床事件的發(fā)生多受一系列因素的影響,且因素間存在著較為復雜的交互關系[1]。既往可通過經(jīng)驗或量表評估臨床事件風險,但其評估結(jié)果面臨嚴峻挑戰(zhàn)[2]。在醫(yī)療資源緊張、患者需求多樣、醫(yī)療護理服務質(zhì)量要求高的當下,精準醫(yī)療受到熱切關注,其中能夠精確預測風險、低成本、高效率的預測模型更成為研究趨勢和熱點[3]。國務院辦公廳于2021年發(fā)布的《深化醫(yī)藥衛(wèi)生體制改革2021年重點工作任務》中提出“要提升早期監(jiān)測預警、風險評估研判的能力”,更是為預測模型的研發(fā)和應用提供了政策保障。近年來,我國護理學者也開展了大量預測模型的研究,以期精準預測潛在風險,保證患者安全。為了系統(tǒng)描述并剖析我國護理學者公開發(fā)表的預測模型相關文獻,進而推動其高質(zhì)量發(fā)展,本研究在澳大利亞Joanna Briggs Institute(JBI)循證衛(wèi)生保健中心范圍綜述方法學框架[4]的指導下,描述了該領域的研究現(xiàn)狀、研究方法和研究內(nèi)容,并借鑒個體預后或診斷的多變量預測模型透明報告(Transparent Reporting of a Multivariable Prediction Model for Individual Prognosis or Diagnosis,TRIPOD)[5-6]對模型進行評價?,F(xiàn)將結(jié)果報告如下。
納入標準:①我國護理學者發(fā)表的中、英文文獻,特指從事臨床護理(護士)、護理教育工作者(護理教師)及護理專業(yè)學生(如護理學研究生)撰寫的文獻;②針對特定的臨床護理問題,通過嚴謹?shù)姆椒▽W構(gòu)建預測模型的文獻。排除標準:①綜述或個案類文獻;②會議類文獻;③重復發(fā)表的文獻;④無法獲取全文的文獻;⑤非中、英文的文獻。
計算機檢索中文數(shù)據(jù)庫包括中國生物醫(yī)學文獻服務系統(tǒng)(SinoMed)、中國知網(wǎng)(CNKI)、萬方數(shù)據(jù)庫(Wanfang Data)及中文科技期刊數(shù)據(jù)庫(VIP);英文數(shù)據(jù)庫包括Embase、PubMed、CINAHL、Web of Science。采用主題詞與關鍵詞相結(jié)合的方式,根據(jù)數(shù)據(jù)庫的具體要求及醫(yī)學信息學專家意見制定檢索策略,全面收集我國護理學者發(fā)表的預測模型建立的相關文獻。在預檢索的基礎上,確定最終的中文檢索式(以萬方數(shù)據(jù)庫為例):(預測模型)AND(建立OR研發(fā)OR構(gòu)建OR開發(fā)OR形成)AND(護理);英文檢索式(以PubMed為例):((((Models, Statistical [MeSH Terms]) OR (((prediction model*[Title/Abstract]) OR (risk assessment[Title/Abstract])) OR(risk prediction[Title/Abstract])))AND ((China[MeSH Terms])OR ((China[Title/Abstract])OR (Chinese[Title/Abstract]))))AND ((nurses[MeSH Terms])OR ((nurse*[Title/Abstract]) OR(nursing[Title/Abstract])))) AND((((build*[Title/Abstract]) OR(establish[Title/Abstract])) OR(structure[Title/Abstract])) OR(construct*[Title/Abstract]))。檢索時限均為建庫至2021年8月31日。
首先將檢索出的文獻導入EndNote軟件進行整理和去重。由2名受過JBI循證方法培訓的研究者嚴格按照納入及排除標準,先閱讀文獻題目和摘要進行初篩,然后進一步查閱全文進行復篩。對篩選結(jié)果有爭議時,邀請第3名專家進行判定。根據(jù)TRIPOD標準形成了信息提取表,內(nèi)容包括如下2個部分。①基本信息:研究者姓名、單位和地區(qū),文獻標題、發(fā)表年份、期刊名稱和基金,學位論文年份和類型等;②研究內(nèi)容及方法:所采取的理論框架、研究主題、研究設計、研究對象、研究場所、樣本量、模型建立的方法、呈現(xiàn)方式等。
將信息提取表的內(nèi)容導入SPSS 22.0軟件進行統(tǒng)計分析。采用頻數(shù)、構(gòu)成比、率等對數(shù)據(jù)進行描述性分析。
按照檢索策略從數(shù)據(jù)庫共檢索出文獻1 005篇,最終納入文獻141篇(中文136篇,英文5篇)。文獻篩選流程見圖1。
本研究共納入文獻141篇,其中學位論文29篇(20.6%),期刊論文112篇(79.4%)。學位論文以碩士論文為主,占到89.7%(26篇),自2014年開始,呈逐年遞增的趨勢。期刊論文中,核心期刊文獻或SCI文獻占77.7%(87篇),雖然自2003年開始已有相關文獻發(fā)表,但發(fā)文量主要集中在2019年及以后(圖2),占83.9%(94篇)。在刊載期刊方面,共發(fā)表于43種期刊,76.8%(86篇)的文獻發(fā)表在護理類期刊,其中發(fā)表量排在前5位的期刊分別為《中華護理雜志》(15篇,占13.4%)、《護理學雜志》(13篇,占11.6%)、《護理研究》(12篇,占10.7%)、《中華現(xiàn)代護理雜志》(11篇,占9.8%)及《護理學報》(8篇,占7.1%)。在基金資助方面,56.3%(63篇)的文獻有基金支持,其中,以省部級及以上的基金支持為主(36篇,占57.1%),其次為市級基金(14篇,占22.2%)。在第一作者來源方面,有26.8%(30篇)的作者來自學校,有73.2%(82篇)來自醫(yī)院。從研究者所在地區(qū)看,文獻分布區(qū)域以北京、上海、廣州等一、二線城市為主。
在納入的141篇文獻中,從建立預測模型聚焦的問題看,圍繞并發(fā)癥主題的預測模型最多,占61.7%,其次為疾病轉(zhuǎn)歸(9.9%)、心理健康(6.4%)等。具體內(nèi)容見表1。
?
2.4.1 數(shù)據(jù)來源
在納入的141篇文獻中,橫斷面調(diào)查研究58篇(41.1%),回顧性研究55篇(39.0%),前瞻性研究28篇(19.9%)。研究皆可清晰描述數(shù)據(jù)收集的起始、結(jié)束時間和隨訪結(jié)束時間節(jié)點。
2.4.2 研究對象與場所
研究對象主要以患者為主(116篇,占82.3%),其次為孕產(chǎn)婦(9篇,占6.4%),同時還關注到了兒童、失能老年人等特殊群體?;颊叨鄧@慢性?。ü谛牟?、高血壓、血透/腹透、糖尿病、慢性阻塞性肺疾病等)、重癥(ICU、急性缺血性/出血性卒中、急性冠脈綜合征)、癌癥(肺癌、乳腺癌、腫瘤晚期)、手術(神經(jīng)外科、心臟、骨科、血管)、傳染病(乙肝)人群,同時也關注到了血友病等罕見病患者人群的研究。
研究場所以單中心為主(116篇,占82.3%),僅有25篇(17.7%)選擇了多中心研究,涉及醫(yī)院、社區(qū)或護理院等不同場所。
2.4.3 預測因素
預測因素的篩選方面,有35篇文獻單純采用了文獻回顧的方法納入預測因素,3篇文獻采用文獻回顧結(jié)合統(tǒng)計分析的方法,33篇文獻采用文獻回顧結(jié)合專家意見的方法,1篇文獻單純使用文獻統(tǒng)計分析的方法,1篇文獻單純采用專家意見法,還有2篇文獻同時采用了以上3種方法(文獻回顧、統(tǒng)計分析、專家意見)。另外,有66篇文獻(46.8%)未介紹預測因素篩選的來源。
2.4.4 樣本量及缺失數(shù)據(jù)
48篇(34.0%)文獻詳細闡述了研究的樣本量計算方法,納入樣本量從60~188 715例不等。其中樣本量在500例以下的文獻共94篇(66.7%),500~1 000例的有20篇(14.2%),1 000例以上的共23篇(16.3%)。有4篇文獻使用Meta分析或德爾菲方法篩選危險因素,因此未提及樣本量及其計算方法。
另外,在缺失數(shù)據(jù)處理方面,僅有26篇文獻(18.4%)簡單闡述了研究數(shù)據(jù)收集過程中缺失數(shù)據(jù)的處理方法。
2.5.1 預測模型的擬合(統(tǒng)計模型類型)
模型的建立過程中,大多數(shù)文獻(119篇,占84.4%)選擇了二分類變量結(jié)局的常用方法Logistic回歸擬合模型。其余研究的統(tǒng)計模型類型使用的是機器學習(8篇)、COX回歸擬合(6篇)、結(jié)構(gòu)方程模型(5篇)、德爾菲專家函詢(1篇)、相關與回歸分析(1篇)、整合移動平均自回歸模型(1篇)。
2.5.2 預測模型的評價
預測模型的性能評價包括區(qū)分度和校準度兩部分。納入的141篇文獻中,有45篇文獻(31.9%)完成了模型的區(qū)分度和校準度的評價,并以ROC曲線或校準曲度等圖形進行呈現(xiàn),來反映模型的性能。有73篇文獻(51.8%)僅完成了區(qū)分度的評價,有23篇文獻(16.3%)未完成模型的性能評價。
2.5.3 預測模型的驗證
模型的驗證包括內(nèi)部驗證和外部驗證。52篇文獻(36.9%)完成了預測模型建立的內(nèi)部驗證,選用的方法有隨機拆分驗證(26次)、交叉驗證(4次)和Bootstrap方法(25次)。進行外部驗證的文獻僅有34篇(24.1%)。
2.5.4 預測模型的呈現(xiàn)
31.9%(45篇)的文獻將模型進行了可視化呈現(xiàn),其中以列線圖為主,占84.4%(38篇),還有6篇文獻(13.3%)建立了評分標準/評分表,1篇文獻(2.2%)構(gòu)建了生存曲線圖。
在討論或結(jié)論中對研究存在局限性進行說明的有113篇,占80.1%。其中以研究場所多為單中心或范圍較?。?3次)及研究樣本量有限(60次)為主,同時也有學者關注到模型的建立使用了回顧性研究(16次),且納入的預測因素較為局限(25次)。
預測模型的建立,標志著循證醫(yī)學高質(zhì)量研究證據(jù)的誕生,也為精準醫(yī)學提供了有利的應用工具[7]。它實現(xiàn)了根據(jù)預測人群未來發(fā)病風險的高低將風險人群正確地區(qū)分出來[6]。然而,臨床預測模型的質(zhì)量欠佳將直接影響模型的應用與推廣[8]。因此,依據(jù)TRIPOD聲明對現(xiàn)有護理學者發(fā)表的預測模型進行評價不僅可以提高模型報告的規(guī)范性,也將有利于預測模型研究質(zhì)量的提高。
本研究檢索了4大中文數(shù)據(jù)庫和4大英文數(shù)據(jù)庫自建庫至2021年8月31日我國護理學者公開發(fā)表的預測模型建立的相關研究,從研究數(shù)量上看,盡管我國護理學者開展預測模型研究起步較晚且呈散發(fā)狀態(tài),但2019年及以后文獻發(fā)表數(shù)量急劇增加。這與近年來我國護理人員對預測模型這一量化工具的認可有關,預測模型的出現(xiàn)為臨床護理決策提供了便捷。而本研究也發(fā)現(xiàn),超過一半的研究都具備基金項目支持,且有73.2%的作者都來自臨床一線。這說明護理預測模型的建立不僅符合目前國家政策發(fā)展需要,得到項目評審的認可,也切實圍繞護理工作的中心——患者,解決了他們的需求。從研究主題可再次印證,與患者密切相關的問題是護理預測模型關注的熱點,排在前3位的研究問題分別是并發(fā)癥、疾病轉(zhuǎn)歸和心理健康,均與患者緊密相關。這些預測模型的臨床應用將幫助發(fā)現(xiàn)患者早期的潛在問題、識別高危個體,更可促進臨床研究的高效轉(zhuǎn)化。我國護理學者開展預測模型研究的增加,有助于推動護理人員臨床決策工具質(zhì)量的提高,提升異常風險識別的科學性和準確性。同時使用高質(zhì)量的預測模型,引導護理人員洞察臨床護理實踐中患者存在的問題,是為患者提供精準護理的有力保障。
將預測模型的開發(fā)和驗證過程進行完整的報告將有利于模型外部驗證、臨床應用及推廣。然而本研究納入的護理學者開展的預測模型研究在使用TRIPOD聲明評價后,發(fā)現(xiàn)報告的質(zhì)量欠佳、信息不完整,還有較大的改進空間,這與李秋萍等[9-10]的研究結(jié)果一致。具體表現(xiàn)在如下幾個方面。
3.2.1 數(shù)據(jù)來源應嚴謹
本研究納入的141篇文獻,僅有19.9%的預測模型采用了前瞻性研究,而回顧性研究占到39.0%。這樣的研究設計將形成選擇偏移和回憶偏移等,導致模型的質(zhì)量降低。有學者指出,利用已有數(shù)據(jù)進行預測模型的構(gòu)建,不一定能較好地滿足模型研究需要,高質(zhì)量的預測模型原則上應使用專門針對該預測模型設計和構(gòu)建的前瞻性研究[11]。因此,未來我國護理學者在進行預測模型的研究時應克服研究設計上的局限性,通過嚴謹?shù)难芯吭O計實現(xiàn)高質(zhì)量預測模型的構(gòu)建。
3.2.2 預測因素納入應全面
本研究結(jié)果顯示,將近一半的文獻未報告預測因素納入的方法,這將直接影響模型所涉及的因素來源及研究的質(zhì)量。可以看出,預測模型建立前都進行了預測因子的匯集及梳理,但僅有53.2%的研究進行了來源報告。事實上,在建立預測模型前,研究者應該系統(tǒng)檢索文獻,收集、整理已報道的預測因子作為備選預測因子。而后,利用統(tǒng)計方法并結(jié)合醫(yī)學認識和專家經(jīng)驗,從備選因素中選出最終納入模型的預測因子開展研究[8]。另外盡管部分研究報告了預測因素的納入方法,但在確定預測模型的預測因素時,部分研究單純將多種量表或問卷作為預測因素,增加了指標測量及應用的難度,導致模型在最終應用過程中資料收集的難度增加。因此護理學者應嚴格選用預測因素的獲取及報告方法,同時納入便于臨床實踐直接應用的因素以提高預測模型研究的科學性和應用性。
3.2.3 樣本及場所的選擇應謹慎
預測模型研究中除了要詳細報告研究樣本的選擇及樣本量的確定方法外,結(jié)合預測模型很難直接在不同類型的場所互通使用的特點,應對研究場所進行詳細的報告,以便于判斷模型的應用范圍[9]。本研究中25篇文獻選擇了多中心研究,進一步分析發(fā)現(xiàn)有2項研究在多中心場所選擇上出現(xiàn)差異,選擇了不同等級、不同地域城市的場所進行研究,這無形中增加了模型使用的復雜性?,F(xiàn)實中不同區(qū)域患者特點存在的差異限制了預測模型應用的目標人群特征,會影響預測模型的通用性和準確性[8,12]。因此,在進行場所的選擇時,應謹慎地選擇研究場所的性質(zhì)、數(shù)量和位置,然后進行嚴格的樣本量測算,以提高模型的質(zhì)量。
同時數(shù)據(jù)缺失在研究中難以避免,從本研究的結(jié)果可以看出,僅有18.4%的文獻描述了缺失數(shù)據(jù)的處理方法,占比較低。未來的研究中可以通過清晰透明地描述缺失數(shù)據(jù)的處理方法,提高研究結(jié)果報告質(zhì)量及研究的可重復性[9]。
3.2.4 模型的評價與驗證應完善
在最終形成臨床可直接使用的預測模型前,模型需要經(jīng)歷擬合、評價、驗證、呈現(xiàn)等步驟[8]。應進行嚴格的驗證,以考察模型的可重復性以及外推性。但從本文結(jié)果可以看出,目前我國護理預測模型的報告中,模型的評價和驗證并不完善且質(zhì)量欠佳。在模型的評價過程中,存在僅完成了區(qū)分度的檢測、未進行模型校準度評價等類似問題,使得模型建立過程不完整。這與王俊峰等[13]的研究結(jié)果相一致,他提出相比于模型開發(fā)的蓬勃發(fā)展,模型驗證卻存在一定程度的滯后。這將造成未被有效驗證的同一疾病或終點事件的新預測模型不斷涌現(xiàn),導致僅有少數(shù)模型可應用于臨床實踐[14-15]。
3.2.5 研究局限性應報告
TRIPOD聲明里明確提到要對研究的局限性進行闡述和分析[6],然而本研究納入的141篇文獻中仍有19.9%的文獻未提及模型建立過程的局限性及不足。作為科學論文討論中最有價值的部分之一,有必要在研究中充分認識并承認研究的局限性。大部分學者在局限性中建議未來應開展多中心、大樣本、前瞻性研究,以提高模型的準確性及可行性。
3.3.1 采用可視化方法促進模型結(jié)果的呈現(xiàn)
臨床預測模型本質(zhì)上是預測因素間復雜的公式組合,并不能在臨床上直接應用。為了更好地應用模型,研究者還需要考慮模型的呈現(xiàn)方式,這樣才能將復雜的模型公式轉(zhuǎn)化成方便臨床使用的工具。從本綜述納入的模型中可以看出,列線圖已在預測模型呈現(xiàn)方面形成了應用規(guī)模[16-18],其便捷、可視化的方法,在一定程度上代替了復雜、煩瑣的計算公式[19]。因此,在模型生成時,可通過直觀的工具,如列線圖、評分表、線上預測軟件/工具等,方便醫(yī)護人員及患者使用。
3.3.2 借助人工智能等方法提高模型的科學性
機器學習作為疾病預測模型構(gòu)建的常見方法之一,通過其強大的數(shù)據(jù)信息提取功能,實現(xiàn)了智能地采集、分析、存儲和預測數(shù)據(jù),對臨床疾病的管理與決策有著積極的作用[20]。本研究中僅有1篇文獻采用了機器學習中隨機森林、人工神經(jīng)網(wǎng)絡模型等方法構(gòu)建預測模型,研究的樣本量為11 788例[21],且該研究嚴格按照TRIPOD聲明的要求開展模型的構(gòu)建及報告。然而現(xiàn)有的護理模型建立研究中多以單中心、小樣本的研究為主,這與臨床易開展簡潔、快速、低成本的護理研究有關。但隨著醫(yī)學的發(fā)展,借助人工智能等高質(zhì)量的研究方法將是未來研究的趨勢,它可規(guī)避傳統(tǒng)方法的局限,從而實現(xiàn)高質(zhì)量模型成為疾病預測發(fā)生的關鍵要素[1]。
3.3.3 結(jié)合臨床實際建立預測模型以提高模型的應用性
對于尚處于起步階段的護理預測模型研究,除了需要嚴謹?shù)难芯糠椒?,還需要緊密結(jié)合臨床實際情況,去解決存在潛在風險的問題,才能更好地指導臨床實際工作。同時,臨床預測模型還需要不斷地更新,以避免出現(xiàn)模型因疾病危險因素、治療措施及治療背景等隨時間變化而發(fā)生的性能下降[7]??梢姡R床預測模型要在臨床實際情況中不斷調(diào)整、動態(tài)更新,從而提高模型的可推廣性。
本研究對我國護理學者開展的預測模型建立研究從發(fā)文數(shù)量、研究設計及模型建立方法等方面進行了系統(tǒng)的回顧與分析??傮w來看,我國護理學者開展預測模型研究的報告質(zhì)量不高,存在研究方法缺陷及報告不完整等問題,建議護理學者遵循TRIPOD聲明中要求的研究方法和報告流程,以提高模型的報告質(zhì)量。本研究也存在一定的局限性,未對模型外部驗證方面進行系統(tǒng)的檢索與分析,可在后續(xù)研究中進一步開展。