亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于醫(yī)院電子病歷數(shù)據(jù)構(gòu)建風(fēng)險預(yù)測模型的研究進展*

        2023-11-24 10:51:40許來雨彭伶麗周芳意
        現(xiàn)代醫(yī)院管理 2023年5期
        關(guān)鍵詞:信息模型

        許來雨,彭伶麗,周芳意

        (中南大學(xué)湘雅醫(yī)院臨床護理學(xué)教研室,長沙市 410008)

        電子病歷是一種醫(yī)學(xué)專用軟件,由一系列個人健康資料組成[1],包括文字、符號、圖標(biāo)、數(shù)據(jù)以及影像等醫(yī)療服務(wù)工作記錄[2]。隨著網(wǎng)絡(luò)技術(shù)和信息技術(shù)的發(fā)展,電子病歷系統(tǒng)順應(yīng)醫(yī)院計算機網(wǎng)絡(luò)化管理的發(fā)展趨勢,被廣泛應(yīng)用。2017年12月,國家衛(wèi)健委指出醫(yī)療機構(gòu)應(yīng)加強以門診及住院病歷為核心的綜合信息系統(tǒng)建設(shè),利用大數(shù)據(jù)信息技術(shù)為醫(yī)療質(zhì)量控制、規(guī)范診療行為、調(diào)配醫(yī)療資源等提供支撐[3]?;陔娮硬v系統(tǒng)的風(fēng)險預(yù)測模型是臨床決策支持系統(tǒng)的基礎(chǔ),可以針對給定的一組患者特征快速計算其發(fā)生某種結(jié)局的風(fēng)險[4],幫助醫(yī)護人員及時發(fā)現(xiàn)病情變化,采取針對性措施,改善患者結(jié)局[5]。筆者從使用電子病歷構(gòu)建風(fēng)險預(yù)測模型的研究設(shè)計、優(yōu)勢及不足三個方面進行綜述,為未來醫(yī)療領(lǐng)域風(fēng)險預(yù)測模型的構(gòu)建提供參考。

        1 研究方法

        目前大多數(shù)風(fēng)險預(yù)測模型以一個電子病歷數(shù)據(jù)集為基礎(chǔ),回顧性納入病歷資料進行對比分析,前瞻性研究相對較少。

        1.1 數(shù)據(jù)收集及數(shù)據(jù)預(yù)處理

        根據(jù)研究目標(biāo),在數(shù)據(jù)集中尋找需要的數(shù)據(jù),并對原始數(shù)據(jù)進行嚴(yán)格清洗、結(jié)構(gòu)化、標(biāo)準(zhǔn)化、質(zhì)量檢查。變量的缺失值會增加數(shù)據(jù)分析的難度,也可能會使最終結(jié)果存在偏差[6]。數(shù)據(jù)缺失的處理有多種方法,包括均值填補法、期望值最大化法、回歸填補法、多重填補法等,研究者根據(jù)不同的數(shù)據(jù)缺失特點具體選擇[7]。自然語言處理信息抽取技術(shù)是處理電子病歷的關(guān)鍵技術(shù),有助于充分利用電子病歷中的非結(jié)構(gòu)化數(shù)據(jù)[8]。必要時進行人工分析和質(zhì)量控制,以保證最終數(shù)據(jù)質(zhì)量。

        1.2 確立模型指標(biāo)

        建立風(fēng)險預(yù)測模型,需要確立風(fēng)險因子和結(jié)局指標(biāo)。識別風(fēng)險因子主要有3種基本方法:(1)查閱相關(guān)文獻選取重要特征;(2)對數(shù)據(jù)集中的特征進行初步統(tǒng)計分析,確定與結(jié)局具有明顯相關(guān)性的特征;(3)由專家給出一些高度懷疑的特征。實踐過程中以三種方法結(jié)合使用多見[9]。近年來,基因信息也被應(yīng)用到構(gòu)建風(fēng)險預(yù)測模型中,并且被證明對許多常見疾病具有預(yù)測價值[10]。

        1.3 構(gòu)建模型

        1.3.1 數(shù)據(jù)劃分。 一般分為訓(xùn)練集、測試集,部分研究增設(shè)驗證集[11]。訓(xùn)練集主要用于擬合模型;驗證集用于對模型的能力進行初步的評估;測試集用于評估模型最終的泛化能力。

        1.3.2 選擇相對成熟的預(yù)測方法。 數(shù)據(jù)挖掘又稱“數(shù)據(jù)庫中的知識發(fā)現(xiàn)”[12],指從大量不完全、有噪聲的隨機數(shù)據(jù)中提取隱含及事先不知道的潛在有用信息,統(tǒng)計學(xué)在其中占有重要地位[13]。應(yīng)用于風(fēng)險預(yù)測的傳統(tǒng)統(tǒng)計學(xué)習(xí)模型以logistic回歸模型和比例風(fēng)險回歸模型為經(jīng)典。常用的機器學(xué)習(xí)算法包括貝葉斯、決策樹模型、隨機森林、人工神經(jīng)網(wǎng)絡(luò)和支持向量機等[14],詳見表1。通過將機器學(xué)習(xí)建立模型與獨特的診療知識相結(jié)合,可以更好地確定患者診治工作的重點,增強醫(yī)療活動科學(xué)依據(jù)性[15]。

        表1 基于電子病歷數(shù)據(jù)構(gòu)建風(fēng)險預(yù)測模型的常用方法及特點

        近年來,深度學(xué)習(xí)方法在處理大量多元數(shù)據(jù)時取得了良好性能,特別是在計算機視覺、語音識別、自然語言處理等方面[16]。陳雯等[17]對深度學(xué)習(xí)在癌癥預(yù)后中的應(yīng)用綜述得出深度學(xué)習(xí)對癌癥患者預(yù)后預(yù)測有良好的指示能力。

        1.4 模型驗證及評價

        模型驗證分為內(nèi)部驗證和外部驗證。內(nèi)部驗證是使用與訓(xùn)練集相同的人群對模型進行評估,主要包括隨機拆分驗證、K折交叉驗證、Bootstrap等方法;外部驗證是使用其他數(shù)據(jù)來源的同類數(shù)據(jù)對模型進行驗證。評價模型預(yù)測性能最常用的指標(biāo)有區(qū)分度和校準(zhǔn)度。區(qū)分度是指模型區(qū)分研究中陽性個體和陰性個體的能力;校準(zhǔn)度是指訓(xùn)練集人群平均預(yù)測概率與實際發(fā)病概率的一致性。另外,評價預(yù)測模型的好壞不僅需要評估其預(yù)測性能,還需考慮數(shù)據(jù)采集成本、開發(fā)難易度及應(yīng)用便利性,研究者應(yīng)努力實現(xiàn)成本和效能之間的平衡。

        2 優(yōu)勢

        在醫(yī)療信息化建設(shè)中,電子病歷因其具有快速全面準(zhǔn)確地采集、存儲、處理和傳輸醫(yī)療信息的能力,成為醫(yī)療信息化的核心建設(shè)內(nèi)容。使用電子病歷系統(tǒng)建立風(fēng)險預(yù)測模型的具體優(yōu)勢如下。

        2.1 樣本數(shù)據(jù)充實

        使用電子病歷系統(tǒng)建立風(fēng)險預(yù)測模型的首要優(yōu)勢即患者數(shù)據(jù)量大?;陔娮硬v系統(tǒng)的風(fēng)險預(yù)測模型與傳統(tǒng)風(fēng)險預(yù)測研究不同,傳統(tǒng)風(fēng)險預(yù)測研究收集數(shù)據(jù)前,需要明確參與者納入排除標(biāo)準(zhǔn)、定期隨訪等方法。而電子病歷對患者的就診和治療信息全面記錄[18],包括患者所有的健康信息,這一特點從本質(zhì)上決定了電子病歷數(shù)據(jù)規(guī)模更大。

        2.2 信息元素豐富

        傳統(tǒng)風(fēng)險預(yù)測研究開始前需明確要收集的特定指標(biāo)以及相應(yīng)的預(yù)期判定結(jié)果。而電子病歷基本覆蓋患者就診的全部過程,支持幾乎所有的實驗室檢驗、臨床醫(yī)療、長期醫(yī)療甚至家庭醫(yī)療中的信息和流程管理,醫(yī)療數(shù)據(jù)資源更豐富[19]。基于電子病歷這一特點,陳漪[20]選取規(guī)律腹膜透析治療同時患有糖尿病的患者建立感染風(fēng)險預(yù)測模型,驗證結(jié)果顯示模型具有較好的預(yù)測性能。Wang等[21]和 Xie等[22]基于瑞典一項病例對照研究采集的電子病歷數(shù)據(jù),分別構(gòu)建了食管鱗癌和食管腺癌患者5年絕對發(fā)病風(fēng)險預(yù)測模型,為人群食管癌防控策略的制定提供依據(jù),使用同一組患者數(shù)據(jù)預(yù)測多種臨床結(jié)局成為可能。

        2.3 采集數(shù)據(jù)頻率高

        電子病歷系統(tǒng)記錄并管理患者片段化或縱向的電子病歷信息,時間序列是其重要特征,采集數(shù)據(jù)的頻率通常遠(yuǎn)高于傳統(tǒng)風(fēng)險預(yù)測,因此預(yù)測患者特定事件發(fā)生的近期風(fēng)險也更容易。周彤彤[23]調(diào)查發(fā)現(xiàn)與傳統(tǒng)的基于特定時間的截面數(shù)據(jù)相比,使用電子病歷時序數(shù)據(jù)建立的模型預(yù)測精度更高、結(jié)果更穩(wěn)定,有助于實現(xiàn)臨床終點預(yù)測任務(wù)提前預(yù)知。

        2.4 結(jié)果可信度高

        來自電子病歷系統(tǒng)的患者群體涵蓋廣泛患者人群,人工選擇較少,凡就診治療的患者其相關(guān)信息均被記錄。電子病歷數(shù)據(jù)來源于真實臨床,而非設(shè)有諸多條件限制的科研場所,樣本信息更具代表性。袁術(shù)鵬[9]基于臨床數(shù)據(jù)建立老年骨科患者術(shù)后泌尿系感染的風(fēng)險預(yù)測模型,經(jīng)驗證有較好的預(yù)測能力。

        2.5 節(jié)省科研資源

        電子病歷數(shù)據(jù)是系統(tǒng)儲存的資料,研究者通過申請可以直接使用。如劉宇英等[24]使用美國前列腺、肺、結(jié)直腸及卵巢癌篩查電子數(shù)據(jù)庫作為數(shù)據(jù)來源建立結(jié)直腸癌發(fā)病風(fēng)險預(yù)測模型。相較于傳統(tǒng)風(fēng)險預(yù)測隊列研究,使用電子病歷數(shù)據(jù)易于進行大樣本研究,節(jié)省研究成本的同時,有助于提高研究效率。

        3 存在不足

        現(xiàn)階段的電子病歷系統(tǒng)仍存在種種不足,需在發(fā)展過程中不斷完善。

        3.1 數(shù)據(jù)質(zhì)量存在問題

        目前電子病歷系統(tǒng)仍處于發(fā)展初期階段,與手寫病歷相比,電子病歷內(nèi)容存在重復(fù)記錄現(xiàn)象,Benke K等[25]認(rèn)為是復(fù)制粘貼所致;如何處理數(shù)據(jù)缺失同樣是電子病歷系統(tǒng)研究公認(rèn)的一大難點[26];另外,電子病歷數(shù)據(jù)可能存在患者病情嚴(yán)重程度分布不均的問題[27],病歷系統(tǒng)賬戶是否為賬戶所有者本人操作存疑[28],可能存在數(shù)據(jù)輸入錯誤,影響預(yù)測模型準(zhǔn)確性,有學(xué)者調(diào)查發(fā)現(xiàn)電子病歷書寫缺陷發(fā)生率高,需要加強改進病歷記錄質(zhì)量管理[29]。只有擁有高質(zhì)量的數(shù)據(jù),風(fēng)險預(yù)測模型才具有真正發(fā)揮作用的基礎(chǔ)。

        3.2 數(shù)據(jù)獲取困難

        3.2.1 數(shù)據(jù)提取技術(shù)仍不成熟。 電子病歷數(shù)據(jù)包含的特征信息種類繁多、維度龐大,充斥著大量非結(jié)構(gòu)化文本數(shù)據(jù),且具有一定的時序性。人工分析法在大樣本研究中效率較低,且受限于研究人員的經(jīng)驗,只能起到輔助作用。諸多學(xué)者對數(shù)據(jù)提取方法進行不斷優(yōu)化,自然語言處理技術(shù)不斷更新。鄭曉燕[30]對人口學(xué)數(shù)據(jù)進行one-hot編碼,用二位編碼代替原有的一位編碼。沈貝敏等[31]采用深度協(xié)同過濾方法對現(xiàn)有精神疾病非結(jié)構(gòu)化數(shù)據(jù)進行處理,最終模型準(zhǔn)確性87.49%,精度51.13%。近年來,卷積神經(jīng)網(wǎng)絡(luò)和循環(huán)神經(jīng)網(wǎng)絡(luò)被應(yīng)用于數(shù)據(jù)的特征提取,有助于充分利用電子病歷中的時序性數(shù)據(jù),但受限于只能捕獲局部特征信息,對數(shù)據(jù)時序排列要求嚴(yán)格,缺少語義特性[32]。如何對電子病歷系統(tǒng)中的大量數(shù)據(jù)進行表征學(xué)習(xí)仍是構(gòu)建風(fēng)險預(yù)測模型的主要挑戰(zhàn)。

        3.2.2 數(shù)據(jù)獲取途徑受限。 醫(yī)學(xué)信息涉及到隱私保護和倫理問題,大多醫(yī)療信息是非公開的,國內(nèi)各醫(yī)院間信息無法共享,數(shù)據(jù)獲取途徑受限。吉云蘭等[33]對嚴(yán)重創(chuàng)傷患者進行譫妄風(fēng)險預(yù)測,但只基于1家醫(yī)院ICU電子病歷數(shù)據(jù)進行研究,可能存在選擇偏移,結(jié)論需通過大樣本、多中心研究進行驗證。

        3.3 風(fēng)險因素考慮不足

        國內(nèi)外學(xué)者構(gòu)建的風(fēng)險評估模型中的風(fēng)險因素不盡相同。大部分模型考慮影響疾病風(fēng)險的因素數(shù)量單一,限制了判別性能[34]。變量的個數(shù)、種類、是否納入了真正有預(yù)測作用的變量均有可能影響預(yù)測模型的效能。關(guān)于老年人跌倒風(fēng)險因素,不同研究者研究結(jié)果不一,覆蓋年齡、性別、疾病、藥物、跌倒史、生活習(xí)慣、生理狀態(tài)、心理狀態(tài)、生化指標(biāo)、環(huán)境因素和社會因素等各個方面[35]。基于電子病歷數(shù)據(jù)篩選風(fēng)險因素應(yīng)綜合應(yīng)用文獻報道、統(tǒng)計方法和醫(yī)學(xué)專業(yè)知識三種策略,盡可能全面納入。

        3.4 模型驗證不足

        預(yù)測模型應(yīng)用前,應(yīng)進行強有力的外部驗證。然而,由于具備完整臨床信息的特定疾病患者數(shù)量往往不足、大量數(shù)據(jù)獲取困難等現(xiàn)實因素制約,大多數(shù)研究沒有進行模型驗證,尤其是外部驗證,模型的穩(wěn)定性和外推性得不到保證,導(dǎo)致許多模型不能用于臨床實踐[36]。如于建發(fā)等[37]構(gòu)建的患者預(yù)后風(fēng)險模型,由于相關(guān)疾病患者數(shù)量不足,且部分臨床特征無法獲取詳細(xì)信息,未能設(shè)立驗證集,模型有效性有待進一步驗證。

        3.5 電子病歷系統(tǒng)不統(tǒng)一

        現(xiàn)階段的電子病歷系統(tǒng)多是中心特定的,尚未形成醫(yī)院間整體統(tǒng)一的電子病歷系統(tǒng)模式,預(yù)測模型針對特定的電子病歷開發(fā),能否在區(qū)域?qū)用嫱茝V有待商榷。大量散在數(shù)據(jù)資源不能被有效整合利用,現(xiàn)有預(yù)測模型效能受到制約。2018年《關(guān)于進一步推進以電子病歷為核心的醫(yī)療機構(gòu)信息化建設(shè)工作的通知》提出醫(yī)療機構(gòu)應(yīng)逐步解決電子病歷信息孤島、信息煙囪問題,推進系統(tǒng)整合[38]。美國新一代醫(yī)院信息系統(tǒng)實現(xiàn)了1 000多家醫(yī)院信息的互聯(lián)互通,其建設(shè)經(jīng)驗值得借鑒研究。

        隨著信息技術(shù)的快速發(fā)展,醫(yī)療行業(yè)全面進入信息化發(fā)展時代,電子病歷在患者信息全程留痕化、數(shù)據(jù)標(biāo)準(zhǔn)化等方面優(yōu)勢明顯,成為診療數(shù)據(jù)的重要來源。在亞健康人群和患病人群不斷增多的全球背景下,預(yù)測疾病的發(fā)生發(fā)展及結(jié)局采用客觀工具、減少主觀經(jīng)驗判斷具有重要意義?;陔娮硬v系統(tǒng)建立的風(fēng)險預(yù)測模型充分利用病歷數(shù)據(jù),結(jié)果可信度高,節(jié)省資源,可有效幫助醫(yī)護人員進行臨床決策,然而在高質(zhì)量數(shù)據(jù)獲取、風(fēng)險因素考慮、模型驗證應(yīng)用等方面還存在不足,現(xiàn)階段電子病歷仍存在患者數(shù)據(jù)重復(fù)記錄、數(shù)據(jù)缺失等問題,尚未打破不同醫(yī)院電子病歷系統(tǒng)間的信息煙囪,未來構(gòu)建高性能風(fēng)險預(yù)測模型應(yīng)注意規(guī)避此類問題。

        猜你喜歡
        信息模型
        一半模型
        重要模型『一線三等角』
        重尾非線性自回歸模型自加權(quán)M-估計的漸近分布
        訂閱信息
        中華手工(2017年2期)2017-06-06 23:00:31
        3D打印中的模型分割與打包
        FLUKA幾何模型到CAD幾何模型轉(zhuǎn)換方法初步研究
        展會信息
        中外會展(2014年4期)2014-11-27 07:46:46
        一個相似模型的應(yīng)用
        信息
        健康信息
        祝您健康(1987年3期)1987-12-30 09:52:32
        欧美日韩a级a| 最新国产不卡在线视频| 国产一区亚洲二区三区极品| 99久久精品国产一区二区| 免费人成网站在线观看欧美| 两个人看的www高清视频中文| 国产日韩欧美视频成人| 国产麻豆放荡av激情演绎| 自拍情爱视频在线观看| 精品久久久久久综合日本| 久久久av波多野一区二区 | 久久久极品少妇刺激呻吟网站| 在办公室被c到呻吟的动态图| 99久久精品国产一区二区三区| 国产av天堂成人网| 久久精品中文字幕久久| 青青草在线成人免费视频| 日韩精品一区二区免费| 狠狠摸狠狠澡| 国产一极内射視颍一| 精品国产一区二区三区AV小说| 久久久精品人妻一区二区三区日本| 中文字幕av一区二区三区诱惑| 久久99精品国产麻豆| 免费无码毛片一区二区app| 丰满人妻熟妇乱又伦精品视| 亚洲色大成网站www在线观看| av无码特黄一级| 日韩女优图播一区二区| 成年女人免费视频播放体验区| 国产精品刺激好大好爽视频| 国产精品久久久久免费看| 亚洲精品一区二区三区日韩| 午夜dv内射一区二区| 男女后进式猛烈xx00动态图片| 久久精品国产亚洲av忘忧草18| 欧美—iGAO视频网| 狠狠综合久久av一区二区三区| 黄色av一区二区在线观看| 99久久er这里只有精品18| 日本高清不卡二区|