亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        某三甲醫(yī)院患者剖面數(shù)據(jù)挖掘與分析

        2022-12-06 09:05:14高瞻何強(qiáng)趙亮
        微型電腦應(yīng)用 2022年11期
        關(guān)鍵詞:數(shù)據(jù)挖掘可視化住院

        高瞻,何強(qiáng),趙亮

        (十堰市太和醫(yī)院,湖北,十堰 442000)

        0 引言

        經(jīng)過多年數(shù)字化醫(yī)院的發(fā)展,目前各個(gè)醫(yī)院信息系統(tǒng)已經(jīng)積累了大量、甚至海量的臨床數(shù)據(jù)、檢驗(yàn)數(shù)據(jù)、影像數(shù)據(jù)以及患者基本信息數(shù)據(jù)(文中簡(jiǎn)稱“患者數(shù)據(jù)”)等。其中,患者數(shù)據(jù)主要包含患者年齡、性別、職業(yè)、地區(qū)、疾病、病史、用藥、花費(fèi)等屬性,挖掘分析這些數(shù)據(jù)中蘊(yùn)含的寶貴信息,將為醫(yī)院運(yùn)營(yíng)管理優(yōu)化、患者疾病精準(zhǔn)診療分析、患者個(gè)性化服務(wù)等提供依據(jù)。如文獻(xiàn)[1]設(shè)計(jì)并實(shí)現(xiàn)了急性發(fā)熱性疾病監(jiān)測(cè)系統(tǒng),以輔助醫(yī)院簡(jiǎn)化該病工作流程,提高監(jiān)測(cè)工作效率與質(zhì)量。文獻(xiàn)[2]提出了傳染病可視分析系統(tǒng),以直觀分析傳染病的時(shí)空模式,交互挖掘不同疾病、地區(qū)之間的關(guān)聯(lián)性和相似性。文獻(xiàn)[3]利用醫(yī)院病案首頁(yè)數(shù)據(jù)庫(kù)數(shù)據(jù),分析醫(yī)院住院患者的疾病種類、住院費(fèi)用、住院天數(shù)的年齡分布特征。

        本文以醫(yī)院現(xiàn)有的醫(yī)院信息系統(tǒng)(HIS)、檢驗(yàn)信息系統(tǒng)(LIS)、電子病歷系統(tǒng)(EMR)等系統(tǒng)數(shù)據(jù)庫(kù)為基礎(chǔ),根據(jù)需求提取有效患者數(shù)據(jù)。經(jīng)過數(shù)據(jù)預(yù)處理后,結(jié)合相應(yīng)的數(shù)據(jù)挖掘規(guī)則,篩選出具有顯著性差異的疾病,并實(shí)現(xiàn)了基于患者數(shù)據(jù)的可視化分析系統(tǒng),簡(jiǎn)單、直觀的展示患者數(shù)據(jù)中的關(guān)聯(lián)元素和規(guī)律,為醫(yī)院針對(duì)不同的患者特征優(yōu)化管理和布局提供參考。

        1 數(shù)據(jù)與方法

        患者數(shù)據(jù)挖掘方法如圖1所示,主要分為4個(gè)方面內(nèi)容:數(shù)據(jù)采集、數(shù)據(jù)預(yù)處理與關(guān)聯(lián)性分析、數(shù)據(jù)篩選與挖掘、可視化分析。

        圖1 患者數(shù)據(jù)挖掘方法示意圖

        1.1 數(shù)據(jù)處理

        原始數(shù)據(jù)采集,需要獲取置于醫(yī)院內(nèi)網(wǎng)的HIS、LIS、EMR等系統(tǒng)的數(shù)據(jù),出于安全性考慮,通過綁定用于數(shù)據(jù)挖掘算法的中間服務(wù)器IP,設(shè)置相應(yīng)的通信接口訪問數(shù)據(jù)。本系統(tǒng)展示的數(shù)據(jù)為醫(yī)院2019年門診或住院的患者數(shù)據(jù),共計(jì)120萬(wàn)余條。其中,住院患者約10人,分為患者基本信息(見表1)和患者疾病信息(見表2),每條患者基本信息對(duì)應(yīng)一條或多條患者疾病信息,通過患者ID關(guān)聯(lián)。

        數(shù)據(jù)預(yù)處理是大數(shù)據(jù)挖掘分析的必要工作,主要包含數(shù)據(jù)清洗、數(shù)據(jù)變換、數(shù)據(jù)集成等操作。本文中主要的數(shù)據(jù)處理操作包含以下3個(gè)部分。

        (1) 數(shù)據(jù)完整性篩選。本系統(tǒng)數(shù)據(jù)皆抽取自院內(nèi)的多個(gè)結(jié)構(gòu)化數(shù)據(jù)庫(kù),不同數(shù)據(jù)庫(kù)之間對(duì)于同一患者數(shù)據(jù)需要使用患者ID字段進(jìn)行關(guān)聯(lián),首先需要過濾掉重復(fù)數(shù)據(jù),然后篩選患者關(guān)鍵信息嚴(yán)重缺失的數(shù)據(jù)予以刪除。

        (2) 數(shù)據(jù)脫敏。醫(yī)院患者數(shù)據(jù)中包含非常多的個(gè)人隱私信息,這類數(shù)據(jù)泄露可能會(huì)造成嚴(yán)重的后果[4]。本系統(tǒng)從醫(yī)院內(nèi)網(wǎng)數(shù)據(jù)抽取過程中已經(jīng)執(zhí)行了嚴(yán)格的數(shù)據(jù)脫敏操作。主要包含:采用2次加密的患者ID代替患者姓名和原始ID、去除身份證和聯(lián)系方式等字段、截取患者住址信息到地區(qū)的粒度等。

        (3) 數(shù)據(jù)集成。數(shù)據(jù)量大會(huì)拖慢系統(tǒng)性能,除了在數(shù)據(jù)庫(kù)中添加索引外,還需要對(duì)數(shù)據(jù)進(jìn)行集成操作,特征聚集劃分規(guī)則根據(jù)挖掘目標(biāo)設(shè)計(jì),通常需要覆蓋所有數(shù)據(jù),本文聚集型劃分包含:年齡分段、職業(yè)分類、疾病分類、住院時(shí)長(zhǎng)區(qū)間統(tǒng)計(jì)等,如根據(jù)患者年齡小于12歲為童年期,12歲至18歲為少年期等。

        表1 患者基本信息表

        表2 患者疾病信息表

        1.2 方法描述

        數(shù)據(jù)挖掘處理方面,采用Python語(yǔ)言及其豐富的數(shù)據(jù)處理和機(jī)器學(xué)習(xí)算法庫(kù),能夠高效完成大批量數(shù)據(jù)的統(tǒng)計(jì)分析、聚類、分類等任務(wù)。本文對(duì)患者數(shù)據(jù)挖掘的主要目標(biāo)是借助統(tǒng)計(jì)學(xué)方法找出與患者各項(xiàng)特征關(guān)聯(lián)性較強(qiáng)的疾病,如:與職業(yè)關(guān)聯(lián)的職業(yè)病、與年齡相關(guān)的年期病、與發(fā)病時(shí)間關(guān)聯(lián)的季節(jié)病等。首先,選取患者特征,根據(jù)數(shù)據(jù)挖掘目標(biāo)設(shè)計(jì)特征分段規(guī)則,重新進(jìn)行特征分段并統(tǒng)計(jì)各種疾病患者數(shù)量;然后,計(jì)算各種疾病在各分段上的患者數(shù)均值,由于基數(shù)較小的疾病不具備統(tǒng)計(jì)學(xué)意義,大量分段區(qū)間為0的數(shù)據(jù)也會(huì)造成誤差,因此通過初篩過濾掉均值小于5的疾病,同時(shí)過濾掉高于三分之二以上的分段中數(shù)量為0的疾??;最后,采用變異系數(shù)計(jì)算各類疾病與特征關(guān)聯(lián)性評(píng)分,根據(jù)評(píng)分進(jìn)行排序,篩選出Top N種疾病。不同疾病在相同特征分段上的均值差異較大,變異系數(shù)能夠較好地體現(xiàn)疾病與患者某項(xiàng)特征的關(guān)聯(lián)性,計(jì)算公式如式(1)~式(3):

        (1)

        (2)

        (3)

        大數(shù)據(jù)可視化方面,基于高性能的Web框架FastAPI,實(shí)現(xiàn)了前后端數(shù)據(jù)高效的異步交互,其性能足以與NodeJS和Go媲美[5],且數(shù)據(jù)處理和挖掘結(jié)果易于組織成JSON格式傳輸。為了便于二次開發(fā)和針對(duì)性的可視化展示,采用基于JavaScript的開源庫(kù)ECharts,可以流暢地運(yùn)行在PC和移動(dòng)設(shè)備上,能夠展現(xiàn)千萬(wàn)級(jí)的數(shù)據(jù)量,同時(shí)提供了大量交互式組件和圖表用于用戶個(gè)性化定制[6]。通過訪問FastAPI中約定好的訪問方式和路徑,前端借助于$.getJSON()函數(shù)獲取對(duì)應(yīng)接口數(shù)據(jù),完成數(shù)據(jù)挖掘結(jié)果與ECharts組件的無(wú)縫銜接,實(shí)現(xiàn)高效、流暢的數(shù)據(jù)可視化渲染。

        系統(tǒng)實(shí)現(xiàn)方面,采用前后端分離技術(shù)設(shè)計(jì),以JSON格式進(jìn)行前后端的數(shù)據(jù)通信和傳輸。系統(tǒng)主體框架分為三個(gè)部分:醫(yī)院內(nèi)網(wǎng)的數(shù)據(jù)庫(kù)訪問模塊、中間服務(wù)器數(shù)據(jù)處理模塊、提供Web服務(wù)的前端應(yīng)用模塊。醫(yī)院內(nèi)網(wǎng)的數(shù)據(jù)庫(kù)訪問模塊負(fù)責(zé)訪問置于醫(yī)院內(nèi)網(wǎng)的HIS、LIS、EMR等系統(tǒng)的數(shù)據(jù)庫(kù)獲取全面的患者數(shù)據(jù);中間服務(wù)器數(shù)據(jù)處理模塊是系統(tǒng)的算法核心層,在Python環(huán)境中,實(shí)現(xiàn)數(shù)據(jù)抽取、優(yōu)化與脫敏處理,并通過上述挖掘算法獲取有效信息為Web服務(wù)器提供JSON格式的后端數(shù)據(jù)接口;前端應(yīng)用模塊,基于B/S(瀏覽器/服務(wù)器)架構(gòu),采用Jsp動(dòng)態(tài)網(wǎng)頁(yè)設(shè)計(jì)系統(tǒng)前端界面、JQuery腳本語(yǔ)言訪問接口數(shù)據(jù)、Echarts組件進(jìn)行可視化渲染,并通過Apache Tomcat為不同的PC端用戶提供高效、流暢的數(shù)據(jù)交互服務(wù)。

        2 數(shù)據(jù)可視化分析

        伴隨醫(yī)院信息化、無(wú)紙化辦公的興起,醫(yī)院患者數(shù)據(jù)呈現(xiàn)爆炸式增長(zhǎng),這些數(shù)據(jù)記錄了患者的疾病、診療、用藥、病史等信息。醫(yī)院各類系統(tǒng)的應(yīng)用,導(dǎo)致這些信息相互冗雜,使人們很難在數(shù)據(jù)層面上直接感知這些數(shù)據(jù)所傳遞的關(guān)聯(lián)信息,對(duì)于患者數(shù)據(jù)的挖掘和可視化分析可以有效幫助我們發(fā)現(xiàn)數(shù)據(jù)中隱藏的規(guī)律和價(jià)值。ANDRIENKO等[7]對(duì)可視化關(guān)鍵問題和發(fā)展途徑展開研究并將可視化方法分為3類:直接可視化、聚集可視化、特征提取可視化。直接可視化,指直接描述數(shù)據(jù)集中的每個(gè)記錄,以便分析人員通過查看可視化展示或交互來提取數(shù)據(jù)最基本的信息;聚集可視化,通過對(duì)數(shù)據(jù)聚合和概括的方法,改進(jìn)傳統(tǒng)直接可視化方法,聚集可視化過程可能涉及各種形式的數(shù)據(jù)抽象,包括聚合、泛化和抽樣,將聚集結(jié)果展示給用戶觀察[8];特征提取可視化,針對(duì)非結(jié)構(gòu)數(shù)據(jù),如文檔、影像等,經(jīng)過特定算法挖掘和抽取數(shù)據(jù)特征,形象的展示研究人員所關(guān)注的全局特征或局部特征[9]。當(dāng)面臨大量復(fù)雜的數(shù)據(jù)時(shí),直接可視化展現(xiàn)方式有限,且可能因?yàn)檫^度繪圖和記錄疊加導(dǎo)致視覺混亂,使用戶難以感知和理解眾多視覺元素,可視化系統(tǒng)響應(yīng)速度通常也會(huì)較慢。因此,本系統(tǒng)主要以聚集可視化和特征提取可視化為主。

        季節(jié)疾病每年在一定季節(jié)內(nèi)呈現(xiàn)發(fā)病率升高的現(xiàn)象,除了人們熟知的季節(jié)病如:流行性感冒、鼻炎、過敏等,還有許多疾病也具有季節(jié)性發(fā)病特點(diǎn)。通過挖掘更多的季節(jié)性疾病,不僅有助于提醒患者隨季節(jié)變遷防患相應(yīng)疾病,也能夠提醒醫(yī)院提前做好同類患者聚集的收治準(zhǔn)備工作。針對(duì)該問題,本系統(tǒng)在住院患者數(shù)據(jù)中篩選出變異系數(shù)最大的前30種疾病,繪制熱力圖如圖2(a)所示。圖2(a)中顏色越深表示疾病在對(duì)應(yīng)月份發(fā)病人數(shù)越多,如:1、2月份易發(fā)癲癇、腰椎間盤突出、各類肺炎等病;7、8月份惡性腫瘤化療、阻塞性睡眠呼吸暫停低通氣綜合征、病毒性腦膜炎等病來院患者較多。

        (a) 篩選出的疾病熱力圖

        相同疾病在不同年齡段的治療代價(jià)具有一定差異,通過挖掘住院周期與患者年齡關(guān)聯(lián)性強(qiáng)的疾病,有利于主治醫(yī)生為對(duì)應(yīng)患者制定出更加符合實(shí)際的治療臨床路徑,從而提高治療效果和節(jié)省相關(guān)花費(fèi)。本系統(tǒng)以年齡浮動(dòng)為2,統(tǒng)計(jì)各年齡段不同疾病患者的平均住院時(shí)長(zhǎng),過濾掉基數(shù)較小的疾病,并選取住院時(shí)長(zhǎng)大于0的數(shù)據(jù)計(jì)算變異系數(shù),篩選出的疾病繪制成氣泡圖如圖2(b)所示。圖2(b)中容易發(fā)現(xiàn),年齡層與住院周期關(guān)聯(lián)性強(qiáng)的疾病有:淚小點(diǎn)狹窄、再生障礙性貧血、沖擊治療、惡性腫瘤內(nèi)分泌治療等。

        除了上述可視化挖掘與分析外,針對(duì)患者其他基本信息,系統(tǒng)將挖掘結(jié)果采用大屏展示模式,通過提取患者疾病、疾病花費(fèi)、來源、職業(yè)、年期等特征,對(duì)其關(guān)聯(lián)因素進(jìn)行可視化分析,如圖3所示。圖3中各區(qū)域圖表通過區(qū)域1中地圖模塊聯(lián)動(dòng)變化展示不同來源的患者特征。區(qū)域1通過患者住址信息提取所在地區(qū),劃分為省外、省內(nèi)、市內(nèi)、各區(qū)縣,直觀展示醫(yī)院患者在各地區(qū)的分布情況、占比、依從系數(shù)反映該地區(qū)患病數(shù)量及關(guān)聯(lián)性強(qiáng)的疾?。粎^(qū)域2對(duì)患者職業(yè)進(jìn)行分類,展示區(qū)域1中所選地區(qū)不同職業(yè)的患者易患的疾病及數(shù)量,容易發(fā)現(xiàn)腰椎間盤突出和冠心病是許多職業(yè)易患的通病、兒童中肺炎和呼吸道感染較多、學(xué)生中癲癇和紫癜較多、退休和教師人員中冠心病較多;區(qū)域3展示了該地區(qū)各類疾病在院的平均花費(fèi)情況;區(qū)域4通過患者年齡劃分為童年期、少年期、青年期、中年期和老年期,統(tǒng)計(jì)分析了各時(shí)期易患的疾病種類。

        圖3 患者數(shù)據(jù)挖掘與分析大屏

        3 總結(jié)

        醫(yī)院信息化、無(wú)紙化辦公的發(fā)展,使醫(yī)院積累了海量的患者數(shù)據(jù)、診療數(shù)據(jù),挖掘這些數(shù)據(jù)隱含的規(guī)律信息、發(fā)揮數(shù)據(jù)寶貴價(jià)值,是智慧醫(yī)院建設(shè)的迫切需求。本文基于醫(yī)院現(xiàn)有的HIS、LIS、EMR等系統(tǒng)數(shù)據(jù)庫(kù),抽取患者信息進(jìn)行數(shù)據(jù)處理和挖掘操作,并設(shè)計(jì)和實(shí)現(xiàn)了基于患者剖面的數(shù)據(jù)分析系統(tǒng)。該系統(tǒng)采用主流的前后端分離技術(shù),挖掘結(jié)果基于JSON格式傳輸,前端采用ECharts可視化組件,能夠高效地完成數(shù)據(jù)加載和可視化頁(yè)面響應(yīng)。

        本文基于大量患者數(shù)據(jù)進(jìn)行全方位統(tǒng)計(jì)學(xué)分析,能夠簡(jiǎn)潔、直觀地反映患者數(shù)據(jù)隱含的規(guī)律信息,具有突出的應(yīng)用價(jià)值,主要體現(xiàn)在以下幾個(gè)方面:首先,基于提取患者所在地區(qū)、職業(yè)、年齡時(shí)期等特征,能夠使醫(yī)院醫(yī)生和管理層從宏觀上更加充分的了解患者基本情況和特點(diǎn),為醫(yī)院發(fā)展布局和個(gè)性化診療提供數(shù)據(jù)支持;其次,分析地域、職業(yè)、年齡、季節(jié)等因素與疾病的關(guān)聯(lián)關(guān)系,清晰的篩選出地方病、職業(yè)病、季節(jié)病、年期病等,有助于部分特殊疾病在不同環(huán)境下的預(yù)防和醫(yī)療資源部署;最后,挖掘患者年齡、疾病等特征對(duì)住院周期的影響,有助于住院資源的精準(zhǔn)調(diào)配,同時(shí)使患者從客觀角度上認(rèn)識(shí)自己的病情及對(duì)相關(guān)花費(fèi)的評(píng)估。但本文存在對(duì)挖掘結(jié)果缺乏深入研究與分析的問題,后期將聯(lián)合多名資深醫(yī)生繼續(xù)研究新的挖掘策略,并結(jié)合臨床充分研究和利用患者數(shù)據(jù)的挖掘結(jié)果。

        猜你喜歡
        數(shù)據(jù)挖掘可視化住院
        媽媽住院了
        基于CiteSpace的足三里穴研究可視化分析
        基于Power BI的油田注水運(yùn)行動(dòng)態(tài)分析與可視化展示
        云南化工(2021年8期)2021-12-21 06:37:54
        探討人工智能與數(shù)據(jù)挖掘發(fā)展趨勢(shì)
        基于CGAL和OpenGL的海底地形三維可視化
        “融評(píng)”:黨媒評(píng)論的可視化創(chuàng)新
        基于并行計(jì)算的大數(shù)據(jù)挖掘在電網(wǎng)中的應(yīng)用
        電力與能源(2017年6期)2017-05-14 06:19:37
        QCC在預(yù)防神經(jīng)內(nèi)科住院患者跌倒與墜床的應(yīng)用
        精神病人住院自縊 醫(yī)院擔(dān)啥責(zé)
        一種基于Hadoop的大數(shù)據(jù)挖掘云服務(wù)及應(yīng)用
        55夜色66夜色国产精品视频| 成人av在线免费播放| 91精品人妻一区二区三区水蜜桃| 精品亚洲成a人在线观看| 少妇高潮惨叫正在播放对白| 国产精品无码无片在线观看3D| 亚洲国产精品二区三区| 亚洲精品中文字幕乱码影院| 东北女人毛多水多牲交视频| 久草视频这里有精品| 韩国美女主播国产三级| 精品人妻中文av一区二区三区| 97精品超碰一区二区三区| 久久aⅴ无码一区二区三区| 在线观看中文字幕一区二区三区| 二区免费在线视频观看| 日韩精品内射视频免费观看| 亚洲自偷自拍另类图片小说| 人妻风韵犹存av中文字幕| 亚洲视频网站大全免费看| 久久综合九色综合欧美狠狠| 天天插视频| 白色白在线观看免费2| 国产成人综合美国十次| 国产色诱视频在线观看| 日本精品久久性大片日本| 国产自拍成人免费视频| 免费观看的av毛片的网站| 国产熟女亚洲精品麻豆| 国产一区精品二区三区四区| 国产熟妇与子伦hd| 99久久综合狠狠综合久久| 国产免费一区二区av| 久久精品成人91一区二区| 人妻熟女中文字幕av| 国产精品久久久久久久久绿色| 亚洲 高清 成人 动漫| 国产一级r片内射免费视频| 在线观看亚洲av每日更新影片| 国产免费人成视频在线观看| 国产精品国产三级在线高清观看|