亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于數(shù)據(jù)挖掘的門診輔助知識決策系統(tǒng)的應(yīng)用研究

        2022-06-27 08:56:20劉東麗袁玉妹王羨欠
        江西科學(xué) 2022年3期
        關(guān)鍵詞:中位數(shù)數(shù)據(jù)挖掘門診

        劉東麗,袁玉妹,王羨欠

        (江西省人民醫(yī)院,330006,南昌)

        0 引言

        隨著社會的發(fā)展,人們對自身的健康越發(fā)關(guān)注,我國優(yōu)質(zhì)醫(yī)療資源相對集中,醫(yī)院面臨的就診壓力越發(fā)增加,尤其體現(xiàn)在門診就診中。此對門診資源的配置會在很大程度上影響廣大患者的就醫(yī)體驗和醫(yī)院的核心競爭力[1-3]。如何科學(xué)、合理并充分地利用門診資源,成為醫(yī)院面臨的一大挑戰(zhàn)[4]。依靠傳統(tǒng)的人工門診資源調(diào)配已經(jīng)無法適應(yīng)新形勢的發(fā)展,隨著信息技術(shù)的發(fā)展,借力于信息化技術(shù)優(yōu)化門診資源配置成為一種新的趨勢[5-8]。

        數(shù)據(jù)挖掘(Data mining)又譯為資料探勘、數(shù)據(jù)采礦。它是數(shù)據(jù)庫知識發(fā)現(xiàn)(英語:Knowledge-Discovery in Databases,簡稱:KDD)中的一個步驟[9]。一般是指從大量的數(shù)據(jù)中通過算法搜索隱藏于其中信息的過程。數(shù)據(jù)挖掘通常與計算機(jī)科學(xué)有關(guān),并通過統(tǒng)計、在線分析處理、情報檢索、機(jī)器學(xué)習(xí)、專家系統(tǒng)(依靠過去的經(jīng)驗法則)和模式識別等諸多方法來實現(xiàn)上述目標(biāo)。隨著醫(yī)院信息化的建設(shè)不斷完善,在功能模塊上越來越豐富,數(shù)據(jù)量也越來越大,如何有效利用現(xiàn)有數(shù)據(jù)為醫(yī)療服務(wù)已經(jīng)成為各個醫(yī)院不得不面臨的問題。為了解決在醫(yī)學(xué)領(lǐng)域具有普遍性的“知識發(fā)現(xiàn)”問題,近幾年來產(chǎn)生了一項從海量數(shù)據(jù)中提取知識的技術(shù)數(shù)據(jù)挖掘[10]。國內(nèi)很多研究嘗試將數(shù)據(jù)挖掘應(yīng)用于醫(yī)院信息系統(tǒng)和統(tǒng)計分析與決策中[11-14],如何在計算機(jī)的幫助下,發(fā)現(xiàn)隱藏在這些海量數(shù)據(jù)背后的那些新的有學(xué)術(shù)價值的醫(yī)學(xué)信息,是系統(tǒng)面臨的重大挑戰(zhàn)[15-20]。

        門診輔助知識決策系統(tǒng)是一種利用信息化技術(shù)和數(shù)據(jù)挖掘技術(shù),展示一家醫(yī)院門診量分布、門診病種分布、季節(jié)性疾病規(guī)律、門診醫(yī)療資源配置等綜合指標(biāo)的系統(tǒng)。

        本文利用醫(yī)院現(xiàn)有數(shù)據(jù),通過基于數(shù)據(jù)挖掘的門診輔助知識決策系統(tǒng)的建立與應(yīng)用,挖掘門診患者在就診時間上的分布情況,掌握門診患者量高峰時間段,為醫(yī)院合理安排醫(yī)護(hù)力量和醫(yī)療設(shè)備提供輔助決策支持,減少患者的等待時間,避免因為醫(yī)療資源緊張導(dǎo)致不必要的醫(yī)療糾紛;挖掘季度性的門診患者量增長及季節(jié)性疾病情況,找出其特定的規(guī)律,為醫(yī)院在次年相應(yīng)季度提前建立應(yīng)對預(yù)案提供輔助決策支持,以優(yōu)化醫(yī)療設(shè)備,增加相應(yīng)疾病藥品的庫存量;挖掘門診醫(yī)療數(shù)據(jù),為醫(yī)院制定最佳的醫(yī)療服務(wù)舉措和最優(yōu)化的醫(yī)療資源配置提供決策支持,增強(qiáng)醫(yī)院對環(huán)境變化的適應(yīng)性,改善患者就醫(yī)體驗。

        1 方法

        1.1 數(shù)據(jù)納入

        某省級三甲綜合醫(yī)院2016—2021年10月門診醫(yī)療數(shù)據(jù)包含就診、門診診療數(shù)據(jù)、門診人員配備數(shù)據(jù)。就診數(shù)據(jù)包括:就診序號、日期、付費方式、患者ID號、就診科室、就診類別;門診診療數(shù)據(jù)包括:患者卡號、性別、出生日期、診斷編碼、診斷名稱、就診日期。核查數(shù)據(jù),剔除性別異常數(shù)據(jù)59條,剔除出生日期異常數(shù)據(jù)257條,共納入數(shù)據(jù)2 830 770例門診就診記錄。分析數(shù)據(jù),對采集的數(shù)據(jù)進(jìn)行分析處理如下(表1)。

        表1 研究變量及其量化情況

        1.2 統(tǒng)計方法

        利用ORACLE數(shù)據(jù)庫存儲原始數(shù)據(jù),Python3.8進(jìn)行數(shù)據(jù)清洗和處理,根據(jù)診斷對性別字段空置進(jìn)行處理。在Python3.8中編寫代碼對診斷數(shù)據(jù)進(jìn)行處理,生成診斷詞云圖。運用SPSS25工具對數(shù)據(jù)進(jìn)行分類、估計、預(yù)測、相關(guān)性分組或關(guān)聯(lián)規(guī)則分析。 運用EViews 進(jìn)行預(yù)測模型建立。

        1.3 結(jié)果與分析

        對2009—2020年10月門診就診數(shù)據(jù)進(jìn)行描述性統(tǒng)計分析,數(shù)據(jù)近似正態(tài)分布(偏度0.386<1,峰度-0.845<1),可以用t檢驗和方差分析,以P<0.05為差異性具有統(tǒng)計學(xué)意義。

        1.3.1 不同年齡就診情況 表2可以看出年齡6歲及以下27 227,中位數(shù)為344;7—17歲81 244,中位數(shù)為993;18—40歲660 726,中位數(shù)為8 056;41—65歲1 161 725,中位數(shù)為15 329。66歲及以上899 848份,中位數(shù)為12 490。采用ANOVA檢驗,得統(tǒng)計量:F=393.88,P<0.05,即不同年齡組的就診數(shù)量存在統(tǒng)計學(xué)差異。

        1.3.2 不同性別就診情況 表3可以看出男性就診量1 505 449,女性就診量1 325 321,男:女=1:0.88。男性就診量的就診數(shù)量中位數(shù)為20 341,女性病例為17 483(表3)。通過T檢驗得到統(tǒng)計量T= 2.585,P=0.663,P>0.05,即不同性別的就診數(shù)據(jù)差別沒有統(tǒng)計學(xué)意義。

        表2 不同年齡就診數(shù)量

        表3 不同性別就診統(tǒng)計

        1.3.3 診斷分布 診斷數(shù)據(jù)存在較多自用的編碼和名稱,為了統(tǒng)計診斷數(shù)據(jù)的差異性,根據(jù)國際疾病分類ICD-10標(biāo)準(zhǔn)編碼對診斷數(shù)據(jù)進(jìn)行清洗,通過T檢驗得到統(tǒng)計量T= 5.935,P=0.000,P<0.05,即不同診斷的就診數(shù)量存在統(tǒng)計學(xué)差異,通過Python生成診斷詞云圖(圖1),排名前10的診斷為高血壓病、糖尿病、腦梗死、心臟病、腹痛、屈光不正、尿毒癥、胃炎、腎移植狀態(tài)、睡眠障礙。

        1.3.4 付費方式 窗口途徑1 838 029例,自助途徑992 741例,窗口:自助= 1.85:1。窗口途徑的就診數(shù)量中位數(shù)為25 819,自助途徑中位數(shù)為13 743(表4)。通過T檢驗得到統(tǒng)計量T= 7.068,

        圖1 診斷詞云圖

        P=0.000,P<0.05,即不同途徑的就診數(shù)量存在統(tǒng)計學(xué)差異。通過分析每年就診途徑數(shù)據(jù)發(fā)現(xiàn)隨著信息技術(shù)發(fā)展自助就診的數(shù)量也在逐年增加。

        1.3.5 就診科室 按科室就診數(shù)量排名前10的為心血管內(nèi)科、神經(jīng)內(nèi)科、內(nèi)分泌骨質(zhì)疏松與骨病科、急診科、消化內(nèi)科、眼科、骨科、呼吸與危重癥醫(yī)學(xué)科、腎臟內(nèi)科、婦科,通過T檢驗得到統(tǒng)計量T= 267.315,P=0.000,P<0.05,即不同科室的就診數(shù)量存在統(tǒng)計學(xué)差異。

        1.3.6 就診類別 專家就診579 230例、普通就診1 989 920 例、急診就診169 952例、義診就診79 608例、特需就診12 060例;專家就診數(shù)量中位數(shù)為7 828,普通就診數(shù)量中位數(shù)為25 497,急診就診數(shù)量中位數(shù)為2 286,義診就診數(shù)量中位數(shù)為2 770,特需就診數(shù)量中位數(shù)為102(表5)。采用ANOVA檢驗,得統(tǒng)計量:F=140.83,P<0.05,即不同類別的就診數(shù)量存在統(tǒng)計學(xué)差異。

        表4 不同性別就診數(shù)量統(tǒng)計

        表5 不同性別就診數(shù)量統(tǒng)計

        1.3.7 回歸分析 單因素分析結(jié)果顯示,納入變量中有多個變量在就診數(shù)量組間存在統(tǒng)計學(xué)差異,因此需進(jìn)行回歸分析,找出主要影響因素。本研究選用能夠反映變量與就診數(shù)量之間直接影響作用的逐步回歸模型。

        1)變量納入。因變量為就診數(shù)量,自變量選取影響因素(表1)。通過以上分析可知就診數(shù)量呈偏近似正態(tài)分布,對因變量和自變量進(jìn)行逐步回歸分析。變量入選標(biāo)準(zhǔn)為α=0.05,剔除標(biāo)準(zhǔn)為β=0.10。

        2)標(biāo)準(zhǔn)化回歸方程的建立。從圖2中可以看出經(jīng)過回歸后6個變量中只進(jìn)入了5個變量即X2、X3、X4、X5、X6。根據(jù)模型的偏回歸系數(shù)、標(biāo)準(zhǔn)回歸系數(shù)、回歸系數(shù)假設(shè)檢驗t值、P值。建立逐步回歸方程如下:

        Y=-7.535+5.868X2-6.611X3+3.654X4+0.256X5-0.005X6

        圖2 回歸分析結(jié)果

        3)回歸方程檢驗?;貧w方式檢驗結(jié)果為F=25.254,P<0.05,認(rèn)為回歸方程有統(tǒng)計學(xué)意義。從標(biāo)準(zhǔn)化回歸方程回歸結(jié)果可以看出,影響就診數(shù)量的主要因素從大到小為:途徑、年齡、就診類別、科室、診斷。在控制其它因素的條件下,就診數(shù)量與年齡、就診類別、科室、診斷呈顯著正相關(guān),就診數(shù)量與途徑呈顯著負(fù)相關(guān)。通過上面分析可以看出,納入的6個變量中途徑、年齡、就診類別、科室、診斷5個變量對就診數(shù)量存在一定影響,與單因素分析結(jié)果一致。

        1.3.8 預(yù)測模型 選取2016年1月至2021年10月的月門診就診數(shù)量,進(jìn)行統(tǒng)計預(yù)測建模及分析。共納入70個月門診就診數(shù)量作為樣本。根據(jù)數(shù)據(jù)特點可進(jìn)行時間序列建模。

        1)平穩(wěn)性時序圖檢驗。將EXCEL中數(shù)據(jù)導(dǎo)入Eviews軟件中生成時序圖,從圖3中可以看出門診就診數(shù)量(ghcount)序列是平穩(wěn)的。

        圖3 時序和自相關(guān)性檢驗圖

        樣本自相關(guān)性檢驗。從樣本相關(guān)函數(shù)圖(圖3)可以看到月門診就診數(shù)量(ghcount)的樣本相關(guān)函數(shù)是緩慢的遞減趨于零的,且具有一定。所以,通過月門診就診數(shù)量(ghcount)的樣本相關(guān)圖,可初步判定該年門診就診數(shù)量(ghcount)時間序列是平穩(wěn)。

        單位根檢驗(ADF-Schwarz Info Criterion檢驗)。對月門診就診數(shù)量(ghcount)進(jìn)行ADF檢驗,結(jié)果顯示在1%的顯著性水平下,單位根統(tǒng)計量ADF=-4.934 538大于Eviews給出的ADF臨界值-3.476 275(圖4)。所以拒絕原假設(shè),即月人均就診數(shù)量(ghcount)序列是平穩(wěn)的。

        圖4 月門診就診數(shù)量(ghcount)單位根檢驗

        2)估計月門診就診數(shù)量統(tǒng)計預(yù)測模型。從時序圖(圖3)可以看出,序列既有長期趨勢又有周期性,季節(jié)性因素會導(dǎo)致統(tǒng)計數(shù)據(jù)不能客觀反映數(shù)據(jù)變化情況,因此使用Eviews軟件中時間序列指數(shù)平滑模型exponential smoothing方法對月門診就診數(shù)量進(jìn)行調(diào)整(圖5),除掉季節(jié)波動因素的影響,可初步建立模型ARIMA(1,0,1)×(1,0,1)12和模型ARIMA(1,0,0)×(0,0,1)12。模型檢驗結(jié)果顯示:ARIMA(1,0,0)×(0,0,1)12模型的SAR(12)系數(shù)、C值系數(shù)、MA(1)系數(shù)的T檢驗P值大于0.05,不滿足參數(shù)有統(tǒng)計學(xué)意義要求;模型ARIMA(1,0,1)×(1,0,1)12的SMA(12)系數(shù)、AR(1)系數(shù)的T檢驗P值均小于0.05(圖6),滿足參數(shù)有統(tǒng)計學(xué)意義要求。

        圖5 月門診就診數(shù)量平滑指數(shù)處理

        3)模型檢驗。對滿足參數(shù)有統(tǒng)計學(xué)意義的模型ARIMA(1,0,1)12進(jìn)行殘差檢驗,根據(jù)殘差相關(guān)圖可以看出,滯后階數(shù)為10時,Q統(tǒng)計量為10.5,P值為0.389,P>0.05(圖7)。因此,可以確定的預(yù)測模型為ARIMA(1,0,1)12,其表達(dá)式為:

        (1-0.966B)▽12▽Xt=(1+0.45B)εt。

        圖6 ARIMA(1,0,1)

        圖7 ARIMA(1,0,1)殘差檢驗

        Theil′s inequality coefficients表示Theil不相等系數(shù),介于0~1之間;數(shù)值越小表明擬合值和真實值之間的差異越小,預(yù)測精度越高。covariance proportion 表示協(xié)方差誤,反映殘存非系統(tǒng)預(yù)測誤差,該誤差占比越大,預(yù)測效果越好。擬合統(tǒng)計模型ARIMA(1,0,1),結(jié)果顯示Theil不相等系數(shù)為0.05,其中協(xié)方差誤為0.969(圖8、圖9),大于方差誤(0.002 665),說明模型的預(yù)測結(jié)果較理想,擬合效果良好,提取序列的信息充分,模型精簡。

        圖8 模型預(yù)測

        4)模型預(yù)測。為檢驗?zāi)P偷念A(yù)測誤差,現(xiàn)以2016—2020年數(shù)據(jù)為樣本,對2021年1—10月進(jìn)行預(yù)測,并與其真實值進(jìn)行對比,計算預(yù)測誤差,誤差均值為5.35%(表6)。

        圖9 模型擬合

        表6 2021年1—10月門診就診數(shù)量預(yù)測

        3 結(jié)論

        通過基于數(shù)據(jù)挖掘的門診輔助知識決策系統(tǒng)的建立與應(yīng)用,挖掘門診患者在就診時間上的分布情況,掌握門診患者量高峰時間段,為醫(yī)院合理安排醫(yī)護(hù)力量和醫(yī)療設(shè)備提供輔助決策支持,減少患者的等待時間,避免因為醫(yī)療資源緊張導(dǎo)致不必要的醫(yī)療糾紛;挖掘季度性的門診患者量增長及季節(jié)性疾病情況,找出其特定的規(guī)律,為醫(yī)院在次年相應(yīng)季度提前建立應(yīng)對預(yù)案提供輔助決策支持,以優(yōu)化醫(yī)療設(shè)備,增加相應(yīng)疾病藥品的庫存量;挖掘門診醫(yī)療數(shù)據(jù),為醫(yī)院制定最佳的醫(yī)療服務(wù)舉措和最優(yōu)化的醫(yī)療資源配置提供決策支持,改善患者就醫(yī)體驗。

        猜你喜歡
        中位數(shù)數(shù)據(jù)挖掘門診
        門診支付之變
        探討人工智能與數(shù)據(jù)挖掘發(fā)展趨勢
        中位數(shù)計算公式及數(shù)學(xué)性質(zhì)的新認(rèn)識
        基于并行計算的大數(shù)據(jù)挖掘在電網(wǎng)中的應(yīng)用
        電力與能源(2017年6期)2017-05-14 06:19:37
        漢字小門診系列(四)
        漢字小門診系列(九)
        漢字小門診系列(八)
        一種基于Hadoop的大數(shù)據(jù)挖掘云服務(wù)及應(yīng)用
        2015年中考數(shù)學(xué)模擬試題(五)
        2015年中考數(shù)學(xué)模擬試題(二)
        中文字幕人成乱码中文乱码 | 精品av天堂毛片久久久| 欧美成人专区| 国产高清丝袜美腿视频在线观看| 国产亚洲av综合人人澡精品| 韩国三级在线观看久| 国产做a爱片久久毛片a片| 亚洲午夜无码AV不卡| 国内偷拍第一视频第一视频区| 日本一区二区视频免费在线看| 国产精品无码久久久久久| 国产网站视频| av天堂手机一区在线| 偷拍综合在线视频二区| 亚洲第一无码xxxxxx| 欧美性一区| 人妻有码中文字幕在线| 久久人妻少妇嫩草av| 亚洲欧洲中文日韩久久av乱码| 亚洲高清精品50路| 久久麻传媒亚洲av国产| 色费女人18毛片a级毛片视频| 亚洲av乱码中文一区二区三区 | 日韩a毛片免费观看| 日本精品久久久久中文字幕1| 日本a爱视频二区三区| 亚洲妇女自偷自偷图片| 中文无码成人免费视频在线观看 | 久久精品国产第一区二区三区| 无码一区二区三区在线在看| 亚洲国产精品成人一区二区在线| 手机看黄av免费网址| 欧美真人性做爰一二区| 日日骚一区二区三区中文字幕| 国产免费在线观看不卡| 人人妻人人爽人人澡人人| 亚洲色欲久久久综合网| av人妻在线一区二区三区| 台湾佬中文娱乐网22| 亚洲视频在线看| 蜜臀久久久精品国产亚洲av|