亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于模糊聚類與機器學(xué)習(xí)的醫(yī)療數(shù)據(jù)統(tǒng)計分析算法設(shè)計

        2022-05-10 10:26:12王晨宇陳曦林昊潘利民徐國剛
        電子設(shè)計工程 2022年9期

        王晨宇,陳曦,林昊,潘利民,徐國剛

        (河北北方學(xué)院附屬第一醫(yī)院,河北張家口 075000)

        近年來,醫(yī)藥衛(wèi)生體制改革正在我國逐步推行,以加強衛(wèi)生經(jīng)濟管理和促進醫(yī)療費用的降級[1-2]?!翱床‰y”、“看病貴”已成為影響人們生活的社會問題,如何降低醫(yī)療費用、合理利用醫(yī)院資源成為了當(dāng)前相關(guān)學(xué)者的重點課題之一[3-5]。

        為了研究醫(yī)療費用和醫(yī)療資源使用情況之間的關(guān)系以及影響醫(yī)療費用的因素,目前已有多名學(xué)者發(fā)表了針對單病種的研究成果[6-10]。單病種通常指不存在并發(fā)癥的疾病,對其醫(yī)療費進行規(guī)范化管理是現(xiàn)階段我國醫(yī)保部門控制費用的方法之一?;颊咴谙硎茚t(yī)療服務(wù)后,根據(jù)疾病的種類和相關(guān)檢查、手術(shù),按照一定的比例進行付費。單病種付費在一定程度上降低了人均醫(yī)療費用,但在住院時間管理、單病種種類等方面仍存在不足[11-16]。

        為進一步綜合分析影響醫(yī)療費用的因素及醫(yī)療費用構(gòu)成是否合理,文中使用模糊聚類對患者治療過程中的相關(guān)信息進行特征提取與因素分析,并采用機器學(xué)習(xí)中的BP 神經(jīng)網(wǎng)絡(luò)構(gòu)建了醫(yī)療費用數(shù)據(jù)分析模型。

        1 單病種醫(yī)療數(shù)據(jù)統(tǒng)計分析

        單病種醫(yī)療數(shù)據(jù)統(tǒng)計分析主要為醫(yī)療費用的分析,充分考慮不同種類單病種的特點,同時多角度分析該種醫(yī)療費用的影響因素,實現(xiàn)診斷、治療成本的控制,進而降低患者的醫(yī)療費用并控制醫(yī)療資源的浪費。

        現(xiàn)階段的醫(yī)院門診與患者所有單據(jù)主要有4類:就診記錄表、手術(shù)信息表、診斷記錄表和收費明細表。根據(jù)這些表格和近年來的文獻,整理出如表1所示的影響醫(yī)療費用的因素。在所整理的數(shù)據(jù)結(jié)構(gòu)與內(nèi)容的基礎(chǔ)上,建立了基于患者、診斷、手術(shù)、醫(yī)院四者關(guān)系的醫(yī)療費用分析框架,具體如圖1 所示。

        表1 醫(yī)療費用影響因素

        圖1 醫(yī)療費用分析框架

        醫(yī)院和患者所有的單據(jù)上主要有數(shù)字和文字兩種信息,由于數(shù)字與文字結(jié)構(gòu)的不同,因此需要進行數(shù)據(jù)預(yù)處理以便進行多源異構(gòu)數(shù)據(jù)的融合。數(shù)據(jù)預(yù)處理包含數(shù)據(jù)清洗、特征提取、特征融合。數(shù)據(jù)清洗主要針對重復(fù)信息、數(shù)據(jù)缺失、異常數(shù)據(jù)這3 種情況,將無效數(shù)據(jù)去除。其中重復(fù)信息采用字段匹配的方式來識別,通過對各字段分詞、排序,分組檢測前后分詞的相似性。數(shù)據(jù)缺失分為兩種情況:一類是關(guān)鍵詞缺失,例如患者姓名、身份證信息、醫(yī)保賬戶等能夠關(guān)聯(lián)各個單據(jù)的關(guān)鍵詞信息缺失;另一類是非關(guān)鍵詞缺失,主要指患者身份信息、診斷內(nèi)容、費用明細表缺失。異常數(shù)據(jù)則主要是指數(shù)據(jù)輸入錯誤、醫(yī)療設(shè)備數(shù)據(jù)采集異常等。

        2 數(shù)據(jù)分析算法設(shè)計

        2.1 影響因素分析

        文中使用模糊聚類來分析影響醫(yī)療費用的因素比重。在未明確各因素的影響時,引入隸屬度來表征各因素與醫(yī)療費用之間的關(guān)系,具體如下式所示:

        式中,集合A為論域U的一個模糊子集,元素u屬于集合A的概率被定義為元素u到集合A的隸屬度,使用μA表示。此處,μA為論域U到[0,1]的一種映射關(guān)系。因此,集合A可用下式來描述:

        根據(jù)研究問題的特性,論域U可分為連續(xù)和離散兩種情況。當(dāng)論域U為連續(xù)集合時,使用式(3)中的積分表達式計算;當(dāng)論域U為離散集合時,使用式(3)中的求和表達式計算。模糊集合內(nèi)的元素具有相應(yīng)的計算規(guī)則,該規(guī)則使用五元組來表示,即(x,T(x),X,G,M)。在五元組中,x為變量,T(x)為定義在論域X上的模糊集合,G為產(chǎn)生語言變量x值名稱的語法規(guī)則,M為產(chǎn)生模糊集合的隸屬度函數(shù)。

        由于模糊理論在進行數(shù)據(jù)處理時,不能進行自適應(yīng)學(xué)習(xí)。而醫(yī)療數(shù)據(jù),尤其是患者醫(yī)療費用數(shù)據(jù)涵蓋了多種信息,直接使用模糊聚類則需要重復(fù)運算。因此,文中引入機器學(xué)習(xí)中的BP 神經(jīng)網(wǎng)絡(luò)來提高自適應(yīng)學(xué)習(xí)能力。

        2.2 基于改進BP神經(jīng)網(wǎng)絡(luò)的數(shù)據(jù)分析

        BP 神經(jīng)網(wǎng)絡(luò)通常由輸入層、隱藏層和輸出層構(gòu)成,根據(jù)每次訓(xùn)練的結(jié)果與預(yù)想結(jié)果的偏差來修改層與層之間的網(wǎng)絡(luò)權(quán)值及閾值,進而提高訓(xùn)練結(jié)果和預(yù)想結(jié)果的一致性。BP 神經(jīng)網(wǎng)絡(luò)的基本結(jié)構(gòu)為神經(jīng)元,如圖2 所示。

        圖2 神經(jīng)元結(jié)構(gòu)模型示意圖

        神經(jīng)元給每個輸入分配不同的比例,再以某種方式進行融合,融合結(jié)果Netin與閾值θi比較之后,經(jīng)過激活函數(shù)處理后傳遞下一個神經(jīng)元。使用w1,w2,…,wj來表示各個輸入的比例,融合方式采用線性加權(quán)求和方式以降低計算量,如式(4)所示:

        Sigmod 函數(shù)被用來作為神經(jīng)元激活函數(shù),其函數(shù)的輸入范圍大,包含負無窮大到正無窮大,輸出范圍為[0,1]。因此,該神經(jīng)元最終輸出可用下式來表示:

        用于單病種醫(yī)療費用數(shù)據(jù)分析的BP 神經(jīng)網(wǎng)絡(luò)模型結(jié)構(gòu)如圖3 所示。由于影響醫(yī)療費用的因素過多且單個樣本數(shù)據(jù)量較少,為提高BP 神經(jīng)網(wǎng)絡(luò)模型的學(xué)習(xí)效率,在隱藏層與輸出層之間增加分類器。對于輸出層與隱藏層之間神經(jīng)元的權(quán)重,使用vih來表示;隱藏層第h層各神經(jīng)元的權(quán)重使用θh來表示;隱藏層與隱藏層、隱藏層與分類器、分類器與分類器之間的神經(jīng)元權(quán)重使用whp來表示;隱藏層到輸出層神經(jīng)元之間的權(quán)重用wpj來表示;輸出層神經(jīng)元的閾值使用θj來表示。隱藏層的層數(shù)與神經(jīng)元的個數(shù)影響著訓(xùn)練的效率和時間。

        圖3 醫(yī)療費用數(shù)據(jù)分析模型結(jié)構(gòu)

        在進行BP 神經(jīng)網(wǎng)絡(luò)模型訓(xùn)練時,需要對各個權(quán)重賦予初始值,其值為區(qū)間(-1,1)之間的隨機數(shù),并約定誤差函數(shù)e、計算精度E和最大學(xué)習(xí)次數(shù)M。在樣本數(shù)據(jù)中隨機選擇訓(xùn)練樣本進行模型訓(xùn)練,則第k個樣本和期望輸出可表示為:

        隱藏層各個神經(jīng)元的數(shù)值與輸出給下一層神經(jīng)元的數(shù)值可表示為:

        在得到隱藏層、輸出層神經(jīng)元數(shù)值后,利用最小二乘法得到與期望數(shù)值的誤差,可表示為:

        利用誤差來修正各個權(quán)值,由于函數(shù)沿著梯度的方向變化速度最快,因此使用梯度下降法來更新BP 神經(jīng)網(wǎng)絡(luò)參數(shù),具體如下式所示:

        式中,η為學(xué)習(xí)速率,該值過大則容易錯過最優(yōu)解;反之,BP 神經(jīng)網(wǎng)絡(luò)模型訓(xùn)練速度過慢,則影響效率。在修正各層神經(jīng)元的連接權(quán)重后,計算全局誤差e。當(dāng)全局誤差e小于預(yù)設(shè)計算精度E或訓(xùn)練學(xué)習(xí)次數(shù)大于設(shè)定的學(xué)習(xí)次數(shù)M時,則終止算法;否則,選取下一個樣本數(shù)據(jù)進行訓(xùn)練。全局誤差e的計算方式為:

        3 數(shù)據(jù)測試與驗證

        模糊聚類和BP 神經(jīng)網(wǎng)絡(luò)模型的使用需要大量的數(shù)據(jù)支撐。為獲取足夠的訓(xùn)練和測試樣本數(shù)據(jù),調(diào)取了某醫(yī)院2020 年度住院患者的基本信息和相關(guān)單據(jù),并對數(shù)據(jù)進行預(yù)處理。訓(xùn)練與測試樣本數(shù)據(jù)共包含40 萬位患者的診斷、治療信息,數(shù)據(jù)量達1 120 萬條。測試仿真采用Matlab 7.0 仿真平臺,計算機配置為具有16.0 GB 內(nèi)存、500 GB 固態(tài)硬盤、2.4 GHz Inter(R)至強可擴展處理器。

        圖4 展示了不同隱藏層層數(shù)與神經(jīng)元個數(shù)對BP神經(jīng)網(wǎng)絡(luò)模型聚類精度的影響。從圖中可以看出,隱藏層層數(shù)和神經(jīng)元個數(shù)的增加對聚類精準(zhǔn)度的提高均具有改善作用。值得注意的是,隱藏層層數(shù)的增加會顯著提高聚類精準(zhǔn)度收斂的速度及收斂值。當(dāng)神經(jīng)元個數(shù)為35、隱藏層層數(shù)為2、3、4、5 時,聚類精度均達到收斂狀態(tài)。而在圖5 中可以看到,神經(jīng)元個數(shù)的增加可降低訓(xùn)練時間,且隱藏層層數(shù)的增加會增大整體的訓(xùn)練時間。這主要是由于BP 神經(jīng)網(wǎng)絡(luò)在進行模型權(quán)重修正時采用逆向傳遞,隱藏層層數(shù)的增加會增大計算量。因此綜合聚類精度與訓(xùn)練時間兩個方面,醫(yī)療費用數(shù)據(jù)分析模型采用4 層隱藏層,每層35 個神經(jīng)元的配置。

        圖4 不同隱藏層數(shù)下神經(jīng)元個數(shù)與聚類精準(zhǔn)度的關(guān)系

        圖5 隱藏層層數(shù)和神經(jīng)元個數(shù)對訓(xùn)練時間的影響

        基于模糊聚類和機器學(xué)習(xí)的醫(yī)療費用數(shù)據(jù)分析算法與基于Adaboost 算法的數(shù)據(jù)分析對比,如表2 所示。其中,兩種算法均采用相同的訓(xùn)練和測試數(shù)據(jù)。與文中采用雙層分類器不同的是,Adaboost 算法僅有一層分類器層,各個分類器的權(quán)重影響著分類精度。在表中,文中所述方案的分類精準(zhǔn)度在兩種樣本數(shù)據(jù)測試下,平均精準(zhǔn)度比Adaboost 算法高5.75%,這是由于雙層分類器的設(shè)置提高了分類器的識別能力。

        表2 兩種算法的數(shù)據(jù)分析精準(zhǔn)度對比

        4 結(jié)束語

        文中通過分析單病種患者的個人信息與病情、診斷、收費項目等內(nèi)容,使用模糊聚類來對相關(guān)信息進行特征提取及分析影響醫(yī)療費用的因素,并采用機器學(xué)習(xí)中的BP 神經(jīng)網(wǎng)絡(luò)構(gòu)建了醫(yī)療費用數(shù)據(jù)分析算法。該算法為綜合分析影響醫(yī)療費用的因素與醫(yī)療費用構(gòu)成是否合理提供了新的途徑。

        成人免费av高清在线| 无码不卡免费一级毛片视频| 亚洲国产AⅤ精品一区二区久| 91国产精品自拍视频| 国产午夜片无码区在线播放| 毛片24种姿势无遮无拦| 日韩成人无码v清免费| 中文亚洲第一av一区二区| 国产自拍精品一区在线观看| a级毛片免费观看在线| 无码免费人妻超级碰碰碰碰| 亚洲国产成人精品一区刚刚 | 中文字幕一区二区三区四区五区| 亚洲国产精品日韩av不卡在线| 国产精品无码片在线观看| 精品少妇一区二区三区四区| 亚洲综合色区一区二区三区| 极品美女aⅴ在线观看| 色综合久久加勒比高清88| 国产在线视频一区二区三| 十八禁无遮挡99精品国产| 久久久久亚洲av无码专区网站| 无码国产精品色午夜| 国产中文字幕亚洲精品| 国产成人a在线观看视频免费 | 99精品国产闺蜜国产在线闺蜜| 久久九九精品国产不卡一区| 国产亚洲美女精品久久久2020| 成人国产精品免费视频| 亚洲免费无毛av一区二区三区| 男男亚洲av无一区二区三区久久| 久久久亚洲欧洲日产国码αv| 狠狠色狠狠色综合日日92| 手机在线看片在线日韩av| 一本色道无码不卡在线观看| 国产suv精品一区二人妻| 精品国产1区2区3区AV| 蜜桃视频第一区免费观看| 中文字幕欧美人妻精品一区| AV无码中文字幕不卡一二三区| 中文字幕亚洲综合久久久|