宋 波,辛文賢,馮云霞
(青島科技大學(xué) 信息科學(xué)技術(shù)學(xué)院,山東 青島 266061)
臨床路徑作為一套標(biāo)準(zhǔn)化的治療模式和治療程序,在降低醫(yī)療費(fèi)用、減少治療天數(shù)、合理規(guī)范醫(yī)務(wù)人員行為、有效利用醫(yī)療資源等方面有很大的改善[1]。許多國內(nèi)外研究者也在不斷地優(yōu)化臨床路徑治療模式。其中,國外研究者Gomez Portilla等以腹膜癌為例,提出制定一個(gè)標(biāo)準(zhǔn)化臨床路徑管理計(jì)劃,以便嚴(yán)格評估護(hù)理計(jì)劃中的發(fā)病率、死亡率和實(shí)施結(jié)果,旨在能夠不斷優(yōu)化臨床路徑[2]。Thomas BURKLE基于工作流的方法開發(fā)和優(yōu)化了腰神經(jīng)壓迫綜合征臨床路徑系統(tǒng),以優(yōu)化臨床路徑的執(zhí)行過程為主,但該系統(tǒng)并沒有實(shí)際運(yùn)用在電子病歷中[3]。Gang Du等人為了提高模型的整體處理性能,提出了基于隨機(jī)協(xié)同分解粒子群優(yōu)化和雙變異機(jī)制的T-S模糊神經(jīng)網(wǎng)絡(luò)模型,對骨肉瘤術(shù)前化療肝腎中毒臨床路徑變異案例進(jìn)行研究驗(yàn)證,結(jié)果表明在穩(wěn)定性、效率性、精確度和普遍性等均優(yōu)于原來的模型[4]。
在國內(nèi),李飛飛將調(diào)度算法和工作流技術(shù)應(yīng)用到電子化臨床路徑管理當(dāng)中,提高臨床路徑執(zhí)行效率、保證臨床路徑的實(shí)施質(zhì)量[5]。趙艷麗對復(fù)雜病種的診療過程采用分層賦時(shí)著色Petri網(wǎng)建模,此模型對臨床路徑中病人狀態(tài)變化、診療信息流轉(zhuǎn)實(shí)現(xiàn)可視化監(jiān)控[6]。譚劍提出基于狀態(tài)機(jī)工作流模型的臨床路徑優(yōu)化方法,通過響應(yīng)臨床事件,降低臨床路徑的執(zhí)行難度和增加變異的適應(yīng)性[7]。田宗梅利用聚類分析和概率相結(jié)合的方法,制定出符合當(dāng)?shù)氐呐R床路徑,提高了準(zhǔn)確性和實(shí)施質(zhì)量[8]。
以上研究解決了臨床路徑優(yōu)化的部分問題,但仍存在以下難點(diǎn):(1)臨床路徑涉及檢查檢驗(yàn)、藥品、護(hù)理等項(xiàng)目,數(shù)據(jù)量大且復(fù)雜,普通的數(shù)據(jù)挖掘技術(shù)難以發(fā)現(xiàn)隱藏?cái)?shù)據(jù)關(guān)系;(2)大部分研究并沒有對臨床路徑治療天數(shù)或費(fèi)用等進(jìn)行實(shí)驗(yàn)分析,缺乏一定的可靠性。
在以前研究的基礎(chǔ)之上,針對以上優(yōu)化難點(diǎn),文中采用BP神經(jīng)網(wǎng)絡(luò)與臨床路徑相結(jié)合的方法解決以上難點(diǎn)。以臨床路徑診療單元的平均治療天數(shù)為網(wǎng)絡(luò)的輸入層,以臨床路徑的期望治療天數(shù)為輸出層,訓(xùn)練網(wǎng)絡(luò)模型,通過修改相關(guān)參數(shù)對網(wǎng)絡(luò)進(jìn)行仿真實(shí)驗(yàn),得到最優(yōu)臨床路徑。
如圖1所示,臨床路徑的優(yōu)化結(jié)構(gòu)分為三部分,第一部分是從醫(yī)院信息管理系統(tǒng)中抽取臨床路徑數(shù)據(jù),根據(jù)醫(yī)囑類型和治療功效劃分為診療單元,并計(jì)算診療單元的平均治療天數(shù);第二部分是建立BP神經(jīng)網(wǎng)絡(luò)臨床路徑優(yōu)化模型,通過修改相關(guān)參數(shù)對網(wǎng)絡(luò)進(jìn)行訓(xùn)練;第三部分是分析輸出值與期望值的相對誤差,根據(jù)誤差范圍判斷模型的有效性。
圖1 基于BP神經(jīng)網(wǎng)絡(luò)的臨床路徑整體優(yōu)化結(jié)構(gòu)
臨床路徑的數(shù)據(jù)情況具有復(fù)雜性和模糊不確定性。BP神經(jīng)網(wǎng)絡(luò)具有非線性映射[9]、自學(xué)習(xí)自適應(yīng)能力和并行分布式的存儲(chǔ)方式[10]以及很強(qiáng)的容錯(cuò)性,能夠處理復(fù)雜的模糊數(shù)據(jù),因此可以作為優(yōu)化臨床路徑的方法。
1985年,David Rumelhart等科學(xué)家研究并發(fā)現(xiàn)了誤差反向傳播算法(error back propagation training,簡稱BP算法),BP算法是由信號的正向傳播和誤差的反向傳播兩部分組成的[11]。
BP算法就是通過不斷修改權(quán)系數(shù)對網(wǎng)絡(luò)進(jìn)行訓(xùn)練?;驹砣缦耓12]:在正向傳播過程中,訓(xùn)練樣本通過網(wǎng)絡(luò)的輸入層傳遞給隱層,經(jīng)隱層處理再傳遞給輸出層,輸出訓(xùn)練后的值。計(jì)算輸出值與期望輸出值是否一致,若值不一致,則進(jìn)入反向傳播階段。反向傳播過程中,首先計(jì)算輸出層輸出值與期望輸出值之間的誤差之和,接下來計(jì)算隱層每個(gè)神經(jīng)元的輸出值的誤差和權(quán)系數(shù)的誤差,通過得到的誤差對權(quán)系數(shù)進(jìn)行更新,直至網(wǎng)絡(luò)中的神經(jīng)元的權(quán)系數(shù)都更新完畢。重新訓(xùn)練樣本數(shù)據(jù),若輸出值與期望輸出值還不一致,則繼續(xù)重復(fù)以上步驟,一直訓(xùn)練到網(wǎng)絡(luò)輸出值與期望輸出值的差在一定接受范圍之內(nèi),或者是達(dá)到設(shè)定的最大迭代次數(shù)。
BP算法的具體步驟如下[13]:
步驟1:初始化感知器的所有參數(shù),包括權(quán)系數(shù)wi、偏置因子bi、最小值m和學(xué)習(xí)率參數(shù)θ(0<θ<1)。
步驟2:確定輸入信息x=(x1,x2,…,xn)T,期望值d=(d1,d2,…,dn)。
(1)正向傳播。計(jì)算隱層和輸出層的各個(gè)神經(jīng)元的輸出值uj:
(1)
uj=f(Wj)
(2)
(2)反向傳播。計(jì)算各隱層神經(jīng)元的誤差δj:
(3)
其中,δi是對第j+1層的所有神經(jīng)元誤差信息求和。
(3)修正權(quán)系數(shù)。
Δwji=θδjui
(4)
(4)更新神經(jīng)元的權(quán)系數(shù)。
wji=wji-Δwji
(5)
步驟3:輸入訓(xùn)練樣本,重復(fù)進(jìn)行第二步,直至所有的輸出值與期望值之間的誤差等于0或小于初始化的最小值m,或者學(xué)習(xí)次數(shù)達(dá)到設(shè)定最大值。
BP神經(jīng)網(wǎng)絡(luò)是一種多層前向神經(jīng)網(wǎng)絡(luò)模型,能夠有效解決網(wǎng)絡(luò)中隱層神經(jīng)元之間的連接權(quán)系數(shù),具有很強(qiáng)的自學(xué)習(xí)和自適應(yīng)性、非線性映射能力,是目前應(yīng)用范圍最廣的神經(jīng)網(wǎng)絡(luò)[14]。BP神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)如圖2所示。
圖2 BP神經(jīng)網(wǎng)絡(luò)模型結(jié)構(gòu)
BP神經(jīng)網(wǎng)絡(luò)包含輸入層、輸出層和一個(gè)或者多個(gè)隱層,圖2中是一個(gè)包含兩層隱層的BP神經(jīng)網(wǎng)絡(luò)。處理好的樣本數(shù)據(jù)從輸入層輸入,經(jīng)由隱層進(jìn)行處理,最后通過輸出層輸出結(jié)果。
以某地區(qū)三甲醫(yī)院心內(nèi)科近兩年的糖尿病加高血壓臨床路徑數(shù)據(jù)為實(shí)驗(yàn)數(shù)據(jù),從醫(yī)院信息管理系統(tǒng)中抽取標(biāo)準(zhǔn)的糖尿病加高血壓臨床路徑60例。首先計(jì)算每個(gè)診療單元的平均治療天數(shù),然后建立基于BP神經(jīng)網(wǎng)絡(luò)的臨床路徑優(yōu)化模型,對網(wǎng)絡(luò)模型進(jìn)行仿真及結(jié)果分析,從而得到最優(yōu)臨床路徑。
診療單元是指按照治療功效將藥品、檢查檢驗(yàn)項(xiàng)目和各種護(hù)理方法組合成不同的集合[15]。糖尿病加高血壓臨床路徑的診療單元如圖3所示。
圖3 糖尿病加高血壓臨床路徑診療單元
根據(jù)診療單元的劃分規(guī)則,首先將糖尿病加高血壓的臨床路徑劃分為內(nèi)分泌科護(hù)理常規(guī)、長期口服藥物、抗血小管聚集、長期胰島素、降壓藥、改善循環(huán)和營養(yǎng)神經(jīng)藥物7個(gè)單元,然后計(jì)算每個(gè)診療單元的平均治療天數(shù),取臨床路徑治療天數(shù)作為最終指標(biāo),設(shè)7個(gè)診療單元為X1,X2,X3,X4,X5,X6,X7,治療天數(shù)為DAY。對數(shù)據(jù)進(jìn)行提取、分析,最終得到的診療單元部分?jǐn)?shù)據(jù)如表1所示。
表1 診療單元
續(xù)表1
BP神經(jīng)網(wǎng)絡(luò)輸入樣本的數(shù)據(jù)中,不同維度的樣本數(shù)據(jù)也有所不同,可能是不同維度之間的樣本數(shù)據(jù)差距較大,也可能是同維度的樣本數(shù)據(jù)之間相差范圍較大,數(shù)據(jù)波動(dòng)范圍太大將會(huì)導(dǎo)致神經(jīng)網(wǎng)絡(luò)模型的訓(xùn)練時(shí)間增長、收斂效果不理想,因此在確定輸入樣本后,還需要對數(shù)據(jù)進(jìn)行歸一化處理,也就是將數(shù)據(jù)映射到區(qū)間[0,1]或者[-1,1]中。
本課題采用的歸一化公式[16]為:
(6)
3.3 基于BP神經(jīng)網(wǎng)絡(luò)的臨床路徑優(yōu)化模型仿真及結(jié)果分析
由于臨床路徑數(shù)據(jù)涉及治療項(xiàng)目較多,因此建模前將臨床路徑劃分為診療單元,并對診療單元數(shù)據(jù)進(jìn)行歸一化處理。將得到的60例樣本數(shù)據(jù)中的42例(70%)作為訓(xùn)練樣本,用于模型的訓(xùn)練,剩下的18例(30%)作為測試樣本,檢驗(yàn)?zāi)P偷挠行?。建立模型的步驟如下:
(1)BP神經(jīng)網(wǎng)絡(luò)的輸入。
糖尿病加高血壓臨床路徑的7個(gè)診療單元即構(gòu)成了BP神經(jīng)網(wǎng)絡(luò)的輸入層。
(2)建立BP神經(jīng)網(wǎng)絡(luò)優(yōu)化模型。
綜合以上BP神經(jīng)網(wǎng)絡(luò)的研究以及臨床路徑數(shù)據(jù)的分析,建立本實(shí)驗(yàn)的BP神經(jīng)網(wǎng)絡(luò)模型結(jié)構(gòu)如下:
第一層:輸入層。輸入的樣本數(shù)據(jù)為內(nèi)分泌科護(hù)理常規(guī)、長期口服藥物、抗血小管聚集、長期胰島素、降壓藥、改善循環(huán)和營養(yǎng)神經(jīng)藥物7個(gè)診療單元的平均治療天數(shù),因此輸入層的神經(jīng)元共有7個(gè)。
第二層:隱層。正向傳播時(shí),利用式(1)和式(2)計(jì)算隱層的總輸出值,并將每個(gè)神經(jīng)元的值傳遞給輸出層;反向傳播時(shí),通過輸出層傳遞的誤差信號計(jì)算隱層各神經(jīng)元的誤差信號,并傳遞給輸入層。因?yàn)殡[層層數(shù)與神經(jīng)元數(shù)量對BP神經(jīng)網(wǎng)絡(luò)有一定影響,因此分別選取3、5、7、9作為隱層的神經(jīng)元數(shù)量進(jìn)行實(shí)驗(yàn),選取錯(cuò)誤率最低的一個(gè)。
第三層:輸出層。通過分析輸出值與期望值的相對誤差,就能判斷模型是否具有有效性。輸出值是臨床路徑的治療天數(shù),因此輸出層神經(jīng)元為1個(gè)。
基于BP神經(jīng)網(wǎng)絡(luò)的臨床路徑優(yōu)化模型結(jié)構(gòu)如圖4所示。
圖4 BP神經(jīng)網(wǎng)絡(luò)模型結(jié)構(gòu)
(3)確定隱層神經(jīng)元數(shù)量。
選取3、5、7、9作為隱層的神經(jīng)元數(shù)量進(jìn)行分組對比實(shí)驗(yàn),結(jié)果如圖5和圖6所示,分別反映了當(dāng)神經(jīng)元數(shù)量不同時(shí),模型的錯(cuò)誤率和迭代次數(shù)。
圖5 錯(cuò)誤率
圖6 迭代次數(shù)
從圖5、圖6中可以看出,當(dāng)隱層神經(jīng)元數(shù)量增加時(shí),錯(cuò)誤率隨之降低,迭代次數(shù)出現(xiàn)波動(dòng),當(dāng)神經(jīng)元數(shù)量為5時(shí)迭代次數(shù)最高為1 051次。結(jié)合兩圖結(jié)果,選取9個(gè)神經(jīng)元作為模型的隱層神經(jīng)元數(shù)量。
(4)優(yōu)化模型仿真及結(jié)果分析。
對42例糖尿病加高血壓臨床路徑的訓(xùn)練樣本進(jìn)行訓(xùn)練,計(jì)算輸出值與期望值的相對誤差,結(jié)果如圖7所示。
圖7 訓(xùn)練輸出相對誤差
從圖7中可以看出網(wǎng)絡(luò)模型的輸出值與期望輸出值非常接近,相對誤差的絕對值在0%~0.2%之間,這說明該網(wǎng)絡(luò)模型具有較好的學(xué)習(xí)能力,能夠通過訓(xùn)練來優(yōu)化臨床路徑,有效降低了臨床路徑的治療天數(shù)。
為了驗(yàn)證網(wǎng)絡(luò)模型的有效性,將18條測試樣本數(shù)據(jù)輸入到網(wǎng)絡(luò)模型中進(jìn)行測試,輸出結(jié)果的相對誤差見圖8。
圖8 測試輸出相對誤差
圖8中顯示,模型的輸出值與期望值之間的相對誤差的絕對值在0%~0.1%之間,測試樣本的輸出相對誤差小于訓(xùn)練樣本的輸出相對誤差,說明模型在訓(xùn)練過程中已經(jīng)學(xué)習(xí)到了診療單元的平均治療天數(shù)與臨床路徑總執(zhí)行天數(shù)之間的關(guān)系,證明網(wǎng)絡(luò)具有很好的自學(xué)習(xí)和自適應(yīng)性,具有一定的有效性。
臨床路徑涉及檢查檢驗(yàn)、手術(shù)、藥品、護(hù)理等項(xiàng)目,數(shù)據(jù)復(fù)雜,BP神經(jīng)網(wǎng)絡(luò)非常適合對臨床路徑進(jìn)行優(yōu)化建模研究。文中選用糖尿病加高血壓臨床路徑作為實(shí)驗(yàn)樣本,基于BP神經(jīng)網(wǎng)絡(luò)選擇錯(cuò)誤率最低的隱層神經(jīng)元數(shù)量建立臨床路徑優(yōu)化模型進(jìn)行仿真實(shí)驗(yàn)。實(shí)驗(yàn)結(jié)果證明,該模型具有良好的自學(xué)習(xí)自適應(yīng)性,并且具有一定的有效性,能夠提高臨床路徑的治療效果,減少臨床路徑的治療天數(shù)。因此,BP神經(jīng)網(wǎng)絡(luò)對臨床路徑優(yōu)化方面具有一定的有效性。