淮安市第二人民醫(yī)院 設備科,江蘇 淮安 223002
隨著科學技術的發(fā)展,現代化機械設備不斷出現在人們的生活和工作中。近年來,醫(yī)療裝備新技術發(fā)展迅猛,大量智能化、高精度化、高速化的新型醫(yī)療裝備(如B超、CT、MRI等)涌入醫(yī)院,已成為二、三級醫(yī)院必備的產品[1-4]。醫(yī)療設備種類多、數量大,如何對龐雜的醫(yī)療設備進行管理、維修已經成為醫(yī)學技術人員研究的重點和難點[5-6]。一方面,醫(yī)療設備,特別是大型醫(yī)療設備,一般是由電子元件、電路、機械、水路以及光路組成,具有龐雜而繁瑣的結構和功能,為醫(yī)療設備故障的監(jiān)測和排查提出了巨大的挑戰(zhàn);另一方面,醫(yī)院制定的預防性維護、定期巡查等制度在龐大的醫(yī)療設備數字面前往往是有形無實,預防性維護難以起到預防的效果。此外,醫(yī)學技術人員技能水平難以實現對醫(yī)療裝備技術的同步提升,對于新型醫(yī)療設備的故障盤查,往往會使醫(yī)學技術人員捉襟見肘?;诖?,本文旨在提出一種基于數據挖掘技術的粗糙神經網絡模型,為醫(yī)療設備故障監(jiān)測和識別提供一種參考方法。
粗糙集理論是由波蘭科學家Z.Pawlak提出的,用于處理不完整的或者具有模糊關系的數據集,并可從已有的一系列數據中挖掘出各模糊數據集中的互作用,從中發(fā)現隱含的知識,揭示潛在的規(guī)律[7-8]。粗糙集理論的核心是有關知識、集合的劃分、近似集合等概念,粗糙集理論作為一種處理不精確、不一致、不完整等各種不完備信息的有效工具,通過對發(fā)掘各類不一致、不精準數據集進行提取整理,通過運算實現有用信息的提取,以及對未知事物的預測[9]。在自然界中,大部分事物呈現的信息都是不完整和模糊的,對于這些信息,無法用常規(guī)方法進行描述其內部邏輯,所以也就不能正確地處理[10]。在粗糙集中使用信息表來描述論域中的數據集合,例如呼吸機供氧濃度高低是否會影響呼吸治療,粗糙集使用信息表描述如表1所示。
表1 呼吸機粗糙集信息表
表1中,“供氧濃度”是該粗糙集的條件屬性(Condition Attribute),“是否影響呼吸治療”是粗糙集的決策屬性(Decision Attribute)。粗糙集理論其原則就是要使用隱含的條件屬性(供氧濃度),來尋找決策規(guī)律(是否影響呼吸治療)。
粗糙集的約簡過程是保持粗糙集中初等范疇的情況下,消除粗糙集中的冗余數據。該過程為降維過程,僅保留真正有用的數據,即粗糙集的“核”。通常一個粗糙集的約簡集不是唯一的,因此,我們期望得到最小決策條件屬性的粗糙約簡集。然而,當所研究的事物結構增加時,最小粗糙約簡集的計算過程將急劇增加。目前,使用最多的方法是啟發(fā)式搜索法,主要包括基于屬性重要性的約簡算法、基于區(qū)分矩陣和邏輯運算的約簡算法、基于屬性頻率函數啟發(fā)的約簡算法等[11-14]。由于醫(yī)療設備故障因素約簡過程受限于軟件、硬件、結構、環(huán)境以及設備固有條件等知識庫,在實際操作中粗糙集約簡過程受經驗、經濟支出等主客觀因素影響,本文使用基于屬性重要性的約簡算法對粗糙集進行簡約。
BP(Back Propagation)網絡,是一種按誤差逆?zhèn)鞑ニ惴ㄓ柧毜亩鄬忧梆伨W絡,是目前應用最廣泛的神經網絡模型之一。BP網絡能學習和存貯大量的輸入-輸出模式映射關系,而無須事前揭示描述這種映射關系的數學方程。BP網絡的學習過程由信息正向傳播和誤差逆向傳播兩個過程組成,輸入層神經元負責接受外界輸入信息并傳遞給中間層神經元,中間層神經元是內部信息處理層,負責信息變換和計算,可設計成單隱藏層或多隱藏層結構,最后一層隱藏層將信息傳遞給網絡輸出層,完成一次信息正向傳遞,即完成一次網絡學習。當實際輸出和期望輸出不符時,進入誤差反向傳遞階段,周而復始的信息正向傳遞和誤差逆向傳遞最終形成一個穩(wěn)定的、可移植的、具有一定魯棒性的自主學習網絡[15]。目前,BP網絡已經被廣泛應用于信號處理、模式識別及人工智能等領域。
粗糙集理論一般用來處理量化數據、模糊關系等問題,但粗糙集理論在推廣能力和容錯能力方面卻略顯不足。而無監(jiān)督BP神經網絡具有較強的容錯能力和推廣能力,以及較強的自組織能力,但卻不能擇優(yōu)選擇模型輸入組合等特點[16]。將粗糙集理論結合BP神經網絡模型,將具有一定的理論性和實用性。目前,有兩種利用粗糙集約簡簡化神經網絡的方法。
(1)利用粗糙集約簡簡化神經網絡輸入維數。神經網絡的結構受輸入網絡的數據維數影響很大,同時數據的維數也影響到決策規(guī)則的數目及網絡的計算量,甚至影響到神經網絡的收斂。因此,適當地利用粗糙約簡集降低作為輸入神經網絡系統(tǒng)的數據維數可以更好地實現網絡系統(tǒng)。
(2)利用粗糙約簡簡化神經網絡規(guī)則數。在實際應用中,規(guī)則數過多會導致系統(tǒng)不能收斂、網絡的訓練時間長或訓練誤差大等缺點,因此利用粗糙集約簡神經網絡的決策規(guī)則數,可以減小網絡的計算量,加快網絡的收斂速度[17]。本文使用前者搭建粗糙神經網絡模型,粗糙神經網絡方法流程圖如圖1所示。
圖1 粗糙神經網絡方法流程圖
呼吸機是臨床治療中必不可少的生命支持類設備,使用過程中呼吸機故障可能會對患者造成不可挽回的后果,因此本文使用呼吸機為研究對象進行實驗平臺的搭建,對其進行數據采集、故障分析、模型搭建,最終實現呼吸機故障智能預警功能。
選取我院2017年10月至2019年5月的呼吸機故障報警,進行分類、整合后,采集故障呼吸機環(huán)境因素數據、電氣因素數據以及氣路數據因素。
(1)環(huán)境數據采集。呼吸機使用過程中內外環(huán)境因素可能是導致呼吸機故障的間接原因,環(huán)境因素數據采集主要針對呼吸機關鍵部件,包括電源模塊、空氧混合模塊(電子閥式及寶石閥式)、機箱內部溫濕度數據的采集。溫濕度采集采用YC1001溫濕度采集模塊進行采集,該模塊可同時采集32路獨立溫度和濕度。
(2)電氣因素采集。呼吸機使用過程中關鍵部件的供電情況的變化是呼吸機故障反應的最直接因素,電氣因素采集主要針對呼吸機總負載電壓、負載電流、渦輪/壓縮機輸入電壓和電流、空氧混合模塊電壓/電流及呼出/吸入閥輸入電壓/電流等。電氣因素使用16路JY-DAM1600AC模塊進行采集。
(3)氣路因素采集。呼吸機氣體供應包括氧氣和空氣,負反饋式氣體監(jiān)測方式可使得呼吸機供氣功能處于穩(wěn)定狀態(tài),氣體問題是導致呼吸機故障的間接因素。氣體因素采集主要針對呼吸機輸入氣體的壓力、濃度以及濕度,空氧混合氣輸入端氣體壓力,內部流量監(jiān)測模塊氣體壓力,吸入、呼出閥氣體壓力等。氣體因素使用LORA、YC1001模塊進行采集。
實驗模型的搭建包括數據的約簡過程、神經網絡模型的搭建、輸出模式的設計等。對2017年10月至2019年5月期間我院呼吸機故障模式進行分析,選取故障頻次較高的3種故障模式為研究對象,總故障數150臺次,其中呼吸機潮氣量異常68臺次,氧濃度異常34臺次,氣密性異常48臺次。隨機將總故障數按6:4分為網絡訓練集和網絡測試集。對每次故障分別進行故障因素采集,通過粗糙集約簡過程,將粗糙集降維至8因素,分別為電源模塊濕度、總負載電流、渦輪/壓縮機輸入電流、空氧模塊溫度、閥電壓、氣源壓力、氣源濕度、氣源濃度。
本文使用采集的數據搭建8輸入3輸出的四層BP網絡,實驗模型搭建如圖2所示。對降維后的8種故障因素進行量化,并作為BP網絡輸入層;各層神經元之間是全連接的,層內無連接,隱藏層各神經元節(jié)點采用Sigmoid函數作為激勵函數;將3種故障模式作為輸出層。利用MATLAB神經網絡工具箱可以方便地完成BP神經網絡的創(chuàng)建工作,具體步驟為:① 使用net=feedforwardnet(hidden Sizes,train Fcn)創(chuàng)建向前神經網絡,使用LM(Levenberg-Marquadt)算法作為訓練權值的算法;② 設置網絡參數,網絡最大迭代次數設置為1000次,訓練最大失敗次數設置為5,目標誤差設置為0.001;③ 訓練BP網絡,使用90臺次故障模式作為訓練集對BP網絡進行訓練,網絡訓練過程使用[net,TR]=train(net, INPUT, OUTPUT)完成;④ 測試BP網絡,使用60臺次“已知”故障模式作為測試集對BP網絡進行測試,網絡測試過程使用T=net(Test)完成。
本文使用靈敏度(Sensitivity,Se)、特異性(Specificity,Sp)、準確率(Accuracy,Acc)作為評價指標,不同于二分類評價指標,定義靈敏度、特異性、準確率如式(1):
其中,max為故障模式分類總數,本文max=3;TP(True Positive)為真比例,真實類別為正例,預測類別為正例;FP(False Positive)為假正例,真實類別為負例,預測類別為正例;FN(False Negative)為假負例,真實類別為正例,預測類別為負例;TN(True Negative)為真負例,真實類別為負例,預測類別為負例。
隨機使用90臺次呼吸機故障作為訓練集對神經網絡進行訓練,其中訓練集包含潮氣量異常41臺次,氧濃度異常22臺次,氣密性異常27臺次。神經網絡訓練迭代次數選擇1000次,經訓練后,BP神經網絡識別故障模式靈敏度、特異性以及準確率分別為87.8%、85.6%、91.1%。使用訓練后的BP神經網絡對60臺次呼吸機故障進行測試,測試集包含潮氣量異常27臺次,氧濃度異常12臺次,氣密性異常21臺次。測試結果顯示,呼吸機故障模式靈敏度、特異性以及準確率分別為75.0%、83.3%、85.0%。呼吸機故障模式識別結果,見表2。
圖2 實驗模型搭建
表2 呼吸機故障模式識別結果[n (%)]
2011年,衛(wèi)生部關于印發(fā)《三級綜合醫(yī)院評審標準(2011年版)》以來,各級醫(yī)院嚴格根據《標準》制定和開展了醫(yī)療器械臨床使用安全控制與風險管理工作,建立醫(yī)療器械臨床使用安全事件監(jiān)測與報告制度,定期對醫(yī)療器械使用安全情況進行巡查和考核[18]。然而由于人員配備不足、設備分散、設備種類雜、數量多等特點,在實際工作中,醫(yī)學技術人員很難對各類設備使用情況進行詳盡把控。
數據挖掘技術是從龐雜無需的數據中挖掘出數據之間的特殊關系,粗糙神經網絡模型是數據挖掘技術的主要算法,它既保留了粗糙集理論量處理數據的優(yōu)點,同時還保留了神經網絡算法的魯棒性、自適應性以及高容錯率,兩者的完美結合,可以提高數據挖掘的準確率[19]。本文使用粗糙神經網絡算法對醫(yī)療設備故障模式與其對應的故障因素進行分析,本文采集故障呼吸機的環(huán)境因素數據、電氣因素數據及氣路數據因素,并使用粗糙約簡理論對各因素進行降維處理,最終建立8輸入3輸出的粗糙神經網絡模型。結果顯示,粗糙神經網絡算法訓練具有較高的靈敏度、特異性和準確率,使用訓練后的粗糙神經網絡對測試集進行預測,呼吸機故障模式靈敏度、特異性以及準確率分別為75.0%、83.3%、85.0%。
綜上所述,本文使用數據挖掘技術探討醫(yī)療設備故障模式與設備使用環(huán)境因素、電氣因素及氣路因素的潛在關系,建立粗糙神經網絡模型對采集的故障因素數據進行訓練和測試。通過挖掘故障模式與故障因素的潛在關系,設備故障模式能夠較好地識別,可為醫(yī)療設備故障監(jiān)測與識別提供一種參考方法。