王苗
摘要:針對當前醫(yī)生工作現狀和醫(yī)囑聯(lián)用現狀,通過Python語言實現了一個醫(yī)囑決策輔助功能模塊,以優(yōu)化醫(yī)院信息系統(tǒng)業(yè)務功能,加快診療速度。該文重點研究優(yōu)化Apriori模型和構建醫(yī)囑知識圖譜,挖掘醫(yī)囑之間的關聯(lián)關系,補充醫(yī)囑組套,輔助醫(yī)囑決策。結果表明該模型運行結果良好,功能基本完備,具有一定的實踐價值,能夠加快推進我國智慧醫(yī)療建設進程。
關鍵詞:醫(yī)囑推薦;關聯(lián)規(guī)則;Apriori算法;Neo4j;知識圖譜
中圖分類號:TP399? ? ? 文獻標識碼:A
文章編號:1009-3044(2022)25-0037-04
開放科學(資源服務) 標識碼(OSID) :
1 引言
醫(yī)療過程所產生的海量數據中存在著潛在未被挖掘的寶貴經驗和規(guī)律[1],不少國內外學者已經嘗試并成功將數據挖掘技術應用于醫(yī)療行業(yè)實際診療過程中,學術界對智慧醫(yī)療的探索也逐漸深入[2-12]。目前國內醫(yī)院信息系統(tǒng)中廣泛采用的輔助醫(yī)生開醫(yī)囑的方法包括:醫(yī)囑組套,醫(yī)囑模板和臨床路徑醫(yī)囑集。在中國抗擊新冠肺炎疫情的過程中,數據挖掘技術在防控手段、疫苗研發(fā)、疫情信息傳播等環(huán)節(jié)發(fā)揮了出色的作用[13],這在一定程度上提高了人們對醫(yī)療大數據的重視程度,也充分說明了數據挖掘技術在醫(yī)療行業(yè)的潛在價值。
本文通過對醫(yī)院門診部醫(yī)護人員對醫(yī)療系統(tǒng)的相關需求進行實地調查和詢問后,發(fā)現了以下問題和需求:
(1)? 醫(yī)生工作現狀
對于醫(yī)療人員來說,工作中最常見的臨床操作之一就是“開具醫(yī)囑”,即醫(yī)生根據患者病史、診斷、檢驗檢查結果等下達醫(yī)學指令,其很大程度上會影響治療效果和進程。根據觀察,醫(yī)生每天花費在開具醫(yī)囑、修改和確認等環(huán)節(jié)上的時間過多,造成了工作效率的降低。例如高血壓患者一般都需要進行靶器官功能評估和合并癥篩查,其中包含血糖、血脂、心腎功能和眼底檢查等,若醫(yī)生在遇到每一位高血壓患者時,都需要一一開具以上醫(yī)囑,則會造成不必要的時間浪費。
(2)? 醫(yī)囑聯(lián)用現狀
臨床醫(yī)學上,不同患者在同一場景或相似診斷下開具的醫(yī)囑具有相似性,基于此,目前醫(yī)療系統(tǒng)輔助醫(yī)生開醫(yī)囑的常用方法之一就是醫(yī)囑組套。醫(yī)囑組套即事先定義的在多個相似場景或診斷下可以同時被開具的醫(yī)囑,一般是由臨床專業(yè)專家基于經驗和討論研究后制定,制定周期比較長,因此有限的醫(yī)囑組套有時候并不能及時跟上時代的步伐,滿足醫(yī)生快速開具醫(yī)囑的需求。
目前醫(yī)院的信息管理系統(tǒng)每天需要對上百萬名病人的診療過程進行記錄,而其中,蘊含著海量未被挖掘的醫(yī)學知識。通常情況下,相同場景或診斷下的歷史病案中會存在聯(lián)用頻率高的一些醫(yī)囑,相當于基于醫(yī)生經驗的潛藏在歷史醫(yī)療數據中的醫(yī)囑組套,本文關鍵就是找出基于歷史數據的某種疾病下醫(yī)囑記錄中的高頻項集,將其作為醫(yī)囑組套補充,輔助醫(yī)生做出醫(yī)囑決策。
因此,在醫(yī)生已經做出診斷的前提下,若醫(yī)院系統(tǒng)能夠基于歷史數據,挖掘歷史病案中相同疾病下關聯(lián)頻率較高的醫(yī)囑聯(lián)用組合,則可以在一定程度上對固定的醫(yī)囑組套進行補充,減少醫(yī)生開具醫(yī)囑的時間。同時可以輔助醫(yī)生借鑒其他醫(yī)生的治療方案,或是將自己過去的治療方法與現在進行對比結合,不斷優(yōu)化治療療效。
2 系統(tǒng)設計
基于上述需求,本文提出了相應的解決方案:利用Neo4j數據庫存儲歷史診療數據,構建病案、診斷和醫(yī)囑節(jié)點,構建病案與診斷、病案與醫(yī)囑的關系邊,構成診斷與醫(yī)囑的知識圖譜,結合關聯(lián)規(guī)則分析技術的Apriori算法,基于輸入診斷或醫(yī)囑,從大量數據中查找關聯(lián)組合,并反饋給用戶,以輔助醫(yī)生針對診斷做出相應醫(yī)囑決策。
2.1 功能模塊設計
本文在處方醫(yī)囑錄入子系統(tǒng)的基礎上,為提高醫(yī)囑錄入的速度,增加基于診斷結果或輸入醫(yī)囑的關聯(lián)醫(yī)囑組套提醒功能模塊,其中功能具體描述為:①當用戶做出診斷結果時,功能自動推薦常用醫(yī)囑組合,即該診斷下的醫(yī)囑組套;②當用戶做出診斷,開立了醫(yī)囑時,推薦在該診斷下,與已開立醫(yī)囑聯(lián)用頻率最高的醫(yī)囑聯(lián)用組合。
2.2 數據庫設計
Neoj4數據庫需要存儲知識圖譜節(jié)點和關系邊,本文中節(jié)點有疾病實體、醫(yī)囑實體以及病案實體,其中疾病實體節(jié)點包含疾病ICD10編碼,疾病名稱;醫(yī)囑實體節(jié)點包含醫(yī)囑唯一標識碼,醫(yī)囑名稱,病案實體節(jié)點包括診療號,主治醫(yī)師職稱,格式如表1所示。通過構建SPO數據格式,將病案與疾病關聯(lián),將疾病與醫(yī)囑關聯(lián),其中病案與疾病的關系為“診斷”,病案與醫(yī)囑的關系為“開立”,如表2所示。
2.3 數據分析設計
本文使用的數據庫為Neo4j,并使用Python輔助進行數據處理和分析。首先以HIS系統(tǒng)現有的病患真實數據為數據源,對數據進行抽取和預處理,并導入Neo4j。接著使用SPSSModeler軟件中的Apriori模型進行模擬,從而對最小條件支持度和最低規(guī)則置信度進行初步篩選。通過Python語言構建Apriori算法,算法構建涉及組合頻繁項集、剪枝策略、刪除策略以及計數策略[14-15],其中計數策略指考慮醫(yī)生職稱對醫(yī)囑開立準確性影響因素,為本文對Apriori算法的優(yōu)化策略。
2.4 用戶界面設計
本文將通過Python語言設計一個簡單的可視化用戶界面,用于用戶與關聯(lián)分析模型的交互,頁面提供兩項功能,分別為在已有診斷下和在已有醫(yī)囑下的關聯(lián)推薦,并返回依據支持度、置信度、前項支持度和提升度排序的推薦醫(yī)囑。
3 實現過程與結果
3.1 構建知識圖譜
數據源于惠州市中大惠亞醫(yī)院2019年至2020年兩年間的真實診療數據,具有一定可鑒性,具體包括接診的患者信息、主要診斷、開立醫(yī)囑以及職工基本信息等,病案以患者流水號為唯一標識。對數據進行預處理后轉化為csv格式,導入Neo4j并構建節(jié)點與節(jié)點關系。
以“門診五官科”科室為例,以隨機三個疾病節(jié)點為例,查詢診斷節(jié)點、病案節(jié)點、醫(yī)囑節(jié)點以及三者之間的關系,查詢所得知識圖譜效果如圖1,其中,藍色代表病案實體,紅色代表疾病實體,黃色代表醫(yī)囑實體,疾病節(jié)點與病案節(jié)點之間存在關系邊“diagnose”表示該病案診斷為該疾病,病案實體與醫(yī)囑實體之間存在關系表“use”表示該病案開立了該醫(yī)囑。
3.2 構建推薦醫(yī)囑模型
進行關聯(lián)分析時,需要設立最小條件支持度Support和最小規(guī)則置信度Confidence,當指標設置得越低,分析所得的規(guī)則事務越多,但同時事務之間關聯(lián)性越弱[16]?;赟PSS關聯(lián)分析模型,通過從關聯(lián)規(guī)則的數量、質量兩個切入點對指標組合分別進行粗粒度和細粒度的分析比較,同時結合規(guī)則數量、平均條件Support、平均Confidence、平均規(guī)則Support、平均Lift和部署能力這幾個方面綜合進行比較,選擇最佳指標組合最低條件Support為3.5,最小規(guī)則Confidence為80的Apriori關聯(lián)模型,作為后續(xù)研究的模型指標,如表3。
3.3 構建Apriori模型
基于上文中關聯(lián)分析模型的閾值選擇,通過Python輔助編程,連接并獲取Neo4j庫中數據,并構建Apriori模型對數據進行關聯(lián)分析,其中構建計算模型時,從Neo4j庫中獲取醫(yī)囑開立醫(yī)生的職稱,轉化為職稱系數,與醫(yī)囑開立的頻次相乘,即計算醫(yī)囑開立頻次時,考慮醫(yī)生職稱所帶來的醫(yī)囑開立準確性的問題,職稱越高的醫(yī)生開立的醫(yī)囑頻次系數越高,從而優(yōu)化醫(yī)囑聯(lián)用效果。
關聯(lián)規(guī)則的挖掘一般分為兩步:第一找尋有效的頻繁項集;然后,在上步的基礎上找尋有效的關聯(lián)規(guī)則。其中挖掘頻繁項集時的計數策略為從Neo4j庫中獲取醫(yī)囑開立醫(yī)生的職稱,轉化為職稱系數,存儲在LevelDict{}中,其中key值為獲取病案的序號,value值為職稱系數。進行項集頻次計數時,醫(yī)囑開立的頻次與該病案對應的職稱系數相乘,職稱越高的醫(yī)生開立的醫(yī)囑頻次系數越高,再將相乘后的頻次積計入頻次字典support_data{}中,代碼如圖2所示。
3.4 模型應用效果
基于診斷推薦醫(yī)囑效果如圖3。輸入患者診療號、主要診斷后,以默認的最小條件支持度和最小規(guī)則置信度,點擊推薦醫(yī)囑按鈕,推薦醫(yī)囑列表即顯示匹配診斷的各項集數醫(yī)囑頻繁項集的前十條醫(yī)囑/醫(yī)囑組合,按條件支持度降序排序顯示,由圖可以看到,當輸入主要診斷為變應性鼻炎時,得到各頻繁項集數第一推薦醫(yī)囑分別為:
(1)? 頻繁項集數為1的最佳推薦醫(yī)囑為{前鼻鏡檢查};
(2)? 頻繁項集數為2的最佳推薦醫(yī)囑為{鼻郎生理性海水鼻腔噴霧器(浙江朗柯),前鼻鏡檢查};
(3)? 頻繁項集數為3的最佳推薦醫(yī)囑為{鼻郎生理性海水鼻腔噴霧器(浙江朗柯),吸入物變應原篩選(五官科專用),前鼻鏡檢查};
(4)? 頻繁項集數為4的最佳推薦醫(yī)囑為{鼻郎生理性海水鼻腔噴霧器(浙江朗柯),吸入物變應原篩選(五官科專用),前鼻鏡檢查,表面麻醉};
(5)? 頻繁項集數為5的最佳推薦醫(yī)囑為{鼻郎生理性海水鼻腔噴霧器(浙江朗柯),吸入物變應原篩選(五官科專用),前鼻鏡檢查,表面麻醉,鼻內鏡檢查}。
基于醫(yī)囑推薦聯(lián)用醫(yī)囑效果如圖4。當輸入主要診斷為“變應性鼻炎”,開立醫(yī)囑為{表面麻醉,玉屏風顆粒}時,最佳推薦醫(yī)囑規(guī)則后項為{前鼻鏡檢查}{前鼻鏡檢查,鼻內鏡檢查}{鼻內鏡檢查、吸入物變應原篩選(五官科專用),前鼻鏡檢查,鼻內鏡檢查}{吸入物變應原篩選(五官科專用),鼻內鏡檢查、吸入物變應原篩選(五官科專用),前鼻鏡檢查}{吸入物變應原篩選(五官科專用)}。
通過Cyper語言對Neo4j數據庫中各項目的計數匯總,系統(tǒng)推薦醫(yī)囑與源數據查詢結果(無考慮職稱) 相比,排序相同,在一定程度上可以驗證本模型的可行性和正確性。并經過專業(yè)醫(yī)生評估,具備一定的實踐價值和科學性,可在后期投入醫(yī)院試用。
4 結束語
本文在智慧醫(yī)療的大背景下,基于工作經歷與醫(yī)生需求,針對醫(yī)療系統(tǒng)輔助醫(yī)生開立醫(yī)囑功能進行研究。通過獲取醫(yī)院病患診療的實際數據,對數據進行預處理,基于Neo4j圖數據庫,構建病案、診斷和醫(yī)囑之間關聯(lián)的知識圖譜,并通過優(yōu)化Apriori模型,在輸入診斷或醫(yī)囑的前提下,做出最佳醫(yī)囑組合推薦,以期能夠嵌入醫(yī)院信息系統(tǒng),在診療過程中對固定的醫(yī)囑組套進行補充,輔助醫(yī)生做出最佳診療方案,從而一方面借助圖數據庫,優(yōu)化數據存儲結構,提高數據檢索的速度,優(yōu)化醫(yī)院信息系統(tǒng)業(yè)務功能,加快診療速度和提高病人治愈效果,改善醫(yī)患關系。另一方面,對我國在醫(yī)療大數據應用的研究上進行補充,將計算機編程技術融入醫(yī)療行業(yè),響應國家鼓勵培養(yǎng)跨學科人才的號召,加快推進我國智慧醫(yī)療建設進程。
在醫(yī)院醫(yī)療數據中,蘊含了豐富的病案數據,例如患者的個人信息、患病歷史、過敏藥物史、檢查檢驗數據,開立醫(yī)囑的詳細信息,例如頻次、用量等。這些數據不僅能夠幫助我們進一步理解醫(yī)生的醫(yī)囑開立行為,更能挖掘醫(yī)囑之間相互作用和潛在的聯(lián)用風險,具有巨大的潛在價值。同時,藥物成分數據可以輔助模型對涉及藥品的醫(yī)囑進行相似性對比,從而構建細粒度的藥物相互聯(lián)用知識圖譜。關聯(lián)分析算法和Apriori模型是對事物關聯(lián)性最常用的一種研究方法,然而數據挖掘的算法知識涉及領域非常廣泛,未來將進一步研究數據挖掘技術,與醫(yī)院信息管理系統(tǒng)的其他模塊進行結合,探索醫(yī)療數據中更多的潛在價值。
參考文獻:
[1] 陳少敏,陳愛民,梁麗萍.醫(yī)療大數據共享的制約因素及治理研究[J].衛(wèi)生經濟研究,2021,38(9):18-20,24.
[2] 張?zhí)壹t,范素麗,郭徐徐,等.基于數據融合的智能醫(yī)療輔助診斷方法[J].工程科學學報,2021,43(9):1197-1205.
[3] 石升,董金琳,王瑋,等.Apriori算法的改進及其在睡眠輔助醫(yī)療中的應用[J].小型微型計算機系統(tǒng),2020,41(12):2668-2671.
[4] 劉勘,張雅荃.基于醫(yī)療知識圖譜的并發(fā)癥輔助診斷[J].中文信息學報,2020,34(10):85-93,104.
[5] 孫明俊,張丹,鄭明智,等.基于人工智能的類風濕性關節(jié)炎中醫(yī)輔助診療系統(tǒng)[J].模式識別與人工智能,2021,34(4):343-352.
[6] 陳杰,程勝,徐夢,等.面向醫(yī)療輔助診斷的可視化多屬性決策方法[J].計算機工程與應用,2020,56(8):249-255.
[7] 梁書彤,郭茂祖,趙玲玲.基于機器學習的醫(yī)療決策支持系統(tǒng)綜述[J].計算機工程與應用,2019,55(19):1-11.
[8] Liu Y,Kohlberger T,Norouzi M,et al.Artificial intelligence-based breast cancer nodal metastasis detection:insights into the black box for pathologists[J].Archives of Pathology & Laboratory Medicine,2019,143(7):859-868.
[9] Pacheco A G C,Krohling R A.An attention-based mechanism to combine images and metadata in deep learning models applied to skin cancer classification[J].IEEE Journal of Biomedical and Health Informatics,2021,25(9):3554-3563.
[10] 于楠.中文電子病歷信息抽取關鍵技術研究[D].北京:北京工業(yè)大學,2017.
[11] 夏冬,李國壘,陳先來.基于電子病歷的胃癌治療方案輔助選擇[J].中華醫(yī)學圖書情報雜志,2018,27(2):63-68.
[12] 許杰.基于機器學習的醫(yī)療健康分類方法研究[D].鄭州:鄭州大學,2018.
[13] 孫燁祥,呂筠,沈鵬,等.健康醫(yī)療大數據驅動下的疾病防控新模式[J].中華流行病學雜志,2021,42(8):1325-1329.
[14] Han,J.W.andKamber,M.數據挖掘:概念與技術[M].第三版.2012.
[15] 哈林頓,P.機器學習實戰(zhàn)[M].北京:人民郵電出版社,2013.
[16] 趙洪英,蔡樂才,李先杰.關聯(lián)規(guī)則挖掘的Apriori算法綜述[J].四川理工學院學報(自然科學版),2011,24(1):66-70.
【通聯(lián)編輯:李雅琪】