,,
隨著醫(yī)院信息化進程不斷推進,醫(yī)院信息系統(tǒng)(HIS)在醫(yī)院管理中發(fā)揮的作用愈加重要[1]。
新版門診工作站、住院工作站等信息系統(tǒng)的升級應(yīng)用催生了海量信息的迅速增長。如果能整合、分析、利用這些海量數(shù)據(jù),將醫(yī)療基礎(chǔ)信息中存在的知識精華進行自動化的提取與存儲、智能化的分析與應(yīng)用,必然對醫(yī)生診療、患者就診、臨床科研及管理層的決策有所助力。
因此,尋找一種可以把虛擬分散的海量數(shù)據(jù)轉(zhuǎn)化為現(xiàn)實的、可以提高臨床醫(yī)生診斷效率和臨床科研知識的技術(shù),是大數(shù)據(jù)時代醫(yī)療衛(wèi)生領(lǐng)域亟待解決的問題,有突出的現(xiàn)實意義和實用價值。解放軍第302醫(yī)院(以下簡稱“我院”)是全軍最大的傳染病醫(yī)院,多年來積累了大量肝病診療資料。本文利用豐富的肝病數(shù)據(jù)資源,建立肝病診斷數(shù)據(jù)庫系統(tǒng),為提高臨床診療效率服務(wù)。
我院現(xiàn)有的HIS已采集到海量的病例數(shù)據(jù),本系統(tǒng)設(shè)計即是利用這些現(xiàn)有數(shù)據(jù)形成新的智能診斷數(shù)據(jù)庫,并在此基礎(chǔ)上實現(xiàn)自動診病和快速治療。
采用Visual Basic 6.0企業(yè)版對主體系統(tǒng)編程,采用SQL server建立診斷數(shù)據(jù)庫。首先通過HIS-Visual Basic-SQL server對病例數(shù)據(jù)進行智能診病訓(xùn)練和測試,具體應(yīng)用時采用逆向SQL server到VB以實現(xiàn)診療過程。
軟件設(shè)計方法為以Visual Basic語言編輯軟件代碼并設(shè)置SQL server數(shù)據(jù)庫表單,鏈接醫(yī)院HIS網(wǎng)絡(luò)數(shù)據(jù)庫測試并調(diào)試軟件功能,最終打包軟件安裝軟件客戶端。
系統(tǒng)設(shè)計所采用的3種軟件中,HIS具有數(shù)據(jù)優(yōu)勢,VB具有簡易和可視化編程的完善功能,SQL server的優(yōu)勢在于通用性和性能高效。由此建成的系統(tǒng)投入快速、易于操作,不需要專門培訓(xùn)就可以很好地融入現(xiàn)有診療系統(tǒng)之中。
系統(tǒng)采用圖形化用戶界面(GUI),主要有AI訓(xùn)練模塊、測試模塊和診療模塊3個核心模塊。在培訓(xùn)模塊中,采用神經(jīng)網(wǎng)絡(luò)方法對HIS數(shù)據(jù)進行采集以實現(xiàn)自我學習;測試模塊是在現(xiàn)有AI并不完善的情況下,采用人工系統(tǒng)測試和矯正;診療模塊針對最終用戶即醫(yī)師,直接應(yīng)用在診療過程中,并可由醫(yī)師反饋改進意見。
本系統(tǒng)以醫(yī)院HIS網(wǎng)絡(luò)為基礎(chǔ),以SQL server數(shù)據(jù)庫存儲系統(tǒng)數(shù)據(jù),用戶以客戶端讀寫網(wǎng)絡(luò)SQL server數(shù)據(jù)庫并將結(jié)果存儲于數(shù)據(jù)庫內(nèi)以供其他用戶分享使用(圖1),客戶端軟件也可以訪問HIS數(shù)據(jù)庫并提取數(shù)據(jù),為診斷模塊提供數(shù)據(jù)來源。
圖1系統(tǒng)運行結(jié)構(gòu)
根據(jù)系統(tǒng)功能需求將客戶端分成肝病知識模塊、肝病數(shù)據(jù)庫模塊、肝病診斷模塊、肝病專家?guī)炷K和軟件設(shè)置模塊5部分。各模塊分別為用戶提供肝病知識信息,為已知檢測指標提供智能診斷、肝病典型數(shù)據(jù)信息、肝病專家信息,以及軟件維護和設(shè)置功能??蛻舳艘灾悄茉\斷功能為核心,其余模塊為智能診斷模塊提供數(shù)據(jù)和知識信息支持。用戶通過人機對話過程即可快速完成知識庫錄入和查詢、病例診斷數(shù)據(jù)的查詢與統(tǒng)計、疾病智能診斷等過程。
神經(jīng)網(wǎng)絡(luò)(NN)也稱為人工神經(jīng)網(wǎng)絡(luò)(ANN),是一種基于大腦結(jié)構(gòu)形成程序功能的計算模型,在大數(shù)據(jù)集中,它具有很好的成本效益和靈活性,在推理準確度方面具有不可替代的優(yōu)勢。在神經(jīng)網(wǎng)絡(luò)中,神經(jīng)元可以以各種方式排列,權(quán)重(神經(jīng)元之間的連接)可具有不同的模式,可以實現(xiàn)如前饋、反饋、聯(lián)網(wǎng)計算和AI自我競爭等功能,這是本系統(tǒng)的實現(xiàn)基礎(chǔ)和優(yōu)勢。神經(jīng)網(wǎng)絡(luò)技術(shù)原理公式如下:
系統(tǒng)核心功能是為用戶提供肝病智能診斷功能,智能診斷模塊采用k-NN(k-nearest neighbor)算法建模,將肝病數(shù)據(jù)庫內(nèi)診斷病例的疾病按照種類進行二進制命名,訓(xùn)練器通過對主要診斷指標(通過統(tǒng)計計算后出現(xiàn)概率最高的診斷項目)進行加權(quán),以類中心法離線方式進行數(shù)據(jù)訓(xùn)練,以在線方式計算用戶設(shè)定所需個數(shù)的待分類疾病距離,從而獲得概率最高的疾病列表,并以概率順序羅列。
該模塊根據(jù)用戶輸入的患者臨床診斷或輔助診斷指標等信息,通過讀取樣本數(shù)據(jù)、計算各類中心、比較待檢樣本與K-NN算法計算出的各類中心距離,輸出最近距離的3類疾病和概率數(shù)值,以供用戶對診斷進一步甄別(圖2)。
圖2 算法流程
功能方面包括AI訓(xùn)練模塊、測試模塊和診病模塊。AI訓(xùn)練的目的是通過改變病例間的權(quán)重實現(xiàn)預(yù)期輸出,共使用了3種訓(xùn)練方式:一是監(jiān)督訓(xùn)練,在此過程中,可以為系統(tǒng)提供一系列標準樣本輸入,并將結(jié)果輸出與預(yù)期結(jié)果比較;二是無監(jiān)督訓(xùn)練,完成監(jiān)督訓(xùn)練后輸入隨機的病例,進行AI自我學習,盲訓(xùn)和進化神經(jīng)網(wǎng)絡(luò);三是加固訓(xùn)練,此過程用于加強預(yù)期結(jié)果的正確性。為保證達到預(yù)期結(jié)果,系統(tǒng)將HIS數(shù)據(jù)庫等分為兩份,使用第一部分進行AI訓(xùn)練,使用第二部分進行正確性測試。測試模塊是本系統(tǒng)實現(xiàn)預(yù)期響應(yīng)的最重要模塊,由人工全程監(jiān)督測試,用以確定訓(xùn)練模塊的正確性。只有當測試結(jié)果達到或超出預(yù)期時,才可認為完成了系統(tǒng)的自我學習過程。
本系統(tǒng)智能診斷功能采用神經(jīng)網(wǎng)絡(luò)模型設(shè)計。以我院HIS數(shù)據(jù)庫10余萬條肝病典型肝病病例數(shù)據(jù)為訓(xùn)練樣本,涵蓋了感染性和非感染性等全部肝病種類,篩選了肝病病例的家族史、感染史、用藥史、臨床癥狀、檢驗結(jié)果、影像資料等具有代表性的各類診斷以及輔助診斷等50種指標信息(表1),并可擴展或縮減指標數(shù)量,用戶將預(yù)測樣本(患者檢測或臨床指癥等指標)輸入系統(tǒng)即可開始模擬診斷。系統(tǒng)根據(jù)用戶提供的數(shù)據(jù),對用戶輸入的樣本數(shù)據(jù)與系統(tǒng)數(shù)據(jù)庫內(nèi)疾病病例數(shù)據(jù)進行計算和比對,以概率高低順序輸出與預(yù)測樣本最接近的3種肝病種類名稱,以供用戶進一步甄別診斷。本系統(tǒng)的應(yīng)用過程中實測訓(xùn)練誤差為5.23%,測試誤差4.20%,可以滿足疾病預(yù)測要求和目標。
表1 系統(tǒng)采用的肝病診斷及輔助診斷指標
系統(tǒng)以智能診斷技術(shù)為核心,擴展了多個系統(tǒng)輔助功能供用戶使用。肝病知識庫模塊存儲了肝臟基礎(chǔ)知識和臨床所有已知肝病知識信息,并分為感染和非感染性將肝病兩類,每一類別又詳細劃分成若干肝病子類,且每種肝病又分為疾病簡介、典型癥狀、發(fā)病原因、實驗室檢測、鑒別診斷、預(yù)防、治療、護理、并發(fā)癥、飲食保健等多個部分,為用戶提供知識信息快速查詢功能。
肝病數(shù)據(jù)庫模塊包含了我院HIS數(shù)據(jù)庫各類肝病病例的診斷指標數(shù)據(jù),為智能診斷模提供模擬訓(xùn)練數(shù)據(jù)源,同時也為臨床醫(yī)護人員提供病例樣本和診斷指標的統(tǒng)計和瀏覽功能。用戶可以通過客戶端錄入和編輯疾病各類的診斷指標、篩選HIS數(shù)據(jù)庫的病例等,以豐富肝病數(shù)據(jù)庫病例數(shù)據(jù)。
肝病專家模塊包含肝病方面的權(quán)威專家信息(包括專家簡介、研究領(lǐng)域、聯(lián)系方式、工作單位等),為疾病診斷、專家會診等提供信息幫助。系統(tǒng)的設(shè)置模塊可輔助用戶設(shè)置軟件各類參數(shù)(用戶管理、數(shù)據(jù)庫維護、軟件界面調(diào)整、功能編輯等),以豐富和優(yōu)化軟件功能,確保軟件運行安全。
作為智能診斷技術(shù)的分支,神經(jīng)網(wǎng)絡(luò)模型技術(shù)[2-4]已經(jīng)廣泛應(yīng)用于各行業(yè)的數(shù)據(jù)挖掘與前瞻性結(jié)論預(yù)測[5-6]。當前醫(yī)療領(lǐng)域疾病智能診斷技術(shù)開發(fā)與應(yīng)用成果很多,但受限于學科方向不同,尤其是不同學科的疾病臨床癥狀千差萬別,一種智能診斷技術(shù)不能涵蓋多個學科領(lǐng)域;加上數(shù)據(jù)來源的權(quán)威性、代表性的差異以及數(shù)據(jù)模型針對性的不同,各醫(yī)療學科目前還需要量體裁衣地設(shè)計和制作適合自身的智能診斷系統(tǒng)。肝病智能診斷方面目前尚無成熟技術(shù)可以應(yīng)用。我院屬于大型肝病??漆t(yī)院,HIS數(shù)據(jù)庫存儲了幾十萬條病例數(shù)據(jù)信息,涵蓋了肝病領(lǐng)域的各類典型病例,大量病例數(shù)據(jù)資源未能充分挖掘使用,無疑是醫(yī)療資源的浪費。
本文基于為肝病臨床診療與科研提供前沿、實用、高效的智能輔助信息支持的目的,開發(fā)了基于HIS數(shù)據(jù)庫的肝病信息與診療數(shù)據(jù)庫系統(tǒng)。該系統(tǒng)以我院HIS數(shù)據(jù)庫數(shù)據(jù)為依托,在查閱各類專業(yè)資料[7-16]和專家充分論證的基礎(chǔ)上,精選了50余個最有價值的臨床指標作為肝病診療參數(shù),通過人工篩選LIS典型病例數(shù)據(jù)方式建立數(shù)據(jù)庫和神經(jīng)網(wǎng)絡(luò)模型,以期達到疾病預(yù)測和智能判斷的目的,為臨床提供快速的智能診療途徑,也為統(tǒng)計和搜集科研數(shù)據(jù)提供便捷通道。系統(tǒng)的知識庫模塊包含了所有肝病診療、護理、預(yù)防和保健知識的信息,并可隨時更新和豐富,為臨床工作提供了強大的專業(yè)知識保障。專家模塊包含各類肝病領(lǐng)域的權(quán)威專家信息,為臨床進一步診療提供信息幫助和支持。
系統(tǒng)的神經(jīng)網(wǎng)絡(luò)模型采用k-NN算法技術(shù)[17-21]。該算法的優(yōu)點是數(shù)據(jù)選擇簡單有效,編程實現(xiàn)簡單,是一種懶惰學習算法,分類器不需要使用訓(xùn)練集訓(xùn)練,訓(xùn)練復(fù)雜度為0,將部分工作量離線進行,可減少在線計算量。缺點是在線計算量較大,不適合過多預(yù)測樣本的計算,不過可以在系統(tǒng)管理模塊中合理設(shè)置樣本預(yù)測數(shù)量,以減少過多數(shù)據(jù)處理負擔。實際應(yīng)用過程中,單機10余萬條數(shù)據(jù)的數(shù)據(jù)庫采用3個預(yù)測樣本參數(shù),系統(tǒng)響應(yīng)時間為2-3秒,單種類肝病及常見多因素肝病預(yù)測準確率高于95%,可以滿足臨床診斷要求。由于部分患者個體因素復(fù)雜以及肝病與其他多疾病同時存在會對該預(yù)測模型造成影響,目前該系統(tǒng)僅屬于臨床輔助診療工具。下一步還應(yīng)在當前模型基礎(chǔ)上建立多因素狀態(tài)肝病患者數(shù)據(jù),并對多因素種類分類和積累數(shù)據(jù)量,以期達到提高多疾病疊加和多因素影響下預(yù)測準確性的目的。隨著信息技術(shù)的發(fā)展,數(shù)據(jù)開發(fā)成為各新興行業(yè)發(fā)展的立足點[22],醫(yī)療智能診療系統(tǒng)也將迎來更大發(fā)展空間,醫(yī)院在開發(fā)各類輔助醫(yī)療應(yīng)用的同時應(yīng)該加強診療數(shù)據(jù)的挖掘和使用,以提高診療水平和診療質(zhì)量。