彭喬立 李漢民 肖 輝
(武漢大學(xué)中南醫(yī)院信息中心 武漢430071)
商務(wù)智能系統(tǒng)(Business Intelligence System,BI)是基于數(shù)據(jù)倉庫、數(shù)據(jù)挖掘、數(shù)據(jù)可視化等技術(shù)構(gòu)建的信息系統(tǒng)。抽取、匯總業(yè)務(wù)系統(tǒng)數(shù)據(jù)并存儲于大數(shù)據(jù)平臺,基于主題劃分形成數(shù)據(jù)集市(Data Market,DM),將數(shù)據(jù)圖形化,使用統(tǒng)計(jì)圖表進(jìn)行展示,呈現(xiàn)企業(yè)運(yùn)營狀況,進(jìn)行深度挖掘與分析,從中獲取商業(yè)規(guī)律,幫助企業(yè)管理者進(jìn)行決策[1]。本文主要介紹基于人工智能技術(shù)的醫(yī)院商務(wù)智能系統(tǒng)構(gòu)建。
隨著計(jì)算機(jī)技術(shù)發(fā)展,企業(yè)數(shù)據(jù)存儲量呈指數(shù)級增長,同時數(shù)據(jù)倉庫(Data Warehouse,DW)概念誕生。DW是對關(guān)系型數(shù)據(jù)庫的重新組織,具有面向主題、超大存儲、高度集成等特點(diǎn)[2],成為企業(yè)BI系統(tǒng)首選存儲解決方案。
20世紀(jì)50年代提出人工智能(Artificial Intelligence,AI)概念[3],逐漸演化出以人工神經(jīng)網(wǎng)絡(luò)(Artificial Neural Network,ANN)與深度學(xué)習(xí)(Deep Learning)為核心的AI技術(shù)。特定算法無法解決高度集成的管理問題,而AI技術(shù)具有的層次性、分布性等特征則可滿足現(xiàn)代管理數(shù)據(jù)分析需求,可以賦予BI系統(tǒng)更強(qiáng)的決策支持能力,通過分析解決復(fù)雜問題為不同管理場景提供專業(yè)支持[4]。
數(shù)據(jù)可視化(Data Visualization)是指將數(shù)據(jù)通過圖形進(jìn)行展現(xiàn)。在應(yīng)用程序領(lǐng)域,配備圖形化交互界面(Graphic User Interface,GUI)[5]成為行業(yè)標(biāo)準(zhǔn)。在商業(yè)數(shù)據(jù)分析領(lǐng)域,將數(shù)據(jù)轉(zhuǎn)化成統(tǒng)計(jì)學(xué)圖形是經(jīng)典的可視化方案。隨著網(wǎng)絡(luò)時代到來,基于Web技術(shù)的報(bào)表框架(Echarts、FusionCharts等)較好地滿足需求[6],其具有開源、跨平臺、維護(hù)成本低、社區(qū)資源豐富等特點(diǎn),支持Web技術(shù)的報(bào)表框架成為BI可視化首選方案,能夠?qū)崿F(xiàn)一中心多終端、跨設(shè)備一致性等功能特點(diǎn),為管理人員提供高效便捷的數(shù)據(jù)訪問服務(wù)[7]。
我國醫(yī)療信息化尚處于起步階段,而公眾醫(yī)療衛(wèi)生需求日益提高,醫(yī)療衛(wèi)生行業(yè)競爭激烈,醫(yī)院管理者面臨巨大挑戰(zhàn)。醫(yī)院管理者進(jìn)行決策需要人事、財(cái)務(wù)、設(shè)備、醫(yī)療等多維度多層次數(shù)據(jù)支持[8]。本文介紹如何構(gòu)建基于人工智能的BI系統(tǒng),利用最新信息技術(shù)建設(shè)智能化管理平臺,助力醫(yī)院管理者決策,見圖1。
圖1 基于人工智能的醫(yī)院BI系統(tǒng)架構(gòu)
3.2.1 大數(shù)據(jù)平臺 采用多節(jié)點(diǎn)分布式系統(tǒng)架構(gòu),基于高效網(wǎng)絡(luò),將計(jì)算任務(wù)分配給多個節(jié)點(diǎn),在操作系統(tǒng)層面構(gòu)建軟件,具有分布性、自治性、并行性等特點(diǎn),適用于對并行性、容錯性有較高要求的場景。單個節(jié)點(diǎn)配備至少4核心且時鐘頻率在2.5GHZ及以上的中央處理器(Center Processing Unit,CPU),8GB內(nèi)存,每個節(jié)點(diǎn)能采集、清洗4~6個業(yè)務(wù)系統(tǒng)數(shù)據(jù)。軟件層面需要支持Hadoop框架,該框架基于Map/Reduce技術(shù)開發(fā)[9],是面向大數(shù)據(jù)處理的并行計(jì)算框架,擁有數(shù)據(jù)劃分、數(shù)據(jù)源代碼定位、優(yōu)化策略、錯誤檢測等功能,適合需要多任務(wù)處理、多線程計(jì)算場景,可實(shí)現(xiàn)海量數(shù)據(jù)秒級響應(yīng)。
3.2.2 人工智能核心 配備高性能服務(wù)器集群,為提高人工智能訓(xùn)練效率,還需配備支持統(tǒng)一計(jì)算設(shè)備架構(gòu)(Compute Unified Device Architecture,CUDA)加速技術(shù)的圖形處理器(Graphic Process Unit,GPU),加速訓(xùn)練過程[10]。由于人工智能訓(xùn)練數(shù)據(jù)集多為矩陣格式,與圖像數(shù)據(jù)格式相同,GPU能夠以數(shù)倍于CPU的速度訓(xùn)練數(shù)據(jù)。CUDA架構(gòu)能充分發(fā)揮GPU處理性能,提升人工智能數(shù)據(jù)訓(xùn)練效率。
3.2.3 數(shù)據(jù)展示平臺 配備高性能服務(wù)器,能夠?qū)⒂?xùn)練結(jié)果轉(zhuǎn)變?yōu)榻y(tǒng)計(jì)學(xué)圖形、圖表,直觀呈現(xiàn),實(shí)現(xiàn)決策支持功能。終端電腦通過醫(yī)院內(nèi)局域網(wǎng)訪問人工智能核心服務(wù)器并獲取數(shù)據(jù),客戶端配備通用瀏覽器軟件,基于WEB的圖形化框架適配主流網(wǎng)絡(luò)圖形標(biāo)準(zhǔn),用戶使用任意設(shè)備和操作系統(tǒng)都能獲得一致圖形化體驗(yàn)。
醫(yī)院BI基礎(chǔ)數(shù)據(jù)可以依據(jù)業(yè)務(wù)分為3層:駕駛艙、子主題、專題報(bào)告,見圖2。駕駛艙主要展示來自各子主題的核心指標(biāo),管理者可獲取在服務(wù)端實(shí)時更新的醫(yī)院運(yùn)營關(guān)鍵信息。子主題根據(jù)業(yè)務(wù)特點(diǎn)將醫(yī)院運(yùn)營管理數(shù)據(jù)進(jìn)行分類,包括醫(yī)療收入、醫(yī)療總量、醫(yī)保分析、醫(yī)療效率、醫(yī)療質(zhì)量。醫(yī)療收入主題主要從財(cái)務(wù)口徑進(jìn)行分析,展示業(yè)務(wù)量變化趨勢;醫(yī)療總量主題展示各科室主要醫(yī)療業(yè)務(wù)量變化趨勢及問題所在;醫(yī)保分析主題包含總體概況、門診/住院醫(yī)保分析等頁面;醫(yī)療效率主題展示醫(yī)療資源利用率與服務(wù)效率,有助于管理者控制醫(yī)院成本,改善患者就醫(yī)體驗(yàn)。
圖2 醫(yī)院BI基礎(chǔ)數(shù)據(jù)展示模型
3.4.1 算法 不同于傳統(tǒng)數(shù)據(jù)處理算法,人工智能算法在輸入輸出之間有不定層數(shù)的人工神經(jīng)網(wǎng)絡(luò)(Artificial Neutral Network,ANN),基于獨(dú)特統(tǒng)計(jì)學(xué)算法,模仿神經(jīng)元特性對數(shù)據(jù)進(jìn)行定性劃分;通過控制輸入數(shù)據(jù)屬性,可構(gòu)造各式人工智能模型。醫(yī)院BI人工智能模型利用開源框架Tensorflow。該框架是基于數(shù)據(jù)張量的人工智能算法集,具有跨平臺性,能部署于Linux、Windows等不同操作系統(tǒng),支持Python、C++等面向?qū)ο缶幊陶Z言以及CUDA框架,充分利用GPU計(jì)算能力(GPU計(jì)算功能需要支持CUDA架構(gòu)的硬件)。Tensorflow 框架能夠?qū)?shù)據(jù)轉(zhuǎn)變?yōu)閺埩勘4妫ㄟ^數(shù)據(jù)流與會話構(gòu)造神經(jīng)網(wǎng)絡(luò),訓(xùn)練數(shù)據(jù)集。
3.4.2 架構(gòu) 醫(yī)院管理人工智能模型包含營銷、風(fēng)控、方案3個主題[11],見圖3。營銷主題包含患者、客戶、消費(fèi)3個類別,該模塊主要利用患者掛號信息、醫(yī)囑、費(fèi)用明細(xì)等信息為訓(xùn)練數(shù)據(jù),在此基礎(chǔ)上實(shí)現(xiàn)預(yù)測與分析的功能,精準(zhǔn)模擬患者消費(fèi)與分布情況,幫助管理者對醫(yī)院效益進(jìn)行準(zhǔn)確估計(jì),把握影響醫(yī)院效益的關(guān)鍵因素;風(fēng)控主題包含醫(yī)療、糾紛、行為、欺詐等類別,運(yùn)用文本挖掘、圖像識別等大數(shù)據(jù)技術(shù),通過對電子病歷、病程記錄、診斷、錄音、錄像、圖片等信息進(jìn)行訓(xùn)練,對各種醫(yī)療風(fēng)險(xiǎn)發(fā)生可能性進(jìn)行預(yù)測與警告,對醫(yī)療事故與沖突進(jìn)行防范,幫助管理者減少醫(yī)患糾紛,提升醫(yī)院服務(wù)質(zhì)量,提高患者滿意度[12];方案主題包含投資、量化、決策、集成等類別,綜合運(yùn)用神經(jīng)網(wǎng)絡(luò)、聚類分析、決策樹等技術(shù),對醫(yī)院人事、物資采購、藥品出入庫、設(shè)備折舊、不動產(chǎn)等信息進(jìn)行數(shù)據(jù)訓(xùn)練,輔助醫(yī)院管理者進(jìn)行人事更迭、設(shè)備更新、資產(chǎn)評估方面決策,在指導(dǎo)管理者采購大型設(shè)備、提升職工滿意度、降低維護(hù)成本等方面發(fā)揮作用[13]。
圖3 醫(yī)院BI智能決策模型
本文從軟硬件環(huán)境、數(shù)據(jù)模型層次結(jié)構(gòu)、醫(yī)院管理人工智能模型幾方面闡述建立人工智能BI系統(tǒng)構(gòu)建,該系統(tǒng)可幫助管理者掌握醫(yī)院運(yùn)營動態(tài),輔助決策,以增加醫(yī)院業(yè)務(wù)量、提升醫(yī)療質(zhì)量、提高患者滿意度及減少醫(yī)患糾紛。目前醫(yī)院運(yùn)營多層面尚未形成統(tǒng)一標(biāo)準(zhǔn),存在多種理論,如臨床路徑、單病種付費(fèi)、DRGS等[14],并且理論實(shí)施尚存在較多適應(yīng)性問題。下一步應(yīng)關(guān)注與探討如何構(gòu)建更具普適性的指標(biāo)體系與智能模型,為不同類型、不同規(guī)模醫(yī)院提供無差別支持與幫助。