王螢,徐琛
(1.首都醫(yī)科大學(xué)附屬北京朝陽(yáng)醫(yī)院財(cái)務(wù)科,北京 100043;2.首都醫(yī)科大學(xué)附屬北京朝陽(yáng)醫(yī)院病案統(tǒng)計(jì)科,北京 100043)
基于OLAP+DM技術(shù)的醫(yī)院財(cái)務(wù)分析系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)
王螢1,徐琛2
(1.首都醫(yī)科大學(xué)附屬北京朝陽(yáng)醫(yī)院財(cái)務(wù)科,北京100043;2.首都醫(yī)科大學(xué)附屬北京朝陽(yáng)醫(yī)院病案統(tǒng)計(jì)科,北京100043)
文中成功將醫(yī)院的數(shù)據(jù)信息庫(kù)與下屬醫(yī)院的信息庫(kù)有效相結(jié)合,建立了龐大的整合數(shù)據(jù)資源池,并經(jīng)過(guò)一系列的數(shù)據(jù)抽取、轉(zhuǎn)換和加載為資源的整合做出了有效的準(zhǔn)備工作,且最終建立了一個(gè)有效的財(cái)務(wù)分析數(shù)據(jù)倉(cāng)庫(kù),解決了始終困擾行業(yè)的數(shù)據(jù)孤島問(wèn)題。在此基礎(chǔ)上,還經(jīng)過(guò)一些列的分析和推導(dǎo),利用OLAP和DM技術(shù),對(duì)財(cái)務(wù)報(bào)表進(jìn)行了全方位多維度的分析,同時(shí)對(duì)于數(shù)據(jù)的可靠性和價(jià)值性進(jìn)行一定程度上的數(shù)據(jù)挖掘,將對(duì)數(shù)據(jù)分析的結(jié)果提供給醫(yī)院的管理層和決策層。對(duì)系統(tǒng)地測(cè)試表明,該系統(tǒng)在數(shù)據(jù)分析和處理整合上均具有可靠性和權(quán)威性。
醫(yī)院財(cái)務(wù)系統(tǒng);數(shù)據(jù)庫(kù);數(shù)據(jù)整合;技術(shù)分析
進(jìn)入21世紀(jì)以后,計(jì)算機(jī)信息技術(shù)發(fā)展突飛猛進(jìn),我們的生產(chǎn)生活方式已經(jīng)發(fā)生了巨大的改變,已經(jīng)避免不了要和大量的數(shù)據(jù)信息進(jìn)行交流溝通,對(duì)于醫(yī)院來(lái)說(shuō),更是如此,作為社會(huì)上的職能機(jī)構(gòu)每天要處理很多龐大數(shù)據(jù)信息,作為醫(yī)院的管理層和決策層,如何在大量的數(shù)據(jù)流量信息中捕捉到有價(jià)值的信息,從而進(jìn)行有針對(duì)性的正確決策是一個(gè)考驗(yàn)著IT工作者們的難題,而這也決定著一個(gè)醫(yī)院的成敗興衰和工作效率。正是為了解決這種實(shí)際問(wèn)題,文將本來(lái)用于數(shù)據(jù)倉(cāng)庫(kù)管理的OLAP技術(shù)和用于數(shù)據(jù)挖掘的DM技術(shù)移植到數(shù)據(jù)處理中來(lái)[1],為財(cái)務(wù)分析工作進(jìn)行輔助,在對(duì)這兩種技術(shù)進(jìn)行深入的與原理剖析后,結(jié)合醫(yī)院目前的運(yùn)行現(xiàn)狀,對(duì)系統(tǒng)的功能和設(shè)計(jì)進(jìn)行綜合考量,最終確定了一套行之有效的設(shè)計(jì)原則和標(biāo)準(zhǔn),使用該系統(tǒng)后可以改變醫(yī)院以前的每月月報(bào)的傳統(tǒng)財(cái)務(wù)分析行為,可以在系統(tǒng)中直接進(jìn)行綜合整理和上報(bào),這有效的提高了醫(yī)院的運(yùn)行效率,除此之外,系統(tǒng)還能只能分析財(cái)務(wù)報(bào)表,將隱含的突出信息上報(bào)給決策層。
1.1體系結(jié)構(gòu)的設(shè)計(jì)研究
文中設(shè)計(jì)的這款系統(tǒng)的體系結(jié)構(gòu)可分成4個(gè)層次,如圖1所示,位于體系最底層的是數(shù)據(jù)獲取層,數(shù)據(jù)源主要是醫(yī)院的日常財(cái)務(wù)報(bào)表,這里面包括各類憑證數(shù)據(jù),要保證數(shù)據(jù)的統(tǒng)一性和一致性必須對(duì)數(shù)據(jù)進(jìn)行必要的抽取,清理和轉(zhuǎn)換,而后在將統(tǒng)一后的數(shù)據(jù)類型進(jìn)化型存入操作,目標(biāo)地址是數(shù)據(jù)倉(cāng)庫(kù)。這里面采用的是SAP BW數(shù)據(jù)抽取機(jī)制[2],通過(guò)一定得技術(shù)手段將數(shù)據(jù)先加載至PSA再通過(guò)與信息源的對(duì)照等更新規(guī)則的清洗加載到ODS中,最終進(jìn)入目標(biāo)地址信息立方體。
數(shù)據(jù)存儲(chǔ)層的主要功能是用來(lái)處理講過(guò)加工后的數(shù)據(jù),來(lái)源主要是醫(yī)院日常的財(cái)務(wù)系統(tǒng)地?cái)?shù)據(jù)流,按照某種需求進(jìn)行重新的組織和處理,這個(gè)層面的主要功能是為醫(yī)院的決策層提供大量的規(guī)范化的數(shù)據(jù)以便于進(jìn)行分析從而做出正確的判斷。
數(shù)據(jù)處理層是體系結(jié)構(gòu)中很重要的一個(gè)環(huán)節(jié),主要工作原理是利用OLAP技術(shù)和數(shù)據(jù)挖掘技術(shù)對(duì)醫(yī)院的信息數(shù)據(jù)流進(jìn)行立方式的設(shè)計(jì)和處理,從而刪除不必要的信息,有價(jià)值的信息進(jìn)行保留上傳至下一環(huán)節(jié)。
圖1 醫(yī)院財(cái)務(wù)分析系統(tǒng)的體系結(jié)構(gòu)設(shè)計(jì)Fig.1 Architecture design Hospital Financial Analysis System
1.2數(shù)據(jù)準(zhǔn)備模塊相關(guān)設(shè)計(jì)研究
設(shè)計(jì)這個(gè)模塊的主要作用是將醫(yī)院的各個(gè)部門之間不同的數(shù)據(jù)類型新型轉(zhuǎn)換清洗和加載[3],由此可使得數(shù)據(jù)具有統(tǒng)一性。要達(dá)到這個(gè)目的,首先應(yīng)對(duì)數(shù)據(jù)源和數(shù)據(jù)倉(cāng)庫(kù)進(jìn)行數(shù)據(jù)化建模。
在進(jìn)行數(shù)據(jù)處理時(shí),要考慮數(shù)據(jù)源結(jié)構(gòu)等相關(guān)問(wèn)題,即數(shù)據(jù)源結(jié)構(gòu)是什么樣的,在抽取結(jié)果中EPR是包含著那些有價(jià)值的數(shù)據(jù),諸如此類問(wèn)題必須在EPR系統(tǒng)中提前定義好,這個(gè)過(guò)程通常稱之為數(shù)據(jù)源建模,我們?cè)O(shè)計(jì)的這款財(cái)務(wù)分析系統(tǒng)使用的就是EPR系統(tǒng)中的財(cái)務(wù)模塊數(shù)據(jù)[4]。設(shè)計(jì)的系統(tǒng)中將存在兩種數(shù)據(jù)類型庫(kù),分別如圖表1和表2所示,表1表示的是資產(chǎn)負(fù)債表的數(shù)據(jù)源建模相關(guān)參照標(biāo)準(zhǔn),表2是利潤(rùn)表的數(shù)據(jù)源建模系統(tǒng)相關(guān)參照標(biāo)準(zhǔn)。
表1 資產(chǎn)負(fù)債表相關(guān)數(shù)據(jù)源建模Tab.1 Balance sheet data source modeling
表2 利潤(rùn)表相關(guān)數(shù)據(jù)建模Tab.2 Income statement data modeling
根據(jù)系統(tǒng)實(shí)際需求,這個(gè)數(shù)據(jù)倉(cāng)庫(kù)會(huì)按照多維分析和指標(biāo)分析等將邏輯模型設(shè)計(jì)為兩個(gè)可擴(kuò)展的星型模型。
Ⅰ在系統(tǒng)中多維分析模塊是由兩個(gè)部分組成,即一個(gè)事實(shí)表和六維表組成。其中的每一個(gè)維表包含的SID表均由三部分組成,即屬性表,文本表和層次表[5]。
Ⅱ指標(biāo)的分析模塊的邏輯模型是由兩部分組成個(gè),即一個(gè)事實(shí)表和4個(gè)維表,這些屬性會(huì)在財(cái)務(wù)分析系統(tǒng)中起到至關(guān)重要的提示作用,為系統(tǒng)的操作帶來(lái)了方便,分別是時(shí)間維表,單位名稱維表。
1.3多維分析模塊的設(shè)計(jì)研究
在系統(tǒng)設(shè)計(jì)中,這個(gè)模塊的主要功能是將各選定的科目以一種多維的方式顯示出來(lái),使用者可通過(guò)OLAP技術(shù)對(duì)這些數(shù)據(jù)進(jìn)行比較分析,即使用OLAP的在維度方面的變化功能對(duì)一個(gè)單位不同年份進(jìn)行縱向比較和分析,或者對(duì)同一個(gè)時(shí)間節(jié)點(diǎn)的不同單位進(jìn)行橫向比較。
這個(gè)模塊的優(yōu)勢(shì)或者說(shuō)是特色功能是可以利用數(shù)據(jù)挖掘技術(shù)中的OLAP技術(shù)進(jìn)行數(shù)據(jù)的維度操作[6],這運(yùn)行在財(cái)務(wù)分析系統(tǒng)上是一個(gè)技術(shù)創(chuàng)新,這在實(shí)際使用中具有很有價(jià)值的意義,例如若要比較某一個(gè)單位在不同年份上的同一個(gè)時(shí)期或者季度的營(yíng)業(yè)情況或者比較同一年份的不同單位的效益情況都需要一種維度的比較?;诖耍鞠到y(tǒng)采用了分組序號(hào)聚焦算法,這能提高查詢效率,顯著提高了排序的速度。
該算法步驟中主要有兩大部分組成,即排序和分組聚集兩個(gè)部分,在排序中,首先是要將查詢分解為單維表,其次將各維表按照查詢的關(guān)鍵字進(jìn)行分組編號(hào),再次將事實(shí)表中的每個(gè)需要記錄的字段進(jìn)行對(duì)應(yīng)維表的替換工作,新的關(guān)鍵字就在系統(tǒng)中連接起來(lái)了。排好序后,將按照關(guān)鍵字進(jìn)行分組的聚集求和,這個(gè)過(guò)程與剛才的排序過(guò)程相反,它是將記錄的關(guān)鍵字從后向前依次分解出各維表的分組序號(hào),相同的分組序號(hào)顯然可以納入一組,最后再系統(tǒng)中對(duì)其求和操作。這個(gè)算法的流程圖可用如圖2所示的框圖表達(dá)出來(lái)。
1.4報(bào)表輸出模塊的研究設(shè)計(jì)
在上文提到的多維度分析模塊中有兩種報(bào)表,分別是運(yùn)營(yíng)收入狀況分析和費(fèi)用情況分析的報(bào)表。其中在“運(yùn)營(yíng)收入狀況分析”中,其收入主要來(lái)源于門診和醫(yī)藥費(fèi)等環(huán)節(jié),使用者通過(guò)這個(gè)財(cái)務(wù)分析系統(tǒng)中不僅可查詢到醫(yī)院各年度的銷售收入狀況,還可進(jìn)行下鉆操作,而這依賴于OLAP技術(shù)的運(yùn)用[7],這樣可以獲得本年度醫(yī)院各項(xiàng)銷售和運(yùn)行狀況財(cái)務(wù)分析情況。
在“費(fèi)用支出情況分析中”,費(fèi)用情況被系統(tǒng)自動(dòng)分為了醫(yī)院門診費(fèi)用,管理維護(hù)費(fèi)用和財(cái)務(wù)費(fèi)用等3大類,這每一大類都有不同的費(fèi)用科目進(jìn)行選擇,其結(jié)構(gòu)設(shè)計(jì)情況大同小異,分4個(gè)維度進(jìn)行表征,主要為單位,利潤(rùn),費(fèi)用科目情況和時(shí)間節(jié)點(diǎn)4個(gè)維度。使用者在系統(tǒng)中可通過(guò)OLAP技術(shù)添加利潤(rùn)版塊額度,這便于決策者對(duì)不同的模塊進(jìn)行統(tǒng)計(jì)分析。表3給出了醫(yī)院財(cái)務(wù)分析系統(tǒng)的指標(biāo)分析情況和具體科目表。
圖2 分組序號(hào)的聚集算法流程框圖Fig.2 Packet sequence number of aggregation algorithm flow diagram
表3 財(cái)務(wù)分析系統(tǒng)中的指標(biāo)分析模塊樣本Tab.3 Financial analysis system index analysis module sample
2.1數(shù)據(jù)倉(cāng)庫(kù)的建模實(shí)現(xiàn)
數(shù)據(jù)倉(cāng)庫(kù)概念是在關(guān)系型的數(shù)據(jù)庫(kù)模型的基礎(chǔ)上發(fā)展而來(lái)的,其所表征的數(shù)據(jù)類型應(yīng)該具有以下幾個(gè)基本特點(diǎn)和特點(diǎn),即非冗余性、穩(wěn)定性、一致性和最終數(shù)據(jù)使用的靈活性等特點(diǎn)。這個(gè)程序是系統(tǒng)中必要的準(zhǔn)備,為以后數(shù)據(jù)庫(kù)的大量數(shù)據(jù)提取和存儲(chǔ)提供了技術(shù)支持。
這個(gè)程序主要的功能即是從zbalance表和 faglflext表中獲得數(shù)據(jù)[8],而后將數(shù)據(jù)按照月份想加的方式從而得到醫(yī)院的各項(xiàng)財(cái)務(wù)部門的期末余額,這些數(shù)據(jù)都將保存在資產(chǎn)的負(fù)債表中,最后經(jīng)過(guò)數(shù)據(jù)分析和提煉上報(bào)決策層做出最正確的選擇。
zbalancep.”從資產(chǎn)負(fù)債表對(duì)應(yīng)科目中讀出所有記錄,存放在 zbalancep表中
2.2多維分析模塊的報(bào)表開(kāi)發(fā)與相應(yīng)實(shí)現(xiàn)
在設(shè)計(jì)的這款醫(yī)院財(cái)務(wù)分析系統(tǒng)中為了加快計(jì)算及相應(yīng)的速度和利用好存儲(chǔ)效率,里面運(yùn)用了OLAP聚焦查詢的算法,這即是對(duì)CUBE事實(shí)表進(jìn)行預(yù)計(jì)算,具體實(shí)現(xiàn)方式是對(duì)要查詢的維度進(jìn)行聚焦運(yùn)算,將結(jié)果保存在實(shí)施表中。
系統(tǒng)中采用分組序號(hào)聚焦算法明顯提高了查詢效率,當(dāng)事實(shí)表記錄數(shù)越多,這種算法提高效率的效果更加理想。舉個(gè)例子,在實(shí)驗(yàn)中記錄的數(shù)據(jù)為100 000時(shí),利用分組聚焦算法的計(jì)算機(jī)查詢速度是3 s,當(dāng)采用傳統(tǒng)的聚焦算法時(shí),查詢速度為99 s,結(jié)果如下表4所示。
2.3指標(biāo)分析模塊的報(bào)表相關(guān)開(kāi)發(fā)與實(shí)現(xiàn)方式
在這個(gè)模塊中使用的是模糊識(shí)別的算法,這實(shí)現(xiàn)了對(duì)輸入測(cè)試的樣本集的4項(xiàng)重要指標(biāo)分析,這能根據(jù)指標(biāo)數(shù)據(jù)的不同對(duì)數(shù)據(jù)進(jìn)行只能預(yù)警分析,這也就引起了醫(yī)院決策層的注意。
查詢效率高是這個(gè)模塊應(yīng)該具備的基本特征,數(shù)據(jù)存儲(chǔ)在數(shù)據(jù)倉(cāng)庫(kù)中,進(jìn)行預(yù)計(jì)算和聚焦運(yùn)算,當(dāng)決策層要查詢相關(guān)數(shù)據(jù)時(shí),就可以隨時(shí)進(jìn)行訪問(wèn),這極大地提高了數(shù)據(jù)分析的效率。維護(hù)性好和維護(hù)量小也是系統(tǒng)的一個(gè)特色功能,醫(yī)院的財(cái)務(wù)分析系統(tǒng)在建立的時(shí)候就已經(jīng)設(shè)定好取數(shù)邏輯和查詢邏輯。這無(wú)需專門人員進(jìn)行操作和處理,只要對(duì)模型進(jìn)行稍加修正即可。圖3是指標(biāo)分析模塊的切片設(shè)計(jì)分析圖。
表4 分組聚焦算法與傳統(tǒng)聚焦算法相關(guān)運(yùn)算效率的比較結(jié)果Tab.4 Comparison of the results of the focus groups related to the algorithm algorithm with the traditional focus of the operation efficiency
圖3 指標(biāo)分析模塊的切片設(shè)計(jì)圖Fig.3 Slice design index analysis module
OLAP技術(shù)和DM技術(shù)經(jīng)過(guò)多年的發(fā)展已日趨成熟,并在眾多行業(yè)得到了廣泛的應(yīng)用,而將這兩種技術(shù)結(jié)合起來(lái)為醫(yī)院的財(cái)務(wù)方面決策層提供服務(wù)卻是近些年才興起來(lái)的。本文成功將這兩種技術(shù)應(yīng)用于醫(yī)院的財(cái)務(wù)分析系統(tǒng)中,經(jīng)過(guò)一系列的數(shù)據(jù)抽取和轉(zhuǎn)換等操作,建立了一個(gè)適用于醫(yī)院財(cái)務(wù)部門的信息數(shù)據(jù)系統(tǒng),解決了一直存在的數(shù)據(jù)孤島問(wèn)題,在建立的這個(gè)數(shù)據(jù)倉(cāng)庫(kù)中利用OLAP技術(shù)和DM技術(shù)進(jìn)行數(shù)據(jù)挖掘,對(duì)醫(yī)院財(cái)務(wù)狀況進(jìn)行深入分析研究,且對(duì)數(shù)據(jù)進(jìn)行了價(jià)值判斷,這些結(jié)果將直達(dá)決策層,為醫(yī)院管理者的分析和決策提供了重要的技術(shù)支持。
[1]Efrem G.Mallach.Decision Support and Data Warehouse Systems[M].李昭智,李昭勇,譯.北京:電子工業(yè)出版社,2001.
[2]Paul Gray Hugh J.Watson.Decision Support In The Data Warehouse[M].北京:北京理工大學(xué)出版社,2001.
[3]Daubechies I.Ten lectures on wavelets[C].Philadelphia,Pennsylvania,SIAM Mathematieal Analysis,1992.
[4]British Standard Institution.BS EN 50160:2007 Voltage characteristics of electricity supplied by public distribution system[S].2007.
[5]IEEE Standards Coordinating Committee 22 on Power Quality,IEEE Std 1159-1995.IEEE Recommended Practice for Monitoring Electric Power Quality,ISBN-1-55937-549-3,1995.
[6]何玉潔,張俊超.數(shù)據(jù)倉(cāng)庫(kù)與 OLAP實(shí)踐教程[M].北京:清華大學(xué)出版社,2008.
[7]徐潔磐.數(shù)據(jù)倉(cāng)庫(kù)與決策支持系統(tǒng)[J].北京:科學(xué)出版社,2005.
[8]遲忠先,李艷紅,張春濤.OLAP核心技術(shù)—數(shù)據(jù)立方體的研究現(xiàn)狀與展望[J].計(jì)算機(jī)工程,2002,28(10):1-2.
Design and implementation of financial analysis system with hospital based on techniques of OLAP+DM
WANG Ying1,XU Chen2
(1.Financial Affairs Office,Beijing Chaoyang Hospital affiliated to Capital Medical University,Beijing 100043,China;2. Statistical room of Medical Records,Beijing Chaoyang Hospital affiliated to Capital Medical University,Beijing100043,China)
In this paper,the success of the hospital′s data bank and affiliated hospitals effectively combine information base,establishment of a large integrated data resource pool,and after a series of data extraction,transformation and loading for the integration of resources to make effective preparations,and the eventual establishment of an effective financial analysis of the data warehouse,to solve the industry has been plagued by the problem of data islands.On this basis,but also through analysis and derive some out using OLAP and DM technology,the financial statements of a full range of multi-dimensional analysis,and for the reliability and value of data mining to some extent,will the results of the data analysis provided to the hospital′s management and decision-making.To systematically test shows that the system is reliable and authoritative in the data analysis and processing integration.
hospital financial system;database;data integration;technical analysis
TM933.4
A
1674-6236(2016)05-0051-04
2015-04-17稿件編號(hào):201504177
王 螢(1982—),女,北京人。研究方向:數(shù)據(jù)庫(kù)、醫(yī)院財(cái)務(wù)分析。