張宇 武警北京總隊(duì)第二醫(yī)院信息科
得益于信息與計(jì)算機(jī)技術(shù)的飛速發(fā)展,醫(yī)院信息化不斷完善和進(jìn)步,數(shù)字化對于醫(yī)院而言已不陌生。各家醫(yī)院普遍采用數(shù)據(jù)庫技術(shù)以及網(wǎng)絡(luò)技術(shù)來處理醫(yī)院的日常工作和管理。醫(yī)院信息系統(tǒng)(Hospital Information System,簡稱HIS)的采用,使得醫(yī)院的業(yè)務(wù)工作更加高效、快捷、準(zhǔn)確,提高了醫(yī)院的醫(yī)療和管理水平。但隨著醫(yī)院信息化技術(shù)的深入發(fā)展,針對現(xiàn)有的業(yè)務(wù)和管理工作,HIS的發(fā)展遇到了瓶頸。就目前的HIS應(yīng)用,還限于對日常業(yè)務(wù)數(shù)據(jù)的采集、存儲、查詢等初級階段,并沒有實(shí)現(xiàn)對歷史數(shù)據(jù)的篩選、整合和分析,數(shù)據(jù)中隱含的有價(jià)值的信息不能被發(fā)現(xiàn)并加以利用。如何讓歷史數(shù)據(jù)不成為“歷史”,重新發(fā)揮作用,是醫(yī)院“后信息化時(shí)代”要解決的主要問題。
系統(tǒng)分析是根據(jù)用戶感興趣的問題確定主題,主題就是需要通過數(shù)據(jù)倉庫來解決的問題,也是在構(gòu)建數(shù)據(jù)倉庫時(shí)將數(shù)據(jù)歸類的基本依據(jù)。此處簡單分析兩個(gè)主題,以此為例,其他主題均可照此例進(jìn)行。分別是門診掛號工作量主題和門診費(fèi)用情況主題。
1.門診掛號工作量
門診掛號是病人來院就診的第一行為,它所產(chǎn)生的信息相對較少,但是信息相對完整。對門診掛號數(shù)據(jù)進(jìn)行分析,從門診科室,病人費(fèi)別,掛號類別,掛號員等不同角度對掛號人次,掛號費(fèi)用等數(shù)據(jù)重新歸納總結(jié),可以得到不同科室的接診情況,各種費(fèi)別患者的就診情況以及掛號員的工作量等數(shù)據(jù),從而可以了解醫(yī)院門診的運(yùn)行情況,進(jìn)而對門診醫(yī)療資源的優(yōu)化調(diào)整提供數(shù)據(jù)參考。
2.門診費(fèi)用情況
門診收費(fèi)是門診的主要業(yè)務(wù)之一,它直接反應(yīng)醫(yī)院門診的收入情況。通過對門診收費(fèi)數(shù)據(jù)的分析,從門診科室,病人費(fèi)別,收費(fèi)類別,收費(fèi)員等角度對門診費(fèi)用進(jìn)行歸納總結(jié),可以得到門診科室的收入情況,各種費(fèi)別患者的門診費(fèi)用統(tǒng)計(jì)以及各種收費(fèi)類別的費(fèi)用統(tǒng)計(jì)等數(shù)據(jù)。對了解門診各科室的業(yè)務(wù)開展?fàn)顩r有指導(dǎo)作用,還可以分析出不同費(fèi)別病人在醫(yī)院的消費(fèi)情況。
1.概念模型設(shè)計(jì)
數(shù)據(jù)倉庫的開發(fā)人員可以在數(shù)據(jù)倉庫開發(fā)之前通過數(shù)據(jù)倉庫的需求分析,了解數(shù)據(jù)倉庫用戶的大致需求。這樣,就可以界定一個(gè)數(shù)據(jù)倉庫的大致系統(tǒng)邊界,集中精力進(jìn)行主要部分的開發(fā)。因而,界定邊界的工作也可看作是數(shù)據(jù)倉庫系統(tǒng)的概念模型設(shè)計(jì)。概念模型設(shè)計(jì)的主要工作就是確定主題域及其相關(guān)內(nèi)容。本文中我們通過需求分析得到兩個(gè)主題域,門診掛號主題域和門診收費(fèi)主題域。
2.邏輯模型設(shè)計(jì)
數(shù)據(jù)倉庫的邏輯模型通常采用星形模型和雪花模型,在本案中我們采用的是星形模型。邏輯模型設(shè)計(jì)包括維度設(shè)計(jì)以及度量值設(shè)計(jì)。
(1)維度設(shè)計(jì)
維度是描述事實(shí)表中數(shù)據(jù)級別的有組織的層次結(jié)構(gòu),維度的創(chuàng)建需要根據(jù)具體問題進(jìn)行分析確定。例如:構(gòu)建病人掛號記錄的多維數(shù)據(jù)集后,我們可以通過日期維度統(tǒng)計(jì)每日就診人次,也可以通過科室維度統(tǒng)計(jì)各科室接診人次,再或者通過掛號員維度統(tǒng)計(jì)掛號員的工作量。另外,按照使用方式來分,維度可以分為“共享維度”和“專用維度”?!肮蚕砭S度”可在多個(gè)數(shù)據(jù)集中使用,避免了重復(fù)創(chuàng)建,節(jié)約了存儲空間和創(chuàng)建時(shí)間,專用維度是為個(gè)別數(shù)據(jù)集專門使用的維度。本文涉及的數(shù)據(jù)倉庫模型的主要維度如下:
①日期維:日期維屬于共享維,是數(shù)據(jù)倉庫中必備的維度,因?yàn)閷?shù)據(jù)倉庫的操作通常要加入時(shí)間段,否則統(tǒng)計(jì)數(shù)據(jù)將失去意義。根據(jù)一般使用需要將時(shí)間維分為四個(gè)層次:年→季度→月→日。
②科室維:屬于共享維,維表中記錄全院科室名稱及代碼。從HIS數(shù)據(jù)庫中科室字典中獲取。
③費(fèi)別維:屬于共享維,在統(tǒng)計(jì)醫(yī)療數(shù)據(jù)時(shí)通常會區(qū)分病人的費(fèi)別,從而有效的對不同類別的病人信息進(jìn)行分類匯總。費(fèi)別一般包括“自費(fèi)”、“免費(fèi)”、“醫(yī)療保險(xiǎn)”、“公費(fèi)”等,從HIS數(shù)據(jù)庫中費(fèi)別字典中獲取。
④工作人員維:包括掛號員維和收費(fèi)員維,因?yàn)檫@兩個(gè)維表的數(shù)據(jù)均取自HIS數(shù)據(jù)庫中人員字典,所以實(shí)際上是一個(gè)共享維。
⑤收費(fèi)分類維:門診收費(fèi)專用維度,對費(fèi)用進(jìn)行分類的依據(jù),數(shù)據(jù)取自HIS數(shù)據(jù)庫中收費(fèi)類別字典。
⑥掛號類別維:門診掛號專用維度,對掛號類別進(jìn)行分類的依據(jù),數(shù)據(jù)取自HIS數(shù)據(jù)庫中號類字典。
(2)度量值設(shè)計(jì)
度量值是多維數(shù)據(jù)集事實(shí)表中的一列或多列數(shù)值,是多維數(shù)據(jù)集最終要計(jì)算并顯示的結(jié)果,供用戶瀏覽查詢。數(shù)據(jù)類型一般為數(shù)值型,通常是對數(shù)據(jù)集中的某一列或幾列求和、計(jì)數(shù)、取平均值等計(jì)算。度量值是用戶通過數(shù)據(jù)倉庫最終要獲取的信息。例如門診掛號度量值有掛號人次計(jì)數(shù)和掛號費(fèi)用求和,門診收費(fèi)度量值有當(dāng)日次均費(fèi)用等。
將HIS數(shù)據(jù)庫中數(shù)據(jù)通過ETL導(dǎo)入SQLServer數(shù)據(jù)庫中。以門診掛號為例,科室、用戶、掛號分類由HIS數(shù)據(jù)庫導(dǎo)入到SQLServer數(shù)據(jù)庫中,時(shí)間表由SQL語句生成?;A(chǔ)數(shù)據(jù)準(zhǔn)備完畢后,利用SQLServer的Analysis Services組件,建立Analysis Services項(xiàng)目,設(shè)計(jì)數(shù)據(jù)源視圖,以及數(shù)據(jù)倉庫的維度及度量值。最后設(shè)計(jì)數(shù)據(jù)立方體并部署Analysis Services項(xiàng)目,生成可瀏覽的多維數(shù)據(jù)集。
前面我們通過對數(shù)據(jù)倉庫的設(shè)計(jì)與構(gòu)建,最終得到了關(guān)于主題的多維數(shù)據(jù)集。但是對于用戶而言,多維數(shù)據(jù)集本身并不適合瀏覽與分析,通過SQLServer的報(bào)表服務(wù)器可以將數(shù)據(jù)以友好的形式展示給用戶。報(bào)表服務(wù)器,是商業(yè)智能報(bào)表產(chǎn)品的重要組成部分,主要功能是提供報(bào)表資源管理,用戶身份與權(quán)限管理,任務(wù)調(diào)度,信息分發(fā)等。報(bào)表服務(wù)器管理的報(bào)表資源主要包括數(shù)據(jù)庫元數(shù)據(jù),報(bào)表模版,報(bào)表輸出結(jié)果等。另外報(bào)表不僅可以以表格的形式顯示,還可以以圖表的形式進(jìn)行顯示,如餅狀圖、柱狀圖等形式,在表現(xiàn)方式上更友好、更直觀。
本文主要闡述了數(shù)據(jù)倉庫技術(shù)在醫(yī)院管理中的應(yīng)用。伴隨著大數(shù)據(jù)時(shí)代的來臨,對于陳舊歷史數(shù)據(jù)的整合與應(yīng)用越來越多的成為人們關(guān)注的焦點(diǎn),這也是本文的研究背景。通過對數(shù)據(jù)倉庫技術(shù)的研究以及對數(shù)據(jù)倉庫構(gòu)建的具體實(shí)施,初步掌握了數(shù)據(jù)倉庫的開發(fā)技術(shù)與實(shí)施方法。結(jié)合醫(yī)院歷史數(shù)據(jù)所構(gòu)建的兩個(gè)簡單實(shí)例,為以后構(gòu)建更復(fù)雜的數(shù)據(jù)倉庫,開發(fā)決策支持系統(tǒng)奠定了基礎(chǔ)。數(shù)據(jù)倉庫技術(shù)對數(shù)據(jù)的整合及再利用,提供多維度、多角度、多層次觀察數(shù)據(jù)的方式,為信息技術(shù)帶來了新的革命。以往的業(yè)務(wù)數(shù)據(jù)分散零碎,沒有關(guān)聯(lián),為了得到某一數(shù)據(jù)往往需要進(jìn)行多張數(shù)據(jù)表的查詢,而且一旦查詢主題改變,又要反復(fù)查詢工作,數(shù)據(jù)倉庫技術(shù)極好的解決了這些問題。
[1]Jamie Mac Lennan,Zhao Hui Tang,Bogdan Crivat.董艷,程文俊譯.數(shù)據(jù)挖掘原理與應(yīng)用—SQL Server 2008數(shù)據(jù)庫[M].第2版.北京:清華大學(xué)出版社,2012.
[2]Erik Thomasen.朱建秋等譯.OLAP解決方案:創(chuàng)建多維信息系統(tǒng)[M].第2版.北京:電子工業(yè)出版社,2004.