鮑劍洋,項(xiàng)馨立
(南京中醫(yī)藥大學(xué) 網(wǎng)絡(luò)中心,江蘇 南京210046)
在數(shù)字校園的建設(shè)中,隨著技術(shù)的發(fā)展,應(yīng)用系統(tǒng)集成要求能夠無(wú)縫集成來(lái)自多個(gè)異構(gòu)數(shù)據(jù)源的結(jié)構(gòu)化、半結(jié)構(gòu)化和非結(jié)構(gòu)化數(shù)據(jù),而且必須很好地支持標(biāo)準(zhǔn)元數(shù)據(jù)交換、模式映射并且支持標(biāo)準(zhǔn)數(shù)據(jù)傳輸格式。這就對(duì)信息集成解決方案提出了更高的要求,實(shí)現(xiàn)應(yīng)用系統(tǒng)集成主要有以下的兩種模式:
(1)數(shù)據(jù)倉(cāng)儲(chǔ)模式:這種模式首先從一個(gè)或多個(gè)數(shù)據(jù)源中抽取數(shù)據(jù),并對(duì)數(shù)據(jù)進(jìn)行必要的處理,最終將數(shù)據(jù)存儲(chǔ)到目標(biāo)數(shù)據(jù)倉(cāng)庫(kù)中,建立一個(gè)全校共享的數(shù)據(jù)中心。各個(gè)部門(mén)所需要的數(shù)據(jù)都在數(shù)據(jù)中心中提取。最終操作將針對(duì)目標(biāo)數(shù)據(jù)倉(cāng)庫(kù)中數(shù)據(jù)進(jìn)行。
(2)數(shù)據(jù)聯(lián)邦模式:在各個(gè)應(yīng)用系統(tǒng)中只提取統(tǒng)計(jì)分析時(shí)所需要的數(shù)據(jù),它將分布式異構(gòu)數(shù)據(jù)集成到一個(gè)虛擬表中,而不用建立共享數(shù)據(jù)中心。用戶或應(yīng)用程序可以通過(guò)該虛擬表對(duì)數(shù)據(jù)進(jìn)行實(shí)時(shí)操作。
目前大多數(shù)高校都采用的是第一種解決方案,第一種解決方案有它自身的優(yōu)點(diǎn),但是在共享數(shù)據(jù)中心的投入與維護(hù)運(yùn)行費(fèi)用巨大,共享數(shù)據(jù)中心基本需要小型機(jī)或大型服務(wù)器支持,巨大,為了安全起見(jiàn),還要建立小型機(jī)集群以保證系統(tǒng)的安全性。
因此我們?cè)趹?yīng)用系統(tǒng)集成采用第二種解決方案,使用IBM公司的解決方案,在各個(gè)應(yīng)用系統(tǒng)中只提取統(tǒng)計(jì)分析時(shí)所需要的數(shù)據(jù),而不用建立共享數(shù)據(jù)中心。使用IBM的Cognos軟件成功地將學(xué)校有關(guān)的幾個(gè)應(yīng)用系統(tǒng)進(jìn)行整合,不但可以進(jìn)行相關(guān)的查詢統(tǒng)計(jì)工作,還可以進(jìn)行更深層次的分析工作,較好的達(dá)到了我們的目標(biāo)。
商業(yè)智能(BI)是由數(shù)據(jù)倉(cāng)庫(kù)、聯(lián)機(jī)分析處理OLAP和數(shù)據(jù)挖掘等技術(shù)的綜合運(yùn)用。商業(yè)智能的關(guān)鍵是從許多來(lái)自不同的應(yīng)用系統(tǒng)的數(shù)據(jù)中提取出有用的數(shù)據(jù)并進(jìn)行清理,以保證數(shù)據(jù)的正確性,然后經(jīng)過(guò)抽?。‥xtraction)、轉(zhuǎn)換(Transformation)和裝載(Load),合并到一個(gè)企業(yè)級(jí)的數(shù)據(jù)倉(cāng)庫(kù)里,從而得到學(xué)校數(shù)據(jù)的一個(gè)全局視圖,在此基礎(chǔ)上利用合適的查詢和分析工具、數(shù)據(jù)挖掘工具、OLAP工具等對(duì)其進(jìn)行分析和處理 (這時(shí)信息變?yōu)檩o助決策的知識(shí)),最后將知識(shí)呈現(xiàn)給管理者,為管理者的決策過(guò)程提供支持。
南京中醫(yī)藥大學(xué)數(shù)字化校園的數(shù)據(jù)集成平臺(tái)的結(jié)構(gòu)如圖1。
圖1 南京中醫(yī)藥大學(xué)數(shù)字化校園的數(shù)據(jù)集成平臺(tái)系統(tǒng)結(jié)構(gòu)圖
Cognos結(jié)構(gòu)在邏輯上可以分為瀏覽器層、Web Server層、應(yīng)用服務(wù)層和數(shù)據(jù)源與內(nèi)容庫(kù)層(如圖2)。Cognos提供了強(qiáng)大的OLAP多維分析、查詢、報(bào)表、地圖、儀表板、門(mén)戶等多種前沿展現(xiàn)手段,對(duì)數(shù)據(jù)進(jìn)行多維分析并定制生成報(bào)表。
圖2 Cognos的體系結(jié)構(gòu)圖
Cognos具有強(qiáng)大的OLAP數(shù)據(jù)引擎,能產(chǎn)生多維數(shù)據(jù)分析的立方體Cubes。多維數(shù)據(jù)立方體是由各維度數(shù)據(jù)組成的數(shù)據(jù)集市,保證只占用很少的存儲(chǔ)空間就能處理大量數(shù)據(jù),能夠使用戶以更多的角度分析更多的指標(biāo)。
Cognos數(shù)據(jù)源可以是 Oracle、SQL Server、DB2、Sybase等大型關(guān)系型數(shù)據(jù)庫(kù),也可以是Access、dBase等桌面型數(shù)據(jù)庫(kù);可以是未經(jīng)處理的業(yè)務(wù)數(shù)據(jù)庫(kù),也可以是經(jīng)處理后的數(shù)據(jù)集市。
Cognos統(tǒng)一了Web應(yīng)用架構(gòu)與元數(shù)據(jù),通過(guò)抽取各數(shù)據(jù)源中所需數(shù)據(jù)存入數(shù)據(jù)立方體的方法訪問(wèn)企業(yè)的所需信息,為用戶提供了基于純?yōu)g覽器的全面的BI功能。
南京中醫(yī)藥大學(xué)數(shù)字化校園的數(shù)據(jù)集成平臺(tái)主要功能與應(yīng)用集成的過(guò)程如下:
(1)采用了聯(lián)邦數(shù)據(jù)庫(kù)模式,以IBM Cognos為基礎(chǔ)的應(yīng)用集成平臺(tái)。
(2)采用數(shù)據(jù)聯(lián)邦技術(shù)的建設(shè)模式,原始數(shù)據(jù)分布在各自應(yīng)用系統(tǒng)中,用戶直接在全局模式的基礎(chǔ)上提交調(diào)用各個(gè)數(shù)據(jù)源中數(shù)據(jù)的請(qǐng)求,由Cognos轉(zhuǎn)換成各個(gè)數(shù)據(jù)源在本地?cái)?shù)據(jù)視圖基礎(chǔ)上能夠執(zhí)行的請(qǐng)求。
(3)以國(guó)家《教育管理信息化標(biāo)準(zhǔn)》規(guī)范為基礎(chǔ),建立南京中醫(yī)藥大學(xué)數(shù)字化校園的信息化建設(shè)規(guī)范。
(4)IBM Cognos為用戶提供透明的數(shù)據(jù)訪問(wèn)方法,對(duì)所要集成的不同應(yīng)用系統(tǒng)中的數(shù)據(jù)信息進(jìn)行抽取,將原來(lái)異構(gòu)的數(shù)據(jù)模式作適當(dāng)?shù)霓D(zhuǎn)換,建立數(shù)據(jù)Cube。
(5)在抽取的過(guò)程中,根據(jù)南京中醫(yī)藥大學(xué)數(shù)字化校園的信息化建設(shè)規(guī)范,對(duì)不同系統(tǒng)的數(shù)據(jù)進(jìn)行數(shù)據(jù)清洗,使得數(shù)據(jù)統(tǒng)一規(guī)范。
(6)完成了數(shù)據(jù)抽取與匯總之后,根據(jù)學(xué)校對(duì)具體應(yīng)用的需求,建立相應(yīng)的數(shù)據(jù)模型與腳本,運(yùn)用Cognos報(bào)表制作功能就能實(shí)現(xiàn)數(shù)據(jù)集成的過(guò)程。對(duì)數(shù)據(jù)Cube進(jìn)行數(shù)據(jù)挖掘,得出所需的信息,并通過(guò)前端展現(xiàn)設(shè)計(jì)進(jìn)行展示。
圖3 數(shù)據(jù)集成平臺(tái)主要功能結(jié)構(gòu)圖
在高校學(xué)生教育管理工作中,學(xué)生的評(píng)優(yōu)工作是一項(xiàng)重要而復(fù)雜的工作。獎(jiǎng)勵(lì)種類多,涉及的金額高,參與的學(xué)生眾多。每種獎(jiǎng)勵(lì)都有相應(yīng)的評(píng)定條件,學(xué)生要獲得某種獎(jiǎng)勵(lì)就必須要滿足該項(xiàng)目的最低條件。
評(píng)綜合獎(jiǎng)只需要成績(jī)數(shù)據(jù)因此只涉及教務(wù)管理一個(gè)數(shù)據(jù)源,但評(píng)院優(yōu)干不僅需要成績(jī)數(shù)據(jù)還需要學(xué)工數(shù)據(jù),因此涉及教務(wù)管理和學(xué)工管理這兩個(gè)異構(gòu)數(shù)據(jù)源。教務(wù)管理數(shù)據(jù)庫(kù)為Oracle數(shù)據(jù)庫(kù),而學(xué)工數(shù)據(jù)庫(kù)為SQL數(shù)據(jù)庫(kù),這兩種數(shù)據(jù)庫(kù)在數(shù)據(jù)格式、標(biāo)準(zhǔn)和訪問(wèn)接口方面都有著重大區(qū)別。如何將這兩個(gè)數(shù)據(jù)庫(kù)中的數(shù)據(jù)集成直接影響到評(píng)優(yōu)過(guò)程的開(kāi)展。
評(píng)優(yōu)過(guò)程的實(shí)現(xiàn)步驟如下:
首先,在數(shù)據(jù)源中選擇教務(wù)數(shù)據(jù)庫(kù)中的表和表中需要的字段,并建立表之間的連接。然后用同樣的方法再選操作學(xué)生工作數(shù)據(jù)庫(kù),并建立兩個(gè)數(shù)據(jù)庫(kù)之間表的連接(如圖4)。
圖4 兩個(gè)異構(gòu)數(shù)據(jù)源的連接
接著在將需要的數(shù)據(jù)過(guò)濾出來(lái)并打包發(fā)布,新建一張空白報(bào)表,運(yùn)用列表工具,將運(yùn)行后要顯示的字段拖入。
接下來(lái)過(guò)濾出精確數(shù)據(jù),要在數(shù)據(jù)項(xiàng)中寫(xiě)表達(dá)式,將2007-2008學(xué)年的成績(jī)和學(xué)生工作數(shù)據(jù)過(guò)濾出來(lái)。如“院優(yōu)干”這一數(shù)據(jù)項(xiàng)的表達(dá)式的意思應(yīng)為在2007-2008學(xué)年擔(dān)任過(guò)班級(jí)以上干部并且單科成績(jī)不低于60分(如圖5)。
圖5 數(shù)據(jù)過(guò)濾
按上述操作后運(yùn)行,得出評(píng)優(yōu)結(jié)果(如圖6),該結(jié)果與2007-2008年度院優(yōu)干入圍學(xué)生名單相符。由上可以看出:采用Cognos系統(tǒng)實(shí)現(xiàn)評(píng)優(yōu)過(guò)程是真實(shí)可行的,而且有效的。
圖6 評(píng)選優(yōu)秀干部的結(jié)果
經(jīng)過(guò)對(duì)南京中醫(yī)藥大學(xué)應(yīng)用系統(tǒng)集成的應(yīng)用,證明了采用數(shù)據(jù)聯(lián)邦模式和商業(yè)智能平臺(tái)能夠在建立數(shù)字化校園系統(tǒng)的時(shí)候,對(duì)應(yīng)用系統(tǒng)能夠進(jìn)行較好的集成,并且很好的實(shí)現(xiàn)了系統(tǒng)的可擴(kuò)展性和兼容性,大大降低了系統(tǒng)集成的復(fù)雜性和集成成本。相對(duì)于目前許多高校采用的大型數(shù)據(jù)倉(cāng)庫(kù)技術(shù)進(jìn)行應(yīng)用集成,具有投入少、實(shí)現(xiàn)快的優(yōu)點(diǎn),并可利用平臺(tái)所具備數(shù)據(jù)挖掘與分析技術(shù),快速建立決策分析平臺(tái),是進(jìn)行校園應(yīng)用集成與應(yīng)用系統(tǒng)建設(shè)的一條新的快速途徑,是一些高校進(jìn)行數(shù)字化校園建設(shè)可采用的有效技術(shù)。
[1]萬(wàn)里鵬,陳雅,鄭建明.中國(guó)高校數(shù)字化校園建設(shè)與思考[J].情報(bào)科學(xué),2004(3):122.
[2]李海峰,韋東杰,李濤.兩種常用信息集成模式比較[EB/OL].http://www.ibm.com/developerworks/cn/data/library/techarticles/dm-0903lihf/index.html.
[3]漢端科技有限公司.IBM Cognos商業(yè)智能軟件整體簡(jiǎn)介[J].2008,12(1):1-17.