白榮妙
摘 要:本文淺析了集成數(shù)據(jù)環(huán)境的建設(shè)方案,探討了數(shù)據(jù)環(huán)境分類理論,指出第三類和第四類數(shù)據(jù)環(huán)境是高檔次的數(shù)據(jù)環(huán)境,提出了信息化校園數(shù)據(jù)層邏輯框架,指明第三類數(shù)據(jù)環(huán)境對應(yīng)于數(shù)據(jù)共享層,第四類數(shù)據(jù)環(huán)境對應(yīng)于數(shù)據(jù)倉庫層。比較分析了基于企業(yè)服務(wù)總線ESB和中間件技術(shù)數(shù)據(jù)集成方案的適用情景,探討了信息分類標(biāo)準(zhǔn)的內(nèi)容和編制規(guī)則。
關(guān)鍵詞:共享數(shù)據(jù)庫設(shè)計(jì);數(shù)據(jù)環(huán)境;數(shù)據(jù)集成方案;信息分類標(biāo)準(zhǔn)體系
1 共享數(shù)據(jù)庫設(shè)計(jì)
1.1 總體目標(biāo)
共享數(shù)據(jù)庫是全域數(shù)據(jù)模型在物理數(shù)據(jù)庫中的反映,它通過數(shù)據(jù)集成工具收集、處理、存儲全校各類共享信息數(shù)據(jù),并為全校各類應(yīng)用系統(tǒng)提供信息共享訪問服務(wù),它的總體目標(biāo)是要做到以下幾點(diǎn):
1.保證數(shù)據(jù)合理有效安全地存儲;
2.落實(shí)“誰生產(chǎn)、誰維護(hù)”原則,保證所有數(shù)據(jù)都只有單一的維護(hù)來源;
3.反映學(xué)校管理主要的業(yè)務(wù)主題信息;
4.保證數(shù)據(jù)的規(guī)范性、一致性、完整性;
5.存儲的數(shù)據(jù)能夠反映學(xué)校當(dāng)前的運(yùn)行狀況。
1.2 數(shù)據(jù)環(huán)境分類
美國管理與信息技術(shù)專家詹姆斯·馬丁(James Martin)在《信息工程》和《總體數(shù)據(jù)規(guī)劃方法論》中將計(jì)算機(jī)的數(shù)據(jù)環(huán)境分為四種類型,并認(rèn)為清楚地了解它們之間的區(qū)別是很重要的,因?yàn)樗鼈儗Σ煌墓芾韺哟危òǜ邔庸芾恚┑淖饔檬遣煌腫1]。
1.第一類數(shù)據(jù)環(huán)境:數(shù)據(jù)文件(Data Files)。這是一種數(shù)據(jù)組織技術(shù)簡單、相對容易實(shí)現(xiàn)的數(shù)據(jù)環(huán)境,系統(tǒng)分析員和程序員根據(jù)應(yīng)用的需要,用程序語言分散地設(shè)計(jì)實(shí)現(xiàn)各種數(shù)據(jù)文件;
2.第二類數(shù)據(jù)環(huán)境:應(yīng)用數(shù)據(jù)庫(Application Databases)。它使用了數(shù)據(jù)庫管理系統(tǒng),系統(tǒng)分析員和程序員沒有在數(shù)據(jù)分析和組織上下功夫,而是為分散的應(yīng)用設(shè)計(jì)各自的數(shù)據(jù)庫,不能支持?jǐn)?shù)據(jù)的共享;
3.第三類數(shù)據(jù)環(huán)境:主題數(shù)據(jù)庫(Subject Databases)。它經(jīng)過科學(xué)的規(guī)劃與設(shè)計(jì),其結(jié)構(gòu)與使用它的處理過程是獨(dú)立的,各種面向業(yè)務(wù)主題的數(shù)據(jù),通過一些共享數(shù)據(jù)庫被聯(lián)系和體現(xiàn)出來,其建模需要花費(fèi)很多時間,但其后的維護(hù)成本很低;
第四類數(shù)據(jù)環(huán)境:信息檢索系統(tǒng)(Information Retrieval System)。這種數(shù)據(jù)環(huán)境的目的是保證信息檢索和快速查詢的需要,以支持高層管理和輔助決策,而不是大量的事務(wù)管理,又稱為數(shù)據(jù)倉庫,它是主題數(shù)據(jù)庫的集成,是深加工的信息。
以數(shù)據(jù)文件或應(yīng)用數(shù)據(jù)庫為主體的數(shù)據(jù)環(huán)境,是低檔次的數(shù)據(jù)環(huán)境,一個現(xiàn)代化管理水平較高的企事業(yè)單位,應(yīng)該具有第三類和第四類數(shù)據(jù)環(huán)境,這是高檔次的數(shù)據(jù)環(huán)境,能保證高效率、高質(zhì)量地利用數(shù)據(jù)資源。
1.3 信息化校園數(shù)據(jù)層結(jié)構(gòu)
信息化校園數(shù)據(jù)層結(jié)構(gòu)可以看作是狹義集成數(shù)據(jù)環(huán)境所包含的內(nèi)容,根據(jù)數(shù)據(jù)環(huán)境分類理論和整體校園數(shù)據(jù)規(guī)劃方案,信息化校園的文件型數(shù)據(jù)源和應(yīng)用數(shù)據(jù)庫屬于第一類和第二類數(shù)據(jù)環(huán)境,而共享數(shù)據(jù)中心、歸檔庫和數(shù)據(jù)倉庫屬于第三類和第四類數(shù)據(jù)環(huán)境。根據(jù)數(shù)據(jù)應(yīng)用的類型劃分,信息化校園數(shù)據(jù)層整體結(jié)構(gòu)從邏輯上可以分為三層:應(yīng)用數(shù)據(jù)層、共享數(shù)據(jù)層和數(shù)據(jù)倉庫層,如圖1所示。
1.應(yīng)用數(shù)據(jù)層包含第一類數(shù)據(jù)環(huán)境(文件型數(shù)據(jù)源)和第二類數(shù)據(jù)環(huán)境(應(yīng)用系統(tǒng)數(shù)據(jù)庫),無論是單獨(dú)的數(shù)據(jù)文件還是應(yīng)用系統(tǒng)的后臺數(shù)據(jù)庫,它們都屬于局部數(shù)據(jù)存儲,它們?yōu)楣蚕頂?shù)據(jù)層提供數(shù)據(jù)來源,同時又從共享數(shù)據(jù)層中獲取自己所需的數(shù)據(jù)。
2.共享數(shù)據(jù)層也稱為主題數(shù)據(jù)層,它是整體結(jié)構(gòu)的核心層,它為應(yīng)用數(shù)據(jù)層提供數(shù)據(jù)抽取、訂閱的服務(wù),又為數(shù)據(jù)倉庫層提供數(shù)據(jù)的來源,起到承上啟下的作用,共享庫、標(biāo)準(zhǔn)庫和歸檔庫都屬于該層,歸檔庫的數(shù)據(jù)結(jié)構(gòu)與共享庫一致,只是其中存儲的是已過時、不會發(fā)生變化的數(shù)據(jù)。
3.數(shù)據(jù)倉庫層顧名思義其主要內(nèi)容是數(shù)據(jù)倉庫,前文已提到,數(shù)據(jù)倉庫是為決策支持系統(tǒng)DSS服務(wù)的,DSS一般由數(shù)據(jù)倉庫技術(shù)、OLAP和數(shù)據(jù)挖掘技術(shù)三部分組成,數(shù)據(jù)倉庫的數(shù)據(jù)源是共享庫和歸檔庫,數(shù)據(jù)倉庫也是通過ETL工具從來源庫中抽取出用于查詢、統(tǒng)計(jì)和分析的各種數(shù)據(jù)。
2 數(shù)據(jù)集成方案探析
當(dāng)前主流的數(shù)據(jù)集成方案有兩種,分別是基于SOA架構(gòu)的數(shù)據(jù)集成方案和基于中間件技術(shù)的數(shù)據(jù)集成方案,SOA是一種面向服務(wù)的架構(gòu),它在信息化校園資源整合方面將發(fā)揮重要的作用,ESB則是實(shí)現(xiàn)SOA架構(gòu)最核心的部件,也是信息化校園框架中基礎(chǔ)服務(wù)平臺重要的組成部分,中間件位于數(shù)據(jù)源和目標(biāo)存儲之間,它通過提供配套的工具實(shí)現(xiàn)從源端到目標(biāo)端數(shù)據(jù)的抽取、轉(zhuǎn)換、加載等工作。
2.1 SOA架構(gòu)與企業(yè)服務(wù)總線ESB
SOA是一種設(shè)計(jì)理念,為應(yīng)對復(fù)雜企業(yè)應(yīng)用面臨的柔性化、按需重構(gòu)、異構(gòu)系統(tǒng)集成和跨企業(yè)邊界集成等嚴(yán)峻挑戰(zhàn)提供了一種比較理想的解決方案[2]。SOA是一種應(yīng)用程序體系結(jié)構(gòu),在這種體系結(jié)構(gòu)中,所有功能都定義為獨(dú)立的服務(wù),這些服務(wù)帶有定義良好的可調(diào)用接口,接口獨(dú)立于實(shí)現(xiàn)服務(wù)的硬件平臺、操作系統(tǒng)和編程語言,可以以定義好的順序調(diào)用這些服務(wù)來形成業(yè)務(wù)流程,如圖2所示[3]。ESB是SOA的基礎(chǔ)設(shè)施,它是傳統(tǒng)中間件技術(shù)與XML、Web服務(wù)等技術(shù)結(jié)合的產(chǎn)物,它是服務(wù)間的連接框架,其功能包括消息轉(zhuǎn)換、消息機(jī)制、基于內(nèi)容的路由和服務(wù)容器四個部分,它是一種松耦合架構(gòu),實(shí)現(xiàn)了服務(wù)和通信相分離,使應(yīng)用系統(tǒng)具有更好的開放性和可擴(kuò)展性。
2.2 中間件技術(shù)
中間件泛指能夠屏蔽操作系統(tǒng)和網(wǎng)絡(luò)協(xié)議差異,為異構(gòu)系統(tǒng)之間提供通訊服務(wù)的軟件。數(shù)據(jù)異構(gòu)屏蔽可以由數(shù)據(jù)提供者處理,也可以由數(shù)據(jù)中間人在數(shù)據(jù)集成中間件中處理。根據(jù)數(shù)據(jù)異構(gòu)屏蔽處理的位置不同,可將數(shù)據(jù)集成分為兩種模式:分散式和集中式[4]。分散式中間件通過標(biāo)準(zhǔn)的訪問接口提供數(shù)據(jù)的訪問,它返回標(biāo)準(zhǔn)的實(shí)體描述信息,屏蔽數(shù)據(jù)在存儲上的異構(gòu)性,集中式模式需要數(shù)據(jù)提供者提供數(shù)據(jù)源的類型(如關(guān)系數(shù)據(jù)庫類型)、連接信息(如IP、用戶名、密碼)和數(shù)據(jù)字典等信息,然后中間件通過這些信息訪問數(shù)據(jù)源。
2.3 ESB與中間件方案比較
ESB松耦合的特性非常適合高校信息資源整合的需要,特別是業(yè)務(wù)流程的改造和整合,也有很多高校在進(jìn)行數(shù)據(jù)資源整合時采用此方案,如上海交大、華南師大等,ESB除了能夠?yàn)閿?shù)據(jù)整合提供方案外,借助ESB基礎(chǔ)設(shè)施平臺,還可以實(shí)現(xiàn)全校的流程整合、應(yīng)用整合等,ESB采用標(biāo)準(zhǔn)XML規(guī)范的消息格式,支持Web Service、JMS、JCA等標(biāo)準(zhǔn),支持同步/異步消息機(jī)制,支持服務(wù)間的消息通信等諸多優(yōu)點(diǎn),但采用ESB架構(gòu)有兩個前提,首先需要得到各個應(yīng)用廠商的支持,即廠商愿意配合學(xué)校的信息化工作,并有能力實(shí)現(xiàn)所需的接口服務(wù),其次整體數(shù)據(jù)規(guī)劃已涵蓋各個信息系統(tǒng)間數(shù)據(jù)交換的需求,即要求各個信息系統(tǒng)提供的接口服務(wù)必須明確,分散式中間件技術(shù)對廠商也有類似的要求。
3 信息分類標(biāo)準(zhǔn)體系建立
3.1 學(xué)校信息標(biāo)準(zhǔn)化的重要性
高校信息化建設(shè)是一個復(fù)雜的系統(tǒng)工程,如何規(guī)范建設(shè)管理是一個重要的課題。建設(shè)環(huán)境體系是信息化校園的重要組成部分,它為集成數(shù)據(jù)環(huán)境的建設(shè)提供支撐和保障,建設(shè)環(huán)境體系包括管理規(guī)范和信息標(biāo)準(zhǔn)體系和信息安全與運(yùn)維保障體系,具體展開可以包括信息化管理規(guī)范、信息標(biāo)準(zhǔn)規(guī)范、應(yīng)用系統(tǒng)規(guī)范、基礎(chǔ)設(shè)施規(guī)范等方面內(nèi)容,信息標(biāo)準(zhǔn)規(guī)范是建設(shè)環(huán)境體系的基礎(chǔ)部分,也是學(xué)校信息化建設(shè)優(yōu)先重點(diǎn)建設(shè)的內(nèi)容。
學(xué)校的數(shù)據(jù)表示需要按照一定的編碼標(biāo)準(zhǔn),以方便學(xué)校內(nèi)部數(shù)據(jù)的流通和統(tǒng)計(jì)上報(bào)工作的開展,可以參考的標(biāo)準(zhǔn)有國家標(biāo)準(zhǔn)、行業(yè)標(biāo)準(zhǔn)、各省市標(biāo)準(zhǔn)等,學(xué)校應(yīng)該根據(jù)自身實(shí)際情況引用參考標(biāo)準(zhǔn)制定供全校使用的信息標(biāo)準(zhǔn),還需要建立學(xué)校內(nèi)部定義的標(biāo)準(zhǔn),如單位編碼、專業(yè)編碼等,老系統(tǒng)可以通過改造或?qū)φ毡淼姆绞綄?shí)現(xiàn)與全校信息標(biāo)準(zhǔn)的一致,新系統(tǒng)在構(gòu)建初期就引入全校信息標(biāo)準(zhǔn)相關(guān)內(nèi)容,以實(shí)現(xiàn)與整體信息化校園的無縫對接。
3.2 標(biāo)準(zhǔn)代碼集編制規(guī)則
1.涉及國家和教育部已頒發(fā)的標(biāo)準(zhǔn)時,可以按照相應(yīng)的規(guī)范要求直接引用,對于找不到相關(guān)標(biāo)準(zhǔn)的代碼,學(xué)??梢愿鶕?jù)自己的實(shí)際情況制定標(biāo)準(zhǔn);
2.對于正在使用的各類代碼應(yīng)逐一修訂,并且需得到相關(guān)管理部門的認(rèn)可;
3.編寫制定基礎(chǔ)性代碼或編碼規(guī)則,如單位編碼、專業(yè)編碼、學(xué)號等;
4.保證學(xué)校各部門與教育行政管理各部門之間暢通的信息交流。
參考文獻(xiàn)
[1]高復(fù)先. 信息資源規(guī)劃—信息化建設(shè)基礎(chǔ)工程[M]. 北京: 清華大學(xué)出版社, 2002.
[2]張朝暉, 徐立臻, 董逸生 等. 一種基于SOA的企業(yè)集成平臺[J]. 計(jì)算機(jī)工程, 2011, 37(5): 258-260.
[3]管紅杰, 王珂, 江海峰 等. SOA架構(gòu)的工作流管理系統(tǒng)的研究與應(yīng)用[J]. 計(jì)算機(jī)工程與設(shè)計(jì), 2011, 32(5): 1654-1657.
[4]裴玉玲, 龐佑兵 等. 基于中間件的異構(gòu)數(shù)據(jù)集成系統(tǒng)設(shè)計(jì)[J]. 微電子學(xué), 2010, (2): 260-264.