史松+冀亞林+蔡娜+王霞+馬成龍
摘要: 當(dāng)今正處于信息高速發(fā)展的時(shí)代,數(shù)據(jù)量高速膨脹,難以在以前的系統(tǒng)中進(jìn)行交流、共享和融合。為了整合數(shù)據(jù)資源、消除“信息孤島”、構(gòu)建企業(yè)發(fā)展藍(lán)圖,人們逐漸意識(shí)到頂層設(shè)計(jì)的重要性。很多企業(yè)針對(duì)自身發(fā)展建立了自己的企業(yè)架構(gòu)進(jìn)行頂層設(shè)計(jì),而作為其核心的數(shù)據(jù)架構(gòu)模型形式也根據(jù)不同行業(yè)體現(xiàn)出不同發(fā)展。本文主要對(duì)數(shù)據(jù)架構(gòu)模型進(jìn)行研究,闡述數(shù)據(jù)架構(gòu)模型的作用及其相互關(guān)系。
Abstract: Today is in the era of rapid development of information, data volume of high-speed expansion, it is difficult in the previous system for communication, sharing and integration. In order to integrate data resources, eliminate the "information island", build enterprise development blueprints, people gradually realize the importance of top design. Many enterprises for their own development establish their own enterprise architecture of the top design, and as its core data architecture model is also reflected in different industries according to different development. This paper mainly studies the data architecture model, expounds the role of data architecture model and its relationship.
關(guān)鍵詞: 企業(yè)架構(gòu);數(shù)據(jù)架構(gòu);數(shù)據(jù)模型
Key words: enterprise architecture;data architecture;data model
中圖分類號(hào):F279.23 文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):1006-4311(2017)33-0054-03
0 引言
數(shù)據(jù)和信息是21世紀(jì)的經(jīng)濟(jì)命脈。在信息時(shí)代,數(shù)據(jù)被認(rèn)為是一項(xiàng)重要的企業(yè)資產(chǎn)。通常一個(gè)企業(yè)長(zhǎng)期以來(lái)會(huì)積累大量的需求、說(shuō)明、數(shù)據(jù)庫(kù)、數(shù)據(jù)模型、程序以及各種信息技術(shù)成品構(gòu)件,但是卻缺少一個(gè)“總體設(shè)計(jì)”。
這并不是說(shuō)哪個(gè)信息系統(tǒng)、數(shù)據(jù)庫(kù)或者數(shù)據(jù)庫(kù)管理系統(tǒng)(DataBase Management System,DBMS)是錯(cuò)誤或者被誤導(dǎo)的,只是說(shuō)當(dāng)前產(chǎn)生了大量的信息技術(shù)(Information Technology,IT)構(gòu)件,并且亟需建立一個(gè)“總體架構(gòu)”對(duì)其進(jìn)行規(guī)范、優(yōu)化甚至標(biāo)準(zhǔn)化。
隨著企業(yè)的發(fā)展或者重組,企業(yè)數(shù)據(jù)扮演著越來(lái)越重要的角色。有的企業(yè)業(yè)務(wù)范圍廣,部門多,各項(xiàng)數(shù)據(jù)種類繁多,信息來(lái)源廣泛、內(nèi)容重疊、數(shù)據(jù)分散,沒(méi)有統(tǒng)一的企業(yè)數(shù)據(jù)架構(gòu),缺乏頂層設(shè)計(jì),很難使企業(yè)的信息化建設(shè)與其發(fā)展戰(zhàn)略相一致。而且當(dāng)今信息飛速發(fā)展,數(shù)據(jù)量高速膨脹,那些舊的信息系統(tǒng)都是由不同廠商在不同時(shí)期分別開(kāi)發(fā),造成有價(jià)值的數(shù)據(jù)在舊系統(tǒng)間難以交流、共享和融合,加劇了數(shù)據(jù)的破碎性,系統(tǒng)間缺乏信息共享,業(yè)務(wù)數(shù)據(jù)獨(dú)立存在,形成“數(shù)據(jù)孤島”。
本文認(rèn)為,企業(yè)信息化想要建設(shè)的成功很大程度上依賴于系統(tǒng)模型的合理性和不同系統(tǒng)間標(biāo)準(zhǔn)的一致性,而企業(yè)級(jí)數(shù)據(jù)架構(gòu)模型是企業(yè)信息化的核心所在,建立企業(yè)級(jí)數(shù)據(jù)架構(gòu)模型,能夠定義和統(tǒng)一整個(gè)企業(yè)信息化體系的數(shù)據(jù)標(biāo)準(zhǔn),合理規(guī)劃企業(yè)信息化建設(shè)前景,管理所需資源建設(shè)。并且企業(yè)數(shù)據(jù)架構(gòu)模型也會(huì)提高信息定義的一致性,全面性,從企業(yè)全業(yè)務(wù)的角度,全面、一致的定義信息需求,指導(dǎo)所有未來(lái)系統(tǒng)開(kāi)發(fā),設(shè)計(jì)實(shí)現(xiàn)數(shù)據(jù)需求的藍(lán)圖,全面提升經(jīng)營(yíng)決策、運(yùn)營(yíng)管理、業(yè)務(wù)拓展和客戶服務(wù)等方面的支撐能力。
1 企業(yè)級(jí)數(shù)據(jù)架構(gòu)模型的定義
1.1 數(shù)據(jù)架構(gòu)模型基本定義
企業(yè)級(jí)數(shù)據(jù)架構(gòu)模型,是一種用來(lái)定義信息常規(guī)表示的方法。通過(guò)使用信息模型,我們可以使用不同的應(yīng)用程序?qū)λ芾淼臄?shù)據(jù)進(jìn)行重用,變更以及分享。企業(yè)數(shù)據(jù)架構(gòu)可以幫助企業(yè)消除信息孤島,建立一個(gè)共享、通用、一致和廣泛的企業(yè)數(shù)據(jù)基礎(chǔ)平臺(tái)。[1]
這里提的企業(yè)級(jí)數(shù)據(jù)架構(gòu)模型并不是數(shù)據(jù)倉(cāng)庫(kù)模型,而是站在整個(gè)企業(yè)業(yè)務(wù)的視角,對(duì)企業(yè)所有數(shù)據(jù)整體性描述。企業(yè)級(jí)數(shù)據(jù)架構(gòu)模型是業(yè)務(wù)人員和IT人員進(jìn)行溝通的媒介,同時(shí)也是企業(yè)內(nèi)外進(jìn)行交流的紐帶。
1.2 數(shù)據(jù)模型結(jié)構(gòu)
一個(gè)企業(yè)的數(shù)據(jù)架構(gòu)的參考模型包括:
數(shù)據(jù)元素模型;
概念數(shù)據(jù)模型;
數(shù)據(jù)庫(kù)邏輯模型;
數(shù)據(jù)庫(kù)物理模型;
連接物理數(shù)據(jù)庫(kù)和應(yīng)用信息系統(tǒng)的視圖模型。
上述五個(gè)數(shù)據(jù)結(jié)構(gòu)層次形成了一個(gè)核心,圍繞這個(gè)核心大量信息技術(shù)支撐件可以互聯(lián)、互操作,并且是非冗余的。
我們可以把全部的信息技術(shù)產(chǎn)品,包括數(shù)據(jù)結(jié)構(gòu)參考模型中的那些,統(tǒng)一都畫在一個(gè)圖里面,就會(huì)得到如圖1所示的圖。[2]
然后我們需要一個(gè)具有“元數(shù)據(jù)庫(kù)”核心的應(yīng)用信息系統(tǒng)。這種“元數(shù)據(jù)庫(kù)”是從腦力勞動(dòng)者框架的主要產(chǎn)品延伸得來(lái)的,包含了數(shù)據(jù)結(jié)構(gòu)參考模型中的核心模型。這種“元數(shù)據(jù)庫(kù)”的數(shù)據(jù)模型是高度工程化的,它真正支持相互關(guān)聯(lián)、互操作性、非冗余性。[3]
2 數(shù)據(jù)架構(gòu)參考模型
一直以來(lái)企業(yè)的數(shù)據(jù)架構(gòu)及其伴隨的數(shù)據(jù)模型都被看作是重要的資產(chǎn)。前文的圖1說(shuō)明了這種資產(chǎn)是多么重要。這種重要性不僅體現(xiàn)在數(shù)據(jù)模型組成了企業(yè)策略闡述的基礎(chǔ),而且數(shù)據(jù)模型還是所有信息技術(shù)產(chǎn)品最終的“交匯”所在。[4]endprint
數(shù)據(jù)架構(gòu)中單獨(dú)的數(shù)據(jù)模型都是相互獨(dú)立的,而且分別處理不同的數(shù)據(jù)。這些架構(gòu)促進(jìn)了模型的完整性、互操作型和非冗余性。此外,“更高級(jí)”的模型可被用作創(chuàng)建“低級(jí)”模型的模板。
一旦完成了數(shù)據(jù)架構(gòu)的參考模型,就可以作為一個(gè)框架來(lái)幫助理解組件模型的范圍和相互關(guān)系。
這樣的模型對(duì)于數(shù)據(jù)架構(gòu)模型中組件實(shí)例之間的通信很有幫助。
我們對(duì)數(shù)據(jù)的自然概念,數(shù)據(jù)庫(kù)部署和業(yè)務(wù)信息系統(tǒng)的理解都經(jīng)過(guò)了多年的發(fā)展,在此基礎(chǔ)上,可以認(rèn)為數(shù)據(jù)結(jié)構(gòu)參考模型(參見(jiàn)圖2)有6個(gè)單獨(dú)的模型組成。[5]這6個(gè)模型分別是:
數(shù)據(jù)元素模型;
概念數(shù)據(jù)模型;
邏輯數(shù)據(jù)庫(kù)模型;
物理數(shù)據(jù)庫(kù)模型;
SQL視圖模型;
XML文檔結(jié)構(gòu)模型。
3 數(shù)據(jù)架構(gòu)參考模型中各模型的作用
3.1 數(shù)據(jù)元素模型
數(shù)據(jù)元素是企業(yè)的本質(zhì),被用作概念數(shù)據(jù)模型中實(shí)體屬性的語(yǔ)義基礎(chǔ),支撐業(yè)務(wù)需要的數(shù)據(jù)庫(kù)模型中表里面的列,并在數(shù)據(jù)庫(kù)管理系統(tǒng)中實(shí)現(xiàn),相應(yīng)地被用在業(yè)務(wù)信息系統(tǒng)(視圖數(shù)據(jù)模型)中,實(shí)現(xiàn)了企業(yè)資源所需的數(shù)據(jù)庫(kù)對(duì)象,支撐了企業(yè)任務(wù)的完成。
3.2 概念數(shù)據(jù)庫(kù)模型
概念數(shù)據(jù)模型,由主題,實(shí)體,屬性和實(shí)體間的關(guān)系構(gòu)成。關(guān)系可以體現(xiàn)實(shí)體間多個(gè)主題的相互聯(lián)系。每個(gè)數(shù)據(jù)模型應(yīng)該只對(duì)應(yīng)一個(gè)概念,如人的名字或地址等。概念數(shù)據(jù)模型可在創(chuàng)建數(shù)據(jù)庫(kù)模型(邏輯數(shù)據(jù)模型或物理數(shù)據(jù)模型)時(shí)當(dāng)作模板。每一個(gè)實(shí)體屬性都應(yīng)該映射到其父數(shù)據(jù)元素。語(yǔ)義和數(shù)據(jù)使用修飾語(yǔ)可被歸屬于每個(gè)實(shí)體屬性。其中關(guān)鍵的組件是主題、實(shí)體、屬性和關(guān)系。
概念數(shù)據(jù)模型可表示為一個(gè)容器,比如學(xué)生、學(xué)校、組織、或是地址。這些容器(例如學(xué)生或?qū)W校)必需先進(jìn)行具體化描述,然后才能在一個(gè)或多個(gè)不同的數(shù)據(jù)庫(kù)表中實(shí)現(xiàn),并最終成為可被Oracle等數(shù)據(jù)庫(kù)管理系統(tǒng)操作的對(duì)象。
3.3 邏輯數(shù)據(jù)庫(kù)模型
邏輯數(shù)據(jù)模型,是獨(dú)立于數(shù)據(jù)庫(kù)管理系統(tǒng)的數(shù)據(jù)庫(kù)的數(shù)據(jù)模型。組成該模型的數(shù)據(jù)結(jié)構(gòu)組件包括:模式、表、列和表之間的關(guān)系。關(guān)系被限定于單一模式的表中。盡管每個(gè)實(shí)現(xiàn)數(shù)據(jù)庫(kù)模型可以對(duì)應(yīng)多個(gè)描述數(shù)據(jù)模型,但是每個(gè)實(shí)現(xiàn)數(shù)據(jù)庫(kù)模型應(yīng)該只對(duì)應(yīng)一個(gè)問(wèn)題。表的每一列都應(yīng)該映射到一個(gè)父屬性。語(yǔ)義和數(shù)據(jù)使用修飾語(yǔ)可被歸屬于每一列。描述數(shù)據(jù)模型和實(shí)現(xiàn)數(shù)據(jù)庫(kù)模型之間存在多對(duì)多的關(guān)系。其中關(guān)鍵的組件是模式、表、列和關(guān)系。
3.4 物理數(shù)據(jù)庫(kù)模型
作數(shù)據(jù)模型是綁定到特定數(shù)據(jù)庫(kù)管理系統(tǒng)的數(shù)據(jù)庫(kù)的數(shù)據(jù)模型。組成該模型的數(shù)據(jù)結(jié)構(gòu)組件包括:數(shù)據(jù)庫(kù)管理系統(tǒng)模式、數(shù)據(jù)庫(kù)管理系統(tǒng)表、數(shù)據(jù)庫(kù)管理系統(tǒng)列以及數(shù)據(jù)庫(kù)管理系統(tǒng)表之間的關(guān)系。數(shù)據(jù)庫(kù)管理系統(tǒng)關(guān)系被限定于單一的模式的數(shù)據(jù)庫(kù)管理系統(tǒng)表中。每個(gè)操作數(shù)據(jù)庫(kù)模型可以對(duì)應(yīng)多個(gè)實(shí)現(xiàn)數(shù)據(jù)庫(kù)模型。數(shù)據(jù)庫(kù)管理系統(tǒng)每一列都應(yīng)該映射到一個(gè)父列。實(shí)現(xiàn)數(shù)據(jù)庫(kù)模型和操作數(shù)據(jù)庫(kù)模型之間存在多對(duì)多的關(guān)系。其中關(guān)鍵組件是數(shù)據(jù)庫(kù)管理系統(tǒng)模式、數(shù)據(jù)庫(kù)管理系統(tǒng)表、數(shù)據(jù)庫(kù)管理系統(tǒng)列和數(shù)據(jù)庫(kù)管理系統(tǒng)關(guān)系。[6]
如果數(shù)據(jù)模型是依賴于一個(gè)特定數(shù)據(jù)庫(kù)管理系統(tǒng)和一個(gè)特定軟件應(yīng)用程序性能的狀態(tài),該數(shù)據(jù)模型就被稱作“物理的”,這樣的數(shù)據(jù)模型是通過(guò)視圖數(shù)據(jù)模型綁定到應(yīng)用程序業(yè)務(wù)信息系統(tǒng)的操作數(shù)據(jù)庫(kù)模型。操作數(shù)據(jù)庫(kù)模型里面數(shù)據(jù)庫(kù)管理系統(tǒng)表中的列是實(shí)現(xiàn)數(shù)據(jù)庫(kù)模型里面單一表中單一列的部署。
3.5 視圖數(shù)據(jù)模型
視圖數(shù)據(jù)模型表示的是物理數(shù)據(jù)庫(kù)模型和業(yè)務(wù)信息系統(tǒng)之間的接口。視圖和視圖的列可被定性為輸入/輸出。此外,這些視圖能以列為基礎(chǔ)相互映射,過(guò)程可以被指定來(lái)定義任意數(shù)據(jù)值轉(zhuǎn)換。
視圖數(shù)據(jù)模型是通過(guò)其定義綁定到特定數(shù)據(jù)庫(kù)管理系統(tǒng)的。視圖數(shù)據(jù)模型使應(yīng)用程序系統(tǒng)可以根據(jù)其物理數(shù)據(jù)模型來(lái)選擇、應(yīng)用或更新數(shù)據(jù)庫(kù)系統(tǒng),而不用在應(yīng)用程序系統(tǒng)中包含物理數(shù)據(jù)模型的細(xì)節(jié)信息。[7-8]
4 結(jié)論與展望
企業(yè)架構(gòu)是一種戰(zhàn)略性的信息資產(chǎn)。它描述了一個(gè)組織機(jī)構(gòu)的業(yè)務(wù)、使命、管理流程和支撐性基礎(chǔ)設(shè)施之間當(dāng)前和期望的關(guān)系。而數(shù)據(jù)架構(gòu)作為企業(yè)架構(gòu)中的核心,使業(yè)務(wù)或使命進(jìn)化到一種效率更高、更加有效、更為通用流行的狀態(tài)。同時(shí),提升了互操作性、加強(qiáng)了信息流通共享、升級(jí)改進(jìn)業(yè)務(wù)流程、促進(jìn)重大決策規(guī)劃。
許多企業(yè)系統(tǒng)有著相同的體系結(jié)構(gòu)方法,雖然在企業(yè)數(shù)據(jù)架構(gòu)的實(shí)施過(guò)程中,一個(gè)組織可以有很多不同的流派和做法進(jìn)行選擇。這說(shuō)明獨(dú)立于特定應(yīng)用領(lǐng)域的各種技術(shù)模式和設(shè)計(jì),能夠有效產(chǎn)生反應(yīng)迅速、可伸縮的、靈活的和可統(tǒng)一的企業(yè)應(yīng)用。企業(yè)的發(fā)展壯大離不開(kāi)企業(yè)數(shù)據(jù)架構(gòu),而合理數(shù)據(jù)架構(gòu)應(yīng)用或許會(huì)成為未來(lái)信息社會(huì)企業(yè)生存的關(guān)鍵所在。
參考文獻(xiàn):
[1]于海瀾.企業(yè)架構(gòu)[M].北京:東方出版社,2009.
[2]徐立波.圖書連鎖企業(yè)數(shù)據(jù)倉(cāng)庫(kù)的模型設(shè)計(jì)[J].沈陽(yáng):沈陽(yáng)工程學(xué)院學(xué)報(bào),2011,8:23-24.
[3]林成亮.供電企業(yè)數(shù)據(jù)模型的分析與設(shè)計(jì)[D].北京:華北電力大學(xué).
[4]張根寶.企業(yè)信息化[M].北京:機(jī)械工業(yè)出版社,1999.
[5]企業(yè)架構(gòu).www.wiscorp.com/sp/sp08.pdf.
[6]楊吉江,賀煒,邢春曉.構(gòu)建電子政務(wù)通用數(shù)據(jù)模型[J].電子政務(wù),2007,1.
[7]工程和管理信息系統(tǒng)規(guī)劃. www.wiscorp.com/sp/sp11.pdf.
[8]Adamson,Christopher and Michael Venerable.Data Warehouse Desgn Solutions.John Wiley&Sons,1998.ISBN 0-471-25195-X.544 pages.endprint