[摘要]通過(guò)研究數(shù)據(jù)集成技術(shù)在企業(yè)數(shù)據(jù)系統(tǒng)管理中的應(yīng)用,分析數(shù)據(jù)集成技術(shù)的好處,在應(yīng)用時(shí)的分類,以及在企業(yè)應(yīng)用中常見(jiàn)的三種架構(gòu)。
[關(guān)鍵詞]數(shù)據(jù)系統(tǒng);數(shù)據(jù)集成;集成架構(gòu)
[中圖分類號(hào)]TP311.52[文獻(xiàn)標(biāo)識(shí)碼]A
當(dāng)前許多企業(yè),因?yàn)閮?nèi)部部門缺乏溝通,或開(kāi)發(fā)時(shí)間上的差異,采用了不同的技術(shù)開(kāi)發(fā)數(shù)據(jù)信息系統(tǒng)。這些系統(tǒng)彼此獨(dú)立,數(shù)據(jù)不能交流或共享,形成一個(gè)個(gè)的“信息孤島”,大大降低了數(shù)據(jù)的應(yīng)用和企業(yè)的工作效率。
數(shù)據(jù)集成技術(shù)可以將這些相互獨(dú)立的數(shù)據(jù)系統(tǒng)中的數(shù)據(jù),通過(guò)統(tǒng)一的應(yīng)用標(biāo)準(zhǔn)和數(shù)據(jù)結(jié)構(gòu),進(jìn)行整合,從而使各個(gè)系統(tǒng)或不同的用戶可以對(duì)數(shù)據(jù)進(jìn)行有效的訪問(wèn)。
所以使用數(shù)據(jù)集成技術(shù),統(tǒng)一數(shù)據(jù)平臺(tái),與各個(gè)異構(gòu)數(shù)據(jù)庫(kù)數(shù)據(jù)進(jìn)行交互,是解決企業(yè)現(xiàn)有問(wèn)題的主要手段。
1數(shù)據(jù)集成技術(shù)的好處
1.1降低企業(yè)內(nèi)的信息系統(tǒng)存儲(chǔ)數(shù)據(jù)、維護(hù)數(shù)據(jù)的成本。
1.2提高企業(yè)用戶使用數(shù)據(jù)的效率,加快企業(yè)進(jìn)行決策和運(yùn)營(yíng)的效率。
1.3充分利用現(xiàn)有的數(shù)據(jù)系統(tǒng)進(jìn)行數(shù)據(jù)集成,降低數(shù)據(jù)整合的成本,加快數(shù)據(jù)整合的速度。
2數(shù)據(jù)集成分類
2.1基本數(shù)據(jù)集成
在對(duì)基本數(shù)據(jù)集成時(shí),數(shù)據(jù)異構(gòu)問(wèn)題是最難解決的問(wèn)題之一。如果同一個(gè)實(shí)體對(duì)象存在于多個(gè)異構(gòu)的數(shù)據(jù)源中,由于其名稱、定義或數(shù)據(jù)類型等不一致,還有對(duì)同一個(gè)對(duì)象描述的內(nèi)容不一致,甚至無(wú)法確定這些實(shí)體對(duì)象是否是同一個(gè)實(shí)體時(shí),就可以采取以下方法進(jìn)行處理:
2.1.1分離。在無(wú)法確定的情況下,對(duì)每次遇到的實(shí)體對(duì)象都分配一個(gè)唯一標(biāo)識(shí)符。
2.1.2合并。分辨出哪些實(shí)體對(duì)象實(shí)際上是同一實(shí)體對(duì)象,然后將這些實(shí)體對(duì)象進(jìn)行合并。如果一個(gè)目標(biāo)數(shù)據(jù)對(duì)應(yīng)多個(gè)數(shù)據(jù)源,則還要指定發(fā)生沖突時(shí),哪個(gè)數(shù)據(jù)源占據(jù)主導(dǎo)地位。
如果出現(xiàn)數(shù)據(jù)丟失,則需要產(chǎn)生一個(gè)接近實(shí)際數(shù)據(jù)的估算值來(lái)代替丟失的數(shù)據(jù)。
2.2多級(jí)視圖集成
在進(jìn)行數(shù)據(jù)集成時(shí),還需要集成各個(gè)數(shù)據(jù)源之間的關(guān)系,這就要使用多級(jí)視圖來(lái)進(jìn)行。基本的數(shù)據(jù)存在于單個(gè)的數(shù)據(jù)源中,是數(shù)據(jù)的來(lái)源根本;中間視圖則是符合公共模型格式的數(shù)據(jù)視圖;綜合視圖是對(duì)中間視圖數(shù)據(jù)的進(jìn)一步整理和導(dǎo)出。
2.3模式集成
在異構(gòu)數(shù)據(jù)源中存在多個(gè)數(shù)據(jù)庫(kù)系統(tǒng)時(shí),就需要進(jìn)行模式集成。模式集成可以將異構(gòu)數(shù)據(jù)源中不同的模式集成為一個(gè)統(tǒng)一的模式。
2.4數(shù)據(jù)粒度的集成
數(shù)據(jù)粒度指的是在數(shù)據(jù)庫(kù)設(shè)計(jì)過(guò)程中,數(shù)據(jù)保存的綜合程度或細(xì)化程度。數(shù)據(jù)保存的精度越低,數(shù)據(jù)綜合程度就越高,粒度就越大。反之,數(shù)據(jù)保存的精度越高,數(shù)據(jù)細(xì)化程度就越高,粒度就越小。
3數(shù)據(jù)集成架構(gòu)
3.1單系統(tǒng)數(shù)據(jù)集成架構(gòu)
這種數(shù)據(jù)集成架構(gòu)是目前國(guó)內(nèi)常見(jiàn)的架構(gòu)設(shè)計(jì),十分符合數(shù)據(jù)量較小的小型企業(yè)或?qū)?shù)據(jù)使用權(quán)限不敏感的部門進(jìn)行數(shù)據(jù)集成。它主要是通過(guò)集成企業(yè)所有的位于基層的詳細(xì)數(shù)據(jù),并轉(zhuǎn)換成統(tǒng)一的數(shù)據(jù)標(biāo)準(zhǔn),來(lái)進(jìn)行設(shè)計(jì)。
單系統(tǒng)數(shù)據(jù)集成架構(gòu)采用星型存儲(chǔ)結(jié)構(gòu),將多個(gè)數(shù)據(jù)源中的數(shù)據(jù)通過(guò)數(shù)據(jù)集成平臺(tái),遷移到專業(yè)數(shù)據(jù)庫(kù)或數(shù)據(jù)倉(cāng)庫(kù)中。其轉(zhuǎn)換條件十分復(fù)雜,需要處理和加載的數(shù)據(jù)量也十分巨大,達(dá)到TB級(jí),但是數(shù)據(jù)加載的過(guò)程簡(jiǎn)單清晰。
3.2企業(yè)統(tǒng)一數(shù)據(jù)集成架構(gòu)
單系統(tǒng)數(shù)據(jù)集成架構(gòu)雖然設(shè)計(jì)簡(jiǎn)單,但是編碼復(fù)雜,需要處理和加載的數(shù)據(jù)量巨大,而且需要將企業(yè)各個(gè)部門業(yè)務(wù)系統(tǒng)中的數(shù)據(jù)都進(jìn)行加載。這對(duì)于一些結(jié)構(gòu)復(fù)雜的大型企業(yè),或者數(shù)據(jù)使用權(quán)限比較敏感的政府部門就不適用。
企業(yè)統(tǒng)一數(shù)據(jù)集成架構(gòu)屬于多對(duì)多的架構(gòu),主要通過(guò)企業(yè)或機(jī)構(gòu)內(nèi)部各個(gè)部門一同進(jìn)行協(xié)商,然后建立一個(gè)統(tǒng)一的數(shù)據(jù)集成平臺(tái)。該平臺(tái)對(duì)應(yīng)各個(gè)部門的數(shù)據(jù)接口都是獨(dú)立的,每個(gè)數(shù)據(jù)接口都可以進(jìn)行獨(dú)立的數(shù)據(jù)交換,以滿足這些部門不同的數(shù)據(jù)使用權(quán)限。而且數(shù)據(jù)集成平臺(tái)僅負(fù)責(zé)數(shù)據(jù)交互,不進(jìn)行數(shù)據(jù)加載,這樣對(duì)于數(shù)據(jù)吞吐量較大、數(shù)據(jù)交換較為頻繁的部門來(lái)說(shuō),可以大大提高業(yè)務(wù)效率。
3.3企業(yè)之間數(shù)據(jù)集成架構(gòu)
現(xiàn)代企業(yè)越來(lái)越注重與其他企業(yè)或機(jī)構(gòu)進(jìn)行數(shù)據(jù)交流或共享,以更好地進(jìn)行企業(yè)間的合作及業(yè)務(wù)開(kāi)發(fā)。這樣就需要在企業(yè)之間開(kāi)發(fā)一個(gè)數(shù)據(jù)集成平臺(tái),以滿足企業(yè)間的數(shù)據(jù)需求。這種跨越多個(gè)企業(yè)或機(jī)構(gòu)的多對(duì)多數(shù)據(jù)集成架構(gòu),其需要連接的網(wǎng)絡(luò)更加復(fù)雜,數(shù)據(jù)交換業(yè)務(wù)更加頻繁,數(shù)據(jù)安全性的設(shè)置更高,系統(tǒng)響應(yīng)的實(shí)時(shí)性要求也更強(qiáng)。
為了保障以上業(yè)務(wù)要求,一般會(huì)在各個(gè)企業(yè)與數(shù)據(jù)集成平臺(tái)之間添加前置機(jī)。前置機(jī)主要負(fù)責(zé)保護(hù)企業(yè)自身數(shù)據(jù)的安全性和獨(dú)立性,同時(shí)也分擔(dān)了一部分?jǐn)?shù)據(jù)集成平臺(tái)獲取和交換數(shù)據(jù)的操作,以加快數(shù)據(jù)傳輸速度。
此外,企業(yè)之間數(shù)據(jù)集成架構(gòu)還要滿足不同企業(yè)的各種數(shù)據(jù)接口、各種數(shù)據(jù)類型、各種數(shù)據(jù)標(biāo)準(zhǔn),以及數(shù)據(jù)交換的實(shí)時(shí)性、數(shù)據(jù)抽取和傳輸?shù)乃俣?、?shù)據(jù)質(zhì)量等要求。這需要對(duì)該架構(gòu)進(jìn)行進(jìn)一步的研究和剖析。
以上這三種數(shù)據(jù)集成架構(gòu),基本包含了企業(yè)對(duì)數(shù)據(jù)集成技術(shù)應(yīng)用的各種情況。這三種架構(gòu)是目前國(guó)內(nèi)最常用的數(shù)據(jù)集成架構(gòu),除此之外,數(shù)據(jù)集成技術(shù)也逐步走向成熟,數(shù)據(jù)集成的應(yīng)用也會(huì)更加的種類繁多。
4結(jié)束語(yǔ)
數(shù)據(jù)集成技術(shù)是為解決當(dāng)前企業(yè)中數(shù)據(jù)源彼此孤立,數(shù)據(jù)利用率低下,數(shù)據(jù)混亂,資源極度浪費(fèi)等問(wèn)題的一種有效技術(shù),本文探討了數(shù)據(jù)集成技術(shù)在企業(yè)數(shù)據(jù)系統(tǒng)管理中的應(yīng)用的好處、分類和常用架構(gòu)。今后,還需進(jìn)一步討論數(shù)據(jù)集成技術(shù)的不足之處,以進(jìn)行修正。