摘要:利用數(shù)據(jù)倉(cāng)庫(kù)技術(shù)可以對(duì)分布在企業(yè)各部門之間的業(yè)務(wù)數(shù)據(jù)進(jìn)行采集、加工、整合,根據(jù)不同的業(yè)務(wù)主題建立不同的數(shù)據(jù)倉(cāng)庫(kù),為企業(yè)管理及決策提供分析信息和決策依據(jù)。本文介紹了數(shù)據(jù)倉(cāng)庫(kù)及相關(guān)技術(shù)、企業(yè)數(shù)據(jù)倉(cāng)庫(kù)的設(shè)計(jì)與實(shí)現(xiàn)。
關(guān)鍵詞:數(shù)據(jù)倉(cāng)庫(kù);OLAP;DTS
中國(guó)分類號(hào):G64文獻(xiàn)標(biāo)識(shí)碼:B
文章編號(hào):1672-5913 (2007) 23-0062-04
1引言
1.1國(guó)內(nèi)外數(shù)據(jù)倉(cāng)庫(kù)的發(fā)展?fàn)顩r
隨著企業(yè)信息系統(tǒng)的日趨完善和數(shù)據(jù)交換及處理中心的建立,如何滿足企業(yè)日益增長(zhǎng)的各種查詢、統(tǒng)計(jì)、報(bào)表以及分析的需求,如何有效利用這些數(shù)據(jù)來實(shí)現(xiàn)經(jīng)營(yíng)目標(biāo),預(yù)測(cè)企業(yè)的發(fā)展趨勢(shì),如何利用這些數(shù)據(jù)來設(shè)計(jì)企業(yè)的發(fā)展宏圖,在激烈的競(jìng)爭(zhēng)中贏得先機(jī)是企業(yè)決策支持系統(tǒng)需要解決的問題,也是目前企業(yè)在信息技術(shù)應(yīng)用上的難題。
隨著數(shù)據(jù)倉(cāng)庫(kù)技術(shù)的發(fā)展和應(yīng)用,國(guó)內(nèi)外越來越多的企業(yè)都采用了數(shù)據(jù)倉(cāng)庫(kù)解決方案充當(dāng)企業(yè)決策機(jī)構(gòu)的智囊和參謀。諸如:美國(guó)沃爾瑪連鎖店(世界最大的零售公司)、哈里斯公司(半導(dǎo)體公司的集成電路產(chǎn)品公司)發(fā)達(dá)國(guó)家的大型商業(yè)銀行、國(guó)內(nèi)的電信、銀行、保險(xiǎn)、零售、航空、鐵路運(yùn)輸、郵政等傳統(tǒng)數(shù)據(jù)密集型行業(yè)的全球性大企業(yè)都己采用數(shù)據(jù)倉(cāng)庫(kù)作為決策支持。據(jù)調(diào)查,財(cái)富500強(qiáng)企業(yè)中已有 85%的企業(yè)建成或正在建立數(shù)據(jù)倉(cāng)庫(kù)。
1.2企業(yè)建立數(shù)據(jù)倉(cāng)庫(kù)的必要性:
(1) 從總體上管理客戶與企業(yè)之間的關(guān)系
(2) 讓客戶獲得更多的益處
(3) 建立企業(yè)內(nèi)部的合作關(guān)系
(4) 實(shí)現(xiàn)宏觀數(shù)據(jù)及微觀數(shù)據(jù)的管理
(5) 對(duì)轉(zhuǎn)瞬即逝的機(jī)會(huì)及時(shí)作出反應(yīng)
(6) 改善管理能力
2數(shù)據(jù)倉(cāng)庫(kù)的體系結(jié)構(gòu)
“數(shù)據(jù)倉(cāng)庫(kù)是面向主題的、集成的、隨時(shí)間變化的、非易失的數(shù)據(jù)集合,用于支持管理層的決策過程”。在本定義中,Inmon明確給出了數(shù)據(jù)倉(cāng)庫(kù)的四個(gè)重要特點(diǎn),即“面向主題”、“集成”、“隨時(shí)間變化”和“非易失”。
從數(shù)據(jù)倉(cāng)庫(kù)體系各部件的功能來分析,數(shù)據(jù)倉(cāng)庫(kù)在邏輯上可分為以下三個(gè)層次(數(shù)據(jù)倉(cāng)庫(kù)體系結(jié)構(gòu)如圖2-1所示):
●數(shù)據(jù)獲取/管理層
●數(shù)據(jù)存儲(chǔ)層
●數(shù)據(jù)分析/應(yīng)用層
圖2.1 數(shù)據(jù)倉(cāng)庫(kù)體系結(jié)構(gòu)圖
2.1外部數(shù)據(jù)源
構(gòu)建一個(gè)數(shù)據(jù)倉(cāng)庫(kù),必然要有充足的數(shù)據(jù)源,從外部為數(shù)據(jù)倉(cāng)庫(kù)系統(tǒng)提供進(jìn)行分析的“原材料”-數(shù)據(jù),這些數(shù)據(jù)來源稱為數(shù)據(jù)倉(cāng)庫(kù)的外部數(shù)據(jù)源(Data Resource),外部數(shù)據(jù)源并不局限于傳統(tǒng)數(shù)據(jù)庫(kù),可以是非結(jié)構(gòu)化的信息,如文本文件、網(wǎng)絡(luò)資源,等。
2.2數(shù)據(jù)獲取/管理層
數(shù)據(jù)倉(cāng)庫(kù)中保存的業(yè)務(wù)數(shù)據(jù)來自于多個(gè)數(shù)據(jù)源,這些數(shù)據(jù)源提供的數(shù)據(jù)并非都是理想狀態(tài)的,存在各種缺陷,必須經(jīng)過適當(dāng)?shù)奶幚聿拍軐?dǎo)入數(shù)據(jù)倉(cāng)庫(kù)中存儲(chǔ)的內(nèi)容也必須進(jìn)行維護(hù),以確保系統(tǒng)的正常運(yùn)行。數(shù)據(jù)獲取/管理層主要負(fù)責(zé)數(shù)據(jù)倉(cāng)庫(kù)的定義與修改、數(shù)據(jù)的獲取、數(shù)據(jù)倉(cāng)庫(kù)的管理等工作,保證數(shù)據(jù)倉(cāng)庫(kù)的安全性、穩(wěn)定性和有效性,主要面向數(shù)據(jù)倉(cāng)庫(kù)的設(shè)計(jì)者和維護(hù)者。
2.3數(shù)據(jù)存儲(chǔ)層
數(shù)據(jù)存儲(chǔ)層是數(shù)據(jù)倉(cāng)庫(kù)的主體,所存儲(chǔ)的數(shù)據(jù)包括三部分,其一是從外部數(shù)據(jù)源抽取,經(jīng)清洗、轉(zhuǎn)換處理,并按照組織存放的業(yè)務(wù)數(shù)據(jù),其二是數(shù)據(jù)倉(cāng)庫(kù)的原數(shù)據(jù),其三是針對(duì)不同的數(shù)據(jù)挖掘和分析主題而生成的數(shù)據(jù)集市。
數(shù)據(jù)的存儲(chǔ)與管理是整個(gè)數(shù)據(jù)倉(cāng)庫(kù)系統(tǒng)的核心。在現(xiàn)有各業(yè)務(wù)系統(tǒng)的基礎(chǔ)上,對(duì)數(shù)據(jù)進(jìn)行抽取、清理,并有效集成,按照主題進(jìn)行重新組織,最終確定數(shù)據(jù)倉(cāng)庫(kù)的物理存儲(chǔ)結(jié)構(gòu),同時(shí)組織存儲(chǔ)數(shù)據(jù)倉(cāng)庫(kù)元數(shù)據(jù)(具體包括數(shù)據(jù)倉(cāng)庫(kù)的數(shù)據(jù)字典、記錄系統(tǒng)定義、數(shù)據(jù)轉(zhuǎn)換規(guī)則、數(shù)據(jù)加載頻率以及業(yè)務(wù)規(guī)則等信息)。按照數(shù)據(jù)的覆蓋范圍,數(shù)據(jù)倉(cāng)庫(kù)存儲(chǔ)可以分為企業(yè)級(jí)數(shù)據(jù)倉(cāng)庫(kù)和部門級(jí)數(shù)據(jù)倉(cāng)庫(kù)(通常稱為“數(shù)據(jù)集市”,Data Mart)。數(shù)據(jù)倉(cāng)庫(kù)的管理包括數(shù)據(jù)的安全、歸檔、備份、維護(hù)、恢復(fù)等工作。這些功能與目前的DBMS基本一致。
2.4數(shù)據(jù)分析/應(yīng)用層
數(shù)據(jù)倉(cāng)庫(kù)系統(tǒng)的數(shù)據(jù)分析/應(yīng)用層,面向系統(tǒng)的一般用戶,滿足用戶查詢需要,并以適當(dāng)?shù)姆绞较蛴脩粽故静樵?、分析的結(jié)果。數(shù)據(jù)分析/應(yīng)用層主要包括以下功能。
(1) 查詢/統(tǒng)計(jì)服務(wù)。為用戶提供常規(guī)的查詢檢索、簡(jiǎn)單統(tǒng)計(jì)和報(bào)表等服務(wù),這是數(shù)據(jù)倉(cāng)庫(kù)最基本的功能。
(2) OLAP服務(wù)。對(duì)于以多維數(shù)據(jù)倉(cāng)庫(kù)方式進(jìn)行數(shù)據(jù)組織的數(shù)據(jù)倉(cāng)庫(kù),OLAP是一種極為有效的分析方法,它通過上卷、下鉆、切片、切塊和旋轉(zhuǎn)等操作,對(duì)多維數(shù)據(jù)倉(cāng)庫(kù)進(jìn)行深入的分析。
(3) 數(shù)據(jù)挖掘服務(wù)。數(shù)據(jù)挖掘服務(wù)是數(shù)據(jù)倉(cāng)庫(kù)系統(tǒng)的一種深層次應(yīng)用,它是從大量的、不完全的、有噪聲的、模糊的、隨機(jī)的數(shù)據(jù)中,提取出隱含在其中、不為人們所知的、但又是十分有用的信息和知識(shí)的過程,即從大量數(shù)據(jù)中“挖掘”出知識(shí)的過程。
3 企業(yè)數(shù)據(jù)倉(cāng)庫(kù)的設(shè)計(jì)
3.1需求分析
需求分析是數(shù)據(jù)倉(cāng)庫(kù)設(shè)計(jì)的重要環(huán)節(jié)。如何解決企業(yè)各部門之間的多數(shù)據(jù)源、數(shù)據(jù)不一致、歷史數(shù)據(jù)無(wú)法充分利用及分析的效率等問題?如何滿足企業(yè)日益增長(zhǎng)的各種查詢、統(tǒng)計(jì)、報(bào)表以及分析的需求?如何有效利用現(xiàn)有數(shù)據(jù)實(shí)現(xiàn)經(jīng)營(yíng)目標(biāo),預(yù)測(cè)企業(yè)的發(fā)展趨勢(shì),為企業(yè)的決策提供支持,使企業(yè)在激烈的競(jìng)爭(zhēng)中贏得先機(jī)等都是目前企業(yè)急待解決的問題,這些問題正是目前企業(yè)在信息技術(shù)應(yīng)用上的首要難題。
3.2分析主題的確定
主題是一個(gè)在較高層次上將數(shù)據(jù)歸類的標(biāo)準(zhǔn),每一個(gè)主題基本對(duì)應(yīng)一個(gè)宏觀的分析領(lǐng)域。與傳統(tǒng)數(shù)據(jù)庫(kù)面向應(yīng)用進(jìn)行數(shù)據(jù)組織的特點(diǎn)相對(duì)應(yīng),數(shù)據(jù)倉(cāng)庫(kù)中的數(shù)據(jù)是面向主題進(jìn)行組織的。企業(yè)活動(dòng)中有“產(chǎn)品”、“客戶關(guān)系”、“財(cái)務(wù)”等相關(guān)主題。
3.3數(shù)據(jù)源的確定
數(shù)據(jù)源是企業(yè)多年來積累的事務(wù)數(shù)據(jù),數(shù)據(jù)大多基于關(guān)系數(shù)據(jù)庫(kù)。由于多年的數(shù)據(jù)積累,數(shù)據(jù)源中存在有臟數(shù)據(jù),比如多數(shù)據(jù)源、數(shù)據(jù)不完整(有些感興趣的屬性缺少屬性值,或僅包含聚集數(shù)據(jù)),含噪聲的(包含錯(cuò)誤或存在偏離期望的孤立點(diǎn)值),不一致的(例如,同一字段的表達(dá)方式不同)等。這些數(shù)據(jù)同數(shù)據(jù)倉(cāng)庫(kù)有著不同的數(shù)據(jù)質(zhì)量要求,不能夠達(dá)到數(shù)據(jù)倉(cāng)庫(kù)的數(shù)據(jù)質(zhì)量標(biāo)準(zhǔn)。另外,這些數(shù)據(jù)源是異構(gòu)的,即使是正確的數(shù)據(jù),也可能存在著不一致性,甚至存在著沖突。因此需要對(duì)數(shù)據(jù)進(jìn)行凈化后再為數(shù)據(jù)倉(cāng)庫(kù)所用。
3.4數(shù)據(jù)倉(cāng)庫(kù)層的設(shè)計(jì)及OLAP服務(wù)器層的設(shè)計(jì)
使用SQL Server 2000作為數(shù)據(jù)倉(cāng)庫(kù)服務(wù)器,在SQL Server 2000的“企業(yè)管理器”中新建一個(gè)關(guān)系數(shù)據(jù)庫(kù),在該數(shù)據(jù)庫(kù)中建立表和關(guān)系圖,表的建立依據(jù)物理模型設(shè)計(jì),關(guān)系圖的建立依據(jù)邏輯模型設(shè)計(jì)。此關(guān)系數(shù)據(jù)庫(kù)中的數(shù)據(jù)是使用SQL語(yǔ)句和DTS工具對(duì)源數(shù)據(jù)進(jìn)行合并、清理、轉(zhuǎn)換和加載后得到的,新建的關(guān)系數(shù)據(jù)庫(kù)就是數(shù)據(jù)倉(cāng)庫(kù),即數(shù)據(jù)存儲(chǔ)中心,它將是OLAP服務(wù)器的數(shù)據(jù)來源。
使用SQL Server 2000的Analysis Services作為OLAP服務(wù)器,在Analysis Manager中建立分析數(shù)據(jù)庫(kù),在分析數(shù)據(jù)庫(kù)下設(shè)定數(shù)據(jù)源,并按照星型模型建立多維數(shù)據(jù)集,為下一步進(jìn)行多維分析奠定基礎(chǔ)。中小企業(yè)數(shù)據(jù)倉(cāng)庫(kù)中的多維數(shù)據(jù)可以用ROLAP關(guān)系型結(jié)構(gòu)進(jìn)行表示和存儲(chǔ)的。
3.5數(shù)據(jù)分析/應(yīng)用層的選擇
在數(shù)據(jù)透視表服務(wù)組件的支持下,應(yīng)用Excel前端工具對(duì)數(shù)據(jù)倉(cāng)庫(kù)進(jìn)行多維分析和查詢。這種操作不需要學(xué)習(xí)其他語(yǔ)言來編寫客戶端應(yīng)用程序,使用所附帶的連接數(shù)據(jù)庫(kù)的功能操作即可。而且,它可以連接到分析服務(wù)器,將服務(wù)器端的多維數(shù)據(jù)集放到客戶端成為一個(gè)本地文件,以后在無(wú)網(wǎng)絡(luò)連接的情況下可以用來分析。使用Microsoft Visual Basic 開發(fā)客戶端人機(jī)交互界面,其中用ADO MD和DSO對(duì)象實(shí)現(xiàn)對(duì)多維數(shù)據(jù)集的訪問,從而實(shí)現(xiàn)多維數(shù)據(jù)集瀏覽工具的開發(fā)。
3.6OLAP系統(tǒng)數(shù)據(jù)立方體及系統(tǒng)維的設(shè)計(jì)
數(shù)據(jù)倉(cāng)庫(kù)中維的概念類似于關(guān)系表的屬性。數(shù)據(jù)立方體是指由兩個(gè)或更多個(gè)屬性即兩個(gè)或多個(gè)維來描述或分類的數(shù)據(jù)。在三維的情況下以圖形來表示,該類數(shù)據(jù)具有立方體結(jié)構(gòu),一般稱為數(shù)據(jù)立方體。雖然通常從幾何意義的角度將立方體理解為三維的,但在數(shù)據(jù)倉(cāng)庫(kù)中數(shù)據(jù)立方體是一個(gè)n維的概念。在確定分析主題的基礎(chǔ)上設(shè)計(jì)OLAP數(shù)據(jù)立方體。
維是決策分析者分析數(shù)據(jù)的角度,也是數(shù)據(jù)立方中重要的組件。維是有組織的“類別”層次結(jié)構(gòu),此類別成員結(jié)構(gòu)就是“層次”,主要用來說明“事實(shí)數(shù)據(jù)表”中的數(shù)據(jù)(也就是“度量值”)。有關(guān)維的層次信息需要存放在元數(shù)據(jù)中,系統(tǒng)在進(jìn)行各種綜合查詢時(shí),通過元數(shù)據(jù)的信息區(qū)分不同的維層次,從而正確地完成相應(yīng)的分析功能。在設(shè)計(jì)中,要正確確定維的層次級(jí)別。例如在時(shí)間維上,從上到下有年、季、月、日四個(gè)層次,其級(jí)別關(guān)系是年包括季、季包括月、月包括日。在數(shù)據(jù)綜合過程中,要在同一維層次上進(jìn)行求和操作。如果系統(tǒng)不能區(qū)分維層次而跨越不同的維層次求和,就會(huì)產(chǎn)生錯(cuò)誤的結(jié)果,出現(xiàn)重復(fù)計(jì)算或缺項(xiàng)計(jì)算。維包括共享維和私有維,共享維是指在同一個(gè)分析數(shù)據(jù)庫(kù)中可以共享的維度,也就是說,該維度可以同時(shí)用在同一分析數(shù)據(jù)庫(kù)中的不同數(shù)據(jù)立方上。私有維是指隸屬于某一特定的數(shù)據(jù)立方。
根據(jù)設(shè)計(jì)好的主題,了解企業(yè)需要從哪些角度對(duì)主題進(jìn)行分析,從而確定相關(guān)的維,以及適當(dāng)?shù)膶哟魏土6取?/p>
3.7數(shù)據(jù)倉(cāng)庫(kù)數(shù)據(jù)模型設(shè)計(jì)
由于數(shù)據(jù)倉(cāng)庫(kù)的主要操作對(duì)象是多維數(shù)據(jù),因此,在數(shù)據(jù)倉(cāng)庫(kù)設(shè)計(jì)中,應(yīng)采用多維數(shù)據(jù)建模技術(shù),以使用戶更好地理解企業(yè)的數(shù)據(jù)信息。多維數(shù)據(jù)建模符合人們的思維方式,易于用戶的理解和使用,能支持用戶從多個(gè)角度對(duì)數(shù)據(jù)進(jìn)行分析。現(xiàn)在大部分企業(yè)使用的是關(guān)系數(shù)據(jù)庫(kù),在建設(shè)企業(yè)的數(shù)據(jù)倉(cāng)庫(kù)時(shí),一般采用基于關(guān)系數(shù)據(jù)庫(kù)的建模方法。在基于關(guān)系數(shù)據(jù)庫(kù)的多維數(shù)據(jù)建模中最常見的是星形模型。
數(shù)據(jù)倉(cāng)庫(kù)是數(shù)據(jù)庫(kù)技術(shù)一種新的應(yīng)用。至今,數(shù)據(jù)倉(cāng)庫(kù)一般仍是應(yīng)用數(shù)據(jù)庫(kù)管理系統(tǒng)來管理其中的數(shù)據(jù)。數(shù)據(jù)倉(cāng)庫(kù)的邏輯數(shù)據(jù)模型最終將轉(zhuǎn)為數(shù)據(jù)庫(kù)的物理模型。
建立數(shù)據(jù)倉(cāng)庫(kù)物理模型所依據(jù)的邏輯模型是多維數(shù)據(jù)模型,而不是實(shí)體-關(guān)系模型,并且要盡可能地與多維數(shù)據(jù)模型保持一致。由于實(shí)際應(yīng)用環(huán)境的限制,數(shù)據(jù)倉(cāng)庫(kù)的物理模型同邏輯模型存在差異是不可避免的。
根據(jù)以上設(shè)計(jì)的星形模型圖,將星型圖中的各個(gè)邏輯實(shí)體分別轉(zhuǎn)換為相應(yīng)的表。
4企業(yè)數(shù)據(jù)倉(cāng)庫(kù)的實(shí)現(xiàn)
4.1技術(shù)環(huán)境和實(shí)現(xiàn)工具的選擇
目前,Oracle、SQL Server、Informix、Sybase等主要的RDBMS產(chǎn)品,均可以為用戶提供數(shù)據(jù)倉(cāng)庫(kù)項(xiàng)目的開發(fā)工具;Delphi等通用的應(yīng)用程序開發(fā)平臺(tái),也能對(duì)數(shù)據(jù)倉(cāng)庫(kù)項(xiàng)目的開發(fā)提供有效的支持。
SQL Server 2000能提供超大型系統(tǒng)所需的數(shù)據(jù)庫(kù)服務(wù),尤其是微軟在SQL Server中推出了DTS(Data Transformation Service,數(shù)據(jù)轉(zhuǎn)換服務(wù)),結(jié)合SQL Server 2000提供的Analysis Services和數(shù)據(jù)倉(cāng)庫(kù)技術(shù)為企業(yè)建立數(shù)據(jù)倉(cāng)庫(kù)系統(tǒng)提供了一個(gè)完備的解決方案。
基于上述原因,本文使用Microsoft SQL Server2000作為數(shù)據(jù)倉(cāng)庫(kù)服務(wù)器開發(fā)平臺(tái),使用Analysis Services作為OLAP服務(wù)器開發(fā)平臺(tái),使用DTS作為數(shù)據(jù)轉(zhuǎn)換工具。
4.2數(shù)據(jù)倉(cāng)庫(kù)的建立
將數(shù)據(jù)源中數(shù)據(jù)按設(shè)計(jì)模型進(jìn)行抽取、轉(zhuǎn)換、加載等操作,最終將數(shù)據(jù)存儲(chǔ)在數(shù)據(jù)庫(kù)中以備OLAP分析使用。
(1) 建立數(shù)據(jù)庫(kù)
打開Microsoft SQL Server的企業(yè)管理器, 在“數(shù)據(jù)庫(kù)”快捷菜單中選擇【新建數(shù)據(jù)庫(kù)】,出現(xiàn)“數(shù)據(jù)庫(kù)屬性”對(duì)話框,在“名稱”文本框中輸入數(shù)據(jù)庫(kù)名即可建立數(shù)據(jù)庫(kù)。
(2) 創(chuàng)建事實(shí)表與維表
在已建立的數(shù)據(jù)庫(kù)中創(chuàng)建事實(shí)表與維表,并建立數(shù)據(jù)庫(kù)關(guān)系圖。這樣便按照設(shè)定的邏輯模型和物理模型建立起一個(gè)新的數(shù)據(jù)倉(cāng)庫(kù)-企業(yè)決策(這只是一個(gè)空的數(shù)據(jù)倉(cāng)庫(kù)結(jié)構(gòu),還需繼續(xù)加載數(shù)據(jù))。
4.3DTS任務(wù)包的設(shè)置
通常,數(shù)據(jù)倉(cāng)庫(kù)具有多個(gè)數(shù)據(jù)源,為了有效地從各數(shù)據(jù)源獲取所需數(shù)據(jù),并將其導(dǎo)入數(shù)據(jù)倉(cāng)庫(kù)。DTS技術(shù)可以將取自完全不同源的數(shù)據(jù)進(jìn)行抽取、轉(zhuǎn)換、合并至單個(gè)或多個(gè)目的數(shù)據(jù)庫(kù)。
由于來自企業(yè)內(nèi)部的源數(shù)據(jù)中有數(shù)據(jù)的重復(fù)、丟失、改變等臟數(shù)據(jù)??梢韵仁褂肧QL語(yǔ)句將多個(gè)表的數(shù)據(jù)組合在一起,并進(jìn)行字段的刪除、屬性修改等操作,最后通過DTS傳輸至企業(yè)數(shù)據(jù)庫(kù)相應(yīng)的表中。數(shù)據(jù)導(dǎo)入時(shí)應(yīng)先導(dǎo)入維表,再導(dǎo)入事實(shí)表;數(shù)據(jù)刪除先刪除事實(shí)表,再刪除維表。
完成數(shù)據(jù)庫(kù)的DTS包設(shè)置后,通過執(zhí)行包將源數(shù)據(jù)庫(kù)中的數(shù)據(jù)加入到數(shù)據(jù)倉(cāng)庫(kù)中,并將數(shù)據(jù)倉(cāng)庫(kù)作為分析服務(wù)器的數(shù)據(jù)源,在分析服務(wù)器下建立多維數(shù)據(jù)集,并保存DTS包。
4.4企業(yè)數(shù)據(jù)倉(cāng)庫(kù)中數(shù)據(jù)分析的實(shí)現(xiàn)
●分析數(shù)據(jù)庫(kù)的建立
在SQL SERVER 2000的Analysis Manager中新建一個(gè)OLAP分析數(shù)據(jù)庫(kù)
●數(shù)據(jù)源的設(shè)置
將新建立的SQL數(shù)據(jù)庫(kù)文件設(shè)定為數(shù)據(jù)源
●多維數(shù)據(jù)集的建立
●多維數(shù)據(jù)集的處理
使用存儲(chǔ)設(shè)計(jì)向?qū)幚矶嗑S數(shù)據(jù)集,在存儲(chǔ)設(shè)計(jì)向?qū)е羞x擇ROLAP關(guān)系數(shù)據(jù)存儲(chǔ)類型(三種存儲(chǔ)模式可供選擇:MOLAP、ROLAP及HOLAP)。
●多維數(shù)據(jù)集的分析
使用Analysis Manager對(duì)“企業(yè)決策”數(shù)據(jù)倉(cāng)庫(kù)中多維數(shù)據(jù)集進(jìn)行分析;通過選擇不同維實(shí)現(xiàn)切片、切塊等操作;通過拖動(dòng)鼠標(biāo)到不同的位置實(shí)現(xiàn)旋轉(zhuǎn)操作;通過雙擊屬性前 “+”或“-”來完成下鉆或上卷的操作。
5結(jié)束語(yǔ)
本文在研究數(shù)據(jù)倉(cāng)庫(kù)技術(shù)的理論基礎(chǔ)上,提出了基于企業(yè)數(shù)據(jù)倉(cāng)庫(kù)的設(shè)計(jì)與實(shí)現(xiàn)架構(gòu)。在整個(gè)研究過程中,本人通過與企業(yè)有關(guān)領(lǐng)導(dǎo)及管理人員多次溝通,進(jìn)行需求分析,根據(jù)企業(yè)的需求狀況,設(shè)計(jì)并實(shí)現(xiàn)了某企業(yè)的數(shù)據(jù)倉(cāng)庫(kù)系統(tǒng)。
近年來,隨著因特網(wǎng)和電子商務(wù)的發(fā)展,各大數(shù)據(jù)倉(cāng)庫(kù)產(chǎn)品供應(yīng)商紛紛把注意力投向電子商務(wù)領(lǐng)域,并且通過數(shù)據(jù)倉(cāng)庫(kù)技術(shù)來構(gòu)造商業(yè)智能(BI)平臺(tái)。
實(shí)踐證明:數(shù)據(jù)倉(cāng)庫(kù)的建立,可以使企業(yè)更好地了解自己的運(yùn)營(yíng)狀況,更全面、深入地分析業(yè)務(wù)數(shù)據(jù),從而為業(yè)務(wù)的發(fā)展提供良好的決策基礎(chǔ)。使用數(shù)據(jù)倉(cāng)庫(kù)系統(tǒng)會(huì)給我們的企業(yè)、生產(chǎn)部門、銷售等領(lǐng)域提供再造信息、再造知識(shí)、再造利潤(rùn)的機(jī)遇。
參考文獻(xiàn)
[1] 曲江.數(shù)據(jù)倉(cāng)庫(kù):支持企業(yè)管理決策的核心[J].信息與電腦,2006,(9):31.
[2] 蘇新寧,楊建林,江念南,栗湘.數(shù)據(jù)倉(cāng)庫(kù)和數(shù)據(jù)挖掘[M].清華大學(xué)出版社,2006,56~63.
[3] 曹曉靜.決策支持系統(tǒng)的發(fā)展及其關(guān)鍵技術(shù)分析[J].計(jì)算機(jī)技術(shù)與發(fā)展,2006,(11):94.
收稿日期:2007-09-24
作者簡(jiǎn)介
柴巧葉(1964-),女,山西萬(wàn)榮縣人,工學(xué)碩士,副教授,網(wǎng)絡(luò)應(yīng)用工程師,研究方向:數(shù)據(jù)庫(kù)技術(shù)