亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于數(shù)據(jù)倉(cāng)庫(kù)的決策支持系統(tǒng)設(shè)計(jì)研究

        2010-07-25 07:16:22閔建虎
        微型電腦應(yīng)用 2010年4期
        關(guān)鍵詞:決策支持系統(tǒng)數(shù)據(jù)倉(cāng)庫(kù)數(shù)據(jù)源

        閔建虎

        0 引言

        根據(jù)對(duì)國(guó)內(nèi)外一些企業(yè)決策支持系統(tǒng)(DSS)的現(xiàn)狀研究與分析,以及對(duì)國(guó)內(nèi)外發(fā)表在期刊上介紹 DSS案例的文章分析,初期的 DSS是使用關(guān)系型數(shù)據(jù)庫(kù)(RDB)。雖然RDB有許多優(yōu)點(diǎn),但DSS直接使用下層信息系統(tǒng)所建立的數(shù)據(jù)庫(kù)極不方便。綜合數(shù)據(jù)均要經(jīng)過(guò)一定加工和通過(guò)一定的查詢途徑才能得到,速度慢,實(shí)用性差。為解決此問(wèn)題,中期的DSS多采用在原基層數(shù)據(jù)庫(kù)的基礎(chǔ)上,增加DSS專用數(shù)據(jù)庫(kù)的方法。該專用數(shù)據(jù)庫(kù)是由原內(nèi)源基礎(chǔ)數(shù)據(jù)庫(kù)和外源數(shù)據(jù)庫(kù)抽取數(shù)據(jù),經(jīng)加工后得到的綜合數(shù)據(jù)組成的。它可滿足快速查詢和顯示要求,系統(tǒng)性能大大改善。但仍未解決DSS的根本性問(wèn)題,即獲得數(shù)據(jù)是非現(xiàn)實(shí)的,不是面向主題、面向分析和面向支持管理層的決策制定。

        一般決策所需的數(shù)據(jù)總是與一些維數(shù)和不同級(jí)別的統(tǒng)計(jì)和計(jì)算有關(guān),以多維數(shù)據(jù)為核心的多維數(shù)據(jù)分析是決策的主要內(nèi)容,DW技術(shù)的出現(xiàn)給DSS數(shù)據(jù)的提取和分析,特別是多維數(shù)據(jù)的分析與處理創(chuàng)造了很好的條件。DW的多維特征滿足DSS對(duì)數(shù)據(jù)的分析要求,并且克服數(shù)據(jù)庫(kù)的數(shù)據(jù)組織性差、利用率低的缺點(diǎn)。在數(shù)據(jù)庫(kù)多年的應(yīng)用中已經(jīng)積累大量數(shù)據(jù),而且目前數(shù)據(jù)庫(kù)的數(shù)量和規(guī)模還在迅速增加和擴(kuò)大,從而出現(xiàn)“數(shù)據(jù)豐富、知識(shí)貧乏”的問(wèn)題。因此,從龐大的數(shù)據(jù)庫(kù)中抽出有用的信息已是當(dāng)務(wù)之急,所以 DW 為DSS發(fā)展開(kāi)辟了新的途徑,并且基于數(shù)據(jù)倉(cāng)庫(kù)的決策支持系統(tǒng)設(shè)計(jì)有著十分重要的應(yīng)用價(jià)值。

        1 數(shù)據(jù)倉(cāng)庫(kù)

        1.1 數(shù)據(jù)倉(cāng)庫(kù)的概述

        數(shù)據(jù)倉(cāng)庫(kù)是號(hào)稱“數(shù)據(jù)倉(cāng)庫(kù)之父”的 W. H. Inmon提出,數(shù)據(jù)倉(cāng)庫(kù)是支持管理決策過(guò)程的、面向主題的、集成的、不可更新的、隨時(shí)間不斷變化的數(shù)據(jù)集合。換句話說(shuō):數(shù)據(jù)倉(cāng)庫(kù)為支持海量存儲(chǔ)和高層決策分析,提供了一種解決方案。它抽取和凈化來(lái)自不同應(yīng)用系統(tǒng)的數(shù)據(jù),從事物發(fā)展和歷史的角度進(jìn)行組織和存儲(chǔ),并通過(guò)對(duì)這種集成化數(shù)據(jù)的分析和挖掘,為最終用戶提供綜合性和分析性的深層次信息,是基于傳統(tǒng)數(shù)據(jù)庫(kù)技術(shù)的一種應(yīng)用拓展。該定義指出了它與數(shù)據(jù)庫(kù)的區(qū)別:數(shù)據(jù)倉(cāng)庫(kù)并非是一個(gè)僅僅存儲(chǔ)數(shù)據(jù)的簡(jiǎn)單信息庫(kù),因?yàn)檫@實(shí)際上與傳統(tǒng)數(shù)據(jù)庫(kù)沒(méi)有兩樣。如果說(shuō)傳統(tǒng)數(shù)據(jù)庫(kù)系統(tǒng)的重點(diǎn)與要求是快速、準(zhǔn)確、安全、可靠地將數(shù)據(jù)存進(jìn)數(shù)據(jù)庫(kù)中的話,那么數(shù)據(jù)倉(cāng)庫(kù)的重點(diǎn)與要求就是能夠準(zhǔn)確、安全、可靠地從數(shù)據(jù)庫(kù)中取出數(shù)據(jù),經(jīng)過(guò)加工轉(zhuǎn)換成有規(guī)律信息之后,再供管理人員進(jìn)行分析使用。

        1.2 數(shù)據(jù)倉(cāng)庫(kù)的系統(tǒng)結(jié)構(gòu)

        數(shù)據(jù)倉(cāng)庫(kù)是存儲(chǔ)數(shù)據(jù)的一種組織形式。從邏輯結(jié)構(gòu)看,其中的數(shù)據(jù)可分為3至4層:最初是從傳統(tǒng)數(shù)據(jù)庫(kù)中獲得原始數(shù)據(jù),先按輔助決策的主題要求形成當(dāng)前基本數(shù)據(jù)層;再按綜合決策的要求形成綜合數(shù)據(jù)層(其中又可分為輕度綜合層和高度綜合層);隨著時(shí)間的推移,由時(shí)間控制機(jī)制將當(dāng)前基本數(shù)據(jù)層轉(zhuǎn)為歷史數(shù)據(jù)層。這幾個(gè)數(shù)據(jù)層均由元數(shù)據(jù)(Meta Data)組織而成,元數(shù)據(jù)是數(shù)據(jù)倉(cāng)庫(kù)的核心。從物理結(jié)構(gòu)看,可分為多維數(shù)據(jù)庫(kù)組織形式(空間超立方體形式)、基于關(guān)系數(shù)據(jù)庫(kù)組織形式和虛擬存儲(chǔ)形式。數(shù)據(jù)倉(cāng)庫(kù)系統(tǒng)(DWS)是對(duì)進(jìn)入數(shù)據(jù)倉(cāng)庫(kù)的原始數(shù)據(jù),完成抽取轉(zhuǎn)換過(guò)濾清洗等處理,最終進(jìn)入數(shù)據(jù)倉(cāng)庫(kù),機(jī)器對(duì)數(shù)據(jù)倉(cāng)庫(kù)中存儲(chǔ)的數(shù)據(jù),進(jìn)行更新管理,使用相關(guān)軟件進(jìn)行集合,用以支持管理決策。DWS通常由數(shù)據(jù)倉(cāng)庫(kù)、倉(cāng)庫(kù)管理和分析工具組成。如圖1所示。

        圖1 數(shù)據(jù)倉(cāng)庫(kù)的體系結(jié)構(gòu)

        (1)數(shù)據(jù)源

        如圖1所示,最左邊是數(shù)據(jù)源,包括數(shù)據(jù)庫(kù)數(shù)據(jù)源和非數(shù)據(jù)庫(kù)數(shù)據(jù)源。數(shù)據(jù)庫(kù)一般是異構(gòu)的,通過(guò)網(wǎng)絡(luò)互連。數(shù)據(jù)源是數(shù)據(jù)倉(cāng)庫(kù)系統(tǒng)的基礎(chǔ),是整個(gè)系統(tǒng)的數(shù)據(jù)來(lái)源。在建立數(shù)據(jù)倉(cāng)庫(kù)之前必須對(duì)各種不同的數(shù)據(jù)源進(jìn)行抽取、轉(zhuǎn)換等操作。

        (2)數(shù)據(jù)源的集成

        多數(shù)據(jù)源的集成包括抽取、轉(zhuǎn)換、裝載等過(guò)程。數(shù)據(jù)集成是構(gòu)建數(shù)據(jù)倉(cāng)庫(kù)的重要一環(huán),用戶從數(shù)據(jù)源抽取出所需的數(shù)據(jù),經(jīng)過(guò)數(shù)據(jù)轉(zhuǎn)換和清洗,最終按照預(yù)先定義的數(shù)據(jù)倉(cāng)庫(kù)模型,將數(shù)據(jù)加載到數(shù)據(jù)倉(cāng)庫(kù)中去。

        (3)中心數(shù)據(jù)倉(cāng)庫(kù)

        當(dāng)前數(shù)據(jù)倉(cāng)庫(kù)的核心仍是 RDBMS管理下的一個(gè)數(shù)據(jù)庫(kù)系統(tǒng),由于數(shù)據(jù)倉(cāng)庫(kù)的數(shù)據(jù)量大,查詢復(fù)雜,因此系統(tǒng)性能的好壞仍然是個(gè)嚴(yán)重問(wèn)題。為了提高性能,在數(shù)據(jù)倉(cāng)庫(kù)中通常采用下列措施:(a)采用并行系統(tǒng)結(jié)構(gòu);(b)對(duì)數(shù)據(jù)倉(cāng)庫(kù)中用得多、開(kāi)銷大的處理;(c)針對(duì)數(shù)據(jù)倉(cāng)庫(kù)以讀為主的特點(diǎn),把查詢中常用的結(jié)果定義為視圖,并將事先計(jì)算好的視圖存于數(shù)據(jù)倉(cāng)庫(kù)中,在需要時(shí)讀出即可,無(wú)需臨時(shí)計(jì)算。上述3條措施中,并行處理已經(jīng)是數(shù)據(jù)庫(kù)中的通用技術(shù),受到各主要RDBMS產(chǎn)品的支持;后兩項(xiàng)措施,主要是隨數(shù)據(jù)倉(cāng)庫(kù)的興起而發(fā)展起來(lái)的,目前一些主要的RDBMS產(chǎn)品,都增加了這些方面的功能。

        (4)數(shù)據(jù)集市

        數(shù)據(jù)的最終查詢分析,往往是基于某個(gè)主題的,不同的決策主題,所需要的數(shù)據(jù)當(dāng)然也不盡相同。如果每次都從整個(gè)中心數(shù)據(jù)倉(cāng)庫(kù)去獲取數(shù)據(jù)的話,其執(zhí)行效率顯然是比較低的;因此可在單位數(shù)據(jù)倉(cāng)庫(kù)之外,再建立若干部門(mén)數(shù)據(jù)倉(cāng)庫(kù),即數(shù)據(jù)集市。

        (5)聯(lián)機(jī)分析處理(OLAP)服務(wù)器

        OLAP服務(wù)器位于客戶端與數(shù)據(jù)倉(cāng)庫(kù)之間,負(fù)責(zé)管理數(shù)據(jù)模型及其數(shù)據(jù),實(shí)際上是一個(gè)功能強(qiáng)大的多維分析引擎。它從數(shù)據(jù)倉(cāng)庫(kù)中抽取數(shù)據(jù),并根據(jù)分析需要,對(duì)分析需要數(shù)據(jù)進(jìn)行有效集成按多維模型予以組織,以便進(jìn)行多角度、多層次的分析,并發(fā)現(xiàn)趨勢(shì)。

        (6)前端的分析工具

        前端分析工具包括各種查詢工具、數(shù)據(jù)分析工具、報(bào)表工具、數(shù)據(jù)挖掘工具以及各種基于數(shù)據(jù)倉(cāng)庫(kù)或數(shù)據(jù)集市的應(yīng)用開(kāi)發(fā)工具。其中數(shù)據(jù)分析工具主要針對(duì) OLAP服務(wù)器;報(bào)表工具、數(shù)據(jù)挖掘工具主要針對(duì)數(shù)據(jù)倉(cāng)庫(kù)。以上各種前端分析工具運(yùn)行于客戶端,主要功能是提供多維數(shù)據(jù)查詢和分析操作以達(dá)到?jīng)Q策支持的目的。

        2 聯(lián)機(jī)分析處理(OLAP)與數(shù)據(jù)挖掘(DM)

        2.1 聯(lián)機(jī)分析處理(OLAP)技術(shù)

        聯(lián)機(jī)分析處理(OLAP, On-line Analytical Processing),是一種針對(duì)特定問(wèn)題進(jìn)行聯(lián)機(jī)數(shù)據(jù)訪問(wèn)和分析的技術(shù)。它是決策人員通過(guò)對(duì)信息的多種可能的觀察形式進(jìn)行快速、一致和交互式的存取來(lái)獲得對(duì)數(shù)據(jù)的深入觀察。

        隨著數(shù)據(jù)倉(cāng)庫(kù)的發(fā)展,OLAP也得到了迅猛的發(fā)展。數(shù)據(jù)倉(cāng)庫(kù)側(cè)重于存儲(chǔ)和管理面向決策主題的數(shù)據(jù);而 OLAP則側(cè)重于數(shù)據(jù)倉(cāng)庫(kù)的數(shù)據(jù)分析,并將其轉(zhuǎn)換成輔助決策信息。OLAP的一個(gè)主要特點(diǎn)是多維數(shù)據(jù)分析,這與數(shù)據(jù)倉(cāng)庫(kù)的多維數(shù)據(jù)組織正好形成相互結(jié)合、相互補(bǔ)充的關(guān)系。因此,利用 OLAP技術(shù)與數(shù)據(jù)倉(cāng)庫(kù)的結(jié)合,可以較好地解決傳統(tǒng)決策支持系統(tǒng),既需要處理大量數(shù)據(jù)又需要進(jìn)行大量數(shù)值計(jì)算的問(wèn)題。OLAP的多維數(shù)據(jù)分析,主要通過(guò)對(duì)多維數(shù)據(jù)的維進(jìn)行剖切、鉆取和旋轉(zhuǎn)來(lái)實(shí)現(xiàn)對(duì)數(shù)據(jù)庫(kù)所提供的數(shù)據(jù)進(jìn)行深入分析,為決策者提供決策支持。多維結(jié)構(gòu)是決策支持的支柱,也是 OLAP的核心。多維結(jié)構(gòu)中的維突破了三維概念,可以有四維、五維甚至更多維的數(shù)據(jù)結(jié)構(gòu),即超立方體和多立方體的數(shù)據(jù)結(jié)構(gòu)。我們可以利用分析工具對(duì)多維數(shù)據(jù)結(jié)構(gòu)進(jìn)行切片、切塊、向上鉆取、向下鉆取、跨越鉆取和旋轉(zhuǎn)等處理,得到所需的決策分析數(shù)據(jù)。

        2.2 數(shù)據(jù)的挖掘(DM)技術(shù)

        數(shù)據(jù)的挖掘(Data Mining)就是從大量的、不完全的、有噪聲的、模糊的、隨機(jī)的實(shí)際應(yīng)用數(shù)據(jù)中,提取隱含在其中的、人們事先不知道的、但又是潛在有用的信息和知識(shí)的過(guò)程。準(zhǔn)確的說(shuō),數(shù)據(jù)挖掘是數(shù)據(jù)倉(cāng)庫(kù)中的數(shù)據(jù)集合,在面向主題的預(yù)操作的作用下,轉(zhuǎn)化成面向主題的數(shù)據(jù)挖掘集合,然后數(shù)據(jù)挖掘集合,在挖掘算法它數(shù)據(jù)轉(zhuǎn)化操作的作用下,轉(zhuǎn)化成相應(yīng)的信息,最后,在信息輸出時(shí)對(duì)信息進(jìn)行度量和濾除。在DDS中通過(guò)進(jìn)行數(shù)據(jù)挖掘,用以發(fā)現(xiàn)數(shù)據(jù)之間的復(fù)雜聯(lián)系以及這種聯(lián)系對(duì)決策的影響。數(shù)據(jù)挖掘的功能有自動(dòng)預(yù)測(cè)趨勢(shì)和行為,關(guān)聯(lián)分析、聚類、概念描述和偏差檢測(cè)。在數(shù)據(jù)倉(cāng)庫(kù)基礎(chǔ)上挖掘的知識(shí)通常以圖表、可視化、類自然語(yǔ)言等形式表示出來(lái),但所挖掘的知識(shí)并不都是有意義的,必須進(jìn)行評(píng)價(jià)、篩選和驗(yàn)證,把有意義的知識(shí)放到知識(shí)庫(kù)中,隨著時(shí)間的推移將積累更多的知識(shí)。知識(shí)庫(kù)根據(jù)挖掘的知識(shí)類型包括總結(jié)性知識(shí)、關(guān)聯(lián)性知識(shí)、分類模型知識(shí)、聚類模型知識(shí),這些知識(shí)通過(guò)相應(yīng)挖掘算法得到。

        3 決策的支持系統(tǒng)(DSS)

        目前沒(méi)有普遍接受的決策支持系統(tǒng)(Decision Support System,簡(jiǎn)稱為DSS)的定義。一個(gè)經(jīng)典的定義是:決策支持系統(tǒng)通過(guò)結(jié)合個(gè)人的智力資源和計(jì)算機(jī)的能力來(lái)改進(jìn)決策的質(zhì)量。它是一個(gè)基于計(jì)算機(jī)的支持系統(tǒng),服務(wù)于處理半結(jié)構(gòu)化或非結(jié)構(gòu)化問(wèn)題的管理決策制定者。

        一個(gè)決策支持系統(tǒng)將包括如下典型的組件:

        (1)管理的子系統(tǒng)

        DSS的數(shù)據(jù)庫(kù)通常包括在數(shù)據(jù)庫(kù)中。數(shù)據(jù)倉(cāng)庫(kù)是集成、面向主題的數(shù)據(jù)庫(kù)集合,它是用來(lái)支持決策支持功能的,其中每個(gè)數(shù)據(jù)單元都不隨時(shí)間改變。數(shù)據(jù)倉(cāng)庫(kù)的數(shù)據(jù)通常從內(nèi)部和外部數(shù)據(jù)源中抽取。

        (2)模型的管理系統(tǒng)

        一個(gè)包含有財(cái)務(wù)、統(tǒng)計(jì)、運(yùn)籌和其他定量模型的軟件包,能夠提供系統(tǒng)的分析能力和合適的軟件管理能力。在模型庫(kù)中的模型可以分為戰(zhàn)略性的、策略性的、營(yíng)運(yùn)性的等。

        (3)知識(shí)的管理系統(tǒng)

        許多非結(jié)構(gòu)化和半結(jié)構(gòu)化的問(wèn)題是如此的復(fù)雜,以至于超出了通常的 DSS能力,它們還需要特別的專業(yè)知識(shí)。這些知識(shí)可以由專家系統(tǒng)或者其他智能系統(tǒng)提供。因此,更高級(jí)的DSS系統(tǒng)還包含成為知識(shí)管理的組件。

        (4)用戶界面的子系統(tǒng)

        用戶界面子系統(tǒng)就是用戶與應(yīng)用之間的交流。如交互式界面、報(bào)表打印。為了實(shí)現(xiàn)組織內(nèi)的信息共享,還應(yīng)包括信息的發(fā)布方式。在目前采用 Web瀏覽器的形式已經(jīng)成為趨勢(shì),用戶可看作系統(tǒng)的一部分。

        決策支持系統(tǒng)作為一門(mén)新興的信息技術(shù),能夠?yàn)槠髽I(yè)提供各種決策信息支持以及許多商業(yè)問(wèn)題的解決方案,從而減輕管理者從事低層次信息處理和分析的負(fù)擔(dān),使得他們專注于最需要決策智慧和經(jīng)驗(yàn)的工作,從而提高決策的質(zhì)量和效率。

        4 設(shè)計(jì)的實(shí)現(xiàn)

        4.1 基于DW的DSS的構(gòu)建

        針對(duì)現(xiàn)在一般企業(yè)用戶范圍廣、流動(dòng)性大和面對(duì)市場(chǎng)需求分析工作量大的特點(diǎn),在該企業(yè)現(xiàn)有內(nèi)部網(wǎng)(Intranet)的基礎(chǔ)上,本人設(shè)計(jì)了一個(gè)基于數(shù)據(jù)倉(cāng)庫(kù)的決策支持系統(tǒng),其系統(tǒng)框架結(jié)構(gòu)模型如圖2所示。

        圖2 基于DW的DSS框架模型設(shè)計(jì)

        本系統(tǒng)的整個(gè)框架結(jié)構(gòu)是建立在基于Web技術(shù)的企業(yè)Intranet應(yīng)用于集成框架之上,其應(yīng)用模型是瀏覽器/服務(wù)器(B/S) 3層結(jié)構(gòu)形式,即客戶端、應(yīng)用(數(shù)據(jù)采集、處理、分析與挖掘)服務(wù)器和數(shù)據(jù)源(數(shù)據(jù)倉(cāng)庫(kù)、數(shù)據(jù)庫(kù)與知識(shí)庫(kù))服務(wù)器。數(shù)據(jù)倉(cāng)庫(kù)的采集單元(pump)負(fù)責(zé)定期的通過(guò)企業(yè)內(nèi)部網(wǎng)通信干線分布在網(wǎng)絡(luò)各站點(diǎn)上的有關(guān)數(shù)據(jù)庫(kù)收集最新的數(shù)據(jù),并完成數(shù)據(jù)的凈化與變換??紤]到 DW 中數(shù)據(jù)對(duì)象較為復(fù)雜且數(shù)量巨大,決策支持系統(tǒng)其他單元對(duì) DW 的訪問(wèn)是通過(guò)OLAP服務(wù)器來(lái)完成的。使用OLAP服務(wù)器的目的是為了得到完善的多維數(shù)據(jù)管理,并提供簡(jiǎn)便快速且性能有保證的多維數(shù)據(jù)查詢和分析,大大地降低了系統(tǒng)的數(shù)據(jù)傳輸量,提高了數(shù)據(jù)挖掘和決策分析效率。

        與傳統(tǒng)的 DSS體系結(jié)構(gòu)不同的是:知識(shí)庫(kù)中的知識(shí)除了在系統(tǒng)建立之初輸入之外,還由系統(tǒng)的數(shù)據(jù)挖掘單元不斷地進(jìn)行補(bǔ)充。在數(shù)據(jù)挖掘單元中,盡量使用已有的一些數(shù)據(jù)挖掘軟件工具,如SAS,IBM Intelligent Mines等。在中間層設(shè)置Web服務(wù)器和知識(shí)服務(wù)器。用戶通過(guò)HTTP協(xié)議訪問(wèn)Web服務(wù)器上的HTML格式的頁(yè)面,而Web服務(wù)器則根據(jù)頁(yè)面設(shè)置與用戶要求向知識(shí)服務(wù)器提出決策需求。知識(shí)服務(wù)器是處理用戶決策需求的綜合服務(wù)單元,它根據(jù)用戶需求向知識(shí)庫(kù)和數(shù)據(jù)庫(kù)要求相應(yīng)的知識(shí)和數(shù)據(jù),經(jīng)處理后以Web頁(yè)面的形式提供給用戶。在客戶端,用戶通過(guò) Web瀏覽器訪問(wèn)Intranet上的Web服務(wù)器來(lái)進(jìn)行決策咨詢。本系統(tǒng)的用戶可分為兩類:一類是一般人員,他們只需要了解一下企業(yè)總體情況以及決策支持系統(tǒng)對(duì)具體的一般性建議,服務(wù)器上的靜態(tài) Web頁(yè)面就可以滿足他們要求。另一類是企業(yè)高層管理決策人員,他們除需了解各部門(mén)情況與相關(guān)統(tǒng)計(jì)以外,還想知道發(fā)展趨勢(shì)分析與預(yù)測(cè),進(jìn)行某些專門(mén)分析與知識(shí)咨詢等,這就需要與系統(tǒng)進(jìn)行動(dòng)態(tài)交互。系統(tǒng)可以通過(guò) Web頁(yè)面上嵌套Java Applet小程序來(lái)實(shí)現(xiàn)這種用戶和系統(tǒng)的動(dòng)態(tài)交互,使用戶能動(dòng)態(tài)地通過(guò)知識(shí)庫(kù)服務(wù)器訪問(wèn)數(shù)據(jù)倉(cāng)庫(kù)和知識(shí)庫(kù),以取得所需要的特殊信息。

        4.2 數(shù)據(jù)倉(cāng)庫(kù)的設(shè)計(jì)

        數(shù)據(jù)倉(cāng)庫(kù)與傳統(tǒng)數(shù)據(jù)庫(kù)的設(shè)計(jì)過(guò)程都要經(jīng)歷概念模型、邏輯模型和物理模型3個(gè)設(shè)計(jì)階段。但數(shù)據(jù)倉(cāng)庫(kù)與數(shù)據(jù)庫(kù)在各個(gè)設(shè)計(jì)階段所采取的方法卻截然不同。本人根據(jù)上述系統(tǒng)數(shù)據(jù)倉(cāng)庫(kù)采用面向主題,即面向?qū)ο笞陨隙碌脑O(shè)計(jì)方法。下面分別介紹3個(gè)模型設(shè)計(jì)階段采用的建模技術(shù)。

        (1)DW概念模型的設(shè)計(jì)

        超立方體(Hypercube)可用超出三維的表示來(lái)描述一個(gè)對(duì)象(對(duì)象可以是客戶、產(chǎn)品、營(yíng)銷策略等),它完全可以滿足 DW 的多維特性。使用自上而下的方法設(shè)計(jì)一個(gè)超立方體的步驟如下:

        (a) 確定模型中需要抓住的關(guān)鍵過(guò)程。

        (b) 確定需要捕獲的值。

        (c) 確定數(shù)據(jù)的粒度,即需要獲取最低一級(jí)的詳細(xì)信息。

        當(dāng)維數(shù)超過(guò)三維后,超立方體在表現(xiàn)上缺乏直觀性,因此我們采用一種稱為信息包圖(Information packed picture)的方法在平面上展開(kāi)超立方體。使用信息包圖設(shè)計(jì)概念模型的具體步驟如下:

        (a) 確定指標(biāo):指標(biāo)是訪問(wèn)DW的關(guān)鍵所在,是用戶最關(guān)心的信息。它是表示在維度空間衡量商務(wù)信息的一種方法。

        (b) 確定維度:維度提供了用戶訪問(wèn)DW的信息途徑,對(duì)應(yīng)超立方體的每一面,位于信息包圖的第一行的每個(gè)欄目中。

        (c) 確定類別:類別是在一個(gè)維度內(nèi)為了提供詳細(xì)的分類而定義的,而其中的成員又是為了辨別和區(qū)分特別數(shù)據(jù)而設(shè)的,它表示一個(gè)維度包含的詳細(xì)信息。一個(gè)維度內(nèi)最低層的可用分類可以又稱為詳細(xì)類別。

        (2) DW邏輯模型的設(shè)計(jì)

        DW主要提供的是查詢操作,而最便于執(zhí)行查詢操作的邏輯模型設(shè)計(jì)工具是星型圖(star chart),因此我們利用星型圖建模技術(shù),可以為DW建立完善的邏輯模型。從DW的概念模型(信息包圖模型)轉(zhuǎn)換成 DW 的邏輯模型(星型圖模型)的過(guò)程,可以分為以下幾個(gè)步驟:

        (a) 定義指標(biāo)實(shí)體:指標(biāo)實(shí)體位于星型圖的中心,是用戶最關(guān)心的基本實(shí)體和查詢活動(dòng)的中心,為用戶的商務(wù)活動(dòng)提供定量數(shù)據(jù)。每一個(gè)指標(biāo)實(shí)體代表一系列相關(guān)事實(shí),完成一項(xiàng)指定的功能,在一般情況下代表一個(gè)現(xiàn)實(shí)事物的綜合水平,僅僅與每個(gè)相關(guān)維度的一個(gè)點(diǎn)對(duì)應(yīng)。

        (b) 定義維度實(shí)體。一個(gè)維度實(shí)體對(duì)應(yīng)指標(biāo)實(shí)體中的多個(gè)指標(biāo),用戶使用維度實(shí)體來(lái)訪問(wèn)指標(biāo)實(shí)體,其實(shí)質(zhì)是對(duì)應(yīng)著邏輯數(shù)據(jù)實(shí)體。一個(gè)維度實(shí)體對(duì)應(yīng)信息包圖中的一個(gè)列。

        (c) 定義詳細(xì)類別實(shí)體。一個(gè)詳細(xì)類別的實(shí)體與現(xiàn)實(shí)世界的某一個(gè)實(shí)體相對(duì)應(yīng)。

        (d) 定義邏輯模型。定義邏輯模型的最后一步是將星型模型轉(zhuǎn)換成雪花模型。限于篇幅,轉(zhuǎn)換過(guò)程與圖示從略。

        (3) DW物理模型的設(shè)計(jì)

        根據(jù)星型模型或雪花模型,就可以方便地定義出DW的物理數(shù)據(jù)結(jié)構(gòu)。一般將指標(biāo)實(shí)體和詳細(xì)類別實(shí)體轉(zhuǎn)變?yōu)橐粋€(gè)具體的物理數(shù)據(jù)庫(kù)表,稱為事實(shí)表。維度實(shí)體通常也轉(zhuǎn)化為數(shù)據(jù)庫(kù)表,稱為維表,它包括其每一層次的主碼和對(duì)應(yīng)的值。維表和事實(shí)表通過(guò)維關(guān)鍵字相關(guān)聯(lián)。在物理模型設(shè)計(jì)階段,需要確定以下的內(nèi)容:

        (a)規(guī)定數(shù)據(jù)質(zhì)量指標(biāo),規(guī)范數(shù)據(jù)倉(cāng)庫(kù)中的各種數(shù)據(jù)。(b)定義實(shí)體、實(shí)體特征以及實(shí)體所具有的一切屬性。(c)定義規(guī)模,確定數(shù)據(jù)容量和更新頻率。為了獲得物理模型設(shè)計(jì)階段完整的文檔資料,可利用自動(dòng)定義軟件工具進(jìn)行數(shù)據(jù)管理。

        4.3 基于數(shù)據(jù)倉(cāng)庫(kù)的數(shù)據(jù)挖掘

        數(shù)據(jù)挖掘(DM)是DSS應(yīng)用中非常重要的環(huán)節(jié),它是在一些事實(shí)或觀察數(shù)據(jù)中尋找合適模式的決策支持過(guò)程。DM的對(duì)象主要是數(shù)據(jù)倉(cāng)庫(kù)或大型的數(shù)據(jù)庫(kù),也可以是文件系統(tǒng)或其他任何組織在一起的數(shù)據(jù)集合,從簡(jiǎn)化的觀點(diǎn)來(lái)講,絕大多數(shù)的挖掘算法,可以看成是由少數(shù)幾個(gè)基本原則與技術(shù)組成的。本系統(tǒng)的DM算法是由模型、偏好判據(jù)和搜索算法3個(gè)部分組合而成的。主要的模型有特征模型、分類模型、聚集模型、關(guān)聯(lián)模型、對(duì)比模型、匯總模型和決策模型等。由于篇幅有限有關(guān)它們的具體數(shù)據(jù)挖掘算法的確定與應(yīng)用就不在此一一闡述。

        5 結(jié)束語(yǔ)

        大量數(shù)據(jù)的產(chǎn)生和收集導(dǎo)致了信息爆炸,現(xiàn)代社會(huì)的競(jìng)爭(zhēng)趨勢(shì)要求對(duì)這些數(shù)據(jù)進(jìn)行實(shí)時(shí)的和深層次的分析。雖然現(xiàn)在有了更強(qiáng)大的存儲(chǔ)和檢索系統(tǒng)。但是使用者發(fā)現(xiàn)在分析和使用所擁有的信息方面變得越來(lái)越困難。數(shù)據(jù)倉(cāng)庫(kù)提供了容納大量信息的場(chǎng)所,但只有和 OLAP技術(shù)、數(shù)據(jù)挖掘技術(shù)的應(yīng)用綜合起來(lái)才能最終解決用戶的困惑,使用戶能夠從大量繁雜的數(shù)據(jù)中找出真正有價(jià)值的信息和知識(shí)。而數(shù)據(jù)倉(cāng)庫(kù)的建立并不是要取代原有數(shù)據(jù)庫(kù),而是在原有的數(shù)據(jù)庫(kù)應(yīng)用系統(tǒng)的基礎(chǔ)上建立全面、完善的信息應(yīng)用基礎(chǔ),用于支持高層決策分析。本文主要對(duì)數(shù)據(jù)倉(cāng)庫(kù)、OLAP、數(shù)據(jù)挖掘著幾種技術(shù)以及基于DW的DSS構(gòu)建、數(shù)據(jù)倉(cāng)庫(kù)的設(shè)計(jì)等方面進(jìn)行了較為深入的分析研究,對(duì)于數(shù)據(jù)倉(cāng)庫(kù)技術(shù)的決策支持系統(tǒng)具有十分廣泛的應(yīng)用前景。

        [1]Efrem G.Mallach, Decision Support and Data Warehouse Systems, McGraw-Hill, Companies, Inc, 2000.

        [2]Inmon W H. Building the Data Warehouse[M]. 機(jī)械工業(yè)出版社,2003.

        [3]陳文偉.決策支持系統(tǒng)及其開(kāi)發(fā)[M].北京:清華大學(xué)出版社,2000.

        [4]張維明.數(shù)據(jù)倉(cāng)庫(kù)原理及應(yīng)用[M].電子工業(yè)出版社,2002.

        [5]王珊.數(shù)據(jù)倉(cāng)庫(kù)技術(shù)和聯(lián)機(jī)分析處理[M].科學(xué)出版社,1999.

        [6]康曉東.基于數(shù)據(jù)倉(cāng)庫(kù)的數(shù)據(jù)挖掘技術(shù)[M].機(jī)械工業(yè)出版社,2004.

        [7]石麗,李堅(jiān).數(shù)據(jù)倉(cāng)庫(kù)與決策支持[M].國(guó)防工業(yè)出版社,2003.

        [8]王珊,薩師煊.數(shù)據(jù)庫(kù)系統(tǒng)概論(第四版)[M].高等教育出版社,2007.

        猜你喜歡
        決策支持系統(tǒng)數(shù)據(jù)倉(cāng)庫(kù)數(shù)據(jù)源
        護(hù)理臨床決策支持系統(tǒng)的理論基礎(chǔ)
        臨床決策支持系統(tǒng)應(yīng)用于呼吸疾病的現(xiàn)狀概述
        基于數(shù)據(jù)倉(cāng)庫(kù)的住房城鄉(xiāng)建設(shè)信息系統(tǒng)整合研究
        電務(wù)維修決策支持系統(tǒng)研究
        Web 大數(shù)據(jù)系統(tǒng)數(shù)據(jù)源選擇*
        基于不同網(wǎng)絡(luò)數(shù)據(jù)源的期刊評(píng)價(jià)研究
        分布式存儲(chǔ)系統(tǒng)在液晶面板制造數(shù)據(jù)倉(cāng)庫(kù)中的設(shè)計(jì)
        電子制作(2016年15期)2017-01-15 13:39:15
        探析電力系統(tǒng)調(diào)度中數(shù)據(jù)倉(cāng)庫(kù)技術(shù)的應(yīng)用
        縣級(jí)防汛輔助決策支持系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)
        水利信息化(2015年5期)2015-12-21 12:54:40
        基于數(shù)據(jù)倉(cāng)庫(kù)的數(shù)據(jù)分析探索與實(shí)踐
        亚洲爆乳精品无码一区二区| 亚洲国产一区二区av| 美丽的小蜜桃在线观看| 亚洲av日韩精品久久久久久久| 狠狠噜天天噜日日噜| 亚洲成a人片在线观看中| 青青草视频是针对华人| 成人特黄a级毛片免费视频| 国产精品成人av在线观看| 久久人妻av无码中文专区| 国产美腿丝袜一区二区| 麻豆婷婷狠狠色18禁久久| 亚洲爆乳无码专区| 精品亚洲不卡一区二区| 亚洲自拍偷拍色图综合| 在线成人爽a毛片免费软件| 香蕉视频在线观看国产| 亚洲国产精品夜男人天堂| 午夜一区二区三区观看| 人人爽人人澡人人人妻| 国产美女69视频免费观看| 亚洲五月天中文字幕第一页| 亚洲av无码一区东京热久久| 国产午夜三级一区二区三| 无码一区二区三区久久精品| 被灌醉的日本人妻中文字幕| 亚洲成在人线av品善网好看| 久久国产精品国产精品日韩区| 玩弄丝袜美腿超短裙校花| 97色伦图片97综合影院| 无码手机线免费观看| 久久亚洲精彩无码天堂| 婚外情长久的相处之道| 曰本人做爰又黄又粗视频| 老熟妇Av| 99蜜桃在线观看免费视频| 亚洲熟妇久久精品| 99成人精品| 伊人狼人激情综合影院| 国产精品办公室沙发| 精品日韩国产欧美在线观看|