張澤雅
裝甲兵工程學(xué)院,北京 100072
基于數(shù)據(jù)挖掘技術(shù)的決策支持系統(tǒng)及應(yīng)用探討
張澤雅
裝甲兵工程學(xué)院,北京 100072
文章介紹了數(shù)據(jù)挖掘技術(shù)的概念,分析了基于數(shù)據(jù)挖掘技術(shù)的決策支持系統(tǒng),探析了基于數(shù)據(jù)挖掘技術(shù)決策支持系統(tǒng)的應(yīng)用,以供參考。
數(shù)據(jù)挖掘技術(shù);決策支持系統(tǒng);應(yīng)用
隨著數(shù)據(jù)庫技術(shù)的快速發(fā)展和廣泛應(yīng)用,人們對(duì)數(shù)據(jù)信息提出了更高層次的需求,但是傳統(tǒng)的決策支持系統(tǒng)并不能夠滿足人們?cè)诜治鰧哟?、決策層次的實(shí)際需求,基于數(shù)據(jù)挖掘技術(shù)的決策支持系統(tǒng)應(yīng)運(yùn)而生?;跀?shù)據(jù)挖掘技術(shù)的決策支持系統(tǒng),利用數(shù)據(jù)挖掘技術(shù)強(qiáng)大的數(shù)據(jù)挖掘功能,能夠?yàn)闆Q策支持系統(tǒng)提供有效、可靠、全面的數(shù)據(jù)信息,幫助決策人員快速、準(zhǔn)確的做出決策,由此可見其重要性。
數(shù)據(jù)挖掘指的是從隨機(jī)的、模糊的、有噪聲的、不完全的、大量的數(shù)據(jù)信息中,提取隱含在其中的人們事先不知道,但是又有用、潛在的信息知識(shí)。數(shù)據(jù)挖掘涵蓋了高性能計(jì)算、數(shù)據(jù)可視化、機(jī)器學(xué)習(xí)、統(tǒng)計(jì)學(xué)、數(shù)據(jù)倉庫以及數(shù)據(jù)庫系統(tǒng)等眾多領(lǐng)域,廣泛涉及到歸納邏輯變成、信號(hào)處理、圖像數(shù)據(jù)庫、空間數(shù)據(jù)分析、模式識(shí)別以及人工神經(jīng)網(wǎng)絡(luò)等眾多學(xué)科。數(shù)據(jù)挖掘由三層體系結(jié)構(gòu)組成,其體系結(jié)構(gòu)如圖1所示。
圖1
基于數(shù)據(jù)挖掘技術(shù)的決策支持系統(tǒng),能夠有效的解決傳統(tǒng)決策支持系統(tǒng)存在的問題,基于數(shù)據(jù)挖掘技術(shù)的決策支持系統(tǒng)架構(gòu)構(gòu)建表現(xiàn)為以下幾個(gè)方面。
2.1 創(chuàng)建數(shù)據(jù)倉庫
為了滿足決策支持系統(tǒng)的實(shí)際要求,要求數(shù)據(jù)倉庫的數(shù)據(jù)具備以下特點(diǎn):統(tǒng)一性、抽象性以及概括性,并且部門數(shù)據(jù)庫與數(shù)據(jù)倉庫中間還應(yīng)該設(shè)置一個(gè)虛擬層,該層的功能是對(duì)數(shù)據(jù)倉庫提取的數(shù)據(jù)進(jìn)行清洗。結(jié)構(gòu)設(shè)計(jì)時(shí)數(shù)據(jù)倉庫設(shè)計(jì)的重點(diǎn),包括物理設(shè)計(jì)與邏輯設(shè)計(jì)兩個(gè)方面。
1)數(shù)據(jù)庫物理設(shè)計(jì)。數(shù)據(jù)庫在物理設(shè)備上的存取、儲(chǔ)存結(jié)構(gòu)稱之為物理結(jié)構(gòu),良好的物理結(jié)構(gòu)設(shè)計(jì)能夠增大事務(wù)吞吐率、提高儲(chǔ)存空間利用率、縮短事務(wù)相應(yīng)時(shí)間、提高存取效率等,其中存取方法是物理設(shè)計(jì)的重點(diǎn),常用的存取方法包括HASH存取方法、索引存取方法等。
2)數(shù)據(jù)庫邏輯設(shè)計(jì)。想要進(jìn)行數(shù)據(jù)庫邏輯設(shè)計(jì),首先應(yīng)該創(chuàng)建一個(gè)概念模型,該概念模型獨(dú)立于其他所有數(shù)據(jù)模型。數(shù)據(jù)庫邏輯設(shè)計(jì)的主要任務(wù)是將概念模型轉(zhuǎn)化成適應(yīng)數(shù)據(jù)庫系統(tǒng)支持的邏輯結(jié)構(gòu)。因?yàn)樵S多商用數(shù)據(jù)庫采用關(guān)系型數(shù)據(jù)庫,因此邏輯設(shè)計(jì)的主要任務(wù)是將實(shí)體和實(shí)體屬性的聯(lián)系轉(zhuǎn)變成關(guān)系模式。企業(yè)中存在眾多實(shí)體,例如市場(chǎng)部、財(cái)務(wù)部、生產(chǎn)部以及人力資源部等
2.2 數(shù)據(jù)庫挖掘方法
數(shù)據(jù)挖掘技術(shù)的本質(zhì)是商用信息的處理技術(shù),數(shù)據(jù)倉庫為數(shù)據(jù)挖掘提供了良好的活動(dòng)空間,保證數(shù)據(jù)來源的完整性與廣泛性,數(shù)據(jù)庫挖掘方法主要包括以下兩個(gè)方面。
1)聯(lián)機(jī)處理分析。數(shù)據(jù)庫創(chuàng)建完成后,應(yīng)該對(duì)數(shù)據(jù)信息進(jìn)行分析和處理,其中最常用的一種技術(shù)為聯(lián)機(jī)分析處理技術(shù)。數(shù)據(jù)倉庫重點(diǎn)對(duì)數(shù)據(jù)進(jìn)行儲(chǔ)存,聯(lián)機(jī)處理分析的重點(diǎn)是對(duì)材料進(jìn)行分析,進(jìn)而為決策支持系統(tǒng)提供幫助?!熬S”與“度量”是聯(lián)機(jī)處理分析的兩個(gè)重要概念,在進(jìn)行聯(lián)機(jī)處理分析時(shí),通常把信息當(dāng)作一個(gè)立方體,在對(duì)數(shù)據(jù)信息進(jìn)行分析時(shí),采用旋轉(zhuǎn)、鉆取、切塊、切片的方式進(jìn)行處理,從各個(gè)角度進(jìn)行數(shù)據(jù)的提取。以某產(chǎn)品的銷售信息為例,該產(chǎn)品的銷售信息包括倉庫、型號(hào)、日期等,每一個(gè)信息都指向不同的維表,倉庫號(hào)指向倉庫維表,包括倉庫名、庫存量、城市以及省等;產(chǎn)品型號(hào)指向產(chǎn)品維表,包括說明、商標(biāo)、種類以及部門等;日期會(huì)指向日期維表,包括日、月、季以及年等。聯(lián)機(jī)處理分析的操作包括:其一,鉆取,鉆取包括下鉆與上卷,下鉆指的是向下一維的信息,例如,通過產(chǎn)品維表下鉆,能夠獲得倉庫名、庫存量等信息;上卷指的是從低維度的信息中獲得高維度的信息,例如,在日期維表上卷,能夠獲得產(chǎn)品銷售維表的信息;其二,切塊,切塊指的是在一定維度范圍內(nèi)切取信息的部分屬性,通過切塊處理后獲得的部分依然為立方體;其三,切片,切片指的是切取某一維度的某一或者某些屬性,獲得的部分為一個(gè)薄片。
2)數(shù)據(jù)挖掘。數(shù)據(jù)挖掘是聯(lián)機(jī)處理分析的高層階段,基于數(shù)據(jù)倉庫的支持,利用挖掘引擎能夠?qū)崿F(xiàn)對(duì)數(shù)據(jù)倉庫的信息進(jìn)行多功能分析和處理。數(shù)據(jù)挖掘想要實(shí)現(xiàn)該種功能,應(yīng)該利用獨(dú)特的挖掘知識(shí)與算法,然后結(jié)合機(jī)器學(xué)習(xí)方法、模糊倫、統(tǒng)計(jì)分析、信息論以及人工智能技術(shù)等,在提取和分析的基礎(chǔ)上,對(duì)數(shù)據(jù)信息進(jìn)行評(píng)價(jià)和處理。數(shù)據(jù)挖掘的過程包括準(zhǔn)本數(shù)據(jù)集、建模分析、結(jié)果報(bào)告、策略應(yīng)用。
數(shù)據(jù)挖掘技術(shù)在決策支持系統(tǒng)中的應(yīng)用,是基于對(duì)深層數(shù)據(jù)的分析,以此揭示大量數(shù)據(jù)中有用的、潛在的以及隱含的信息,然后為決策支持提供可靠的幫助。數(shù)據(jù)挖掘技術(shù)在決策支持系統(tǒng)中的應(yīng)用,已經(jīng)被許多大企業(yè)、大公司應(yīng)用在決策控制中,決策支持系統(tǒng)中數(shù)據(jù)挖掘的步驟表現(xiàn)為:其一,根據(jù)行業(yè)背景,了解基本數(shù)據(jù);其二,確定數(shù)據(jù)挖掘的目標(biāo);其三,選定和數(shù)據(jù)庫相對(duì)應(yīng)的數(shù)據(jù)集合;其四,采用合適的挖掘算法進(jìn)行實(shí)際數(shù)據(jù)挖掘;其五,對(duì)獲得的結(jié)果進(jìn)行評(píng)價(jià)并輸出。目前,基于數(shù)據(jù)挖掘技術(shù)的決策支持系統(tǒng)應(yīng)用的領(lǐng)域包括:氣象預(yù)報(bào)、金融風(fēng)險(xiǎn)分析、股票分析與預(yù)測(cè)、生產(chǎn)過程優(yōu)化、市場(chǎng)分析與預(yù)測(cè)等。雖然不同行業(yè)的給予數(shù)據(jù)挖掘技術(shù)的決策支持系統(tǒng)的設(shè)計(jì)存在差異,但是可以采用一種簡(jiǎn)單的模型來刻畫基本的框架,如圖2所示。在實(shí)際的決策支持系統(tǒng)中,首先應(yīng)該利用數(shù)據(jù)采集模塊、加工模塊對(duì)數(shù)據(jù)源中的所有數(shù)據(jù)載入數(shù)據(jù)倉庫中,然后采用數(shù)據(jù)挖掘、在線分析對(duì)數(shù)據(jù)倉庫中的所有數(shù)據(jù)進(jìn)行分析,為實(shí)際決策提供可靠、有效的數(shù)據(jù)信息。
圖2
總而言之,基于數(shù)據(jù)挖掘技術(shù)的決策支持系統(tǒng),很好的解決了傳統(tǒng)決策支持系統(tǒng)存在的問題,能夠?qū)崿F(xiàn)更高層次的系統(tǒng)整合,數(shù)據(jù)來源更加廣泛,集成度更高,挖掘目標(biāo)更加抽象化與細(xì)化,為決策人員快速、準(zhǔn)確的制定決策提供可靠、有效的參考。
[1]鄭得龍,李明明.基于數(shù)據(jù)挖掘的決策支持系統(tǒng)的應(yīng)用研究[J].工業(yè)控制計(jì)算機(jī),2013,26(5):119-121.
[2]杜鵑.高級(jí)決策支持系統(tǒng)中的數(shù)據(jù)挖掘技術(shù)[J].現(xiàn)代計(jì)算機(jī):下半月版,2011(16):20-23.
TP3
A
1674-6708(2015)148-0098-02