崔力文
摘 要:進入新世紀以來,世界經(jīng)濟也發(fā)展到了新的階段,企業(yè)的發(fā)展也應適應世界經(jīng)濟的發(fā)展趨勢。在信息化的今天,企業(yè)ERP系統(tǒng)作為信息化進程的重要產(chǎn)品,越來越多的企業(yè)在實施和應用。然而,隨著時間的推移系統(tǒng)中存在著大量的歷史數(shù)據(jù),這些數(shù)據(jù)占用著大量的資源,但可以利用的卻很少。數(shù)據(jù)挖掘技術(shù)可以從大量的業(yè)務數(shù)據(jù)中提取和挖掘出隱含的而又對決策有潛在價值的信息和知識,為企業(yè)制定決策支持提供依據(jù)和幫助,現(xiàn)在數(shù)據(jù)挖掘已成為企業(yè)提升管理水平保持企業(yè)持續(xù)發(fā)展的必要方法。
關鍵詞:ERP 數(shù)據(jù)挖掘 決策支持
一、前言
隨著數(shù)據(jù)時代的來臨,ERP系統(tǒng)陸續(xù)的出現(xiàn)在各個領域的企業(yè)中。隨著科技的發(fā)展,ERP系統(tǒng)的功能模塊也逐漸再完善,同時隱藏在ERP系統(tǒng)數(shù)據(jù)中的信息也越來越多,我們用常規(guī)的分析方法已經(jīng)無法獲得,通過數(shù)據(jù)挖掘技術(shù)對ERP系統(tǒng)中的業(yè)務數(shù)據(jù)進行抽取,挖掘算法的計算并從多個角度進行數(shù)據(jù)分析得出結(jié)論,為企業(yè)決策者的做出科學的決策提供可靠的支持。
二、數(shù)據(jù)挖掘技術(shù)
(一)什么是數(shù)據(jù)挖掘
數(shù)據(jù)挖掘這個詞匯對大部分人來說很陌生,目前也沒有一個明確的定義來描述它。大家認為比較確認的定義是,數(shù)據(jù)挖掘就是從大量的、未經(jīng)任何處理的數(shù)據(jù)中,提取出隱藏在其中的、不易被人們知道的、但又是對決策有用的信息等知識的過程[6]。它應該具有以下幾個特點:數(shù)據(jù)是大量的、不為人事先知道的; 挖掘出的信息是可以被接受的、易于理解的,并且是可以被應用的;在某個特定的領域挖掘出的信息是有價值的,并且是有其規(guī)律性的,可以大規(guī)模應用的、可以預測的應用。
(二)數(shù)據(jù)挖掘的過程
數(shù)據(jù)挖掘的過程一般由幾個主要的階段組成:定義挖掘目標、選擇目標數(shù)據(jù)、數(shù)據(jù)清理和處理、數(shù)據(jù)變換、數(shù)據(jù)挖掘操作、結(jié)果評估和知識決策。
(三)數(shù)據(jù)挖掘的方法
利用數(shù)據(jù)挖掘進行數(shù)據(jù)分析從不同的角度對數(shù)據(jù)進行挖掘所采用的方法也不同,常用的算法有很多種,對于不同的數(shù)據(jù)挖掘任務所采用的算法也是不同的;當然,對于同一任務也可以采用多種方法,在挖掘分析過程中所采用的算法越多,挖掘分析得出的效果也就越好。常用的數(shù)據(jù)挖掘方法只要有:分類與預測、聚類分析、關聯(lián)規(guī)則、時序模式等。
三、數(shù)據(jù)倉庫技術(shù)
關于數(shù)據(jù)倉庫的并沒有明確的定義,在我看來數(shù)據(jù)倉庫也是一種數(shù)據(jù)庫,數(shù)據(jù)倉庫系統(tǒng)是指根據(jù)需求把各種的所需的應用系統(tǒng)集合在一起,組合成一個廣泛的平臺,為歷史數(shù)據(jù)的查詢分析及信息處理提供幫助和支持。
數(shù)據(jù)倉庫的主要功能是根據(jù)挖掘目的從各個數(shù)據(jù)源中提取相關的數(shù)據(jù),對其進行清洗等相關的操作,并把這些數(shù)據(jù)統(tǒng)一存放到數(shù)據(jù)倉庫中;同時可以以此為基礎,在其上進行智能操作,比如查詢、分析等等。
數(shù)據(jù)倉庫生成的就是把業(yè)務系統(tǒng)中的關系型業(yè)務數(shù)據(jù)抽取出來,并把這些數(shù)據(jù)的進行數(shù)據(jù)處理,最后把他們加載到數(shù)據(jù)倉庫中的過程。具體步驟包括:
定義挖掘目標、數(shù)據(jù)的抽取、數(shù)據(jù)分析、數(shù)據(jù)預處理、裝載和索引等。
四、關于ERP決策支持的設計
首先要從ERP系統(tǒng)中抽取所需的數(shù)據(jù)集,抽取數(shù)據(jù)時應先考慮到需要用到那些數(shù)據(jù),然后有針對性的抽取。抽取數(shù)據(jù)時,可將不準確或者是有遺漏的數(shù)據(jù)信息刪除,并將數(shù)據(jù)轉(zhuǎn)換成與挖掘目標屬性相對應的數(shù)據(jù),這個數(shù)據(jù)可能有多種形式。當這些數(shù)據(jù)預處理后,再根據(jù)需求來源選擇相應的模式進行建模的分析,選取相應的算法進行分析處理,得出相應的結(jié)果和評估。
以某公司SAP中MM模塊為例進行功能設計;本文決策支持以供應商和采購兩個部分為例來討論,通過公司與供應商之間在某一段時間內(nèi)的采購數(shù)據(jù)分析需求進行調(diào)研,為企業(yè)選擇供應商提供量化的準確的依據(jù)。
(一)數(shù)據(jù)倉庫模型設計
數(shù)據(jù)倉庫的設計要經(jīng)過概念模型設計、邏輯模型設計和物理模型設計三個過程來實現(xiàn)。
(1)概念模型設計
確定系統(tǒng)的邊界:在SAP的MM模塊的調(diào)研決策需求中,決策者最感興趣的是供應商的評價、物資的采購方案、采購價格等內(nèi)容。為了對數(shù)據(jù)進行全方面的分析和精確的預測,我們將系統(tǒng)的邊界定為原SAP系統(tǒng)MM模塊中關于供應商的管理、采購管理和物料管理的集合。
確定主題域:在數(shù)據(jù)倉庫中的數(shù)據(jù)以主題域方式出現(xiàn)的,每一個主題對應著相應的數(shù)據(jù)類型,表示可在一個空間內(nèi)進行挖掘分析。根據(jù)該公司SAP系統(tǒng)中MM模塊的結(jié)構(gòu)和相關需求進行分析,確定了本論文研究的基本主題為供應商主題、物資采購主題和物料主題。
(2)邏輯模型設計
邏輯模型設計就是每個主題是怎樣實現(xiàn)的,并且對這個實現(xiàn)的過程進行定義,然后將這個實現(xiàn)過程的相關內(nèi)容記錄在數(shù)據(jù)倉庫的數(shù)據(jù)中。這里就不做過多的介紹,本文只對物資采購主題域的邏輯模型設計作為示范,其它主題域的邏輯設計類似完成。建立物資采購主體模型包括:選取業(yè)務數(shù)據(jù)、定義粒度和維度、 確定事實和維。
(3)物理模型設計
數(shù)據(jù)倉庫的物理數(shù)據(jù)模型主要是確定數(shù)據(jù)將采用什么樣的結(jié)構(gòu)進行存儲,采用什么樣的數(shù)據(jù)搜索策略、以及該數(shù)據(jù)應該存儲在什么地方等問題。其中包括:
確定數(shù)據(jù)的搜索策略、確定數(shù)據(jù)的存儲位置。
(二)數(shù)據(jù)建模分析
在對物資采購數(shù)據(jù)中與供應商的相關的信息(如供貨日期、供貨金額及供貨及時率)進行預處理后,將對其數(shù)據(jù)進行數(shù)據(jù)挖掘及算法的選擇。根據(jù)其數(shù)據(jù)的特點,在此我選擇聚類分析的算法對供應商相關的數(shù)據(jù)進行分析。該算法可以挖掘中不同供應商所隱含的一些信息。根據(jù)挖掘出的信息企業(yè)就可以針對不同的供應商采取不同的采購原則和策略。可以加大同對企業(yè)貢獻度較大的供應商的合作,同時也可以使一些貢獻度較低的供應商通過一些措施發(fā)展成貢獻度較高的供應商。
基于供應商相關數(shù)據(jù)集的聚類分析,可以按照以下步驟進行:
(1)先確定一個聚類算法在此我選擇的是K-Means算法,用該算法對供應商數(shù)據(jù)集進行聚類分析,把該數(shù)據(jù)集命名為D劃分為若干個類,命名類為C(C=(C1,C2…Cn))。其中,D=C1∪C2∪…∪Cn。
(2)選取供貨日期、供貨金額和供貨及時率三個指標作為輸入變量,應用聚類分析算法K-Means進行聚類分析。
(3)對于每一個Ci (i=1,2,…n),根據(jù)其中成員的特點,歸納出能夠描述其特征的一條或幾個規(guī)則。然后對規(guī)則進行評判,若聚類分析的結(jié)果的可信度比較高,則可在實際的工作中將聚類的結(jié)果加以應用,否則,可以選擇其它聚類的算法再次進行分析。
這樣,我們就實現(xiàn)了對供應商的細致劃分,就可以根據(jù)不同類型的供應商采取相應的采購策略了。
五、結(jié)語
隨著信息時代的來臨,各個公司在ERP系統(tǒng)投入了大量的人力物力以及財力,ERP系統(tǒng)本身也更新?lián)Q代多次,系統(tǒng)中留存著大量的歷史業(yè)務數(shù)據(jù)?,F(xiàn)在這些數(shù)據(jù)一直未能合理的利用起來,企業(yè)的各級決策者還是依靠自己的經(jīng)驗來做決策,這樣的決策缺乏科學依據(jù)?,F(xiàn)在的時代是信息時代、是數(shù)據(jù)的時代,為了避免這些大量的數(shù)據(jù)繼續(xù)沉睡,為了使這些數(shù)據(jù)能為決策者提供科學的、有價值的決策依據(jù),利用數(shù)據(jù)挖掘技術(shù)對ERP數(shù)據(jù)進行挖掘增加決策支持功能的必要性是不言而喻的。
參考文獻:
[1] 譚躍進,黃金才,朱承等.決策支持系統(tǒng).電子工業(yè)出版社,2011.6.12-15.
[2] 范明,孟小峰.數(shù)據(jù)挖掘概念與技術(shù).北京:機械工業(yè)出版社,2013.6.32-36.