摘要:在ERP采購管理系統(tǒng)中采用DM與DB/DW緊耦合方式設(shè)計了一個開放集成的數(shù)據(jù)挖掘系統(tǒng)DMSPM。使用基于約束的交互式數(shù)據(jù)挖掘技術(shù),以提高挖掘效率和靈活性;將計算模型和工具分離,形成一個模型求解的工具箱,便于使用和維護(hù);通過人機(jī)界面和知識推理接受用戶決策需求并輸出決策結(jié)果,提供良好的交互性,從而形成一個擁有強(qiáng)大決策功能的ERP采購系統(tǒng)。
關(guān)鍵詞:數(shù)據(jù)挖掘;ERP;決策支持;采購管理
O引言
管理決策中所面臨的問題,往往目標(biāo)含糊不清,多目標(biāo)相互沖突,方案的比較和選擇沒有固定的規(guī)則或程序可循,所需的信息不全或比較模糊,同時不同的決策者的領(lǐng)導(dǎo)風(fēng)格也不完全一樣。為了把握企業(yè)運(yùn)作的整體特征和決策企業(yè)的發(fā)展戰(zhàn)略,需要建立可靠的決策支持系統(tǒng)。當(dāng)前利用企業(yè)已建ERP中大量的基礎(chǔ)信息數(shù)據(jù),實現(xiàn)決策支持已成為ERP的發(fā)展趨勢。數(shù)據(jù)挖掘DM(Data Mining)是實現(xiàn)決策支持系統(tǒng)的最佳途徑。將DM系統(tǒng)平滑集成到DB/DW系統(tǒng)中,成為信息系統(tǒng)中的一個子系統(tǒng);事務(wù)管理、查詢處理、聯(lián)機(jī)分析處理和聯(lián)機(jī)分析挖掘集成在一個統(tǒng)一框架中。這將保證數(shù)據(jù)的可獲得性,數(shù)據(jù)挖掘的可移植性、可伸縮性、并為多維數(shù)據(jù)創(chuàng)立了集成處理的環(huán)境。本文正是根據(jù)上述設(shè)想,構(gòu)建了一個可以集成在ERP系統(tǒng)中并與數(shù)據(jù)庫和數(shù)據(jù)倉庫系統(tǒng)緊耦合的數(shù)據(jù)挖掘系統(tǒng),可以進(jìn)行自動和交互探查的挖掘方式,以多種方式將挖掘結(jié)果智能地提供給決策者,使ERP系統(tǒng)具有完善的決策支持功能。
1應(yīng)用在采購管理中的數(shù)據(jù)挖掘系統(tǒng)
我們所構(gòu)建的采購管理中的數(shù)據(jù)挖掘系統(tǒng)DMSPM(Data Mining System for Purchase Management),實現(xiàn)了采購過程的決策支持功能,主要包括:
(1)聯(lián)機(jī)分析處理(0LAP)。采用多層次多維度多種操作方式對采購訂單、供應(yīng)商、物料等數(shù)據(jù)進(jìn)行分析,得到不同的匯總信息,進(jìn)而定性歸納出事物的特征描述或?qū)Ρ让枋觥?/p>
(2)自動選擇合適的供應(yīng)商,對供應(yīng)商進(jìn)行合理的評估。
(3)根據(jù)不同的要求制定采購計劃。
(4)物料價格預(yù)測、采購風(fēng)險評估以及采購屬性關(guān)聯(lián)等。
DMSPM的組成結(jié)構(gòu)如圖1所示。
DMSPM嵌入到ERP系統(tǒng)中,ERP系統(tǒng)通過ERP接口調(diào)用DMSPM中各模塊,智能顯示相關(guān)決策信息。例如可以根據(jù)預(yù)先設(shè)定參數(shù)自動生成采購計劃或引導(dǎo)決策者根據(jù)要求生成采購計劃,并提供相關(guān)信息,如供應(yīng)商信譽(yù)度、價格信息等。利用DMSPM的OLAP服務(wù),可以對多維數(shù)據(jù)集進(jìn)行上卷、下鉆等操作。DMSPM中的決策管理采用任務(wù)驅(qū)動,若要生成決策信息則可通過挖掘向?qū)Фx任務(wù),存儲在任務(wù)模型庫中,任務(wù)模型庫中預(yù)先已經(jīng)定義部分任務(wù)。任務(wù)由任務(wù)引擎分配給挖掘引擎,選擇合適的挖掘算法(如分類、關(guān)聯(lián)等)在數(shù)據(jù)集市中運(yùn)行,并將結(jié)果存儲在知識庫,將該挖掘模型存儲于PMML模型庫。知識庫中的結(jié)果由推理評估模塊評估解釋后展示出來。知識庫存放數(shù)據(jù)挖掘所需要的領(lǐng)域知識以及挖掘結(jié)果等,用戶可以通過知識管理模塊對知識庫進(jìn)行管理。
2數(shù)據(jù)倉庫和聯(lián)機(jī)分析處理OI.AP的設(shè)計
在DMSPM中,數(shù)據(jù)倉庫的構(gòu)建過程如下:
(1)概念模型設(shè)計:界定系統(tǒng)邊界,包括供應(yīng)商選擇和評估、采購計劃制定等;涉及數(shù)據(jù)有供應(yīng)商和物料目錄、價格和反饋記錄等。描述采購主題域,以訂單編號為公共碼鍵,屬性組包括物料編號、供應(yīng)商編號、發(fā)出日期、收貨日期、合格率、數(shù)量等。
(2)邏輯模型設(shè)計:采用單一粒度,直接存儲細(xì)節(jié)數(shù)據(jù);用時間屬性和物料性質(zhì)屬性來分割數(shù)據(jù),以方便實施,且與粒度劃分層次相適應(yīng)。維表和事實表主要部分設(shè)計如圖2所示。
(3)物理模型設(shè)計:采用供應(yīng)商編號和物料號作為索引字段;采購數(shù)據(jù)存放于磁盤;最優(yōu)塊大小取為4K,自動設(shè)置高速緩沖區(qū)大小,緩沖區(qū)個數(shù)可以靈活設(shè)置。
(4)數(shù)據(jù)倉庫的生成:采用Sql server2000的Analysis Services來建立采購數(shù)據(jù)集市,利用數(shù)據(jù)集成轉(zhuǎn)換工具DTS作為數(shù)據(jù)集成開發(fā)工具。從ERP數(shù)據(jù)庫中讀取數(shù)據(jù),進(jìn)行數(shù)據(jù)轉(zhuǎn)換操作,以屬性平均值填充空缺值;對噪聲數(shù)據(jù),使用分箱方法按箱中值平滑。通過腳本處理語言和存儲過程實現(xiàn)一些較復(fù)雜的數(shù)據(jù)有效性檢查等操作。
OLAP從不同角度和層次查詢滿足分析需求的數(shù)據(jù),其基本操作包括:上卷、下鉆等。本文是在ERP系統(tǒng)中調(diào)用ADO對象來操作多維數(shù)據(jù)集,直接在ERP系統(tǒng)中分析采購數(shù)據(jù)。
3任務(wù)引擎和挖掘引擎的設(shè)計
DMSPM采用任務(wù)驅(qū)動機(jī)制,由挖掘向?qū)傻娜蝿?wù)交給任務(wù)引擎,一部分任務(wù)是通過知識庫和推理評估模塊完成,另一部分是由挖掘引擎執(zhí)行,例如物料價格預(yù)測以及采購風(fēng)險評估等。任務(wù)采用類sQL語言MDL描述,其語法如下:
挖掘引擎根據(jù)MDL所描述任務(wù),選擇不同挖掘算法。因為計算模型和算法非組件化開發(fā),工作流程比較固定,缺乏靈活性,所以通過研究挖掘模型和算法,DMSPM實現(xiàn)事務(wù)和流程的分離、計算模型和工具的分離,形成一個模型求解的工具箱。將改進(jìn)過的Apdod算法、ID3算法以及k-means算法等封裝到不同類中,根據(jù)任務(wù)引擎的要求選擇不同的類來完成挖掘任務(wù)。主要挖掘任務(wù)包括物料價格預(yù)測以及采購風(fēng)險評估等。挖掘工具類的輸入?yún)?shù)由任務(wù)指定,包括候選屬性集等,輸出結(jié)果存放在知識庫中。為了實現(xiàn)數(shù)據(jù)挖掘模型的描述、管理標(biāo)準(zhǔn)化和可移植性,系統(tǒng)采用PMML定義挖掘模型,并存放在PMML模型庫中,使DMSPM的挖掘模型可以被別的挖掘系統(tǒng)所共享,實現(xiàn)模型交換。
4知識庫和推理評估模塊的設(shè)計
知識庫是推理評估模塊運(yùn)行的基礎(chǔ),它包括數(shù)據(jù)倉庫定義子庫、主題說明子庫、物料清單子庫、隸屬函數(shù)子庫、結(jié)論子庫等。其中結(jié)論子庫主要內(nèi)容是與供應(yīng)商相關(guān)的指標(biāo):一部分是挖掘任務(wù)的結(jié)果,如供應(yīng)商等級、物料價格預(yù)測等,另一部分是訂單反饋中對供應(yīng)商滿意度、交貨準(zhǔn)時性、質(zhì)量合格率等,這樣就形成了客觀挖掘和主觀評價共同形成評估供應(yīng)商的要素。結(jié)論子庫還包括通過人機(jī)界面輸入的采購要求,如價格、質(zhì)量等,這些指標(biāo)都將決定采購計劃的生成。隸屬函數(shù)子庫定義了各種模糊屬性對應(yīng)數(shù)值表示的隸屬函數(shù),將模糊的定性信息量化,以供推理評估模塊處理。推理評估模塊根據(jù)用戶的采購要求,結(jié)合局部數(shù)據(jù)倉庫中的數(shù)據(jù)和知識庫中的知識,選擇合適算法,對供應(yīng)商進(jìn)行評估以及制定采購計劃。以下算法l是對供應(yīng)商進(jìn)行評估的一種算法,算法2是制定采購計劃的一種算法。算法l(Evaluate_provider):
供應(yīng)商評估
從結(jié)論子庫提取與供應(yīng)商相關(guān)指標(biāo),將指標(biāo)按照隸屬函數(shù)定義轉(zhuǎn)換
為參數(shù)值(Pi);
提取事先設(shè)定的不同指標(biāo)所對應(yīng)的權(quán)值(wi):
將參數(shù)值和權(quán)值進(jìn)行加權(quán)相加,即評估值
記錄每個供應(yīng)商的評估值,在人機(jī)界面中顯示出來//算法1結(jié)束算法2(Purchase_plan):
//制定采購計劃
提取主生產(chǎn)計劃,根據(jù)物料清單,將產(chǎn)品分解,獲得采購物料需求量:
去除庫存中存貨量,得到物料訂貨量且按時區(qū)匯總:
將任務(wù)向?qū)Ю镏付ǖ牟少徱?,通過隸屬函數(shù)轉(zhuǎn)換為相應(yīng)采購影響因子:
For(各時區(qū)內(nèi)的各種物料){
選擇可以供應(yīng)該物料、采購提前期待舍要求并且評估值達(dá)到一定
標(biāo)準(zhǔn)的供應(yīng)商:
根據(jù)采購影響因子,計算供應(yīng)商權(quán)值:
While(物料需求量>0){
根據(jù)權(quán)值,選擇最合適的供應(yīng)商:
根據(jù)物料需求日期和該供應(yīng)商的提前期。計算出訂單發(fā)出日期:
lf(物料需求量>該供應(yīng)商最大供應(yīng)量){
物料需求量=物料需求量.該供應(yīng)商最大供應(yīng)量;
從該物料供應(yīng)商中刪除該供應(yīng)商:
}
}
}
生成采購計劃//算法2結(jié)束
5人機(jī)界面
DMSPM的人機(jī)界面是與ERP原有系統(tǒng)結(jié)合的重要接口,主要包括了以下幾個部分:
(1)決策管理:包括了采購管理中的決策信息,如供應(yīng)商評估、采購計劃、價格預(yù)測等,用戶可以看到系統(tǒng)中已定義好的決策信息,也可以生成新的決策。有的新的決策可以從推理評估模塊中獲得,有的需要利用挖掘向?qū)Ы⑿碌耐诰蚰P蛠淼玫健?/p>
(2)挖掘向?qū)В河捎跀?shù)據(jù)量總是在不斷激增,而用戶所需信息又有一定的限制范圍,因此在增加用戶交互的同時如何改進(jìn)挖掘處理效率是一個重要問題,解決這個問題的方法就是基于約束的數(shù)據(jù)挖掘,它提供了額外的控制方法,允許用戶說明和使用約束,引導(dǎo)數(shù)據(jù)挖掘系統(tǒng)進(jìn)行搜索。在挖掘向?qū)е校试S用戶自己選擇屬性集,定義領(lǐng)域知識,運(yùn)用不同挖掘算法等。由此生成任務(wù)模型,可以由任務(wù)管理保存或調(diào)出,再交給任務(wù)引擎來完成。
(3)知識管理:包括接受采購要求、修改隸屬函數(shù)、實現(xiàn)物料清單添加修改等。
(4)OLAP服務(wù)和ERP接口:OLAP服務(wù)提供接口函數(shù)操作OLAP服務(wù)器中的多維數(shù)據(jù)集,可以直接在ERP系統(tǒng)中分析采購數(shù)據(jù);ERP接口提供了一系列API函數(shù),使ERP系統(tǒng)可以通過調(diào)用這些函數(shù)將決策信息結(jié)合到ERP系統(tǒng)流程中。例如在制定采購計劃過程中,系統(tǒng)智能顯示相關(guān)決策信息,包括供應(yīng)商選擇、物料價格走勢、自動生成采購計劃等。
6結(jié)束語
數(shù)據(jù)挖掘與信息系統(tǒng)的緊密結(jié)合,增強(qiáng)了ERP的決策功能,充分滿足了用戶需求。系統(tǒng)采用基于約束的交互式數(shù)據(jù)挖掘技術(shù),提高了挖掘效率和靈活性;將計算模型和工具的分離,形成一個模型求解的工具箱,便于使用和維護(hù)。當(dāng)然,DMSPM僅僅是滿足了采購中的決策要求,如果擴(kuò)展到銷售、生產(chǎn)、人力資源等其它ERP模塊上,就可以形成一個真正完整的ERP系統(tǒng)。
(注:本文中所涉及到的圖表、注解、公式等內(nèi)容請以PDF格式閱讀原文。)