謝榮燕 ,趙明
(1.河海大學商學院,江蘇南京211100;2.海軍航空大學,山東煙臺264000)
支持向量機(Support Vector Machine,SVM),是由Vapnik提出的一種新興的基于數(shù)據(jù)學習的機器學習技術(shù),是最大間隔超平面、Mercer核、凸二次規(guī)劃、稀疏解和松弛變量等技術(shù)的集大成者。與以人工神經(jīng)網(wǎng)絡為代表的其他機器學習技術(shù)不同的是,SVM的理論基礎是統(tǒng)計學習理論,而不是傳統(tǒng)的統(tǒng)計學理論。利用SVM進行預測的應用領(lǐng)域正在逐步拓展,SVM預測方法除了在工業(yè)界得以應用外,在經(jīng)濟金融、生物學等領(lǐng)域也逐漸得到應用。支持向量機是統(tǒng)計學習理論中最核心的部分,其在回歸算法的研究方面表現(xiàn)出了極好的性能,尤其對小樣本問題有非常好的擬合效果。支持向量機(SVM)方法根據(jù)結(jié)構(gòu)風險最小化(SRM)原則,通過轉(zhuǎn)化為一個凸二次規(guī)劃問題來求解,能夠保證得到的極值就是全局最優(yōu)解,一方面可以有效地克服過學習問題,另一方面又可以防止造成維數(shù)災難,在解決小樣本學習問題上具有神經(jīng)網(wǎng)絡等方法不可比擬的優(yōu)勢。
以影響生產(chǎn)設備采購量發(fā)生的因素作為輸入,以生產(chǎn)設備采購量作為輸出,建立基于支持向量機生產(chǎn)設備采購量預測模型,其基本步驟如圖1所示。
圖1 支持向量機生產(chǎn)設備采購量預測流程
第1步,尋找與生產(chǎn)設備采購量相關(guān)的各個影響因素。影響生產(chǎn)設備采購量的因素有很多,采購量不僅與歷史需求有關(guān),而且與其他多種影響因素有關(guān),同時各影響因素相互之間的關(guān)系比較復雜。如生產(chǎn)設備運轉(zhuǎn)時間、生產(chǎn)設備綜合性能、生產(chǎn)設備的采購的難易程度等因素,都對生產(chǎn)設備采購量有不同程度的影響。
第2步,生產(chǎn)設備采購量驅(qū)動因子(描述各個影響因素的說明性變量)的選取。生產(chǎn)設備采購量驅(qū)動因子的確定原則:采購量驅(qū)動因子合乎邏輯地和各個影響因素相聯(lián)系;采購量驅(qū)動因子的變化引起生產(chǎn)設備采購量的變化具有一貫性;采購量驅(qū)動因子的量值易于確定。
第3步,對數(shù)據(jù)進行預測處理,采用支持向量機對生產(chǎn)設備采購量樣本進行學習,生產(chǎn)設備采購量驅(qū)動因子是輸入,生產(chǎn)設備采購量為輸出;并對精度進行分析,若不能達到要求的精度,重新選擇核函數(shù),若達到精度要求,生成合適的SVM預測函數(shù)。
第4步,輸入新的生產(chǎn)設備采購量情況樣本或者已有生產(chǎn)設備采購量在不同情況下的樣本,到支持向量機模型中進行生產(chǎn)設備采購量預測。
第6步,增添新的生產(chǎn)設備采購量樣本到支持向量機進行學習,不斷地提高生產(chǎn)設備采購量預測的精度。
第7步,預測生產(chǎn)設備采購量數(shù)據(jù),保存模型。
根據(jù)對某企業(yè)采購情況的分析研究,影響生產(chǎn)設備采購量的主要因素包括:生產(chǎn)設備運轉(zhuǎn)時間、生產(chǎn)設備綜合性能、生產(chǎn)設備的采購的難易程度。
(1)生產(chǎn)設備運轉(zhuǎn)時間,運轉(zhuǎn)時間越長,發(fā)生故障的概率也就越大,需要采購量增加。
(2)生產(chǎn)設備綜合性能:制造工藝、產(chǎn)品質(zhì)量等也會對生產(chǎn)設備的消耗產(chǎn)生重要的影響,生產(chǎn)設備質(zhì)量越好,平均故障間隔時間越小,生產(chǎn)設備的需要采購量就越小。
(3)生產(chǎn)設備的采購的難易程度:生產(chǎn)設備易于采購,采購時間短,則生產(chǎn)設備的儲備量就不用太多;反之,生產(chǎn)設備采購困難,采購時間長,則儲備量就要相對多一些,采購量也就更高一些。
根據(jù)此原則將生產(chǎn)設備采購量C的主要影響因素歸納為:生產(chǎn)設備運轉(zhuǎn)時間T、故障率Q,平均故障間隔時間M、不易采購的程度S。將影響生產(chǎn)設備采購的4個因素作為支持向量機的輸入?yún)?shù),將生產(chǎn)設備的采購量C作為輸出。
在上述4個影響因素中,前3個指標均為數(shù)值指標,很容易量化。而對于第4個因素,可以通過查詢生產(chǎn)設備的訂貨紀錄結(jié)合工作人員的經(jīng)驗,將這一指標轉(zhuǎn)化為0~1的數(shù)值指標,即極易容易采購則賦值為1,否則為0。
對于設備采購量的預測準確度評,可以從常用的測評價方法中選取合適的指標作為評價標準。本文選用平均絕對誤差(MAE,Mean Absolute Eror)、均方誤差(MSE,Mean Squared Error)對采購量的預測結(jié)果進行綜合評價。評價指標計算如下:
根據(jù)上述定義可知,MAE、MSE值越小,表明預測值與實際值的擬合精度越高,則需求預測的準確度越高。
以年為單位,對某生產(chǎn)設備2000年到2009年采購影響因素的相關(guān)數(shù)據(jù)進行搜集整理,結(jié)果見表1。以前9年的數(shù)據(jù)作為訓練樣本,以第10年(2009年)的數(shù)據(jù)作為測試樣本,應用基于支持向量機的生產(chǎn)設備采購模型進行采購量預測。
表1 某生產(chǎn)設備各年采購影響因素的相關(guān)數(shù)據(jù)
為了適應支持向量機的對數(shù)據(jù)的要求,減少誤差,進而更加準確的進行采購量預測,采用極差變換法分別對數(shù)據(jù)按照下列步驟進行歸一化處理:
(1)尋找各數(shù)據(jù)中的最大值和最小值,分別記為MAX,MIN;
(2)將第t年的數(shù)據(jù)Xi轉(zhuǎn)化為:
通過極差變換法,將每年影響生產(chǎn)設備采購量的相關(guān)數(shù)據(jù)均變?yōu)閷儆赱0,1]區(qū)間的值。某生產(chǎn)設備各年采購量影響因素的相關(guān)數(shù)據(jù)經(jīng)歸一化處理的結(jié)果見表2。極差變換歸一化處理并不改變各期數(shù)據(jù)之間的相對關(guān)系,因此,不會影響到采購量預測模型的構(gòu)建。
表2 歸一化某生產(chǎn)設備各年采購量影響因素的相關(guān)數(shù)據(jù)
運用支持向量機回歸原理進行該生產(chǎn)設備的采購量進行預測。選擇RBF核函數(shù)作為核函數(shù),因為RBF核函數(shù)只有一個g,再加上一個懲罰系數(shù)C,所以只需對這兩個參數(shù)進行優(yōu)化。選擇網(wǎng)格搜索法對懲罰系數(shù)C和核參數(shù)g進行優(yōu)化,參數(shù)尋優(yōu)的過程如圖2所示。當C=1024,g=0.0315時MSE取達到最小值,此時的(C,g)取值為最優(yōu)值。
由圖3可知,預測曲線與實際數(shù)據(jù)的擬合性能較好,經(jīng)計算得到MAE=0.645,MSE=0.7191,2009的采購預測值為12.316。
圖3 生產(chǎn)設備采購量預測SVM-RBF核函數(shù)
根據(jù)以上數(shù)據(jù)實驗的結(jié)果與分析,對比此種方法的MAE、MSE值及2009年的采購預測值可以得出以下結(jié)論:采用RBF優(yōu)化參數(shù)的支持向量機進行預測所得到的結(jié)果和實際值十分接近。利用支持向量機回歸理論對生產(chǎn)設備采購量進行預測,方法簡單,對數(shù)據(jù)的樣本量要求較少,預測過程比較客觀,不存在主觀因素,可以高效、準確地對采購量進行預測。因此,運用支持向量機這種新興的工具能夠較好地解決小樣本生產(chǎn)設備采購量預測問題。
采購工作是一個企業(yè)正常運轉(zhuǎn)的一項重要內(nèi)容,它與一個企業(yè)合理優(yōu)化各種資源配置密切相關(guān)。生產(chǎn)設備作為一個企業(yè)采購的核心部心,價值大、重要性高,其采購量預測模型是企業(yè)管理理論研究的一個重要領(lǐng)域。一般模型在預測采購量時通常假定其服從某種概率分布,如正態(tài)分布、泊松分布等,然后通過樣本數(shù)據(jù)進行參數(shù)估計和假設檢驗,進而得到采購預測數(shù)據(jù)。但是這類方法的理論基礎是基于樣本數(shù)目趨于無窮大的漸進理論。生產(chǎn)設備的小樣本的采購特征決定其歷史使用數(shù)據(jù)的樣本量有限,這使得對其采購量預測的難度非常大。支持向量機是基于統(tǒng)計學習理論的一種新的機器學習算法,它根據(jù)有限樣本信息在模型的復雜性和學習能力之間尋求最佳折衷,以期獲得最好的推廣能力,解決了以往學習方法中存在的小樣本、非線性、過學習、高維數(shù)、局部極小等實際問題。本文將支持向量機回歸原理應用到生產(chǎn)設備采購量預測領(lǐng)域,提出了基于支持向量機生產(chǎn)設備采購量預測的基本步驟。以實際數(shù)據(jù)為例,運用支持向量機進對生產(chǎn)設備采購量進行預測,驗證了支持向量機預測性能的先進性。