秦昌琪
(江蘇信息職業(yè)技術(shù)學(xué)院,江蘇 無錫 214000)
隨著我國電子計算機(jī)技術(shù)的不斷發(fā)展,Matlab得到了越來越廣泛的應(yīng)用,該軟件在鐵路貨運(yùn)領(lǐng)域的應(yīng)用大幅提升了貨運(yùn)量運(yùn)輸預(yù)測的準(zhǔn)確性,為鐵路資源的合理調(diào)配提供了大量的科學(xué)依據(jù)。做好SVM回歸分析的關(guān)鍵在于預(yù)測模型的設(shè)計工作,本文將對SVM預(yù)測模型的設(shè)計方案進(jìn)行重點(diǎn)介紹。
SVM即Support Vector Machine,中文為支持向量機(jī),是一種常用的回歸分析手段,本質(zhì)上特征空間上間隔最大的線性分類器[1],能夠針對未知的新樣本實(shí)施高水平的分類預(yù)測,其根本目的在于以二次規(guī)劃求解的方式來實(shí)現(xiàn)預(yù)測[2]。在鐵路貨運(yùn)量的預(yù)測方向,本次研究所提出的SVM預(yù)測模型的建立流程如下:
第一步:基于現(xiàn)有的貨運(yùn)量數(shù)據(jù)實(shí)施歸一化處理,進(jìn)而建立測試樣本數(shù)據(jù)集和訓(xùn)練樣本數(shù)據(jù)集,即通過歸一化的方式將原始數(shù)據(jù)樣本納入至[a,b]范圍內(nèi),所采用的計算公式為:
上式將原始數(shù)據(jù)記為X;將X經(jīng)過歸一化處理后的數(shù)據(jù)記為Y;將原數(shù)據(jù)樣本的最大值記為Max,將原數(shù)據(jù)樣本的最小值記為Min。
第二步:通過交叉驗證法確定核函數(shù)參數(shù)g和參數(shù)懲罰因子c[3]。設(shè)有一個核函數(shù)參數(shù)g,再隨機(jī)將訓(xùn)練集劃分為k個不相交的子集,將測試樣本鎖定為k,將訓(xùn)練樣本鎖定為除第k以外的部分,在此基礎(chǔ)上估計該參數(shù)的效果,經(jīng)過k次測試后對比結(jié)果,進(jìn)而提取出合理的參數(shù),最終所獲取的性能評價指標(biāo)為k次模型結(jié)果的MSE平均值。
第三步:在獲取最佳參數(shù)的基礎(chǔ)上學(xué)習(xí)訓(xùn)練樣本集數(shù)據(jù)[4]。
第四步:基于測試樣本數(shù)據(jù)實(shí)施預(yù)測,通過反歸一化的方式獲取數(shù)值。
第五步:對梯形預(yù)測結(jié)果進(jìn)行驗證。
為了對所建模型的預(yù)測精度及有效性進(jìn)行驗證,本次研究通過兩種檢驗標(biāo)準(zhǔn)對模型進(jìn)行了檢驗[5-6]。
(1)通過預(yù)測相對誤差對模型預(yù)測精度進(jìn)行檢驗
定義如下所示的預(yù)測相對誤差(FRE):
本次研究基于MATLAB軟件R2016a版本設(shè)計了如圖1所示的鐵路貨運(yùn)量預(yù)測流程。
圖1 SVM 預(yù)測流程
第一步:基于目標(biāo)鐵路站點(diǎn)的流量數(shù)據(jù)提取出用于預(yù)測和訓(xùn)練的貨運(yùn)量數(shù)據(jù)。
第二步:通過三角形模糊信息粒化的處理方式在鐵路貨運(yùn)量數(shù)據(jù)中提取出Up數(shù)據(jù)、R數(shù)據(jù)和Low數(shù)據(jù)。
第三步:通過交叉驗證的方式對經(jīng)過模糊?;幚淼腢p數(shù)據(jù)、R數(shù)據(jù)和Low數(shù)據(jù)進(jìn)行SVM尋優(yōu),進(jìn)而獲得RBF核函數(shù),在此基礎(chǔ)上確定參數(shù)g、c的值,再對擬合結(jié)果和誤差狀況進(jìn)行分析。
第四步:在最優(yōu)參數(shù)的基礎(chǔ)上獲取最終決策函數(shù),再針對鐵路貨運(yùn)量實(shí)施訓(xùn)練與預(yù)測,獲取Up、R和Low的值。
第五步:對模型的預(yù)測結(jié)果進(jìn)行驗證。
本次研究基于MATLAB軟件R2016a版本設(shè)計了如圖2所示的鐵路貨運(yùn)量預(yù)測流程。
圖2 相空間重構(gòu)-SVM預(yù)測流程圖
第一步:基于目標(biāo)鐵路站點(diǎn)的流量數(shù)據(jù)提取出用于預(yù)測和訓(xùn)練的貨運(yùn)量數(shù)據(jù)。
第二步:以矩陣形式對鐵路貨運(yùn)時間序列進(jìn)行轉(zhuǎn)換,明確數(shù)據(jù)之間的關(guān)系。為了充分反映系統(tǒng)的運(yùn)動特征,還需要選取合理的延遲時間τ和嵌入維m,基于經(jīng)過變形后的一維時間序列提取出輸入樣本X并用于訓(xùn)練,每一列為一個相點(diǎn)。
第三步:選取RBF核函數(shù),在對貨運(yùn)量數(shù)據(jù)進(jìn)行空間重構(gòu)處理后對SVM進(jìn)行尋優(yōu),進(jìn)而獲取參數(shù)g和參數(shù)c的值,并對誤差進(jìn)行分析。
第四步:在最優(yōu)參數(shù)的基礎(chǔ)上獲取最終決策函數(shù),再針對鐵路貨運(yùn)量實(shí)施訓(xùn)練與預(yù)測。
第五步:對模型的預(yù)測結(jié)果進(jìn)行驗證。
本文以鐵路貨運(yùn)量的SVM預(yù)測為例詳細(xì)介紹了基于計算機(jī)Matlab軟件的SVM回歸分析方法,在未來的研究中,還可以利用最小二乘法、神經(jīng)網(wǎng)絡(luò)法等方法對各種不同的特征的數(shù)據(jù)進(jìn)行更加深入的分析,以提升數(shù)據(jù)預(yù)測的準(zhǔn)確度,為科學(xué)管理提供更加有效的指導(dǎo)。