顧清華,馬平平,閆寶霞,盧才武,陳 露
(1.西安建筑科技大學資源工程學院,陜西 西安 710055;2.中國有色金屬工業(yè)西安勘察設計研究院有限公司,陜西 西安 710043;3.西安建筑科技大學管理學院,陜西 西安 710055)
近些年,在許多露天礦中已經(jīng)開始應用露天礦卡車調(diào)度系統(tǒng)[1-3],并通過不斷優(yōu)化卡車調(diào)度系統(tǒng)[4],來降低運營成本和提高采礦效率[5]。卡車調(diào)度系統(tǒng)的運行是基于卡車調(diào)度模型和卡車動態(tài)調(diào)度規(guī)則,而這些動態(tài)調(diào)度規(guī)則嚴重依賴于精確的卡車行程時間預測[6-8]。所以,精準的卡車行程時間預測是提高卡車調(diào)度效率的重要途徑。
多年來,國內(nèi)外學者一直致力于研究露天礦卡車行程時間預測。孫慶山[9]提出的多型號卡車運輸?shù)牡V山路段運行時間統(tǒng)計模型,利用統(tǒng)計的卡車行程時間的平均值作為預測值,其難以準確有效地預測行程時間;張瑩等[10]采用非平穩(wěn)時間序列ARIMA模型對道路運行時間、電鏟裝車時間等時間參數(shù)進行預測,這類模型只考慮路段距離長短對行程時間預測的影響,存在預測精度低、實時性差的問題;白潤才等[11]提出了多影響因素下的神經(jīng)網(wǎng)絡(ANN)行程時間預測函數(shù)模型,考慮了道路狀況、卡車類型和卡車裝載狀態(tài)等因素,證明了行程時間預測函數(shù)是復雜的非線性函數(shù)關系;李建剛等[12]建立的基于模糊神經(jīng)網(wǎng)絡推理系統(tǒng)(ANFIS)的實時動態(tài)預測模型,提高了網(wǎng)絡模型的精度和收斂速度;ERARSLAN[13]開發(fā)了一個計算機輔助系統(tǒng)來估算不同阻力的速度,通過道路長度除以卡車速度得到卡車行駛時間;王強等[14]利用stat:Fit軟件對露天礦卡車調(diào)度關鍵時間參數(shù)的概率分布進行了研究,結(jié)果顯示道路運行時間符合正態(tài)分布,電鏟裝車時間符合對數(shù)正態(tài)分布,卸載時間可看做一個穩(wěn)定的常數(shù);薛雪等[15]針對卡車行程時間實時性,預測精度不足的問題,提出了一種基于最小二乘支持向量回歸(LS-SVR)的選擇性集成學習算法,解決了露天煤礦實時調(diào)度中的行程時間預測問題;孟小前[16]針對是否需要將路徑進行劃分來預測行程時間的問題,建立BP神經(jīng)網(wǎng)絡和支持向量機SVM模型進行對比研究,研究結(jié)果表明分路段情景下的模型可以取得更好的預測效果,且SVM模型的精度高于BP模型;SUN等[17]將機器學習方法與大數(shù)據(jù)相結(jié)合預測露天礦卡車調(diào)度時的實時鏈路行程時間,其考慮氣象特征因素影響后,預測精度提高了5.13%。
上述預測模型各有其自身的特點,但在行程時間預測的精度和實時性方面仍有所欠缺,本文在以上成果的基礎上,采用具有完備理論體系的支持向量機(support vector machine,SVM)作為建模理論基礎,利用遺傳算法優(yōu)化支持向量機的懲罰函數(shù)C、核參數(shù)g和損失函數(shù)ε。在此基礎上建立了基于HGSVMA模型的露天礦卡車行程時間預測模型,選取卡車狀態(tài)、速度、載重量、路面坡度、路面類型、起終點長度、轉(zhuǎn)彎次數(shù)、時段和是否降雨作為自變量,行程時間作為因變量。采用HGSVMA模型進行訓練預測,并將該模型的預測結(jié)果與GS-SVM模型、PSO-SVM模型和GA-SVM模型的預測結(jié)果進行對比分析。
SVM算法最初于20世紀90年代由CORTES和VAPNIK提出[18],該算法用于回歸預測的主要思想是建立一個分類超平面作為決策曲面,將樣本數(shù)據(jù)映射到高維特征空間進行線性回歸,從而求解出多影響因素下的最優(yōu)回歸函數(shù)。
(1)
通過引入拉格朗日函數(shù)可將其轉(zhuǎn)換為以下對偶形式,見式(2)。
(2)
考慮特征映射,將支持向量機的核函數(shù)K(xi,xj)=φ(xi)×φ(xj)代入得到式(3)。
(3)
本研究選擇徑向基核函數(shù)(RBF)進行預測。徑向基核函數(shù)表達式見式(4)。
K(xi,xj)=e-g‖Xi-X‖2
(4)
式中,g為核函數(shù)參數(shù)。
首先,利用訓練樣本數(shù)據(jù)集對SVM模型進行訓練,得出預測值與實際值之間的平均絕對誤差;然后將該誤差的倒數(shù)作為算法適應度函數(shù),通過遺傳算法的選擇、交叉、變異進行迭代尋優(yōu),在迭代過程中,搜索SVM的關鍵參數(shù)C、g和ε;最后,建立基于HGSVMA模型的露天礦卡車行程時間預測模型進行預測。 其基本流程如圖2所示,基本步驟如下所述。
1) 初始化參數(shù)。種群規(guī)模M,種群中個體的交叉概率Γ,變異概率ψ,最大迭代次數(shù)T,懲罰函數(shù)C、核參數(shù)g和損失函數(shù)ε變化范圍。
2) 初始化種群。首先利用遺傳算法先生成一個種群,將這個種群中的每個個體進行解碼再生成SVM的初始化參數(shù)。
3) 建立SVM模型計算行程時間預測結(jié)果,計算預測值與真實值之間的誤差。
4) 計算個體適應度值Fi,見式(5)。訓練SVM模型,以真實值與預測值誤差絕對值平均值的倒數(shù)即平均絕對誤差(MAE)的倒數(shù)作為適應度值。
(5)
5) 執(zhí)行選擇操作,采用精英個體保留策略將優(yōu)良個體直接保存下來。首先,從步驟4中計算的適應度值中選擇適應度值最高的個體直接遺傳到下一代群體中;其次,再計算剩余個體的適應度總和S(式(6)),以及個體的選擇概率Pi(式(7));最后,通過計算個體的累積概率,按照輪盤賭的方式選擇被選個體進入子代種群(式(8))。
(6)
(7)
(8)
6) 執(zhí)行交叉操作,采用次序交叉策略對基因加以替換重組而產(chǎn)生新個體。首先,隨機選擇一對染色體(父代)中基因片段交叉的起止位置(相同位置);其次,生成與被選中的基因和父代在同一位置的子代;最后,找出選中基因在另一個父代中的位置,然后在子代中依次放置其余基因。如圖1所示。
圖1 次序交叉策略實例Fig.1 Example of sequential crossover strategy
(9)
式中:λ為[0,1]之間的隨機數(shù);a和b分別為個體xi的下界和上界。
8) 對訓練個體進行選擇、交叉、變異操作后得到的新一代進化種群個體,經(jīng)過反編碼得到SVM新參數(shù),輸入到SVM行程時間預測模型中進行預測,得到預測結(jié)果。
9) 如果預測結(jié)果與實際值之間的誤差達到設定的精度或達到最大迭代次數(shù),算法終止,輸出預測結(jié)果;否則,返回步驟三循環(huán)執(zhí)行,直到滿足條件,算法終止。
HGSVMA模型流程圖如2所示。
研究以構(gòu)建河南某大型露天礦卡車調(diào)度模型為背景,并為解決卡車在車流規(guī)劃模型中的行駛時間預測問題展開。本研究根據(jù)文獻[9]和文獻[10]選取卡車狀態(tài)x1、速度x2、載重量x3、路面坡度x4、路面類型x5、起終點長度x6、轉(zhuǎn)彎次數(shù)x7、時段x8和是否降雨x9共9個因素作為輸入變量,行程時間作為輸出變量。
在卡車智能調(diào)度生產(chǎn)系統(tǒng)平臺中,選取該礦區(qū)2018年8月5輛電動卡車的1 478 746條歷史GPS軌跡數(shù)據(jù)為基礎數(shù)據(jù),并在中國氣象局(CMA)57077號監(jiān)測站提取該月的氣象數(shù)據(jù)。為了消除各數(shù)據(jù)特征間由于量綱不同、原始樣本數(shù)量級之間較大差異和算法的收斂速度不同所造成的影響,對特征影響因子進行線性歸一化處理,利用式(10)將影響因子統(tǒng)一映射到[0,1]區(qū)間內(nèi);通過數(shù)據(jù)預處理總共得到3 410組數(shù)據(jù),將數(shù)據(jù)集進行隨機排序,按7∶3比例分為訓練數(shù)據(jù)集和測試數(shù)據(jù)集,帶入模型中進行訓練預測。數(shù)據(jù)見表1。
(10)
圖2 HGSVMA模型流程圖Fig.2 Flow chat of HGSVMA model
表1 行程時間預測示例數(shù)據(jù)Table 1 Example data of travel time prediction
卡車狀態(tài)x1分為空車和重車,分別用0和1表示;路面坡度x4可以在[-8,+8]中取值(“+”表示上坡;“-”表示下坡);路面類型x5分為干線和半干線兩種類型,分別用0和1表示;降雨x9分為無降雨和有降雨,分別用0和1表示。
本文選取3項評價指標對預測結(jié)果進行評價對比,分別為絕對誤差(MAE)、平均絕對百分比誤差(MAPE)和平均平方誤差(MSE),其評價指標公式為式(11)~式(13)。其中,MAE和MAPE評價算法的精度,MSE評價算法的穩(wěn)定性。
(11)
(12)
(13)
本研究使用Matlab9.4.0.813654(R2018a)進行仿真實驗,選取SVM模型的核函數(shù)為徑向基核函數(shù)。設置模型參數(shù)如下:初始化種群規(guī)模M=20,個體的交叉概率Γ=0.4,變異概率ψ=0.1,最大迭代次數(shù)T=100,學習因子c1=1.5,c2=1.7;慣性權(quán)重0.6;交叉驗證參數(shù)5;懲罰函數(shù)C變化范圍[0,100];核參數(shù)g變化范圍[0,1 000];損失函數(shù)ε變化范圍[0.01,1]。
根據(jù)建立的HGSVMA露天礦卡車行程時間預測模型,HGSVMA模型在經(jīng)過100次進化計算得到的最佳適應度曲線如圖3所示。
圖3 適應度曲線Fig.3 Fitness curve
由圖3可知,迭代曲線最佳適應度在進化到5代后就逐漸趨于平穩(wěn),說明改進后的算法能克服標準SVM不能克服的過學習問題,可認為近似達到最優(yōu)解,此時適用于HGSVMA模型的最佳懲罰項C、核函數(shù)參數(shù)g與損失函數(shù)參數(shù)ε的值分別為62.60、0.77和0.01。將這三個參數(shù)代入SVM模型中,對測試數(shù)據(jù)集進行預測,得到測試結(jié)果如圖4所示。
由圖4(a)為HGSVMA模型的預測擬合效果,圖4(b)為每一樣本數(shù)據(jù)與HGSVMA模型預測結(jié)果之間的絕對誤差值,可以看出其絕對誤差介于0~0.06之間,誤差相對較小。表明HGSVMA模型可以較好地擬合測試數(shù)據(jù)集。
為驗證改進的參數(shù)優(yōu)化算法對模型擬合精度和收斂性的優(yōu)化效果,同時與GS-SVM、GA-SVM和PSO-SVM三組模型用于露天礦卡車行程時間預測的性能進行比較,其部分預測結(jié)果見表2和圖5。
圖4 HGSVMA模型預測結(jié)果Fig.4 Prediction results of HGSVMA model
表2 不同預測模型回歸結(jié)果比較(部分)Table 2 Comparison of regression results of different prediction models(part)
圖5(a)為HGSVMA模型和GS-SVM模型、GA-SVM模型和PSO-SVM模型對測試數(shù)據(jù)集的擬合效果;圖5(b)為每一樣本數(shù)據(jù)與不同模型預測結(jié)果之間的絕對誤差值。從圖5可以看出,HGSVMA模型的絕對誤差值相對最小,而PSO-SVM模型的誤差值最大,GS-SVM模型次之。表明HGSVMA模型可以較好地擬合測試數(shù)據(jù)集。
為了進一步比較模型預測性能的優(yōu)劣,通過使用模型計算得出的MAE、MAPE和MSE評價指標值見表3。
圖5 不同模型預測效果(部分)Fig.5 Prediction results of different models(part)
表3 預測結(jié)果比較Table 3 Comparison of prediction results
預測精度方面,通過比較表3中各模型的MAE和MAPE值可知,HGSVMA模型精度最高,GA-SVM模型次之,MAE和MAPE指標均較GA-SVM模型提高了81.67%和81.17%。表明HGSVMA模型可以明顯提高預測露天礦卡車行程時間的準確性。
預測可靠性方面,通過比較表3中各模型的MSE值可知,HGSVMA模型的可靠性最高,GA-SVM模型次之,HGSVMA模型的可靠性較GA-SVM模型提高了10.45%。表明HGSVMA模型可以明顯提高預測露天礦卡車行程時間的可靠性。
為進一步驗證模型在行程時間預測方面的實時性,對樣本數(shù)據(jù)集進行了100次的重復實驗,并記錄實驗的運行時間。最后50次實驗的運行時間如圖6所示。
由圖6可以看出,GS-SVM模型和PSO-SVM模型的運行時間隨機性相對較大,而GA-SVM模型和HGSVMA模型的運行時間相對較平穩(wěn)。由于在露天礦卡車實時調(diào)度過程中,調(diào)度系統(tǒng)需要平穩(wěn)運行,并且響應時間要盡量短。因此,基于HGSVMA模型可以很好地滿足這些條件,以解決卡車行程預測問題。
圖6 樣本數(shù)據(jù)重復實驗運行時間Fig.6 Sample data repeated experiment run time
針對露天礦卡車行程時間預測問題,本文利用遺傳算法全局并行搜索優(yōu)化的特點,對SVM參數(shù)進行尋優(yōu),建立了基于HGSVMA模型的露天礦卡車行程時間預測模型。利用從某大型露天礦卡車調(diào)度系統(tǒng)所采集的卡車行程時間進行仿真模擬,結(jié)果表明:HGSVMA模型與GS-SVM模型、PSO-SVM模型和GA-SVM模型相比,其MAE、MAPE和MSE指標平均提高了78.71%、84.13%和60.58%,表明HGSVMA模型具有很高的預測精度。下一步擬將本文的露天礦卡車行程時間預測模型應用到露天礦卡車調(diào)度系統(tǒng)中,這將有助于提高露天礦卡車的調(diào)度效率。