汪 明 李少波 傅 廣 馬 旺
(1.貴州大學機械工程學院 貴陽 550000)
(2.貴州大學公共大數(shù)據(jù)國家重點實驗室 貴陽 550000)
采購經(jīng)理指數(shù)(PMI)最早起源于20 世紀30 年代,它是通過對采購經(jīng)理或者企業(yè)采購的主要負責人的月度問卷調查結果匯總計算得到的。國家統(tǒng)計局以及相關的機構每個月都會進行調查并且公布在國家統(tǒng)計局的網(wǎng)站上。中國PMI 指標體系和國際上主要國家PMI 體系基本相同[1]。作為國際上慣用的監(jiān)測宏觀經(jīng)濟的先行性指標之一,PMI具有很強的預測性,涉及《國民經(jīng)濟行業(yè)分類》(GB/T4754-2017)中制造業(yè)的31個行業(yè)大類,3000家調查樣本。它幾乎涵蓋了企業(yè)生產、運輸、采購、雇員、配送等企業(yè)運轉的每一個流程,可以衡量一個國家的生產情況,就業(yè)情況以及物價表現(xiàn)。是反映經(jīng)濟增長與衰退的晴雨表[2]。同時對于政府來說,通過采購經(jīng)濟指數(shù)也便于為監(jiān)督和決策工作提供依據(jù)[3~4]。采購經(jīng)理指數(shù)一般分為制造業(yè)采購經(jīng)理指數(shù)、非制造業(yè)采購經(jīng)理指數(shù)以及綜合采購經(jīng)理指數(shù)。采購經(jīng)理指數(shù)以50%作為國家經(jīng)濟形勢的分界線(榮枯線),PMI>50%表示經(jīng)濟總體擴張,多數(shù)企業(yè)愿意生產,企業(yè)營收可觀,此時企業(yè)可擴大生產規(guī)模,新建生產線,招聘更多的員工,經(jīng)濟總體趨勢向好。PMI<50%表示經(jīng)濟總體收縮,多數(shù)企業(yè)不想生產,生產和銷售不成正比,庫存積壓嚴重,企業(yè)可能面臨裁員的風險,經(jīng)濟在衰退。對于大多數(shù)的中小生產企業(yè)而言,PMI主要可以反映各企業(yè)目前的營運狀況,可以為企業(yè)的生產經(jīng)營提供依據(jù),更能有助于企業(yè)管理層預測行業(yè)未來的經(jīng)濟的趨勢。在如今高速發(fā)展的社會,企業(yè)如果能更快地掌握行業(yè)經(jīng)濟形式,就能減少“牛鞭效應”,提前布局,提前規(guī)劃[5]。更合理地安排企業(yè)生產運行的各個環(huán)節(jié),提升企業(yè)的整體競爭性。而企業(yè)新建生產線擴大產能需要的時間較長,所以根據(jù)歷史的PMI值預測未來的PMI 值對于企業(yè)來說尤為重要。對于PMI 的預測可以為企業(yè)規(guī)劃布局提供理論依據(jù)及參考。本文通過PSO-SVM 算法對PMI 進行了預測,并且對比了PSO-SVM 算法與傳統(tǒng)SVM 算法的預測準確性。
支持向量機的非線性回歸問題就是擬合一條曲線y=f(x),使訓練的樣本基本擬合在一條曲線上。它是依靠一個非線性映射將數(shù)據(jù)映射到一個高維空間,再到高維空間進行線性回歸[6]。在本文中假設有一組訓練樣本信號集(xi,yi),i=1,2,…,N,其xi∈Rn,yi∈Rn,N為樣本的數(shù)量。通過一個映射函數(shù)Φ(x)實現(xiàn)從低維空間到高維空間的非線性映射。函數(shù)f(x)轉換為如下形式[7]:
式中,y為輸出向量;x為輸入向量;W為權重系數(shù);b為偏置項;Φ(x)為輸入向量在高維空間上的映射函數(shù)。
因為預測值和實際值之間會有偏差,所以引入不敏感損失函數(shù)ε:
式中,f(x,w)為SVM 的預測值;y為樣本集的真實值;w為權重參數(shù)。
假設在支持向量機回歸學習的精度ε下,所有樣本表示為
函數(shù)的回歸最優(yōu)化問題等價于如下函數(shù)最小化問題:
在SVM 訓練學習中,非線性擬合曲線會存在一定的偏差,為了適應這種偏差,需要添加一個松弛變量ξi[8]。如圖1所示,松弛變量添加后擬合曲線更加精確。此外,還需要引入懲罰系數(shù)C,并且在引入一個懲罰系數(shù)C后,此時函數(shù)的回歸最優(yōu)化問題變?yōu)?/p>
圖1 SVM非線性擬合曲線
懲罰系數(shù)C對支持向量機的預測準確率有較大的影響,所以懲罰系數(shù)C的選取尤為重要。
為了求解最優(yōu)化問題,在引入拉格朗日乘子對偶參數(shù)αi、和徑向核函數(shù)k(xi,xj)后,式(5)這個具有線性不等式約束的二次規(guī)劃最優(yōu)問題可以轉化為如下問題[9]。
由于高斯徑向基(RBF)核函數(shù)計算量小,運算快,收斂區(qū)間寬,適用于小樣本的數(shù)據(jù)處理。所以本文采用RBF核函數(shù),RBF核函數(shù)如下所示[10]:
式中σ為核參數(shù),對支持向量機的預測準確率也有較大影響,通常選取的C和σ不能確保支持向量機預測的準確率,所以我們引用粒子群算法對參數(shù)C和σ進行尋優(yōu)。引入核函數(shù)后求解最優(yōu)回歸函數(shù)表達式為
粒子群優(yōu)化(Particle Swarm Optimization,PSO)算法是Kennedy 和Eberhart 在1995 年提出的一種群智能優(yōu)化算法[11]。粒子群算法是受鳥類在覓食的過程中個體和整體行為規(guī)則的啟發(fā),在PSO算法中個體最優(yōu)值是個體經(jīng)過的最佳位置,全局最優(yōu)值是種群覓食過程中的最佳位置。在不斷的迭代過程中,每個粒子會根據(jù)個體最優(yōu)值和全局最優(yōu)值更新自己的速度和位置[12]。算法經(jīng)過隨機初始化后,每個粒子按如下式(9)和式(10)進行迭代,直到滿足收斂準則:
式中,為粒子i在上一次迭代結束后的速度且,在迭代過程中如果粒子的速度超過了vmax,則認為粒子的最大速度為vmax;表示粒子i在任意t+1 時刻的速度和位置的更新;為粒子在i時刻的位置;w為慣性權重;c1為認知參數(shù);c2為社會參數(shù);為個體i在迭代過程中的歷史最優(yōu)位置;gbestt為迭代過程中所有粒子的全局最優(yōu)位置。粒子群優(yōu)化算法流程如圖2 所示,通過不斷迭代更新個體最優(yōu)位置和種群最優(yōu)位置來滿足迭代條件。
圖2 粒子群優(yōu)化算法流程
用粒子群算法優(yōu)化SVM,實際上就是優(yōu)化參數(shù)懲罰系數(shù)C和核參數(shù)σ[13~15],其尋優(yōu)過程如下:
1)生成訓練的樣本,進行歸一化處理到[0,1]區(qū)間,并劃分數(shù)據(jù)集。
2)初始化參數(shù)C1、C2以及最大進化數(shù)量、種群最大數(shù)量等參數(shù)。
3)通過更新粒子的速度、位置等參數(shù)尋優(yōu)SVM。
4)利用最新得到最優(yōu)懲罰參數(shù)C與核參數(shù)σ重新訓練一次支持向量機。
5)用訓練的PSOSVM對數(shù)據(jù)進行預測。
本文用Matlab2019 進行實驗仿真,對比PSOSVM 與SVM 的預測準確率。采取的實驗數(shù)據(jù)來自于國家統(tǒng)計局[16]。本實驗選取了從2016年12月到2021 年3 月的月度制造業(yè)采購經(jīng)理指數(shù),共計52個實驗數(shù)據(jù),分成13 組。用前四個月的制造業(yè)采購經(jīng)理指數(shù)預測后四個月的采購經(jīng)理指數(shù),原始數(shù)據(jù)如表1所示,歸一化處理后的數(shù)據(jù)如表2所示。
表1 原始數(shù)據(jù)
表2 歸一化處理后的數(shù)據(jù)
在只運用傳統(tǒng)支持向量機的情況下用Matlab進行仿真結果如圖3。
圖3 SVM仿真結果
可以看出雖然SVM 能預測指數(shù)的漲跌情況,但是預測結果與真實結果存在了一定的差異。這些差異就是沒有尋優(yōu)懲罰系數(shù)C和核參數(shù)σ所導致的。利用2.3 節(jié)中的訓練方法,設置粒子群算法尋優(yōu)的基本參數(shù),設置最大迭代次數(shù)K=100 次,種群最大數(shù)量sizepop 為20 個,種群最大進化數(shù)量為200 個。認知參數(shù)C1 的初始值為1.5,社會參數(shù)C2的初始值為1.7。用Matlab 進行適應度尋優(yōu)迭代過程如圖4。
圖4 PSOSVM尋優(yōu)曲線
由圖4 可知此預測模型迭代到50 次左右達到最優(yōu)值。根據(jù)此模型,在尋優(yōu)最優(yōu)參數(shù)的基礎上,對SVM進行仿真結果如圖5。
圖5 PSOSVM仿真結果
可以看出PSO-SVM 的每次一的預測結果都比SVM 預測結果更加接近真實值,PSO-SVM 的預測準確率較高,與真實值差異小。
制造業(yè)企業(yè)需要能夠時刻調整自己的生產規(guī)劃來適應市場的需求變化,PMI以其可靠性為企業(yè)提供了參考。通過對支持向量機參數(shù)的尋優(yōu),PSO-SVM 算法能夠大致判斷PMI 的漲跌情況,預測值與實際值相差不大,且PSO-SVM 算法具有較強的穩(wěn)定性,收斂速度也比傳統(tǒng)SVM 快,相比于傳統(tǒng)SVM,PSO-SVM 算法能夠提供更精準地預測來滿足企業(yè)的需求。