魏書禾
(東北財(cái)經(jīng)大學(xué) 國(guó)際商學(xué)院,遼寧 大連 116021)
近年來(lái),我國(guó)生豬價(jià)格始終以一種令人難以預(yù)料的方式頻繁波動(dòng)著,嚴(yán)重影響著國(guó)民生產(chǎn)生活的秩序。因此,對(duì)生豬價(jià)格進(jìn)行有效的預(yù)測(cè)是十分必要的。
目前,國(guó)內(nèi)外許多學(xué)者從不同的層面,多維度、多視角對(duì)生豬價(jià)格趨勢(shì)和變化程度進(jìn)行了刻畫——對(duì)生豬價(jià)格波動(dòng)的機(jī)理進(jìn)行剖析,從而提出穩(wěn)定生豬價(jià)格的相應(yīng)機(jī)制,得出結(jié)論:生豬價(jià)格的波動(dòng)是多因素疊加的產(chǎn)物。隨著科技的發(fā)展,生豬價(jià)格預(yù)測(cè)的模型和方法有了很大程度的發(fā)展和提高,應(yīng)用生豬價(jià)格預(yù)測(cè)模型的有多元回歸分析模型、灰色模型、神經(jīng)網(wǎng)絡(luò)模型、支持向量機(jī)模型、ARIMA、VAR等單一的模型[1-11]。這些模型均為基于線性時(shí)間序列的估計(jì)模型,而生豬價(jià)格還是一種多種因素影響的非線性動(dòng)力學(xué)過(guò)程,線性估計(jì)模型對(duì)其運(yùn)行規(guī)律預(yù)測(cè)的精準(zhǔn)度較低。ARIMA模型屬于時(shí)間序列預(yù)測(cè)法,具有建模簡(jiǎn)單的優(yōu)點(diǎn),能夠很好地刻畫生豬價(jià)格序列中的線性變化特征,但其對(duì)非線性變化特征的描述會(huì)產(chǎn)生一定的誤差;支持向量機(jī)回歸(support vector machine regression,SVR)模型具有出色的非線性擬合性能,可以準(zhǔn)確地?cái)M合生豬價(jià)格序列中的非線性變化特征[12]。同時(shí)存在線性和非線性數(shù)據(jù)模式,就可采用ARIMA和SVR的組合,即ARIMA-SVR混合模型[13]。
調(diào)研近年文獻(xiàn)發(fā)現(xiàn),ARIMA-SVM模型已應(yīng)用于飛機(jī)發(fā)動(dòng)機(jī)的使用壽命預(yù)測(cè)[14]、短期風(fēng)力預(yù)測(cè)[15]、干旱預(yù)測(cè)[16]、黃金價(jià)格預(yù)測(cè)[17]和電力負(fù)荷預(yù)測(cè)[18]等方面,但在生豬價(jià)格中的應(yīng)用尚未發(fā)現(xiàn)。本文根據(jù)2020年1月19日-2021年1月31日生豬價(jià)格日數(shù)據(jù),采用ARIMA及SVR模型分別研究生豬價(jià)格變化趨勢(shì)的線性、非線性部分。接著將線性建模結(jié)果與非線性預(yù)測(cè)得到的殘差相結(jié)合,得出結(jié)果即采用ARIMA-SVR模型預(yù)測(cè)的生豬價(jià)格。最后在與對(duì)比模型的比對(duì)下,通過(guò)判斷模型預(yù)測(cè)評(píng)價(jià)指標(biāo)的大小,得出ARIMA-SVR能夠更為精確地預(yù)測(cè)生豬價(jià)格的變化趨勢(shì)。
在ARIMA模型用于時(shí)間序列時(shí),要求序列必須是平穩(wěn)的。如果序列不平穩(wěn),則必須多次差分將其平穩(wěn)化。多階整體也就是通過(guò)多次差分變換的非平穩(wěn)時(shí)間序列。ARIMA(p,d,q)中,p、q被稱為自回歸項(xiàng)的滯后階數(shù)和移動(dòng)平均項(xiàng)的滯后階數(shù),差分時(shí)間序列使其平穩(wěn)化所造成的次數(shù)用d表示,ARIMA(p,d,q)被稱為差分自回歸移動(dòng)平均模型[8],模型一般的表示方法為:
若線性函數(shù)含隨機(jī)擾動(dòng)項(xiàng),可用ARIMA模型的表示法來(lái)表示ARIMA模型,由以下等式可以確定式中Ψ1,Ψ2,…,的值:
時(shí)間序列一般分為4種類型,在識(shí)別的基礎(chǔ)上,構(gòu)建對(duì)應(yīng)的時(shí)間序列模型,對(duì)相應(yīng)的特征模型進(jìn)行平滑化,進(jìn)而建立對(duì)應(yīng)的特征模型,其模型為:
支持向量機(jī)的原理是確定特定的核函數(shù)(Kernel)使得特征空間能夠得到擴(kuò)展,這樣做的目的是為了做線性可分情況的分析。但是對(duì)于線性不可分割的情況,要使用線性算法處理樣本的非線性特征,最終使得樣本在高維特征空間中能實(shí)現(xiàn)線性可分[9],其表達(dá)式為:
其中,f(X)為預(yù)測(cè)值,ω為權(quán)值向量,b為偏置向量,且ω,b都是可變的。如上所述,支持向量機(jī)做預(yù)測(cè)方法的目的是盡量減少經(jīng)驗(yàn)風(fēng)險(xiǎn)。
對(duì)公式(8)展開說(shuō)明,可表示為:
其中,給出了解具有不等式約束的二次最優(yōu)化問(wèn)題后的方程式的參數(shù)向量W,其表達(dá)式為:
其中,將核函數(shù)表示為K(Xi,Xj),特征空間φ(Xi)中的向量Xi與φ(Xi)中的Xj二者的內(nèi)積被稱為核的值,公式表示為:
本文將采用如下步驟構(gòu)建組合模型來(lái)進(jìn)行生豬價(jià)格的預(yù)測(cè):
由于ARIMA和SVR的單一模型各有不同的優(yōu)點(diǎn)和缺點(diǎn),但在解決線性模型和非線性模型的問(wèn)題時(shí),兩者具有不同的優(yōu)點(diǎn)。這兩種模型是相輔相成的。因此,為了預(yù)測(cè)生豬價(jià)格我們可以將兩者結(jié)合起來(lái)得到精度更高的結(jié)果。假設(shè)線性自相關(guān)部分Lt與非線性殘差Nt兩個(gè)部分被看作時(shí)間序列Yt的組合,用公式表示就是Yt=Lt+Nt。利用組合后的ARIMA-SVR組合模型來(lái)期望得到預(yù)測(cè)精度更優(yōu)的結(jié)果。組合預(yù)測(cè)原理如圖1所示。
圖1 ARIMA-SVR組合預(yù)測(cè)模型原理
本文研究的生豬價(jià)格數(shù)據(jù)來(lái)源于中國(guó)養(yǎng)豬網(wǎng)(https://zhujia.zhuwang.cc/),2020年1月19日-2021年1月31日每日生豬(外三元)價(jià)格累計(jì)379條數(shù)據(jù),數(shù)據(jù)真實(shí)可靠。選取2020年1月19日-2021年1月7日累計(jì)355條數(shù)據(jù)作為第一期數(shù)據(jù)進(jìn)行ARIMA建模,2021年1月8日-2021年1月19日累計(jì)12條數(shù)據(jù)作為獲取殘差序列的第二期數(shù)據(jù),2021年1月20日-2021年1月31日累計(jì)12條數(shù)據(jù)作為最終比較模型精度的第三期數(shù)據(jù)。將生豬日價(jià)格繪制成時(shí)序圖,如圖2所示。明顯看出數(shù)據(jù)呈現(xiàn)出季節(jié)性與非平穩(wěn)性特征,進(jìn)行建模前需要消除數(shù)據(jù)的季節(jié)性與不平穩(wěn)性。
圖2 生豬價(jià)格日時(shí)序圖
由于生豬價(jià)格序列易受到各種因素的影響,使用單一模型來(lái)預(yù)測(cè)生豬價(jià)格的變化趨勢(shì)可能是困難的,并且在預(yù)測(cè)精度方面,也難以達(dá)到預(yù)期的效果。因此,在單一模型預(yù)測(cè)精度不高的情況下,我們采用ARIMA-SVR組合模型對(duì)生豬如價(jià)格進(jìn)行預(yù)測(cè)。
我們能夠清晰地從圖2的時(shí)間序列圖中看出,生豬日價(jià)格受到長(zhǎng)期趨勢(shì)效應(yīng)、季節(jié)效應(yīng)和隨機(jī)波動(dòng)之間交互影響,因此我們利用季節(jié)乘積模型對(duì)生豬價(jià)格序列進(jìn)行建模。通過(guò)對(duì)數(shù)據(jù)進(jìn)行一階12步差分消除季節(jié)性與不平穩(wěn)性,如圖3所示。可以發(fā)現(xiàn)差分后的生豬價(jià)格序列已基本平穩(wěn),自相關(guān)系數(shù)結(jié)尾,偏自相關(guān)系數(shù)拖尾,如圖4、圖5所示。一階差分后生豬日時(shí)序呈現(xiàn)出長(zhǎng)期的穩(wěn)定性,基本上在0附近波動(dòng)上下均勻波動(dòng),且周期性仍然明顯。
圖3 生豬價(jià)格一階差分時(shí)序圖
圖4 差分序列自相關(guān)圖
圖5 差分序列偏自相關(guān)圖
為了更準(zhǔn)確地描述數(shù)據(jù)平穩(wěn)性,可以使用ADF單位根檢驗(yàn)來(lái)進(jìn)行檢驗(yàn)是否平穩(wěn)。若序列是平穩(wěn)的,則可以直接用ARIMA模型來(lái)擬合,反之則要經(jīng)過(guò)差分轉(zhuǎn)換。ADF單位根檢驗(yàn)結(jié)果見(jiàn)表1。
表1 一階差分后生豬價(jià)格ADF檢驗(yàn)
建立ARIMA(2,1,3)(0,1,1)×12季節(jié)乘積模型,參數(shù)檢驗(yàn)結(jié)果顯示,模型在參數(shù)估計(jì)中通過(guò)檢驗(yàn),且AIC值為-40.47較小,模型擬合的較好。模型的顯著性檢驗(yàn),LB(Ljung-Box)檢驗(yàn)統(tǒng)計(jì)量p值為0.435 7,顯著大于0.05,表明ARIMA(2,1,3)(0,1,1)×12模型擬合效果顯著,對(duì)建立的模型進(jìn)行12步預(yù)測(cè)分析,結(jié)果見(jiàn)表2。
表2 ARIMA模型預(yù)測(cè)生豬價(jià)格
為了選擇一個(gè)最優(yōu)個(gè)數(shù)能夠使得循環(huán)殘差數(shù)據(jù)的誤差最小,我們采用選擇N個(gè)殘差數(shù)據(jù),保留誤差為它的第N+1個(gè)殘差數(shù)據(jù)作為模型,作為輸出的方法。通過(guò)向后逐步擇優(yōu),最后確定最優(yōu)個(gè)數(shù)N為4使得模型循環(huán)殘差的誤差最小。
利用R軟件實(shí)現(xiàn)SVR建模,選取高斯核函數(shù),參數(shù)gamma范圍在0.01-1 000范圍,懲罰系數(shù)C范圍在0.1-200,采用十折交叉驗(yàn)證,最后通過(guò)擇優(yōu)選擇懲罰系數(shù)C=1.02以及gamma=26,作為最優(yōu)參數(shù)組合對(duì)生豬價(jià)格殘差進(jìn)行預(yù)測(cè)。對(duì)比修正模型與原模型的預(yù)測(cè)精度,預(yù)測(cè)結(jié)果見(jiàn)表3,可以發(fā)現(xiàn)使用SVR模型進(jìn)行殘差修正后,預(yù)測(cè)誤差明顯減小。
表3 ARIMA-SVR模型殘差修正結(jié)果表
從預(yù)測(cè)結(jié)果來(lái)看,由于ARIMA模型本身不能全面表現(xiàn)生豬價(jià)格時(shí)間序列的變化規(guī)律。而與傳統(tǒng)預(yù)測(cè)模型相比,ARIMA-SVR組合模型具有更加精準(zhǔn)的預(yù)測(cè)精度,能夠更好地運(yùn)用生豬價(jià)格的歷史數(shù)據(jù),從中獲取未展現(xiàn)的信息,優(yōu)化了單一模型預(yù)測(cè)的不足之處。
基于同樣的樣本數(shù)據(jù)集,使用單一的利用ARIMA季節(jié)乘積模型和SVR模型對(duì)生豬價(jià)格進(jìn)行12期預(yù)測(cè),將預(yù)測(cè)結(jié)果與ARIMA-SVR模型的預(yù)測(cè)結(jié)果進(jìn)行比較,選用平均絕對(duì)誤差(MAE)和平均百分比誤差(MPE),這2個(gè)指標(biāo)評(píng)價(jià)模型的預(yù)測(cè)性能。
單個(gè)ARIMA模型、SVR模型和ARIMA-SVR組合預(yù)測(cè)模型的預(yù)測(cè)性能比較結(jié)果見(jiàn)表4,MAE與MPE的數(shù)值越小,預(yù)測(cè)精度越高??梢园l(fā)現(xiàn)ARIMA-SVR模型的MAE與MPE值分別為0.950 4與0.027 6,顯著小于ARIMA(2,1,3)(0,1,1)×12模型與SVR模型的對(duì)應(yīng)值,說(shuō)明ARIMA-SVR模型的預(yù)測(cè)精度高于ARIMA(2,1,3)(0,1,1)×12模型與SVR模型,使用建立的SVR模型修正ARIMA季節(jié)模型的預(yù)測(cè)殘差序列在長(zhǎng)期預(yù)測(cè)中可以有效減少預(yù)測(cè)誤差,ARIMA-SVR組合模型能夠有效地提升生豬價(jià)格預(yù)測(cè)精度。
表4 生豬價(jià)格預(yù)測(cè)性能比較
通過(guò)對(duì)比3個(gè)模型的預(yù)測(cè)性能,我們可以清晰地看出,單個(gè)ARIMA和SVR模型的擬合效果比ARIMASVR組合預(yù)測(cè)模型誤差。結(jié)合ARIMA模型在求解線性問(wèn)題以及SVR模型在解決非線性小樣本問(wèn)題上的優(yōu)勢(shì),得到的預(yù)測(cè)精度有效提高,預(yù)測(cè)誤差大幅度減小。
生豬價(jià)格受市場(chǎng)、季節(jié)、政策等多種因素的影響,生豬價(jià)格數(shù)據(jù)序列也因此具有較為顯著的季節(jié)性與非平穩(wěn)性的特征,通過(guò)差分能夠解決序列不平穩(wěn)的問(wèn)題,進(jìn)而進(jìn)行建模分析。實(shí)驗(yàn)表明,使用單一模型進(jìn)行預(yù)測(cè)效果不佳,采用ARIMA季節(jié)乘積模型進(jìn)行線性擬合預(yù)測(cè),SVR模型修正ARIMA季節(jié)乘積模型的預(yù)測(cè)殘差,通過(guò)2個(gè)模型的組合,發(fā)揮出各個(gè)模型的優(yōu)勢(shì)可以有效提升預(yù)測(cè)的準(zhǔn)確性,最終平均預(yù)測(cè)精度可達(dá)97.24%。
生豬市場(chǎng)的穩(wěn)定性影響著我們的日常生活,在疫情疫病的影響下,生豬價(jià)格變化趨勢(shì)難以直接在經(jīng)驗(yàn)上進(jìn)行研究分析,通過(guò)建立的豬價(jià)預(yù)測(cè)模型能較為直觀地觀察到豬價(jià)未來(lái)走勢(shì),幫助養(yǎng)殖戶科學(xué)合理地制定生豬養(yǎng)殖方案。除此之外,有關(guān)政府也需要時(shí)刻關(guān)注好生豬價(jià)格波動(dòng)趨勢(shì),及時(shí)施加有效的政策手段,維護(hù)市場(chǎng)秩序,減少生豬價(jià)格市場(chǎng)的異常波動(dòng)現(xiàn)象。生豬市場(chǎng)的健康發(fā)展需要養(yǎng)殖戶合理制定養(yǎng)殖方案,在豬價(jià)趨勢(shì)異常時(shí)也需要政府穩(wěn)住輿論媒體的壓力,積極進(jìn)行市場(chǎng)調(diào)控,安撫好生豬養(yǎng)殖戶情緒,防止波動(dòng)效應(yīng)擴(kuò)大,只有這樣我國(guó)生豬養(yǎng)殖業(yè)才能做大做強(qiáng),健康穩(wěn)定地持續(xù)發(fā)展。