劉合兵 韓晶晶 馬新明 席 磊*
(1.河南農(nóng)業(yè)大學(xué)信息與管理科學(xué)學(xué)院,鄭州 450002;2.農(nóng)田監(jiān)測與控制河南省工程實(shí)驗(yàn)室,鄭州 450002)
維持農(nóng)產(chǎn)品價(jià)格的穩(wěn)定,對于保障國計(jì)民生具有重要的現(xiàn)實(shí)意義。農(nóng)產(chǎn)品價(jià)格的劇烈波動(dòng)會(huì)對農(nóng)產(chǎn)品市場帶來不利的影響。對于這一問題,政府部門曾多次在“中央一號文件”及政府的報(bào)告中提及應(yīng)該加強(qiáng)農(nóng)產(chǎn)品市場的監(jiān)測管理,建立健全農(nóng)產(chǎn)品市場調(diào)控制度。在一個(gè)成熟的農(nóng)產(chǎn)品市場中,所有的市場參與者都沒有操控市場的能力,農(nóng)產(chǎn)品價(jià)格是市場自由交易的產(chǎn)物。農(nóng)產(chǎn)品價(jià)格的預(yù)測屬于時(shí)間序列預(yù)測的范疇,同時(shí)農(nóng)產(chǎn)品又兼具高度易腐的特殊性,必須滿足供需平衡,這使得農(nóng)產(chǎn)品價(jià)格的預(yù)測又不同于一般商品的價(jià)格預(yù)測?,F(xiàn)實(shí)中,氣候變化、經(jīng)濟(jì)波動(dòng)、特殊節(jié)假日等諸多外生因素都會(huì)對農(nóng)產(chǎn)品價(jià)格產(chǎn)生影響,從而使得農(nóng)產(chǎn)品價(jià)格表現(xiàn)出高度的隨機(jī)波動(dòng)性。這也就使得高準(zhǔn)確率的農(nóng)產(chǎn)品價(jià)格預(yù)測頗具挑戰(zhàn)性。通過對農(nóng)產(chǎn)品的未來價(jià)格進(jìn)行短期預(yù)測,可以為相關(guān)從業(yè)人員提供前瞻性信息,生產(chǎn)者可以及時(shí)調(diào)整生產(chǎn)方案,經(jīng)營者可以及時(shí)調(diào)整銷售思路,提高市場風(fēng)險(xiǎn)規(guī)避能力,減少異常波動(dòng)帶來的損失。價(jià)格預(yù)測也可以為相關(guān)政府部門出臺(tái)穩(wěn)定農(nóng)產(chǎn)品市場供需和價(jià)格相關(guān)政策提供決策參考,也為消費(fèi)者進(jìn)行日常飲食消費(fèi)選擇提供參考。
農(nóng)產(chǎn)品的生產(chǎn)過程受到氣候的限制和影響,農(nóng)產(chǎn)品價(jià)格主要受市場供需影響,所以農(nóng)產(chǎn)品價(jià)格序列表現(xiàn)出季節(jié)性,趨勢性及隨機(jī)波動(dòng)性,呈現(xiàn)典型的非線性特征。國內(nèi)外對于價(jià)格的預(yù)測方法主要分為4 種:計(jì)量經(jīng)濟(jì)預(yù)測法、數(shù)理統(tǒng)計(jì)預(yù)測法、智能分析法和組合模型法[1]。計(jì)量經(jīng)濟(jì)學(xué)以揭示經(jīng)濟(jì)現(xiàn)象中的因果關(guān)系為目的,在農(nóng)產(chǎn)品市場價(jià)格預(yù)測中,最常用的方法是回歸分析法,一般都是根據(jù)自變量和因變量的函數(shù)關(guān)系建立線性或非線性回歸模型,然后對相應(yīng)的農(nóng)產(chǎn)品價(jià)格進(jìn)行預(yù)測[2-3]。但是在對農(nóng)產(chǎn)品價(jià)格進(jìn)行預(yù)測時(shí),影響價(jià)格變動(dòng)的因素較多,我們在預(yù)測時(shí)并不能一一例舉,且個(gè)別影響因素并不能量化,這就對價(jià)格預(yù)測工作帶來很多不便。統(tǒng)計(jì)預(yù)測是統(tǒng)計(jì)學(xué)的一個(gè)重要功能,是預(yù)測領(lǐng)域的一個(gè)重要方法。在農(nóng)產(chǎn)品市場價(jià)格預(yù)測中,應(yīng)用最廣泛的是傳統(tǒng)的時(shí)間序列預(yù)測方法,其主要包括季節(jié)指數(shù)法[4]、移動(dòng)平均法[5]、指數(shù)平滑法[6]等。以上這些方法在對具有線性特征的時(shí)間序列預(yù)測時(shí)表現(xiàn)較好,但農(nóng)產(chǎn)品市場隨著時(shí)間的變化,逐步向復(fù)雜化、不規(guī)則化發(fā)展時(shí),傳統(tǒng)的時(shí)間序列在對這些價(jià)格進(jìn)行預(yù)測時(shí),為模型參數(shù)調(diào)整帶來較大困難,反映出一定的局限性。隨著信息技術(shù)、智能技術(shù)在各領(lǐng)域的廣泛應(yīng)用,農(nóng)產(chǎn)品價(jià)格預(yù)測也應(yīng)用這些新技術(shù)進(jìn)行了有意義的實(shí)踐。在農(nóng)產(chǎn)品市場價(jià)格預(yù)測中應(yīng)用的智能分析方法主要有神經(jīng)網(wǎng)絡(luò)預(yù)測法[7-9]、灰色預(yù)測法[10]、支持向量機(jī)[11]等。智能分析方法具有很強(qiáng)的非線性映射能力和柔性的網(wǎng)絡(luò)結(jié)構(gòu),能夠使樣本預(yù)測誤差逼近最小。組合模型法是將不同的方法組合起來形成的一種新的預(yù)測方法。它有兩種基本的形式,一是將不同的預(yù)測方法所得的結(jié)果進(jìn)行等權(quán)或不等權(quán)的組合[12-13];二是在用一種預(yù)測方法進(jìn)行預(yù)測前,先通過輔助方法進(jìn)行處理以使其后面預(yù)測方法預(yù)測精度更佳的組合[14-15]。這些建立組合預(yù)測模型的結(jié)果證實(shí)比單一預(yù)測模型的精度高,隨即也成為預(yù)測領(lǐng)域的潮流。
極限學(xué)習(xí)機(jī)是Huang 等[16]于2006 年提出的一種機(jī)器學(xué)習(xí)方法,它可以最大限度的提高網(wǎng)絡(luò)的泛化能力和學(xué)習(xí)速度,性能優(yōu)良且具有較強(qiáng)的非線性擬合能力。現(xiàn)如今極限學(xué)習(xí)機(jī)已經(jīng)在股票價(jià)格[17]、網(wǎng)絡(luò)流量[18]、風(fēng)速預(yù)測[19]等方面得到廣泛應(yīng)用。它雖然可以很好的擬合農(nóng)產(chǎn)品價(jià)格序列的非線性部分,但是價(jià)格的非平穩(wěn)部分會(huì)對預(yù)測精度產(chǎn)生較大影響。為了降低農(nóng)產(chǎn)品價(jià)格的非平穩(wěn)性,文章引入經(jīng)驗(yàn)?zāi)B(tài)分解,它可以將一個(gè)復(fù)雜的非平穩(wěn)性信號分解為不同的具有局部時(shí)變特征的信號,從而有效降低序列的非平穩(wěn)性。因此,文章先用經(jīng)驗(yàn)?zāi)B(tài)分解方法對農(nóng)產(chǎn)品價(jià)格序列進(jìn)行預(yù)處理,將處理后的分量作為極限學(xué)習(xí)機(jī)的輸入變量分別建立預(yù)測模型,并將預(yù)測結(jié)果進(jìn)行組合獲得最終農(nóng)產(chǎn)品價(jià)格的預(yù)測值。本文選取2014 年至2019 年河南省批發(fā)市場馬鈴薯的月均價(jià)格進(jìn)行應(yīng)用研究,驗(yàn)證EMD-ELM 組合預(yù)測模型的可行性和精確性。
經(jīng)驗(yàn)?zāi)B(tài)分解(Empirical Mode Decomposition,EMD)是Hilber-Huang 變換中的一種適用于非線性、非平穩(wěn)時(shí)間序列的信號分解方法。它依據(jù)信號自身的時(shí)間尺度特征對信號進(jìn)行分解,無需預(yù)先設(shè)定任何基函數(shù)。它可以將原始序列分解為若干個(gè)具有不同尺度、平穩(wěn)性和周期性波動(dòng)特征的本征模態(tài)函數(shù)(Intrinsic Mode Function,IMF)和一個(gè)剩余分量。其中每個(gè)IMF必須滿足兩個(gè)條件:1.在一個(gè)完整的時(shí)間序列信號上,極值點(diǎn)的個(gè)數(shù)和過零點(diǎn)的個(gè)數(shù)相差不大于1;2.在任意時(shí)刻點(diǎn)處,局部最大值的包絡(luò)線和局部最小值的包絡(luò)線均值為0。
經(jīng)驗(yàn)?zāi)B(tài)分解步驟如下:
1.取序列x(t)的所有極大值和極小值。
3.計(jì)算x(t)與m1(t)之差,記為h1(t),h1(t)=x(t)-m1(t),如果h1(t)滿足IMF 的兩個(gè)條件,則記為c1(t)=h1(t),c1(t)就是第一個(gè)IMF 分量;如果h1(t)不是IMF,則將h1(t)視為新的信號x(t),重復(fù)以上步驟直到h1(t)是一個(gè)IMF,記為c1(t)。
通過將剩余部分r1(t)=x(t)-c1(t)視為新的信號并重復(fù)上述步驟,即可提取其余的IMF和一個(gè)余項(xiàng)。原始數(shù)據(jù)x(t)可表示為本征模態(tài)函數(shù)與余項(xiàng)之和,即因此,一個(gè)時(shí)間信號都可分解為n個(gè)本征模態(tài)函數(shù)分量與一個(gè)余項(xiàng)之和。
極限學(xué)習(xí)機(jī)(Extreme Learning Machine,ELM)是一種新型的單隱層前饋神經(jīng)網(wǎng)絡(luò)。由于它的結(jié)構(gòu)簡單,其初始權(quán)重和偏置是隨機(jī)生成的且不需要迭代調(diào)整,在訓(xùn)練過程中只需要設(shè)置隱含層神經(jīng)元的個(gè)數(shù)即可。極限學(xué)習(xí)機(jī)所得解是唯一最優(yōu)解,保證了網(wǎng)絡(luò)泛化能力,還能克服局部最優(yōu)化的不足且具有學(xué)習(xí)速度快等優(yōu)點(diǎn),在保證較高的精度和預(yù)測效果的前提下,其卓越的訓(xùn)練速度為其自身與其他方法結(jié)合提供便利,越來越引起各個(gè)領(lǐng)域的高度關(guān)注和深入研究。
現(xiàn)今研究農(nóng)產(chǎn)品價(jià)格預(yù)測中,一般都會(huì)涉及預(yù)測模型各種參數(shù)的反復(fù)調(diào)整問題,因此提出一種EMDELM 組合預(yù)測模型,其方法在運(yùn)用時(shí)具有簡易快捷的優(yōu)勢。因?yàn)镋MD-ELM 組合預(yù)測模型充分利用了經(jīng)驗(yàn)?zāi)B(tài)分解方法可以根據(jù)將要預(yù)測序列其自身的時(shí)間尺度自行分解出各個(gè)本征模態(tài)函數(shù)和一個(gè)余項(xiàng),其本征模態(tài)函數(shù)的數(shù)量是根據(jù)原始序列的特征特定產(chǎn)生的,不同的原始序列可能產(chǎn)生的本征模態(tài)函數(shù)的數(shù)量不同。極限學(xué)習(xí)機(jī)解決了傳統(tǒng)神經(jīng)網(wǎng)絡(luò)需要設(shè)置大量網(wǎng)絡(luò)參數(shù)問題,在運(yùn)用過程中只需要設(shè)置好隱含層神經(jīng)元的個(gè)數(shù)即可對序列進(jìn)行學(xué)習(xí)預(yù)測。
EMD-ELM 組合預(yù)測模型具體內(nèi)容如圖1 所示,首先利用經(jīng)驗(yàn)?zāi)B(tài)分解方法,根據(jù)農(nóng)產(chǎn)品價(jià)格其自身的時(shí)間尺度進(jìn)行分解,得出若干個(gè)本征模態(tài)函數(shù)分量和一個(gè)余項(xiàng)分量。對分解出的若干個(gè)本征模態(tài)函數(shù)分量和一個(gè)余項(xiàng)分量分別運(yùn)用極限學(xué)習(xí)機(jī)方法進(jìn)行預(yù)測,每個(gè)分量根據(jù)其自身特性通過設(shè)置不同的參數(shù)值,得到不同的預(yù)測結(jié)果。最后將其各個(gè)分量的預(yù)測結(jié)果進(jìn)行累加組合得到最終的農(nóng)產(chǎn)品價(jià)格預(yù)測值。
農(nóng)貿(mào)市場是城鄉(xiāng)居民對農(nóng)副產(chǎn)品進(jìn)行交易買賣的固定地點(diǎn)市場,本研究所采用的實(shí)驗(yàn)數(shù)據(jù)來源于河南省農(nóng)產(chǎn)品信息監(jiān)測系統(tǒng)(http://ncpprice.agridoor.com.cn/login.asp),考慮樣本的可獲得性和連續(xù)性選擇某個(gè)農(nóng)貿(mào)市場馬鈴薯的月均價(jià)格數(shù)據(jù)。作為全球第四大重要的糧食作物,馬鈴薯是具有發(fā)展前景的高產(chǎn)作物之一,同時(shí)也是十大熱門營養(yǎng)健康食品之一。實(shí)驗(yàn)選取72 個(gè)連續(xù)的月度價(jià)格數(shù)據(jù)樣本,數(shù)據(jù)周期是從2014 年1 月至2019 年12 月。從圖2 中可以看出,馬鈴薯的價(jià)格大多時(shí)間都在1 元/kg 和3 元/kg 內(nèi)波動(dòng),只有個(gè)別月份高于3元/kg,整體來看,其價(jià)格具有不穩(wěn)定、不規(guī)則波動(dòng)特征。實(shí)驗(yàn)過程中,選擇2014年1 月至2018 年12 月的60 個(gè)樣本作為訓(xùn)練集,2019年的12 個(gè)月的樣本作為測試集,對EMD-ELM 組合預(yù)測模型進(jìn)行應(yīng)用驗(yàn)證。
選擇平均絕對誤差(MAE)、平均百分比誤差(MAPE)與均方根誤差(RMSE)三個(gè)指標(biāo)來評估EMD-ELM 組合預(yù)測模型的預(yù)測效果,計(jì)算公式如下:
公式中,n為價(jià)格樣本數(shù)量,y為第i個(gè)月的月均價(jià)格。
從馬鈴薯的價(jià)格走勢圖中可以看出其序列具有不穩(wěn)定、非線性的特征,因此可利用經(jīng)驗(yàn)?zāi)B(tài)分解方法進(jìn)行分解,實(shí)驗(yàn)過程用Matlab R2014b 軟件編程實(shí)現(xiàn),該方法依據(jù)馬鈴薯價(jià)格數(shù)據(jù)信號不斷的分離出高頻分量,直到所有的頻率成分都被分離開,得到了4個(gè)本征模態(tài)函數(shù)分量,然后用原始數(shù)據(jù)減去各本征模態(tài)函數(shù)分量得到1個(gè)線性趨勢余量。分解結(jié)果如圖3所示,圖中第一曲線圖為馬鈴薯的原始序列圖,中間4 個(gè)為本征模態(tài)函數(shù)分量圖,最后一個(gè)為余量圖,從圖中可以看出,IMF1 和IMF2 分量波動(dòng)周期較短,波動(dòng)較為頻繁,IMF3 和IMF4 波動(dòng)較為平緩,且波動(dòng)周期較長,余量與原價(jià)格序列整體趨勢一致,反映了價(jià)格序列的線性趨勢。用極限學(xué)習(xí)機(jī)分別對分解出來的5 個(gè)分量進(jìn)行預(yù)測,為了實(shí)現(xiàn)較高的預(yù)測精度,在預(yù)測過程中首先對價(jià)格數(shù)據(jù)進(jìn)行歸一化處理,分解出來的2014年至2018年月均連續(xù)價(jià)格作為模型的訓(xùn)練集,分解出的2019 年的月均連續(xù)價(jià)格作為測試集。設(shè)置神經(jīng)網(wǎng)絡(luò)時(shí)用當(dāng)前6 個(gè)月的價(jià)格和上一年同月份的價(jià)格共7 個(gè)數(shù)據(jù)作為輸入層數(shù)據(jù)進(jìn)行提前一步的價(jià)格預(yù)測,其輸入輸出的構(gòu)成如圖4 所示。在隱含層神經(jīng)元個(gè)數(shù)的設(shè)定時(shí),考慮到所研究的價(jià)格序列的長度,構(gòu)建了從3 到20 的隱含層節(jié)點(diǎn)的模型,對每個(gè)極限學(xué)習(xí)機(jī)模型在預(yù)測樣本上重復(fù)訓(xùn)練15 次,然后保存預(yù)測結(jié)果計(jì)算每次的平均絕對誤差,選取平均絕對誤差最小的預(yù)測模型。由于各個(gè)分量的波動(dòng)特征不同,經(jīng)過實(shí)踐選取了不同的隱含層節(jié)點(diǎn)數(shù)值。對輸出數(shù)據(jù)進(jìn)行反歸一化處理,還原為價(jià)格數(shù)據(jù),最后對各個(gè)分量的預(yù)測值進(jìn)行累加組合得到最后的預(yù)測值。極限學(xué)習(xí)機(jī)的建模實(shí)驗(yàn)由Matlab R2104b 編程實(shí)現(xiàn)。
表1 不同模型預(yù)測誤差比較Table 1 Comparison of prediction errors of different models
為了比較預(yù)測性能,分別采用單一的極限學(xué)習(xí)機(jī)、BP神經(jīng)網(wǎng)絡(luò)和ARIMA模型對相同的數(shù)據(jù)集進(jìn)行建模預(yù)測。其中BP神經(jīng)網(wǎng)絡(luò)和極限學(xué)習(xí)機(jī)的輸入數(shù)據(jù)集與EMD-ELM 組合預(yù)測模型的預(yù)測設(shè)置一致,同為當(dāng)前6個(gè)月的價(jià)格和上一年同月價(jià)格共7個(gè)數(shù)據(jù)作為輸入數(shù)據(jù)集。從圖5 和表1 可以看出,EMD-ELM組合預(yù)測模型的預(yù)測精度與單一的極限學(xué)習(xí)機(jī)、BP神經(jīng)網(wǎng)絡(luò)和ARIMA 模型的預(yù)測結(jié)果有了較大的提高,原因在于EMD-ELM 組合預(yù)測模型對原始的農(nóng)產(chǎn)品價(jià)格序列用經(jīng)驗(yàn)?zāi)B(tài)分解方法進(jìn)行分解的各個(gè)分量,降低了后續(xù)預(yù)測過程的復(fù)雜度。具體從精度評價(jià)指標(biāo)看,EMD-ELM 組合預(yù)測模型的MAE 最低,為0.093 元/kg,而單一極限學(xué)習(xí)機(jī)、BP 神經(jīng)網(wǎng)絡(luò)和ARIMA 模型的MAE 分別為0.182 元/kg、0.214 元/kg 和0.233 元/kg。且從MAPE 相比較,EMD-ELM 組合預(yù)測模型的MAPE最低,為4.265%,單一的極限學(xué)習(xí)機(jī)、BP 神經(jīng)網(wǎng)絡(luò)和ARIMA 模型的MAPE 分別為7.62%、9.68%、10.92%。從RMSE相比較,EMD-ELM 組合預(yù)測模型的預(yù)測結(jié)果同樣表現(xiàn)最好,RMSE 最低,為0.148,單一極限學(xué)習(xí)機(jī)、BP 神經(jīng)網(wǎng)絡(luò)和ARIMA 模型的RMSE分別為0.233、0.236和0.275。
相對于單一極限學(xué)習(xí)機(jī)、BP 神經(jīng)網(wǎng)絡(luò)和ARIMA模型,EMD-ELM 組合預(yù)測模型有著更為突出的優(yōu)勢。首先,ELM、BP、ARIMA 此類單一模型在進(jìn)行價(jià)格預(yù)測時(shí)并未對價(jià)格數(shù)據(jù)進(jìn)行預(yù)處理,無法很好的擬合價(jià)格的波動(dòng)頻率和波動(dòng)幅度,因而在最終的價(jià)格預(yù)測中存在較大的誤差。因此,對價(jià)格數(shù)據(jù)進(jìn)行經(jīng)驗(yàn)?zāi)B(tài)分解,分離數(shù)據(jù)的波動(dòng)頻率,降低數(shù)據(jù)的波動(dòng)幅度對于建立良好的預(yù)測模型是非常重要的。其次,在對比的3個(gè)模型中,ARIMA模型在3個(gè)評價(jià)指標(biāo)中表現(xiàn)最差,原因在于ARIMA 模型是典型的數(shù)理統(tǒng)計(jì)預(yù)測模型,對于線性的預(yù)測表現(xiàn)較好,而針對具有非線性特征的價(jià)格數(shù)據(jù)會(huì)產(chǎn)生較大的誤差。極限學(xué)習(xí)機(jī)和BP神經(jīng)網(wǎng)絡(luò)是典型的智能預(yù)測模型,從結(jié)果來看,其預(yù)測效果比ARIMA 模型表現(xiàn)好,但不如組合模型。其中可以看出單一的極限學(xué)習(xí)機(jī)預(yù)測結(jié)果比BP神經(jīng)網(wǎng)絡(luò)表現(xiàn)好。由此可以得出在EMD-ELM 組合預(yù)測模型中,經(jīng)驗(yàn)?zāi)B(tài)分解可以很好的降低原始序列的非平穩(wěn)性,有利于提高農(nóng)產(chǎn)品價(jià)格的預(yù)測精度。
針對農(nóng)產(chǎn)品價(jià)格的具體波動(dòng)形態(tài),采用經(jīng)驗(yàn)?zāi)B(tài)分解方法能夠有效地分離出原始價(jià)格序列中的不同特征分量,有效地降低了各分量的非平穩(wěn)性。本文提出了一種EMD-ELM 組合預(yù)測模型,實(shí)驗(yàn)結(jié)果表明該方法較之單一極限學(xué)習(xí)機(jī)、BP神經(jīng)網(wǎng)絡(luò)和ARIMA模型具有更好的預(yù)測能力,為非線性的農(nóng)產(chǎn)品價(jià)格預(yù)測提供一種新的思路。通過對農(nóng)產(chǎn)品的未來價(jià)格做出提前預(yù)測,這對農(nóng)產(chǎn)品從業(yè)人員及相關(guān)政府部門具有重要的現(xiàn)實(shí)意義。由于在對EMD-ELM 組合預(yù)測模型的應(yīng)用中僅對馬鈴薯價(jià)格進(jìn)行了研究,結(jié)果表明能夠很好的擬合價(jià)格的波動(dòng)特征驗(yàn)證EMD-ELM 組合預(yù)測模型的可行性,但并未對其他農(nóng)產(chǎn)品種類進(jìn)行應(yīng)用,后期可以針對此方法進(jìn)行多個(gè)農(nóng)產(chǎn)品種類的預(yù)測。極限學(xué)習(xí)機(jī)的隱含層神經(jīng)元個(gè)數(shù)是通過設(shè)定區(qū)間反復(fù)實(shí)踐調(diào)參取最佳值確定的,比較消耗時(shí)間,如何快速有效的確定極限學(xué)習(xí)機(jī)隱含層神經(jīng)元的個(gè)數(shù)是下一階段的研究目標(biāo)。
農(nóng)業(yè)大數(shù)據(jù)學(xué)報(bào)2020年3期