陳燦虎 陳英偉
(河北經(jīng)貿大學數(shù)學與統(tǒng)計學學院,河北 石家莊 050061)
我國自古以來就是農(nóng)業(yè)大國。“民以食為天”,糧食安全與糧食生產(chǎn)是國民經(jīng)濟安全的戰(zhàn)略性問題,是農(nóng)業(yè)經(jīng)濟工作的根本重心,關系到國計民生,因此精準預測糧食產(chǎn)量及變化趨勢是非常有必要的。由于氣候、自然災害以及其它不可控因素的影響,糧食產(chǎn)量預測往往具有較大難度和不確定性。
糧食產(chǎn)量預測是一個復雜性極高的重大現(xiàn)實問題,學者對糧食產(chǎn)量的預測主要體現(xiàn)在3個方面。從投入占用產(chǎn)出、遙感技術、氣象學等角度入手,這類方法關注的是農(nóng)作物的生長過程;依靠糧食產(chǎn)量歷史數(shù)據(jù)挖掘內生規(guī)律,常見的方法有灰色預測模型、時間序列模型等,此類方法所需數(shù)據(jù)量小,預測簡單;以糧食產(chǎn)量相關影響因素建模并預測,常見的方法有支持向量機、神經(jīng)網(wǎng)絡等模型,這類方法所需數(shù)據(jù)量適中,由于數(shù)據(jù)的易獲得性和科學性,預測結果更加合理,預測精確更高。
近年來,智能算法成為糧食預測領域研究的寵兒。2002年王啟平采用BP神經(jīng)網(wǎng)絡模型預測糧食產(chǎn)量[1],對比發(fā)現(xiàn),BP神經(jīng)網(wǎng)絡對于單輸入單輸出的時間序列預測具有一定的優(yōu)越性,且泛化能力強;李武鵬提出以自適應遺傳算法優(yōu)化BP神經(jīng)網(wǎng)絡建立模型預測糧食產(chǎn)量[2];郭慶春等以非線性最小二乘法優(yōu)化BP神經(jīng)網(wǎng)絡,拓寬了糧食產(chǎn)量預測的途徑[3];2017年戎陸慶等把灰色關聯(lián)分析和BP神經(jīng)網(wǎng)絡相結合預測糧食產(chǎn)量[4];2020年Saleh I A等提出以一種反向傳播的神經(jīng)網(wǎng)絡改進薩爾普群算法(SSA)預測糧食產(chǎn)量[5];2021年胡程磊等以改進的粒子群算法優(yōu)化BP神經(jīng)網(wǎng)絡,大幅度提高了糧食產(chǎn)量預測精度[6];2021年黃琦蘭等提出使用改進的差分進化算法優(yōu)化最小二乘SVM參數(shù),建立了ADE-LSSVM糧食產(chǎn)量預測模型[7]。綜上所述,近年來糧食產(chǎn)量預測主要通過對各種算法加以組合和優(yōu)化,預測精度不斷提高。
新形勢下,我國糧食安全面臨需求增長與土地勞動力消耗的雙重挑戰(zhàn)。因此本文提出以差分進化改進灰狼算法優(yōu)化的BP神經(jīng)網(wǎng)絡模型對糧食產(chǎn)量進行預測[8],該算法具有結構簡單、通俗易懂的特點,通過實證對比,驗證了該模型預測具有精度高、預測結果穩(wěn)定性高的優(yōu)點。
本文研究數(shù)據(jù)來自于《中國統(tǒng)計年鑒》,圖1為1981—2021年全國糧食產(chǎn)量時序圖[9]??偟膩碚f,1981—2021年間,糧食產(chǎn)量由32000萬t上漲到約68000萬t,實現(xiàn)了總量上的“翻番”,整體呈現(xiàn)波動中增長的趨勢。具體來說,有11個年份較前一年出現(xiàn)了糧食減產(chǎn)的現(xiàn)象。在1985—1997年這段時間,每間隔2a就會出現(xiàn)1次糧食減產(chǎn),而減產(chǎn)的原因都是受災面積的猛增。在1999—2003年期間,只有2002年糧食產(chǎn)量較前一年有增加,其余年份都在減少,累計下降超過8000萬t,主要原因是糧食播種面積出現(xiàn)大幅度下降[10]。此外,只有2016年、2018年出現(xiàn)小幅度減產(chǎn)現(xiàn)象,原因是機械總動力下降和受災面積的增加。目前,全國糧食產(chǎn)量呈連續(xù)3a增加趨勢。
1.2.1 指標選取
為了對糧食產(chǎn)量進行精準有效預測,本文研究了影響全國糧食產(chǎn)量的眾多指標及相關數(shù)據(jù)[9]。結合前人研究從中選取第一產(chǎn)業(yè)從業(yè)人數(shù)、上一年糧食商品零售價格指數(shù)等8個指標作為輸入變量[11,12],糧食產(chǎn)量作為輸出變量。指標選擇具體見表1。
表1 糧食產(chǎn)量預測相關指標
1.2.2 數(shù)據(jù)預處理
由于各指標的單位不全相同,在進行糧食產(chǎn)量預測前,需要進行數(shù)據(jù)的歸一化來消除量綱,本文采用最小—最大規(guī)范化:
(1)
式中,x′i代表已處理的數(shù)據(jù);xi代表待處理的數(shù)據(jù);xmax、xmin分別代表指標x的最大值、最小值。
關于指標x2,從中國統(tǒng)計年鑒中只能獲取以前一年為基期的糧食零售價格指數(shù),而指標x2要求以1980年的糧食零售價格指數(shù)為基期(1980=100),因此需要進行累乘來獲取1981—2021年的指標x2數(shù)據(jù)。數(shù)據(jù)中2021年的用電量是缺失的,利用時間序列預測的方法對該數(shù)據(jù)進行了插補,預測結果為9883.6億kWh。
1.2.3 探索性分析
對插補得到的數(shù)據(jù)集進行相關系數(shù)分析和描述性統(tǒng)計分析,得到表2。
表2 糧食產(chǎn)量影響因素相關性及描述統(tǒng)計表
根據(jù)表2可知,x1、x8這2個指標與指標y之間呈負相關關系。指標x1、x8的增大會導致糧食產(chǎn)量的降低。x2、x3、x4、x5、x6、x7這6個指標與指標y之間呈正相關關系,要想增加糧食產(chǎn)量,理論上可以從加大這6個指標的投入入手。其中,導致x7與y之間關聯(lián)度不高(只有0.52)的原因很明顯——可供種糧的土地有限,而糧食產(chǎn)量卻發(fā)生了翻天覆地的改變。在1981—2021年這41a中糧食產(chǎn)量由32000萬t上漲至68000萬t,而糧食播種面積卻始終在112000千hn2上下小范圍內浮動。有學者證明糧食作物播種面積對糧食產(chǎn)量的影響是顯著的[13]。由此可見,以上指標的選取還是很可行的。
由各指標的最大值、最小值和區(qū)間長度了解到,糧食播種面積的波動范圍最小,其區(qū)間長度僅為該指標最小值的1/5。農(nóng)村用電量的波動范圍最大,由最初的370億kWh增加到了9884億kWh,增長超25倍;漲幅第2大的指標為上一年糧食零售價格指數(shù),漲幅超11倍,由基期的100%增長到了1227%。結合標準差和平均數(shù)來看,各指標的變異系數(shù)由大到小依次為x4、x2、x5、x6、x8、x1、x3、x7,同樣是農(nóng)村用電量的變異系數(shù)最大,達到0.84,說明其離散程度最大;糧食播種面積的變異系數(shù)僅為0.04,其離散程度最小。
在農(nóng)業(yè)領域上逐漸采用人工智能方法。其中在糧食預測方面,BP神經(jīng)網(wǎng)絡發(fā)揮著巨大的作用。
BP神經(jīng)網(wǎng)絡中,假設輸入層、隱含層以及輸出層節(jié)點數(shù)依次為l、m、n。隱藏層節(jié)點數(shù)可由經(jīng)驗式(2)確定,其中p∈[1,10]。
(2)
記輸入層、隱藏層、輸出層分別為Xi、Yj、Zk;wij表示輸入層第i節(jié)點到隱藏層中第j節(jié)點的權重;wjk表示隱藏層第j節(jié)點到輸出層中第k節(jié)點的權重;bj表示隱藏層中第j節(jié)點的閾值;bk表示輸出層中第k節(jié)點的閾值。信號激活函數(shù)用f(x)表示。信息的正向傳播可用公式表示如下:
Yj=f(∑wijXi+bj)
(3)
Zk=f(∑wjkYj+bk)
(4)
(5)
在BP神經(jīng)網(wǎng)絡中,參數(shù)的選取對預測精度影響特大,大量參數(shù)的選取也必將導致迭代時間久、效率低,故通常先利用粒子群優(yōu)化或差分進化等其它智能方法來優(yōu)化權值和閾值初始值,再進行神經(jīng)網(wǎng)絡建模預測。
本文建立了差分進化改進灰狼優(yōu)化的BP神經(jīng)網(wǎng)絡模型。差分進化算法(DE)具有如下特點:結構簡單,利于使用;性能優(yōu)越;自適應性;算法通用;具有利用個體局部信息和群體全局信息指導算法進一步搜索的能力?;依莾?yōu)化算法(GWO)脫胎于灰狼捕食獵物的過程,其優(yōu)點是能夠有效避免陷入局部最優(yōu)?;依欠N群內遵循嚴格的社會等級制度,可表示為α、β、δ和ω狼。其中α狼為頭狼,在種群內有著絕對的領導地位,其位置始終是最優(yōu)位置,β狼次之,δ狼更次,β、δ狼起輔助決策的作用,ω狼僅服從命令。
然而灰狼優(yōu)化用來確定最優(yōu)的權值和閾值中,變異的單位是一頭狼(個體),或者是多頭狼的線性組合,無法明顯體現(xiàn)單個屬性的變異,變異的程度不夠大。并且也無法體現(xiàn)出α、β、δ狼在領導性上的先后順序。而差分進化變異的單位(屬性)更小,因此借助差分進化算法來對灰狼優(yōu)化算法進行改進,從而增加了種群多樣性,避免早熟狀況的出現(xiàn)。實踐表明,采用差分進化改進灰狼算法來確定BP神經(jīng)網(wǎng)絡的權重和閾值的最優(yōu)初始值是可行的,效率更高。
以1981—2021年中國糧食產(chǎn)量作為輸出數(shù)據(jù),對應年份的第一產(chǎn)業(yè)從業(yè)人數(shù)、農(nóng)村用電量等8個指標為輸入數(shù)據(jù),其中2019—2021年數(shù)據(jù)作為測試集。本文采用Matlab 2016b軟件,DE-GWO-BP模型的參數(shù)設定如表3所示。
表3 DE-GWO-BP模型參數(shù)
根據(jù)DE-GWO-BP神經(jīng)網(wǎng)絡模型對2019—2021年糧食產(chǎn)量進行預測。由于每次預測的精度并不完全相同,因此進行5次仿真實驗,見圖2。
圖2 DE-GWO-BP神經(jīng)網(wǎng)絡模型5次預測結果
從圖2可以發(fā)現(xiàn),DE-GWO-BP模型5次預測中,仿真3的預測最精準,對2019年、2020年、2021年的預測都是5次仿真的最優(yōu)值,分別為0.04萬t、14.25萬t和172.23萬t;仿真1和仿真2的預測效果較差,但5次仿真綜合來看,該模型預測效果還是很好的。從預測值與實際值的平均絕對誤差來看,3a預測結果中2021年的預測效果最差。平均絕對誤差為577.16萬t,平均相對誤差不到1%,預測效果同樣不錯。
DE-GWO-BP模型與其它模型的預測結果對比,本文選擇的對照模型是粒子群PSO-BP、BP模型,見表4,其中PSO-BP、BP模型用到的參數(shù)盡可能與DE-GWO-BP模型保持一致。實驗結果顯示了該模型的優(yōu)越性。
表4 3種模型5次預測結果的均值比較
取5次仿真的最大誤差MaxEr(億t)、平均相對誤差MRE(%)和均方根誤差RMSE(億t)作為評價指標[6,7]。從均方根誤差RMSE來看,DE-GWO-BP模型的RMSE遠小于PSO-BP模型和BP模型。實驗表明,GWO-BP模型預測的穩(wěn)定性最好,多次預測之間的差異最?。粡淖畲笳`差MaxEr來看,DE-GWO-BP模型的最大誤差同樣遠小于另外兩模型,僅為2019年的0.04億t、2020年的0.06億t和2021年的0.11億t,這說明DE-GWO-BP糧食產(chǎn)量預測模型有效地減小了預測誤差;從平均相對誤差MRE來看,在2019—2021年糧食產(chǎn)量預測中,DE-GWO-BP模型的平均相對誤差分別為0.36%、0.42%、0.85%,顯著地降低了預測誤差,提高了預測精度。綜合來看,均方根誤差、最大誤差和平均相對誤差3個指標的結果都體現(xiàn)了DE-GWO-BP模型的優(yōu)越性。
由于該模型具有較高的預測精度,對2022—2026年全國的糧食產(chǎn)量進行預測。首先根據(jù)ARIMA模型對2022—2026年的全國糧食產(chǎn)量及其影響因素進行預測,以獲取DE-GWO-BP模型這5a所需數(shù)據(jù)。
在預測的過程中,始終秉持多次預測取平均以減小誤差的原則。利用DE-GWO-BP模型成功預測出了2022—2026年我國的糧食產(chǎn)量,取5次預測平均值作為最后的結果,見表5。
表5 2022—2026年我國糧食產(chǎn)量DE-GWO-BP預測結果
在DE-GWO-BP模型的預測結果中,2022年、2023年糧食產(chǎn)量連續(xù)減產(chǎn),于2024年有了一定的恢復,在2024—2026年連續(xù)增產(chǎn),最終在2026年全國糧食產(chǎn)量達到69679.02萬t。預測結果呈現(xiàn)波動結果的原因是利用ARIMA模型獲取的未來5a所需數(shù)據(jù)存在一定的誤差,在預測中,指標x1、x5、x8在2022年和2023年上的數(shù)值與周圍年份存在較大差距,受災面積和第一產(chǎn)業(yè)從業(yè)人數(shù)有大幅度的增加,而機械總動力出現(xiàn)大幅度降低。
糧食產(chǎn)量預測對于國家糧食安全政策制定具有重要的意義。本文通過實際數(shù)據(jù),驗證了DE-GWO-BP糧食預測模型的優(yōu)越性。并應用該模型對未來5a(2022—2026年)的全國糧食產(chǎn)量進行預測,得出以下3條結論。
掌握近年我國糧食產(chǎn)量變化規(guī)律。通過觀察1981—2021年全國糧食產(chǎn)量時間序列圖,發(fā)現(xiàn)我國糧食產(chǎn)量在41a間整體呈上升趨勢,由1981年的32502萬t上漲至2021年的68284.75萬t,實現(xiàn)了“翻番”。在1999—2003年全國糧食產(chǎn)量出現(xiàn)大幅度下降,累計下降超8000萬t。全國糧食產(chǎn)量呈連續(xù)3a增加趨勢。
構建DE-GWO-BP糧食產(chǎn)量預測新模型。DE-GWO算法提高了BP神經(jīng)網(wǎng)絡算法的全局搜索能力,降低了陷入局部最優(yōu)的可能性。在2019—2021年糧食產(chǎn)量預測上,DE-GWO-BP模型的預測值與實際值的平均相對誤差MRE分別為0.36%、0.42%、0.85%。相對PSO-BP和BP模型,最大誤差和平均相對誤差的縮小說明了DE-GWO-BP模型的準確性,均方根誤差的減小證明了DE-GWO-BP模型的穩(wěn)定性??偟膩碚f,DE-GWO-BP糧食產(chǎn)量預測模型的準確性和有效性均得到了驗證,具有較大應用價值。
短期預測了未來5a的全國糧食產(chǎn)量。利用DE-GWO-BP模型預測2022—2026年的全國糧食產(chǎn)量,分別為67362.16萬t、67095.97萬t、67886.80萬t、68995.71萬t和69679.02萬t。準確預測我國的糧食產(chǎn)量,可對政府政策制定和計劃實施提供一定程度上的數(shù)據(jù)支持。