鐘 奇
(重慶師范大學(xué)數(shù)學(xué)科學(xué)學(xué)院,重慶 401131)
我國作為世界上人口最多的國家,始終貫徹把發(fā)展糧食生產(chǎn)放在社會發(fā)展的重要位置。我國糧食產(chǎn)量能滿足人們的基本需求,但隨著生活水平提高,人們對糧食的需求更多樣化[1]?,F(xiàn)階段,我國耕地面積逐年減少,進行糧食產(chǎn)量預(yù)測迫在眉睫。糧食生產(chǎn)受眾多因素綜合影響,分析眾多影響因素并構(gòu)建糧食產(chǎn)量預(yù)測模型是一個值得探討的問題。構(gòu)建良好的糧食產(chǎn)量預(yù)測模型對國家宏觀調(diào)控糧食政策、保障國民糧食需求都具有十分重要的指導(dǎo)意義。
目前,國內(nèi)外對預(yù)測糧食產(chǎn)量問題的研究中,具有很強代表性的模型有3 種。①時間序列模型是根據(jù)長期的歷史趨勢數(shù)據(jù)對未來糧食產(chǎn)量進行分析預(yù)測,其中較常見的包括指數(shù)平滑法和灰色預(yù)測方法,這類模型的優(yōu)點是簡單易行且在短期內(nèi)有較高精度,但不能體現(xiàn)變量因素對糧食產(chǎn)量的影響[2]。②回歸模型能描述變量之間的內(nèi)在聯(lián)系,但易因變量選取不恰當(dāng)造成較大的結(jié)果偏差。③神經(jīng)網(wǎng)絡(luò)模型是模仿人體神經(jīng)元間關(guān)系建立的非線性模型,在糧食產(chǎn)量預(yù)測中有較好的應(yīng)用價值。
采用BP 神經(jīng)網(wǎng)絡(luò)能較好地描述糧食產(chǎn)量的非平穩(wěn)性,但算法可能陷入局部極值等[3]。糧食產(chǎn)量的影響因素之間具有復(fù)雜的聯(lián)系,若考慮較多的影響因素,會增加問題的復(fù)雜程度,因此本文采用主成分分析法提取主成分,優(yōu)化BP 神經(jīng)網(wǎng)絡(luò),提高糧食產(chǎn)量預(yù)測精確度。
糧食生產(chǎn)受眾多因素綜合影響,通過主成分分析法有效降低多個影響因子之間信息的冗余程度,從而獲得糧食產(chǎn)量與影響因子最全面真實的作用關(guān)系。在對糧食產(chǎn)量進行BP 神經(jīng)網(wǎng)絡(luò)預(yù)測前,先對糧食產(chǎn)量影響因子進行相關(guān)性檢驗,判定其是否可以采用主成分分析法。然后進行主成分提取,再進行BP 神經(jīng)網(wǎng)絡(luò)預(yù)測,基本步驟如圖1。
圖1 PCA-BP 神經(jīng)網(wǎng)絡(luò)基本流程圖
基于對上述BP 神經(jīng)網(wǎng)絡(luò)與PCA-BP 神經(jīng)網(wǎng)絡(luò)的理解,對比兩種模型的有效性。
影響糧食產(chǎn)量的因素眾多,本文選取的影響因子包括糧食作物播種面積X1、有效灌溉面積X2、農(nóng)業(yè)機械總動力X3、農(nóng)用化肥施用折純量X4、農(nóng)村用電量X5、受災(zāi)面積X6、鄉(xiāng)村就業(yè)人員X7和農(nóng)村居民家庭人均純收入X8[4]。
本文從《中國統(tǒng)計年鑒》中選取預(yù)測糧食產(chǎn)量所需數(shù)據(jù),即1999—2018 年共20 年的糧食產(chǎn)量相關(guān)數(shù)據(jù),將其分為訓(xùn)練數(shù)據(jù)和檢驗數(shù)據(jù)兩個部分。在實驗中調(diào)用MinMaxScaler 函數(shù),對糧食產(chǎn)量相關(guān)數(shù)據(jù)歸一化,采用最低值法調(diào)試,確定最佳隱含層單元數(shù)為7。BP 神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)效率非常重要,學(xué)習(xí)效率太大會導(dǎo)致不穩(wěn)定,太小會導(dǎo)致程序慢,其取值范圍一般為(0.01,0.1),對學(xué)習(xí)效率進行不斷調(diào)試,確定最佳學(xué)習(xí)效率為0.035。設(shè)置訓(xùn)練精度為0.004,采用1999—2013 年的糧食產(chǎn)量相關(guān)數(shù)據(jù)對網(wǎng)絡(luò)進行訓(xùn)練。預(yù)測2014—2018 年的糧食產(chǎn)量,與真實數(shù)據(jù)進行比較,得到其相對誤差,見表1。對結(jié)果進行分析,得到單一BP 神經(jīng)網(wǎng)絡(luò)能根據(jù)影響因素對糧食產(chǎn)量作出預(yù)測,但預(yù)測的誤差較大,訓(xùn)練時間較長。
表1 預(yù)測值與真實值比較表
先對糧食產(chǎn)量影響因子進行標(biāo)準(zhǔn)化,再采用KMO 統(tǒng)計量和巴特利特檢驗,判定其是否能進行主成分分析。KMO=0.742 即眾多影響因子之間具有較強的相關(guān)性,巴特利特檢驗的顯著性概率為0 <0.01,即滿足顯著性的要求。
采用SPSS 進行主成分分析,使數(shù)據(jù)的基本特征保留下來。第一主成分和第二主成分的累積貢獻率達到95.8%,說明這2 個指標(biāo)可有效解釋8 個糧食產(chǎn)量影響因子中95.8%的信息,表明2 個主成分的信息概況能力較好:
第一主成分在澆灌、機械總動力、化肥施用和用電量等方面的載荷較大,這些變量主要可以反映糧食生產(chǎn)的現(xiàn)代化水平;第二主成分在糧食作物播種面積和受災(zāi)面積方面的載荷較大,反映了糧食生產(chǎn)的基本保障,由此可以作為糧食有效播種面積。
將Y1、Y2即糧食生產(chǎn)現(xiàn)代化水平和有效播種面積這2 個主成分作為輸入層的神經(jīng)元。設(shè)置網(wǎng)絡(luò)的隱含層為1,最佳隱含層單元數(shù)為5,其余參數(shù)與單一BP 神經(jīng)網(wǎng)絡(luò)一致,結(jié)果見表2。對結(jié)果進行分析,得到PCA-BP 組合模型能較好地實現(xiàn)糧食產(chǎn)量的預(yù)測,輸入神經(jīng)元個數(shù)從8 個降為2 個大大降低了模型的復(fù)雜度,預(yù)測的精度較好。
表2 PCA-BP 組合模型預(yù)測值與真實值比較表
根據(jù)以上預(yù)測結(jié)果可知,兩種模型在糧食產(chǎn)量預(yù)測中都能較好地預(yù)測糧食產(chǎn)量。單一模型的輸入神經(jīng)元為糧食產(chǎn)量的8 個影響因子X1~X8,而組合優(yōu)化模型的輸入神經(jīng)元為Y1、Y2,即糧食生產(chǎn)現(xiàn)代化水平和糧食有效播種面積,兩個模型的輸入神經(jīng)元不同。為了更加直觀比較兩個模型的預(yù)測效果,對兩個模型實驗結(jié)果作圖,見圖2、圖3。圖2 表明組合模型比單一模型預(yù)測值更接近糧食產(chǎn)量的實際值。圖3 中,在訓(xùn)練速度、精度相同的情況下,單一模型的收斂步長為200,PCA-BP 組合模型的收斂步長為100,減少了50%,大大提高了神經(jīng)網(wǎng)絡(luò)的運行效率[5]。
圖2 預(yù)測結(jié)果對比圖
圖3 預(yù)測誤差對比圖
如表3 所示,組合優(yōu)化模型比單一模型平均相對誤差減少0.002 394,說明組合優(yōu)化模型在糧食產(chǎn)量預(yù)測上效果好。
表3 兩個模型的誤差對比表
糧食生產(chǎn)始終是我國社會發(fā)展的重要問題,對我國糧食產(chǎn)量進行預(yù)測愈發(fā)重要。本文提出的PCABP 組合優(yōu)化模型能很好地改善單一模型的學(xué)習(xí)速率較緩慢、算法可能陷入局部極值等問題。對糧食產(chǎn)量的影響因子進行相關(guān)性檢驗,判定其是否適合主成分分析,精煉糧食產(chǎn)量影響因子,得到影響因子的2 個主成分Y1、Y2,即糧食生產(chǎn)現(xiàn)代化水平和糧食有效播種面積,使輸入層神經(jīng)元由8 個變?yōu)? 個,簡化了模型復(fù)雜度。仿真實驗表明,PCA-BP 組合模型比傳統(tǒng)模型的學(xué)習(xí)速度更快,預(yù)測誤差更小,可推廣到其他影響因素維度較大的預(yù)測中。