李銘 方華(上海理工大學管理學院)
糧食安全始終是關系我國國民經濟健康發(fā)展、社會穩(wěn)定和國家安全的重大戰(zhàn)略性問題[1]。俗語“民以食為天”同樣提醒人們不可忽視糧食生產的重要性。21世紀以來,我國糧食產量穩(wěn)步增長,2020年全國糧食產量達到了66949.2萬噸,實現(xiàn)“十七連豐”,體現(xiàn)出我國糧食生產的穩(wěn)定性。然而,也應注意到我國仍然存在很多影響糧食生產穩(wěn)定與安全的不利因素。國內方面,隨著“二孩”“三孩”政策的全面放開,我國人地矛盾將更加突出,對糧食生產的需求將持續(xù)擴大;城市化進程逐步加快,侵占耕地與農業(yè)生態(tài)環(huán)境污染現(xiàn)象一直存在,部分主產區(qū)土地質量下降;重大自然災害也在威脅著糧食生產,如2021年7月河南省鄭州市暴雨災情對農業(yè)生產產生致命打擊。國際方面,不斷反復的新冠肺炎疫情增加了更多不確定性因素,國際糧價上升,造成進口難,以至于曾掀起一輪“屯糧潮”,威脅國內糧食安全。國內國際糧食生產的一系列不利變化進一步加大了保障糧食生產穩(wěn)定發(fā)展與糧食安全的難度。
山東省作為我國糧食的主產區(qū),一直在我國糧食安全中扮演著重要的角色。據國家統(tǒng)計局數據,近20年來山東省糧食總產一直占全國糧食產量的7%~8%左右,糧食單位面積產量高于全國糧食單位面積產量。自2002年以來,山東省糧食產量已實現(xiàn)“十六連增”;2014年糧食產量破千億斤大關;2020年糧食產量達5446.8萬噸,連續(xù)7年穩(wěn)定在千億斤以上。
然而受耕地面積減少和退化、生態(tài)環(huán)境污染、人口增長等因素的影響,山東省糧食生產同樣面臨著增產增收的巨大挑戰(zhàn)。正確分析山東省糧食產量的影響因素及其影響程度并對糧食產量進行合理預測研究,對山東省糧食安全乃至全國糧食安全都具有重要意義。
本文通過運用多元線性回歸方法探究近20年來山東省糧食產量的影響因素及各因素影響程度,在此基礎上運用MLP神經網絡建立山東省糧食產量預測模型,旨在為山東省糧食生產賦能增效,推動糧食產量提升,為全國糧食生產提供指導和借鑒。
對全國和山東省糧食生產影響因素與預測的許多研究學者都提出了自己的觀點。姬萌[1]運用主成分分析法將1995-2014年山東省糧食生產數據分為三個時期進行了分析,認為長期以來農業(yè)機械總動力、農田有效灌溉面積、農用化肥施用折純量等因素對糧食生產發(fā)揮著主導作用;蘇興[2]等選用全國2000-2019年時間序列數據,采用多元線性回歸與協(xié)整實證分析方法得出我國糧食產量與種植面積、化肥使用量正相關,與第一產業(yè)勞動人口、成災面積負相關,與農業(yè)固定資產投資存在長期均衡關系;謝杰[3]運用逐步回歸和加權最小二乘法方法得出全國范圍內土地和化肥使用是影響糧食生產的最主要因素;高亮亮[4]等比較了線性回歸與BP神經網絡方法對山東省糧食產量預測的差異,認為BP神經網絡短期預測更為精確;鄒璀[5]等基于1980-2011年山東省糧食生產數據,運用ARMA和OLS結合的方法建立了山東省糧食產量預測模型。
綜上研究,學者已經對糧食生產影響因素及預測的各方面和各種方法進行了探究。本文在學者們研究的基礎上加入山東省近些年糧食生產相關數據,選取更多自變量,對山東省糧食生產影響因素進行更為全面的探究,并運用更為精確的神經網絡預測方法對山東省未來幾年糧食產量進行短期預測。
本文以山東省2000-2019年糧食生產數據為研究對象,相關指標體系數據均來自國家統(tǒng)計局官網、《山東省統(tǒng)計年鑒2020》和《中國統(tǒng)計年鑒2020》。因數據量偏大,受篇幅限制此處不予以展示。
綜合相關文獻研究成果的基礎上概括發(fā)現(xiàn),學者們認為影響糧食綜合生產能力的因素主要包括自然基礎、物質投入、科技支撐、政策保障、災害抵御等方面,為本文指標選取提供了重要依據。另外可依據柯布-道格拉斯生產函數選取變量:其中Q表示產量,L、K、G分別表示勞動、資本與土地投入,A為全要素生產率。
最終選取的自變量指標如下:一是選取糧食播種面積、有效灌溉面積和第一產業(yè)就業(yè)人員三項指標作為糧食生產的勞動與土地投入,作為糧食生產的基本條件。二是選取農用化肥施用折純量、農村用電量、農業(yè)機械總動力、農用塑料薄膜使用量、農用柴油使用量、農藥使用量、水庫總庫容量等指標作為糧食生產物質與科技投入衡量。三是選取受災面積和成災面積兩項指標作為自然災害衡量。四是選取除澇面積和水土流失治理面積作為生態(tài)環(huán)境治理保護衡量。五是選取農業(yè)生產資料指數衡量生產成本。共選取15項指標作為解釋變量,糧食產量作為被解釋變量,如表1所示。
表1 變量列表
此外,原計劃選取第一產業(yè)固定資產投資指標作為糧食生產的資本投入,遺憾的是山東省2017-2019年第一產業(yè)固定資產投資數據缺失,為了保證不同時期影響因素的一致性和可比性,故予以剔除。
土壤、溫度、降雨量、光照等自然條件及國家政策補貼、惠農措施等社會因素對糧食生產同樣具有重要作用,但由于難以進行量化,無法直觀衡量,不再加入回歸模型中。
多元線性回歸模型主要用于探究一個因變量與多個自變量的因果關系,研究各自變量對因變量的影響程度,其理論模型結構如下。
其中,β0為常數項,β1…βn為回歸系數,μ為隨機干擾項,反映遺漏變量與模型誤差對模型的影響。
采用上述數據,使用Eviews10.0軟件,利用OLS最小二乘法估計模型,得到如下回歸結果。
由上述回歸結果可以進行初步統(tǒng)計檢驗和經濟意義檢驗??蓻Q系數與調整的可決系數均大于0.99,擬合優(yōu)度較高;模型同樣通過了F檢驗,充分表明15個自變量整體對因變量糧食產量具有很強的解釋能力,但也應該注意到x3、x6、x10、x12、x13、x14的t值偏小,并未通過t檢驗,且部分解釋變量經濟意義不合理,不能通過經濟意義檢驗。故初步認為回歸模型解釋變量間存在多重共線性。
通過生成變量相關系數矩陣觀察各解釋變量之間的相關性,如表2所示,可以看到部分解釋變量之間具有較高的相關系數,如x9與x10的相關系數為0.95,x7與x8的相關系數為0.89,x12與x14的相關系數為-0.89等。
表2 變量相關系數表
下面進行多重共線性的修正,選擇逐步回歸法消除多重共線性。首先分別做被解釋變量與每個解釋變量的輔助回歸,選取可決系數最高的解釋變量構建基礎模型。經比較,y與x1輔助回歸的可決系數最高,為0.877716,將其選擇為基礎模型,而后逐步引入其他變量,逐步回歸結果如表3所示。
表3 逐步回歸結果
在基礎模型中引入x10,可決系數明顯提高,且能夠通過顯著性檢驗與經濟意義檢驗。在此基礎上繼續(xù)引入其他解釋變量,發(fā)現(xiàn)引入x12能使可決系數顯著提升,并通過了顯著性檢驗。以此類推,以使可決系數提高為目的,以變量顯著性與經濟意義合理性為限制條件,繼續(xù)引入x15,可決系數提升至0.9940。準備引入第5個變量x8時,發(fā)現(xiàn)其P值過大,但若再引進變量x11,即可使x8通過顯著性檢驗,并使可決系數變大。若繼續(xù)引用其他變量則會對模型產生不利影響,因此模型中不再引入其余變量。最終引入x1、x10、x12、x15、x8、x116個解釋變量。
對逐步回歸后得到的回歸模型如下。
進行經濟意義檢驗、異方差檢驗和序列相關檢驗。
1.經濟意義檢驗
多元線性回歸模型顯示,山東省糧食產量與糧食播種面積、水土流失治理面積呈正相關。糧食播種面積和水土流失治理面積每增加1個單位,糧食產量分別增加0.598125個單位和0.199835個單位。山東省糧食產量與農藥使用量、成災面積、農業(yè)生產資料價格指數、第一產業(yè)就業(yè)人員呈負相關。農藥使用量和成災面積每增加1個單位,糧食產量分別減少32.82135個單位和0.227053個單位;農業(yè)生產資料價格指數和第一產業(yè)就業(yè)人員每增加1個單位,糧食產量分別減少7.368045個單位和0.325425個單位。6個解釋變量皆通過了經濟意義檢驗,與現(xiàn)實經濟意義相符。
2.異方差檢驗
選用BP檢驗法,檢驗結果顯示如下。
故5%的顯著性水平下接受模型隨機干擾項方差相同的假設,可認為不存在異方差性。
3.序列相關檢驗
進一步檢驗自相關性。模型DW值為2.367445,在5%的顯著性水平下,n=20,k=6,查表得dL=0.691,dU=2.162,DW>dU。故模型不存在一階自相關。
在分析得到山東省糧食生產的6個主要影響因素后,本文繼續(xù)利用MLP神經網絡方法建立山東省糧食產量預測模型。
由于采用MLP神經網絡預測模型,需要對變量做標準化處理,以消除量綱不統(tǒng)一對預測的不利影響。標準化處理公式如下。
其中xi為各解釋變量的當前實際值;minxi、maxxi分別為各解釋變量的最小值與最大值;為標準化后的實際值。
多層感知器(Muti-Layer Perception,MLP)神經網絡模型是最常用的神經網絡模型之一。MLP網絡包括輸入層、隱藏層和輸出層,上一層的任何一個神經元都與下一層的所有神經元相連接,以實現(xiàn)全連接。將6個解釋變量數據輸入至輸入層,輸出層為糧食產量,兩者之間為隱藏層,設置限制為1~50個。
MLP神經網絡方法較適合進行短期預測,且預測精度普遍高于線性回歸模型。
以2000-2014年6個影響因素數據為訓練集,以2015-2019年數據作為檢驗集。利用SPSS 26.0軟件建立MLP神經網絡模型。選用標度共軛梯度優(yōu)化算法,隱藏層函數為雙曲正切函數,輸出層隱藏函數為恒等式。
訓練集顯示平方和誤差為0.038,相對誤差為0.006;檢驗集顯示平方和誤差為0.031,相對誤差為0.006。如圖1顯示,MLP神經網絡模型預測值與y實際值的散點圖基本沿45度線呈線性趨勢,表明模型擬合效果良好。
圖1 預測值與實際值散點圖
下面對檢驗集預測結果的精度進行詳細分析,詳情如表4所示。可見,基于MLP神經網絡的糧食產量預測精度變化較小,5年的預測精度都在98.7%以上,2018年的相對誤差僅有0.0633552%,平均相對誤差為0.702147%,體現(xiàn)了模型較強的穩(wěn)定性與準確性。
表4 檢驗集糧食產量預測精度
經過模型的訓練與檢驗可發(fā)現(xiàn)MLP神經網絡模型非常適合對山東省未來幾年內糧食產量的預測。只需獲得6個解釋變量的估計數據或實際數據,就可較精準地預測出山東省當年的糧食產量。由于本文只研究山東省近20年的數據,數據量偏少,且受制于數據的可獲得性(如2000年以前山東省水土流失治理面積數據缺失等),無法加入更多數據進行訓練和檢驗,使模型存在一些問題與不足。
一是基于學者們對糧食產量影響因素的研究成果,并結合柯布-道格拉斯生產函數選取了近20年來可能影響山東省糧食生產的15個影響因素。采用逐步回歸法消除原始模型的多重共線性問題,建立了包含6個解釋變量的多元線性回歸模型。模型顯示,糧食播種面積和水土流失治理面積對山東省糧食產量產生正向影響,體現(xiàn)出生態(tài)治理對糧食生產的重要積極作用;農藥使用量、受災面積、農業(yè)生產資料價格指數和第一產業(yè)就業(yè)人員對山東省糧食產量產生負向影響,體現(xiàn)出農藥、自然災害、農業(yè)生產成本上升等對糧食生產產生的不利影響。第一產業(yè)就業(yè)人員與糧食產量呈負相關的結論基本與程名望[6]等學者的研究結論相似,即農村勞動力轉移并不會影響主產區(qū)的糧食產量。目前,針對山東省來看,農業(yè)就業(yè)人員已達到飽和狀態(tài),增加農業(yè)就業(yè)人員甚至會產生負向影響。6個影響因素中農藥使用量彈性系數為-32.82135,對山東省糧食產量影響最大,農藥的使用對糧食產量的貢獻已處于邊際遞減階段,亟須轉變農藥使用方式,促進生態(tài)化發(fā)展。
二是在得到影響山東省糧食生產的6個因素后,利用MLP神經網絡模型構建山東省糧食產量預測模型,發(fā)現(xiàn)模型具有較高的預測精度,具備穩(wěn)定性和準確性,可用于預測未來幾年內山東省糧食產量。