張文政 孫德山 王玥 張蕾
摘?要?隨著中國經(jīng)濟(jì)的不斷發(fā)展,城市化進(jìn)程不斷推進(jìn),總?cè)丝谥鹉暝黾?農(nóng)村人口逐年減少,糧食的需求量逐年增加,某些貧困地區(qū)已經(jīng)出現(xiàn)糧食短缺的狀況.本文選取了1986年-2016年遼寧省年糧食總產(chǎn)量、有效灌溉面積、農(nóng)業(yè)化肥施用量、農(nóng)業(yè)機(jī)械總動力、播種面積以及受災(zāi)面積等相關(guān)數(shù)據(jù).利用支持向量機(jī)回歸、線性回歸,隨機(jī)森林三種方法,對遼寧省糧食產(chǎn)量進(jìn)行了預(yù)測,并比較了三種方法預(yù)測的精準(zhǔn)度.
關(guān)鍵詞?支持向量機(jī);線性回歸;隨機(jī)森林;核函數(shù)
中圖分類號 ?O212.4?文獻(xiàn)標(biāo)識碼?A
Abstract?With the continuous development of China's economy, the process of urbanization is advancing, and ?the total population is increasing year by year, but the population of rural areas is decreasing year after year. As time goes on ,the demand for grain has increased , and some poor areas have already appeared in the condition of grain shortage. In this paper, the total annual grain output, the effective irrigation area, the amount of agricultural fertilizer application, the total power of agricultural machinery, the sown area and the affected area of ?Liaoning province from 1986 to 2016 were selected. By using three methods of support vector machine regression, linear regression and random forest, the grain yield of Liaoning province was predicted, and the accuracy of the three methods was compared.
Key words?support vector machine; linear regression; random forest; kernel function
1?引?言
糧食問題一直以來都是世界關(guān)注的焦點(diǎn),糧食不僅關(guān)乎國計民生的問題,也關(guān)乎著社會安定以及經(jīng)濟(jì)能否持續(xù)發(fā)展.我國從古至今都非常重視糧食問題,一直將糧食的生產(chǎn)放在國民經(jīng)濟(jì)的首位[1].隨著城市化進(jìn)程不斷推進(jìn),總?cè)丝诓粩嘣黾樱r(nóng)村人口不斷減少的背景下,對糧食的需求將進(jìn)一步擴(kuò)大.如果糧食的產(chǎn)量得不到提高,糧食的供給與需求的缺口便會越來越大.那么如何提高糧食產(chǎn)量,就必須分析影響糧食產(chǎn)量的因素以及糧食產(chǎn)量的變化趨勢.
影響糧食產(chǎn)量的因素千絲萬縷,這些因素對糧食產(chǎn)量作用機(jī)制又很難用數(shù)學(xué)語言來表示,這就使數(shù)學(xué)預(yù)測模型難以建立.傳統(tǒng)的預(yù)測方法有:線性回歸法、時間序列法、灰色理論法等,后來也發(fā)展出許多其他預(yù)測的方法,如神經(jīng)網(wǎng)絡(luò)法、混沌理論法等.國內(nèi)外專家學(xué)者對糧食產(chǎn)量的研究眾多,在國內(nèi)的研究中,由于我國地域遼闊,氣候多樣,糧食品種繁多,因此我國專家學(xué)者的研究主要分為全國糧食的研究和區(qū)域糧食研究兩大類[2].在全國糧食的研究中,劉杰[3]構(gòu)建了一種加權(quán)的馬爾科夫預(yù)測模型,與傳統(tǒng)的馬爾科夫鏈相比,加權(quán)的馬爾科夫鏈方法的誤差更小精度更高.陳錫康等人[4]探討了農(nóng)業(yè)復(fù)雜巨系統(tǒng)的特點(diǎn),提出了預(yù)測全國糧食產(chǎn)量的系統(tǒng)綜合因素預(yù)測法.在區(qū)域糧食研究中:周永生等人[5]利用多元線性回歸方法對影響糧食產(chǎn)量的各種因素進(jìn)行分析,構(gòu)建廣西糧食產(chǎn)量預(yù)測模型.龔波等人[6]運(yùn)用灰色相對關(guān)聯(lián)分析,以糧食產(chǎn)量作為系統(tǒng)特征序列數(shù)據(jù),構(gòu)建糧食產(chǎn)量的灰色GM(1,N)模型,對湖南省2015年糧食產(chǎn)量進(jìn)行擬合和預(yù)測.ZHOU等人[7]以單期植被指數(shù)(VIS)和多光譜遙感(MS)和數(shù)字圖像為基礎(chǔ),對水稻產(chǎn)量進(jìn)行了預(yù)測,并確定了水稻產(chǎn)量預(yù)測的最佳時期和最優(yōu)VIS.國外對于糧食產(chǎn)量的研究主要依據(jù)氣候,然后基于氣候的影響對糧食產(chǎn)量作出短期預(yù)測[2].然而結(jié)合遼寧省氣候多變這一情況,只是基于氣候很難作出精準(zhǔn)預(yù)測,而且短期預(yù)測也很難對政府提出有效建議. 本文運(yùn)用了支持向量機(jī)的方法對遼寧糧食產(chǎn)量進(jìn)行分析,建立了遼寧糧食產(chǎn)量預(yù)測模型,該模型的優(yōu)勢在于綜合考慮了遼寧省糧食產(chǎn)量的主要影響因素.支持向量機(jī)的擬合和泛化能力是最好的,這是因?yàn)榧Z食數(shù)據(jù)屬于小樣本數(shù)據(jù),支持向量機(jī)基于結(jié)構(gòu)風(fēng)險最小,較好地解決了小樣本、非線性、過擬合,維數(shù)災(zāi)難等問題.
遼寧省欲打造振興東北重要增長極,糧食問題在全省經(jīng)濟(jì)社會發(fā)展中始終處于重要位置.因此提前預(yù)測遼寧省糧食產(chǎn)量,對有關(guān)部門及時進(jìn)行糧食的調(diào)入調(diào)出和安排庫存具有重要參考價值.
由表4可知,利用支持向量模型預(yù)測遼寧省玉米、稻谷、大豆的產(chǎn)量依然精準(zhǔn),故利用支持向量機(jī)分析遼寧省糧食產(chǎn)量問題具有一定的可行性.
4?結(jié)?論
本文在運(yùn)用了支持向量機(jī)的方法對遼寧糧食產(chǎn)量進(jìn)行分析的基礎(chǔ)上,綜合運(yùn)用了線性回歸,隨機(jī)森林等方法,建立了遼寧糧食產(chǎn)量預(yù)測模型,該模型的優(yōu)勢在于綜合考慮了遼寧省糧食產(chǎn)量的主要影響因素. 由表2可知,支持向量回歸的相對誤差均小于10%,而線性回歸模型的預(yù)測精度不高,主要是不能捕捉到糧食數(shù)據(jù)的非線性特征.而相比于隨機(jī)森林,支持向量機(jī)的擬合和泛化能力是最好的,這是因?yàn)榧Z食數(shù)據(jù)屬于小樣本數(shù)據(jù),支持向量機(jī)基于結(jié)構(gòu)風(fēng)險最小,較好地解決了小樣本、非線性、過擬合和維數(shù)災(zāi)難等問題.表明SVR在糧食產(chǎn)量的預(yù)測中具有一定的可行性.
參考文獻(xiàn)
[1]?田秀芹. 基于多元線性回歸的糧食產(chǎn)量預(yù)測[J].科技創(chuàng)新與應(yīng)用,2017(16):3-4.
[2]?鄒璀,劉秀麗.山東省糧食產(chǎn)量預(yù)測研究[J].系統(tǒng)科學(xué)與數(shù)學(xué), 2013,33 (1) :97-109.
[3]?劉杰.基于加權(quán)馬氏鏈的全國糧食產(chǎn)量預(yù)測研究[J].廊坊師范學(xué)院學(xué)報:自然科學(xué)版,2015,15 (1) :56-59.
[4]?陳錫康,楊翠紅.農(nóng)業(yè)復(fù)雜巨系統(tǒng)的特點(diǎn)與全國糧食產(chǎn)量預(yù)測研究[J].系統(tǒng)工程理論與實(shí)踐 ,2002,22 (6) :108-112.
[5]?周永生,肖玉歡,黃潤生.基于多元線性回歸的廣西糧食產(chǎn)量預(yù)測[J].南方農(nóng)業(yè)學(xué)報,2011,42(9) :1165-1167.
[6]?龔波,肖國安,張四梅. 基于灰色系統(tǒng)理論的湖南糧食產(chǎn)量預(yù)測研究[J].湖南科技大學(xué)學(xué)報:社會科學(xué)版, 2012 , 15 (5) :62-65.
[7]?ZHOU X, ZHENG H B, XU X Q, et ?al.Predicting grain yield in rice using multi-temporal vegetation indices from UAV-based multispectral and digital imagery[J],ISPRS Journal of Photogrammetry& Remote Sensing, 2017 , 130 :246-255.
[8]?鄭建安. 主成分和BP神經(jīng)網(wǎng)絡(luò)在糧食產(chǎn)量預(yù)測中的組合應(yīng)用[J].計算機(jī)系統(tǒng)與應(yīng)用, 2016,25 (11) :274-278.
[9]CORTESC,VAPNIKV.Support-vector networks[J].Machine Learning.1995.20(3): 273-297.
[10]向昌盛,周子英,武力娜.糧食產(chǎn)量預(yù)測的支持向量機(jī)模型研究[J].湖南農(nóng)業(yè)大學(xué)學(xué)報:社會科學(xué)版, 2010 , 11 (1) :6-10.