余永松,龐正武,周葉寧,鐘文峰,何龍飛,王愛勤
(1.廣西大學農(nóng)學院,廣西 南寧 530004;2.廣西大學計算機與電子信息學院,廣西 南寧 530004;3.華中科技大學管理學院,湖北 武漢 430074)
廣西地處我國華南地區(qū),為亞熱帶、熱帶季風氣候,熱量充足,降水豐富,年均氣溫在16.5~23.1℃之間,降水量1 070 mm以上,年均無霜期284~365 d,非常適合蔬菜種植,且蔬菜品種資源非常豐富,其中秋冬季蔬菜大量遠銷國內(nèi)東部及北方地區(qū)和東盟市場[1]。
全國蔬菜產(chǎn)業(yè)發(fā)展規(guī)劃(2011~2020年)中,將廣西26個縣(區(qū))列為全國蔬菜產(chǎn)業(yè)重點縣,以確保元旦、春節(jié)期間全國蔬菜的供應(yīng)[2],被譽為北方地區(qū)“冬季菜籃子”。同時,近年來,由于珠三角地區(qū)城市化快速發(fā)展,農(nóng)用地逐漸減少,蔬菜種植成本高昂,以及土地污染嚴重等問題,廣西也成為了珠三角全年蔬菜供應(yīng)的重要基地[3],“廣西蔬菜之鄉(xiāng)”賀州市更是被譽為珠三角的“后菜園”[4],廣西蔬菜產(chǎn)業(yè)可持續(xù)發(fā)展具有重要的戰(zhàn)略意義。加強對廣西蔬菜產(chǎn)量的科學預(yù)測,對指導廣西蔬菜產(chǎn)業(yè)生產(chǎn)、儲存與加工十分必要[5]。
1981年,華中理工大學鄧聚龍教授在上海中-美控制系統(tǒng)學術(shù)會議上首次提出“灰色系統(tǒng)”和灰色模型(Grey Model,GM)。由于灰色系統(tǒng)模型的建立不需要大量的樣本數(shù)據(jù)及樣本有規(guī)律的分布,同時計算工作量較小,可用于近期、短期以及中長期的系統(tǒng)預(yù)測,且預(yù)測精度比較高,逐漸被廣泛應(yīng)用[6]。匯總利用灰色系統(tǒng)對2014—2017年全國糧食產(chǎn)量進行的預(yù)測研究,結(jié)合國家統(tǒng)計局公布的各省以及全國歷年的糧食實際產(chǎn)量,發(fā)現(xiàn)其準確率高達95%以上,是一種比較可靠的糧食產(chǎn)量預(yù)測模型。
目前,國內(nèi)外利用灰色預(yù)測模型進行的產(chǎn)量預(yù)測多集中在糧食產(chǎn)量領(lǐng)域,關(guān)于蔬菜產(chǎn)量預(yù)測的較少。魯珊珊等[7]利用灰色預(yù)測模型對上海市2013—2017年的蔬菜產(chǎn)量進行了預(yù)測研究。王潔等[8]利用最小二乘法GM(1,1)模型對2017—2019年我國蔬菜產(chǎn)量進行了預(yù)測研究。張賽麗[9]利用灰色模型、Quadratic模型和BP神經(jīng)網(wǎng)絡(luò)模型對海南1980—2020年間的瓜類產(chǎn)量進行了預(yù)測研究,結(jié)果顯示3個模型之間的預(yù)測數(shù)據(jù)偏差較大。
基于灰色預(yù)測模型對廣西蔬菜產(chǎn)量進行預(yù)測的研究尚未見報道。本研究根據(jù)廣西壯族自治區(qū)統(tǒng)計局公布的2008—2014年廣西蔬菜產(chǎn)量數(shù)據(jù),采用灰色系統(tǒng)理論的方法構(gòu)建數(shù)學預(yù)測模型,并進行相對誤差、關(guān)聯(lián)度、后驗差精度檢驗以及模型實際檢驗,在此基礎(chǔ)上對2017—2019年廣西蔬菜產(chǎn)量進行預(yù)測。
2008—2016年廣西蔬菜(包含菌類)產(chǎn)量數(shù)據(jù)來源于《廣西統(tǒng)計年鑒》。
灰色模型是基于一階常微分方程建立的,故稱為一階一元灰色模型,記為GM(1,1)[12]。根據(jù)灰色系統(tǒng)理論,建立蔬菜灰色模型的數(shù)據(jù)選取2008—2014年廣西蔬菜產(chǎn)量作為輸出因子,首先通過數(shù)據(jù)序列級比和可容覆蓋計算,確定原始數(shù)據(jù)序列X(0){X(0)=X(0)(1),X(0)(2),…X(0)(n)}是否能直接用于建模,其次運用累加生成和累減生成方法對數(shù)據(jù)進行預(yù)處理,得到新序列,建立起廣西蔬菜產(chǎn)量數(shù)據(jù)時間模型,得到關(guān)于蔬菜產(chǎn)量的原始數(shù)據(jù)序列,建立灰色預(yù)測模型[12]。
模型檢驗是建模工作必不可少的一部分,為準確對實際情況進行預(yù)測,在進行數(shù)學建模時必須要對模型的有效性進行評估,參照文獻[10]-[11]中4種檢驗方法對1.2構(gòu)建的模型進行準確度檢驗。
1.3.1 殘差檢驗 殘差的計算公式為:
相對誤差計算公式為:
則平均相對誤差計算公式為:
1.3.2 關(guān)聯(lián)度檢驗 先計算出預(yù)測序列與預(yù)測因素之間的關(guān)聯(lián)系數(shù)r,關(guān)聯(lián)系數(shù)再計算關(guān)聯(lián)度:
式中,ρ為分辨率,0<ρ<1,一般取ρ=0.5,其中k=2,3,…n。
1.3.3 后驗差檢驗 根據(jù)下列公式計算后驗差比值C和小誤差概率P,再根據(jù)預(yù)測精度等級標準(表1),判斷該模型預(yù)測精度等級。
表1 預(yù)測精度等級標準
1.3.4 模型實際檢測 對符合殘差、關(guān)聯(lián)度以及后驗差檢驗的模型進行實際產(chǎn)量預(yù)測,求出2015—2016年廣西蔬菜產(chǎn)量,并與當年實際值對比,檢驗準確率如何。根據(jù)已知擬合模型為:x(0)(i)-0.046864Zt(i)=1902.815305,且模型的白化響應(yīng)式為求出2015—2016年廣西蔬菜產(chǎn)量的預(yù)測數(shù)據(jù)。
基于2008—2014年廣西蔬菜產(chǎn)量歷史數(shù)據(jù),建立起的灰色預(yù)測GM(1,1)模型,通過了殘差檢驗、關(guān)聯(lián)度檢驗、后驗差精度檢驗以及實際檢測,檢驗結(jié)果證明該模型可以使用。在此基礎(chǔ)上,基于建模中利用的原始數(shù)據(jù)越多,利用的數(shù)據(jù)在時間上越貼近,建立的預(yù)測模型越準確,所以我們基于2008—2016年共9年的廣西蔬菜產(chǎn)量歷史數(shù)據(jù),以及灰色預(yù)測系統(tǒng)原理建立新的GM(1,1)模型,對廣西未來3年的蔬菜產(chǎn)量進行預(yù)測。
為保證蔬菜產(chǎn)量出現(xiàn)預(yù)期的結(jié)果,我們對影響蔬菜產(chǎn)量的相關(guān)性因素進行分析。根據(jù)Elisabeth Simclton等學者對蔬菜產(chǎn)量的相關(guān)性進行研究,結(jié)合實際情況,將影響廣西蔬菜產(chǎn)量的因素選擇為蔬菜種植面積、蔬菜消費量以及農(nóng)業(yè)財政支出(包括農(nóng)業(yè)基礎(chǔ)設(shè)施建設(shè)、農(nóng)業(yè)技術(shù)、農(nóng)業(yè)補貼等支出)。根據(jù)《廣西統(tǒng)計年鑒》、國家統(tǒng)計局、農(nóng)業(yè)局公布的2008—2016年廣西蔬菜種植面積、廣西財政支農(nóng)支出及全國蔬菜消費量數(shù)據(jù)(表2),以廣西蔬菜產(chǎn)量為因變量,其他3個變量均為自變量,并利用SPSS對這4個因素進行復(fù)相關(guān)關(guān)系分析。相關(guān)系數(shù)計算公式如下:
相關(guān)系數(shù)r的一般標準為:|r|<0.3時,兩個現(xiàn)象之間沒有關(guān)系;0.3≤|r|<0.5時,低度相關(guān);0.5≤|r|<0.8時,顯著相關(guān)或稱中度相關(guān); |r|≥0.8時, 高度相關(guān)。
表2 2008—2016年廣西蔬菜種植面積、廣西財政支農(nóng)支出及全國蔬菜消費量
從表3可以看出,自2008年以來,廣西蔬菜產(chǎn)量逐年上升。2007年廣西蔬菜產(chǎn)量2 352.1萬t,由于受到春季寒潮以及雪災(zāi)的影響,2008年蔬菜產(chǎn)量僅有2 015.20萬t,2009—2016年連續(xù)8年保持著平均4.80%的增長速度,蔬菜播種面積也總體增加。
表3 2008—2016年廣西蔬菜種植面積及產(chǎn)量
其一階常微分方程為:X(0)={X(0)(1),X(0)(2), …X(0)(7)}={2015.20,2063.07,2129.44,2246.40,2356.72,2435.62,2610.08}。
由于不確定該數(shù)據(jù)序列是否可以用于建模,所以需要計算該數(shù)據(jù)序列的級比,并做級比判斷:
其中,可容覆蓋區(qū)間為:
顯然,所有的λk均在可容覆蓋區(qū)間內(nèi),因此不需要對原始數(shù)列X(0)進行弱化緩沖算子處理,故可以用原始數(shù)據(jù)序列X(0)進行GM(1,1)建模,對數(shù)據(jù)序列進行進一步的預(yù)處理:
原始數(shù)據(jù)序列:X(0)={2015.20,2063.07,2129.44,2246.40,2356.72,2435.62,2610.08}
由原始序列X(0)經(jīng)一次累加得新序列為:
X(1)={2015.20,4078.27,6201.71,8454.11,10810.83,13246.45,15856.53}
接著建立GM(1,1)預(yù)測模型,設(shè)X(1)滿足一階常微分方程:
式中,a、u為常數(shù),a為發(fā)展灰數(shù);u為內(nèi)生控制灰數(shù),是對系統(tǒng)的常定輸入。
灰色建模的途徑是一次累加序列通過最小二乘法來估計常數(shù)a與u。因X(1)(1)留作初值用,故將X(1)(2),X(1)(3),…X(1)(n) (n=7)分別代入方程用差分代替微分,又因等間隔取樣Δt=(t+1)-t=1,得:
則類似有:
得表達式(a):
生成緊鄰均值為:Z(t)=(3046.735,5139.99, 7327.91, 9632.47, 12028.64, 14551.49)
所以,可以將上式表達式(a)寫為矩陣表達式(b)為:
于是得到:
用GM(1,1)建模:
解得時間響應(yīng)序列為:
據(jù)此模型求得數(shù)據(jù)還原值,即根據(jù)此模型預(yù)測計算得出的2008—2014年廣西蔬菜產(chǎn)量為:2245.71,2353.46,2466.37,2584.71}。
2.3.1 殘差檢驗結(jié)果 原始數(shù)列的殘差、相對誤差見表4。
表4 GM(1,1)模型檢驗結(jié)果統(tǒng)計
根據(jù)灰色模型預(yù)測精度檢驗等級標準(表5),判斷該模型預(yù)測精度達到一級,可以使用[13]。
表5 灰色預(yù)測精度檢驗等級標準
2.3.2 關(guān)聯(lián)度檢驗結(jié)果 根據(jù)關(guān)聯(lián)度的計算公式,η(k)=(0.47734,0.55694,1.00000,0.86209,0.34807,0.39428) 。
則關(guān)聯(lián)度r=0.60645>0.6,根據(jù)經(jīng)驗判斷,該模型可以使用[13]。
2.3.3 后驗差檢驗結(jié)果 根據(jù)均值和方差計算公式分別得:
顯然,所有的 ?(k)<134.53577,則P=1>0.95。
根據(jù)預(yù)測精度等級對照(表5),該模型預(yù)測精度等級為一級,可以使用[14]。
2.3.4 模型實際檢測結(jié)果 利用該模型對2015、2016年廣西蔬菜產(chǎn)量的預(yù)測結(jié)果分別為2 708.739萬、2 838.704萬t(表6)。與廣西蔬菜產(chǎn)量實際數(shù)據(jù)誤差絕對值分別為2.79%、3.08%,正確率均在96%以上,且平均誤差絕對值為2.935%,說明該模型預(yù)測精度比較高,可以用于預(yù)測2017—2019年廣西蔬菜產(chǎn)量。
表6 2015—2016年廣西蔬菜產(chǎn)量灰色預(yù)測實際對照(萬t)
基于2008—2016年9年的廣西蔬菜產(chǎn)量歷史數(shù)據(jù),以及灰色預(yù)測系統(tǒng)原理建立新的GM(1,1)模型:
得到新的原始數(shù)列的殘差、相對誤差(表7)。根據(jù)表7中新建GM(1,1)模型中2015、2016年的模擬值和相對誤差(0.891>2.79,0.705<3.08)表明,利用更多和最新的數(shù)據(jù)建立的模型比之前建立的灰色預(yù)測模型更有效。
表7 誤差檢驗
利用新模型預(yù)測2017—2019年的廣西蔬菜產(chǎn)量以及發(fā)展趨勢,結(jié)果表明,2017、2018、2019年廣西蔬菜預(yù)測產(chǎn)值分別為3 062.58萬、3 225.20萬、3 396.45萬t。未來3年,廣西蔬菜產(chǎn)量將持續(xù)穩(wěn)定增長,平均年增長155.88萬t,年均增長率在5%左右(表8)。
表8 2017—2019年廣西蔬菜產(chǎn)量預(yù)測值(萬t)
在置信水平為0.01的情況下,采用t檢驗的方法進行雙側(cè)檢驗,種植面積、消費量、財政支農(nóng)支出與蔬菜產(chǎn)量的相關(guān)系數(shù)分別為0.974、0.990、0.974。由此可知,廣西蔬菜的種植面積、我國蔬菜消費量以及廣西財政支農(nóng)支出與蔬菜產(chǎn)量存在高度依存的關(guān)系[15]。
目前應(yīng)用于農(nóng)業(yè)領(lǐng)域的產(chǎn)量預(yù)測模型主要有神經(jīng)網(wǎng)絡(luò)預(yù)測法、遙感預(yù)測模型、多元回歸模型以及灰色預(yù)測模型。神經(jīng)網(wǎng)絡(luò)預(yù)測法產(chǎn)生于機器智能的背景下,具有自學習、分布式處理、大規(guī)模并行以及自組織的優(yōu)點。利用神經(jīng)網(wǎng)絡(luò)預(yù)測法對馬鈴薯、廣西糧食產(chǎn)量進行預(yù)測,預(yù)報精度和擬合精度平均相對誤差達到4.48%,部分誤差值達到5%以上[16-17]。神經(jīng)網(wǎng)絡(luò)預(yù)測法比傳統(tǒng)的回歸模型更有優(yōu)勢,但是神經(jīng)網(wǎng)絡(luò)預(yù)測法需要反復(fù)測試,對于樣本依賴性比較強,在早期數(shù)據(jù)缺失以及統(tǒng)計失當?shù)那闆r下,預(yù)測精度誤差較大[16]。
遙感技術(shù)于20世紀70年代引入我國,經(jīng)過40年的發(fā)展,已在社會各個行業(yè)大量應(yīng)用[15-16]。但利用遙感技術(shù)對產(chǎn)量預(yù)測精確度仍有待提高,與其他預(yù)測方法相比,遙感預(yù)測法成本比較大,專業(yè)性也比較強[18-19]。
利用回歸模型進行產(chǎn)量預(yù)測的研究已經(jīng)比較成熟,如王春輝等[20]利用回歸模型對江蘇省糧食產(chǎn)量進行了預(yù)測,易淳等[21]利用線性回歸和灰色預(yù)測模型對四川省涼山州冕寧縣煙葉產(chǎn)量進行了預(yù)測;但利用回歸模型需要與其他模型相組合,才能提高預(yù)測的精度以及可信度,而且需要樣本數(shù)據(jù)較多,一般不少于20個。同時,預(yù)測對象與影響因素之間必須存在因果聯(lián)系。
與線性回歸模型、神經(jīng)網(wǎng)絡(luò)預(yù)測法、遙感預(yù)測模型等預(yù)測模型相比,灰色預(yù)測模型在理論、方法以及預(yù)測上都有需要的數(shù)據(jù)少、數(shù)據(jù)不需要有一定的規(guī)律、定量分析結(jié)果與定性分析結(jié)果比較一致、計算工作量小、預(yù)測精度高的特點。本研究利用灰色理論和2008—2014年區(qū)統(tǒng)計局官方公布的廣西蔬菜產(chǎn)量7年數(shù)據(jù),構(gòu)建的模型預(yù)測2015—2016年廣西蔬菜產(chǎn)量,結(jié)果與區(qū)統(tǒng)計局官方公布結(jié)果精度達到96%,平均誤差僅為2.9%,進一步說明灰色理論預(yù)測模型更適合于農(nóng)業(yè)產(chǎn)量類預(yù)測。
作為一種數(shù)學模型,與多元回歸預(yù)測模型、神經(jīng)網(wǎng)絡(luò)預(yù)測模型、遙感預(yù)測模型一樣,也有自己的應(yīng)用背景與前提,也會存在著不足之處。以本文研究為例,利用灰色模型對廣西未來3年的蔬菜產(chǎn)量預(yù)測是基于廣西2008—2016年的蔬菜種植環(huán)境,這種環(huán)境因素包括蔬菜種植面積、財政支農(nóng)支出、重大氣候變化及氣象災(zāi)害、市場需求等因素,而大部分因素是不可控的,導致實際值會與預(yù)測值有較大差距。因此,也需要加強灰色模型影響因素的研究,提高模型的精確度。
根據(jù)相關(guān)性分析結(jié)果,廣西蔬菜產(chǎn)量的提高與種植面積、消費量、財政支農(nóng)支出等密切相關(guān),說明廣西蔬菜產(chǎn)量穩(wěn)定增長,與政府的支持力度、消費者需求拉動和蔬菜種植面積增加密切相關(guān),在政府支持和種植面積有限的條件下,如何拉動消費者需求是確保廣西蔬菜產(chǎn)業(yè)健康穩(wěn)步增長的關(guān)鍵。政府增加蔬菜行業(yè)新品種選育研究與推廣、提升抗擊意外災(zāi)害能力的基礎(chǔ)設(shè)施建設(shè)和加強對蔬菜市場的監(jiān)測等方面增加投入,根據(jù)市場需求來布局和指導蔬菜種植,更有利于拉動消費者需求,確保廣西蔬菜產(chǎn)業(yè)的可持續(xù)、穩(wěn)步增長。蔬菜產(chǎn)量極其容易受到天氣變化影響,2008年初由于不可控的寒潮以及雪災(zāi)的影響,廣西蔬菜產(chǎn)量從2007年的2 352.1萬t跌至 2008年的2 015.2萬t,直到2012年才恢復(fù)到2007年的產(chǎn)量水平,對于廣西的農(nóng)業(yè)發(fā)展以及農(nóng)民收入來說是巨大損失。從這個角度來說,維護蔬菜產(chǎn)量的穩(wěn)定增長具有重要的意義。除此之外,蔬菜也是一種對市場價格波動敏感的作物,中央和地方政策也會影響蔬菜種植面積。保持廣西蔬菜產(chǎn)量持續(xù)穩(wěn)定增長,需要國家、地方政府以及種植戶共同努力,減少外部因素的影響,避免蔬菜產(chǎn)量出現(xiàn)大幅度“跳水”情況。