閆海霞 劉素兵 張 華
(西安理工大學高科學院 西安 710019)
農(nóng)業(yè)是一個國家的國民經(jīng)濟的基礎,而糧食生產(chǎn)則是農(nóng)業(yè)的關(guān)鍵。因此,搞好糧食產(chǎn)量的預測十分重要[1~3]。預測糧食產(chǎn)量的方法有很多:神經(jīng)網(wǎng)絡預測方法[4],回歸分析法[5~6],灰色預測法[7~8]等。灰色系統(tǒng)是針對信息不完全的對象進行研究,它克服了概率統(tǒng)計的弱點,可以從有限的、離散的數(shù)據(jù)中找出規(guī)律,建立灰色系統(tǒng)模型,然后用它來進行相應的分析[9]。
灰色災變預測模型[10~12]的特點,關(guān)注數(shù)據(jù)序列中出現(xiàn)突高突低的數(shù)據(jù)所對應的時刻,稱為預測異常值或“災變”點出現(xiàn)的時間。我國糧食作物主要以玉米、水稻、小麥為主,而小麥主要有春小麥[13~14]和冬小麥兩種。春小麥的抗旱能力強,生長周期短,適合春天播種,主要分布在冬季很冷的地方,開春以后播種,秋季收獲。我國種植春小麥的地區(qū),主要是在長城以北,如黑龍江、新疆、甘肅、山西和內(nèi)蒙古。本文研究我國春小麥產(chǎn)量,小麥產(chǎn)量會受到自然“災害”的影響,比如降水太多會發(fā)生“澇災”,降水太少又會出現(xiàn)“旱災”,以及病蟲災害都會影響小麥產(chǎn)量[15]。本文將多項式模型與灰色災變預測模型相結(jié)合,預測我國春小麥產(chǎn)量。
災變預測[16]:定量求時,是預測異常值或“災變”點出現(xiàn)的時間。
原始數(shù)據(jù)序列,規(guī)定一個閾值(臨界值),把原始數(shù)據(jù)序列中大于該臨界值(上災變)和小于該臨界值(下災變)的數(shù)叫做異常值,將其選出來形成一個新的數(shù)據(jù)序列,該數(shù)據(jù)序列就被稱為災變序列。同時以這組數(shù)據(jù)中各個數(shù)據(jù)出現(xiàn)的對應時刻(即做災變映射)。組成災變時刻序列(日期集)。利用日期集數(shù)據(jù)序列建立GM(1,1)模型進行災變預測。
多項式數(shù)據(jù)擬合,是依據(jù)原始數(shù)據(jù)散點圖,分析變量間的相關(guān)程度與相關(guān)關(guān)系,構(gòu)建多項式擬合方程,得到數(shù)據(jù)的擬合值,然后計算擬合殘差。殘差反應了實際值與擬合曲線的偏離程度。本文以擬合殘差數(shù)據(jù)為依據(jù),在給定的臨界值基礎上找出異常值和異常值對應時刻,利用殘差將原始數(shù)據(jù)分為兩大類:偏離較多的一類,偏離較少的一類。偏離較多的數(shù)值點的日期作為災變?nèi)掌邳c,形成災變序列,構(gòu)建GM(1,1)模型,預測出下一個或幾個災變?nèi)掌邳c,同時以跳變?nèi)掌邳c的原始數(shù)據(jù)構(gòu)建GM(1,1)模型,預測下一個或幾個災變值。為更好地反應原始序列的災變點的變化趨勢,不妨以殘差的正負符號將災變點分為兩類:上災變點和下災變點。然后在分別使用GM(1,1)模型進行預測,對于偏離較少的點,用原始序列中去除災變點后的序列重新進行數(shù)據(jù)擬合,同時也可用其預測未來的非災變時刻的春小麥產(chǎn)量值。
總之,在進行預測時,如果預測點是灰色災變模型預測出的災變?nèi)掌邳c,則由灰色模型預測災變值,如果預測時刻不是災變?nèi)掌邳c,則用多項式函數(shù)預測。
灰災變GM(1,1)模型與多項式擬合方程的具體步驟:
1)符號假設
2)建模方法
由原始數(shù)據(jù)序進行擬合,得到三次多項式擬合公式和殘差序列。
若該點的殘差絕對值大于給定的臨界值,則認為該點為災變點,否則為非災變點。根據(jù)殘差的正負號,將災變點分為上災變點(殘差值為正)和下災變點(殘差值為負)。將上災變點日期和相應原始數(shù)據(jù)災變值分別組成災變?nèi)掌谛蛄蠵0=(p(1),p(2),…,p(r)) 和 對 應 的 災 變 值 序 列=(X0(p(1)),…,X0(p(r)))。同理下災變點日期和相應原始數(shù)據(jù)災變值分別組成災變?nèi)掌谛蛄蠶0=(q(1),q(2),…,q(s)) 和 對 應 的 災 變 值 序 列=(X0(q(1)),…,X0(q(s)))。建立GM(1,1)模型。
3)GM(1,1)模型原理
由時間響應函數(shù)來預測,由于模型的預測值是數(shù)據(jù)處理后的預測值,所以需要對預測值進行累減后就還原為原始數(shù)據(jù)系列x(0)的模擬預測值,即
采集到1995年~2014年我國春小麥產(chǎn)量(見表1),運用本文的組合模型對我國春小麥產(chǎn)量進行分析、擬合、預測。
表1 1995年~2014年我國春小麥產(chǎn)量(單位:萬噸)
從數(shù)據(jù)表中看到2001年為缺省數(shù)據(jù),這里使用移動平均法補足數(shù)據(jù),2001年的春小麥產(chǎn)量以664.54萬噸計入計算方法中。使用Matlab軟件,對數(shù)據(jù)進行三次多項式擬合,得到擬合方程:
對災變?nèi)掌谛蛄泻蜑淖冎敌蛄?,運用GM(1,1)模型計算災變?nèi)掌谛蛄蠵0、Q0和災變值序列的 預 測 函 數(shù) P?0Yk+Y 、Q?0(k+) 和(k+)。
上災變?nèi)掌诤蜕蠟淖冎殿A測函數(shù)為
下災變?nèi)掌谂c下災變值預測函數(shù)為
從表2和表3看出,災變灰色模型的擬合殘差比三次多項式擬合殘差小,說明灰色災變模型的擬合程度較好。
表2 上災變點的三次多項式與GM(1,1)擬合結(jié)果比較
表3 下災變點的三次多項式與GM(1,1)擬合結(jié)果比較
原始數(shù)據(jù)序列中除去災變點數(shù)值的其他值為非災變值,相應日期點為非災變?nèi)掌邳cT0=(2,6,7,10,11,12,13,14,16,17,18,19,10),用非災變?nèi)掌邳c及相應數(shù)值,重新使用三次多項式擬合,有
由R2顯然得出,對數(shù)據(jù)進行分類的擬合精度明顯得到改善。
使用新的模型對我國春小麥產(chǎn)量進行預測,由上下災變時間點預測函數(shù)知道,下一個下災變點是2017年,下一個上災變點時間點是2004年。從數(shù)據(jù)表中可以看出2004年用多項式擬合劃分為非災變點,但是按照上下災變點的劃分,2004年擬合殘差為正值,基本符合模型條件。2015年、2016年不是災變點,故使用三次多項式模型預測,2017年為災變點,用下災變預測函數(shù)預測,2017年我國春小麥產(chǎn)量為667萬噸。
總體來看我國春小麥產(chǎn)量,1995年~1999年春小麥產(chǎn)量相對穩(wěn)定,2000年由于種植面積減少,產(chǎn)量減少近35%,之后幾年小麥產(chǎn)量雖有起伏但相差不大,2001年缺省,2003年產(chǎn)量最低只有400萬噸,2009年春小麥產(chǎn)量超過700萬噸。本文通過分析春小麥產(chǎn)量的變化趨勢,將三次多項式模型與灰色災變模型相結(jié)合,首先對原始數(shù)據(jù)進行篩選,將原始數(shù)據(jù)分類,組成災變時間點序列,災變是序列,非災變值序列。同時對未來的災變時間點及相應的產(chǎn)量值進行預測,減少了單一模型的長期預測誤差。
本文的灰色災變多項式組合模型,在一定程度上能反應我國春小麥產(chǎn)量的變化規(guī)律,符合我國經(jīng)濟發(fā)展情況,也提高了預測精度。當然也存在不足,本文沒有考慮影響春小麥生長的環(huán)境、氣候、病蟲等方面,所以在預測上還是有一定的出入。