吳萬(wàn)勤,錢 紅
(1.云南民族大學(xué) 數(shù)學(xué)與計(jì)算機(jī)科學(xué)學(xué)院, 云南 昆明 650500; 2.云南師范大學(xué)文理學(xué)院 信息工程學(xué)院 ,云南 昆明 650231)
降水的分布與人類的生產(chǎn)生活密切相關(guān),對(duì)社會(huì)、經(jīng)濟(jì)和生態(tài)環(huán)境影響顯著.降水量在時(shí)間和空間上的非均勻分布,很大程度上決定了洪澇、干旱和暴雨等氣象災(zāi)害的強(qiáng)度,導(dǎo)致區(qū)域干旱事件的頻繁發(fā)生,地區(qū)水資源的嚴(yán)重短缺,以及洪澇和地質(zhì)災(zāi)害的加劇.昆明市位于我國(guó)云南省低緯高海拔地區(qū),在云貴高原的中心.昆明市近年干旱已成常態(tài),影響了中藥產(chǎn)業(yè),還給當(dāng)?shù)氐幕ɑ墚a(chǎn)業(yè)帶來了損失.科學(xué)準(zhǔn)確的降水預(yù)測(cè),可以使農(nóng)業(yè)、水利等有關(guān)部門及時(shí)采取措施,防止旱澇災(zāi)害,降低不必要的損失.因而對(duì)昆明市降水量做出合乎實(shí)際的預(yù)測(cè)就顯得十分重要.
時(shí)間序列分析法對(duì)降雨量的預(yù)報(bào)有較高的精度,并且操作較方便, 所以該方法在降水量分析中運(yùn)用逐漸普遍起來.馮子溪[1]在基于馬爾科夫鏈與灰色模型的昆明市降雨量預(yù)測(cè)中利用馬爾科夫鏈與灰色模型相結(jié)合的方法建立了合理的模型對(duì)昆明市的年降雨量進(jìn)行了預(yù)測(cè)[1];程敏等[2]基于時(shí)間序列模型對(duì)濟(jì)南市降水量進(jìn)行預(yù)測(cè)分析[2];宮晨[3]在基于ARIMA模型的拉薩降水量時(shí)間序列分析與預(yù)測(cè)中利用ARIMA模型對(duì)其進(jìn)行建模和預(yù)測(cè)[3].王超華等[4]分別建立MA-GARCH模型和MA-EGARCH模型對(duì)降水量進(jìn)行分析和預(yù)測(cè)[4].本論文主要針對(duì)昆明市月降水量進(jìn)行分析和預(yù)測(cè),基于2000—2019年昆明市月降水量數(shù)據(jù)擬合建立模型和相加模型,對(duì)2019年1—12月降水量數(shù)據(jù)預(yù)測(cè),采用實(shí)際值與預(yù)測(cè)值誤差對(duì)比,驗(yàn)證2種模型預(yù)測(cè)效果.相加模型預(yù)測(cè)精度相對(duì)較高,利用相加模型對(duì)昆明市月降水量進(jìn)行3年預(yù)測(cè),并分析預(yù)測(cè)結(jié)果.該模型對(duì)昆明市降水量短期預(yù)測(cè)中有一定參考價(jià)值.
基于中國(guó)統(tǒng)計(jì)年鑒,通過對(duì)2000—2019年昆明市月降水量數(shù)據(jù)分析,可以看出降水量數(shù)據(jù)具有周期波動(dòng)性,并且以年為周期,可以明顯看出干、濕兩季,夏季降水量較多,冬季較少.
具有如下結(jié)構(gòu)的模型稱為求和自回歸移動(dòng)平均模型,簡(jiǎn)記為ARIMA(p,d,q)模型:
(1)
d階差分后序列可以表示為:
(2)
SARIMA模型建模步驟:
①觀察時(shí)間序列周期,確定周期長(zhǎng)度S.
②通過差分保證時(shí)間序列的平穩(wěn)性,確定d值.
③通過自相關(guān)和偏自相關(guān)圖確定非季節(jié)性模型p、q值.
④通過差分平穩(wěn)后的序列圖,自相關(guān)和偏自相關(guān)圖確定季節(jié)模型D、P、Q值.
⑤將選定的p、q、d和P、Q、D的可能值代入SARIMA模型.
⑥根據(jù)Akaike信息準(zhǔn)則(AIC)最小值和t檢驗(yàn)選取最優(yōu)模型[5].
由于昆明市月降水量數(shù)據(jù)具有明顯的周期波動(dòng)性,表現(xiàn)出明顯的年度周期特征,為非平穩(wěn)序列.對(duì)于季節(jié)性波動(dòng)穩(wěn)定的序列,為了提取季節(jié)波動(dòng)信息,通常使用步長(zhǎng)為周期長(zhǎng)度的差分運(yùn)算[6].鑒于此,本文對(duì)所研究的數(shù)據(jù)進(jìn)行1階步長(zhǎng)為12的差分運(yùn)算.通過對(duì)差分運(yùn)算后數(shù)據(jù)的時(shí)序分析.可以得出,1階12步差分可以較好地提取周期信息, 1階12步差分運(yùn)算后序列呈現(xiàn)出明顯的平穩(wěn)性.通過統(tǒng)計(jì)學(xué)分析,數(shù)據(jù)符合ARIMA乘積季節(jié)模型對(duì)平穩(wěn)性的要求.
模型的建立需要進(jìn)行定階和定參.
模型的定階其實(shí)就是確定ARIMA(p,d,q,P,D,Q)S模型適當(dāng)階數(shù),即p,d,q,P,D,Q的數(shù)值.由于對(duì)降水量數(shù)據(jù)進(jìn)行了1階差分和周期為12的差分,因此d=D=1.基于一階12步差分后的自相關(guān)和偏自相關(guān)分析,1階12步差分后的序列,除了一階自相關(guān)系數(shù)在2倍標(biāo)準(zhǔn)差范圍外,其他階數(shù)的自相關(guān)系數(shù)都在2倍標(biāo)準(zhǔn)差內(nèi),偏自相關(guān)系數(shù)拖尾.因此取p=0,P=0,q=1或2再觀察季節(jié)性趨勢(shì),可以看出,自相關(guān)系數(shù)每一季節(jié)效應(yīng)周期(12階)都在2倍標(biāo)準(zhǔn)差外,因此取Q=1或2[6-7].
得到的模型如下:
ARIMA(0,1,1)(0,1,1)12,ARIMA(0,1,2)(0,1,1)12,ARIMA(0,1,1)(0,1,2)12,ARIMA(0,1,2)(0,1,2)12.得到相關(guān)模型估計(jì)結(jié)果和檢驗(yàn)結(jié)果.各個(gè)模型檢驗(yàn)結(jié)果如表1.
由表1可知,僅有模型ARIMA(0,1,1)(0,1,1)12的參數(shù)均通過t檢驗(yàn).故選擇使用ARIMA(0,1,1)(0,1,1)12模型對(duì)昆明市降水量數(shù)據(jù)進(jìn)行建模和預(yù)測(cè).對(duì)該模型ARIMA(0,1,1)(0,1,1)12進(jìn)行最小二乘法估計(jì),估計(jì)結(jié)果為:
表1 模型檢驗(yàn)結(jié)果
(1-B12)xt=(1-0.949 875B)(1-0.911 362B12)εt.
(3)
為了檢驗(yàn)?zāi)P偷挠行?運(yùn)用時(shí)間序列分析軟件建立殘差的自相關(guān)圖,對(duì)殘差進(jìn)行純隨機(jī)性檢驗(yàn).經(jīng)過統(tǒng)計(jì)學(xué)分析表明擬合模型是有效的[5].經(jīng)過t檢驗(yàn),模型ARIMA(0,1,1)(0,1,1)12的參數(shù)統(tǒng)計(jì)量P值均小于顯著性水平(α=0.05).
該論文利用2000—2018年昆明市月降水量的數(shù)據(jù),對(duì)2019年1—12月降水量數(shù)據(jù)進(jìn)行預(yù)測(cè),結(jié)果如圖1,圖中2S.E為二倍標(biāo)準(zhǔn)差曲線.
圖1 擬合圖
結(jié)果表明:預(yù)測(cè)值均在2倍標(biāo)準(zhǔn)差的置信范圍內(nèi),可根據(jù)Theil不相等系數(shù)為0.220 312,以及協(xié)方差比例為0.941 907,得到模型的預(yù)測(cè)結(jié)果較為理想,預(yù)測(cè)效果較好[8].
通過預(yù)測(cè)值與實(shí)際值對(duì)比(見圖 2),圖中X為降水量的實(shí)際值,XF為預(yù)測(cè)值.可以看出該模型擬合較好.
圖2 預(yù)測(cè)值與實(shí)際值對(duì)比圖
Holt-Winters季節(jié)指數(shù)模型包括:Holt-Winters乘法模型和Holt-Winters加法模型2種.
對(duì)于Holt-Winters加法模型,序列通??梢员磉_(dá)為如下模型結(jié)構(gòu):
(4)
式中,{y}表示降水量序列,a為常數(shù)項(xiàng);b為長(zhǎng)期趨勢(shì);c為加法模型的季節(jié)因子,t表示樣本取值時(shí)間,t+k表示將要預(yù)測(cè)的時(shí)期.a,b,c3個(gè)系數(shù)大小通過以下推倒公式來確定:
a(t)=α(yt-ct(t-s))+(1-α)(a(t-1))+b(t-1),b(t)=β(a(t)-a(t-1))+1-βb(t-1),ct(t)=γ(yi-a(t+1))-γct(t-s),
(5)
其中,α,β,γ是3個(gè)平滑因子;s表示周期長(zhǎng)短.
對(duì)于Holt-Winters乘法模型,序列通??梢员磉_(dá)為如下模型結(jié)構(gòu):
(6)
式中,{y}表示降水量序列,a為常數(shù)項(xiàng);b為長(zhǎng)期趨勢(shì);c為加法模型的季節(jié)因子,t表示樣本取值時(shí)間,t+k表示將要預(yù)測(cè)的時(shí)期.a,b,c3個(gè)系數(shù)大小通過以下推倒公式來確定:
(7)
其中,α,β,γ是3個(gè)平滑因子;s表示周期長(zhǎng)短.
學(xué)者們?cè)谘芯吭摲椒〞r(shí)提出了許多有關(guān)α,β,γ的參數(shù)空間選擇的方法,本文要求所有的參數(shù)從區(qū)間[0,1]中選取.
由于降水量序列沒有長(zhǎng)期趨勢(shì),有季節(jié)效應(yīng).故可用Holt-Winters季節(jié)加法模型進(jìn)行預(yù)測(cè).
運(yùn)用公式(4)、公式(5),利用2000—2018年昆明市月降水量的數(shù)據(jù),可以得到模型結(jié)果如下式
(8)
利用軟件進(jìn)行分析,Holt-Winters季節(jié)加法模型Box-Ljung檢驗(yàn)結(jié)果9.
表2 Holt-Winters加法模型模型統(tǒng)計(jì)
結(jié)果顯示Box-Ljung(18)=14.555,P=0.484,P>0.05,故通過白噪聲檢驗(yàn),說明預(yù)測(cè)較準(zhǔn)確.對(duì)殘差序列進(jìn)行統(tǒng)計(jì)學(xué)分析,擬合模型顯著有效[12].通過預(yù)測(cè)值與真實(shí)值對(duì)比見圖3,圖中X為降水量的實(shí)際值,XF為預(yù)測(cè)值.可以看出該模型擬合較好.
圖3 預(yù)測(cè)值與真實(shí)值對(duì)比圖
采取2種模型對(duì)2019年1—12月昆明市月降水量進(jìn)行預(yù)測(cè),并于實(shí)際降水量數(shù)據(jù)進(jìn)行對(duì)比.預(yù)測(cè)結(jié)果顯示:
表3 2種模型預(yù)測(cè)結(jié)果對(duì)比
在本文中發(fā)現(xiàn),在針對(duì)昆明市月降水量序列的預(yù)測(cè)建模過程中,通過誤差比較Holt-Winters相加模型對(duì)實(shí)際數(shù)據(jù)的擬合效果優(yōu)于ARIMA模型.
使用Holt-Winters相加模型基于2000—2019年昆明市月降水量數(shù)據(jù),對(duì)2020—2022年降水量進(jìn)行預(yù)測(cè).
表4 2020-2022年預(yù)測(cè)結(jié)果
從預(yù)測(cè)結(jié)果可以看出3年降水量預(yù)測(cè)結(jié)果具有季節(jié)周期性波動(dòng),與往期數(shù)據(jù)相類似.且在7、8月降水量達(dá)到最高,1月和12月降水量最低,農(nóng)業(yè)、水利等有關(guān)部門就可以及時(shí)采取防澇抗旱措施.
昆明市月降水量會(huì)隨季節(jié)周期性波動(dòng),SARIMA模型是針對(duì)平穩(wěn)時(shí)間序列進(jìn)行擬合預(yù)測(cè)模型,綜合考慮了時(shí)間序列的趨勢(shì)、季節(jié)效應(yīng)、隨機(jī)誤差干擾等因素,可以更好的反應(yīng)原始序列的趨勢(shì)和變化.Holt-Winters相加模型則是根據(jù)數(shù)據(jù)在時(shí)間線上距離的遠(yuǎn)近依次給予不同權(quán)重,近期數(shù)據(jù)影響較大則賦予更大的權(quán)重,遠(yuǎn)期數(shù)據(jù)影響較小而被賦予較小權(quán)重,適合預(yù)測(cè)隨時(shí)間變化趨勢(shì)單一的數(shù)據(jù)[6].ARIMA模型和Holt-Winters模型都屬于短期預(yù)測(cè)模型,它們的預(yù)測(cè)效果會(huì)隨著時(shí)間的推移逐漸變差.從2種方法的預(yù)測(cè)結(jié)果中得出,短期預(yù)測(cè)效果都較好.本文中在針對(duì)昆明市月降水量序列的預(yù)測(cè)建模過程中,Holt-Winters相加模型對(duì)實(shí)際數(shù)據(jù)的擬合效果優(yōu)于SARIMA模型.通過預(yù)測(cè)結(jié)果,可以使農(nóng)業(yè)、水利等有關(guān)部門及時(shí)采取措施,防止旱澇災(zāi)害,降低不必要的損失.