莊燕璇
摘要:本文基于廣州市1998年1月—2019年12月月度降水量數(shù)據(jù),對(duì)序列進(jìn)行建模分析和預(yù)測(cè)?;贏IC和BIC法則分別建立疏系數(shù)模型ARIMA((4,5,6,7,8),1,1)和綜合分析模型Xt=StIt,兩種模型對(duì)2018年數(shù)據(jù)的擬合情況為:疏系數(shù)模的預(yù)測(cè)相對(duì)誤差小于50%的比例為33.33%;而綜合分析模型為58.33%。因此采用綜合分析模型對(duì)廣州市2020年降水量數(shù)據(jù)進(jìn)行預(yù)測(cè),預(yù)測(cè)得出廣州市2020年1月的降水量為54.686 mm,但隨著預(yù)測(cè)期的延長(zhǎng),預(yù)測(cè)精度降低。
關(guān)鍵詞:廣州市降水量序列;AIC;BIC;ARIMA模型;綜合分析方法
降水量是衡量地區(qū)干旱程度的一個(gè)重要指標(biāo),它直接反映了自然界的變化。降水量的多少直接影響農(nóng)業(yè)生產(chǎn),與現(xiàn)在農(nóng)作物的生長(zhǎng)周期和產(chǎn)量更是聯(lián)系密切。同時(shí),降水量的年際變化趨勢(shì)直接制約著區(qū)域社會(huì)經(jīng)濟(jì)發(fā)展和生態(tài)生活環(huán)境,影響著區(qū)域水資源的調(diào)配管理。通過(guò)對(duì)數(shù)據(jù)擬合建立一個(gè)不錯(cuò)的模型進(jìn)行短時(shí)間內(nèi)較精確的預(yù)測(cè),有助于安排農(nóng)業(yè)生產(chǎn),注意防范洪澇災(zāi)害以及對(duì)水資源進(jìn)行調(diào)配,具有重大的現(xiàn)實(shí)意義。
張吉英[1]利用沈陽(yáng)市2005年至2016年的降水量資料,建立了ARIMA(1,1,1)預(yù)測(cè)模型對(duì)沈陽(yáng)市降水量進(jìn)行分析預(yù)測(cè)。張改紅[2]利用渭南市1953年至2013年的降水量資料,采用ARIMA模型對(duì)渭南市降水量趨勢(shì)進(jìn)行模擬分析,建立最優(yōu)降水量預(yù)測(cè)模型,該模型優(yōu)點(diǎn)為短期預(yù)測(cè)精度高。呂志濤[3]利用鄭州市1971年至2013年降水量資料,分別采用了二次多項(xiàng)式擬合、諧波分析法以及自回歸模型構(gòu)建了鄭州市降水量的預(yù)報(bào)模型,預(yù)報(bào)精度較高。
本文以廣州市為研究區(qū)域,利用1998年1月至2019年12月的廣州市降水量資料[4],分別建立ARIMA模型和綜合分析模型對(duì)廣州降水趨勢(shì)進(jìn)行分析,最后選擇最優(yōu)模型進(jìn)行預(yù)測(cè)應(yīng)用。
首先基于AIC和BIC法則分別建立疏系數(shù)模型ARIMA((4,5,6,7,8),1,1)和綜合分析模型Xt=StIt。接著根據(jù)模型對(duì)2018年的擬合結(jié)果選擇最優(yōu)模型,發(fā)現(xiàn)此背景下綜合分析方法優(yōu)于ARIMA模型。最后采用綜合分析模型對(duì)廣州市2020年的降水量數(shù)據(jù)進(jìn)行預(yù)測(cè)。
本文的創(chuàng)新點(diǎn)在于分別選取了ARIMA模型和綜合分析模型對(duì)降水量數(shù)據(jù)進(jìn)行分析,并通過(guò)對(duì)比預(yù)測(cè)效果挑選相對(duì)最優(yōu)模型對(duì)2020年降水量進(jìn)行預(yù)測(cè)。
1? ? 研究方法與理論分析
本章分為三節(jié),第一、二節(jié)分別簡(jiǎn)要介紹ARIMA和綜合分析方法的一般形式和建模步驟;第三節(jié)則給出模型精度評(píng)估方法。
1.1 ARIMA模型
1.1.1 ARIMA模型的一般形式
(1.1)
1.1.2 ARIMA模型建模的大體步驟
一、對(duì)初始時(shí)間序列進(jìn)行平穩(wěn)性分析,利用ADF檢驗(yàn)對(duì)序列的平穩(wěn)性進(jìn)行檢驗(yàn)[5]。
若初始時(shí)間序列平穩(wěn),則接著進(jìn)行白噪聲檢驗(yàn);若初始時(shí)間序列不平穩(wěn),則對(duì)初始時(shí)間序列差分平穩(wěn)化后進(jìn)行白噪聲檢驗(yàn)。
若檢驗(yàn)結(jié)果顯示為非白噪聲序列,則擬合ARMA模型。
對(duì)擬合后的殘差序列進(jìn)行白噪聲檢驗(yàn),若殘差序列為白噪聲,則說(shuō)明初始時(shí)間序列的信息被充分提取,即模型較好;若殘差序列為非白噪聲,則需要重新進(jìn)行擬合。
若ARIMA(p,d,q)模型中有部分自相關(guān)函數(shù)或部分平滑系數(shù)為零,那么該模型成為疏系數(shù)模型,記為ARIMA((p1,...,pm),d,(q1,...qn))。
1.2 綜合分析方法
1.2.1 將序列進(jìn)行混合模式分解
(1.2)
其中,Tt為趨勢(shì)效應(yīng)擬合,St為季節(jié)效應(yīng)擬合, It為隨機(jī)波動(dòng)。
1.2.2 求出季節(jié)效應(yīng)擬合
假定時(shí)間序列 周期長(zhǎng)度為m,則季節(jié)指數(shù)的計(jì)算公式如式(1.3)所示。
(1.3)
其中為每個(gè)周期內(nèi)的平均值,為總體均值。
1.2.3 對(duì)趨勢(shì)效應(yīng)Tt進(jìn)行擬合
對(duì)趨勢(shì)效應(yīng)常用以自變量為時(shí)間t的冪函數(shù)進(jìn)行擬合,即
(1.4)
1.2.4 對(duì)殘差序列擬合移動(dòng)平均模型,以便充分提取相關(guān)信息
(1.5)
由(1.2)、(1.4)、(1.5)構(gòu)造模型如下:
(1.6)
1.3 精度評(píng)估
本文用兩個(gè)準(zhǔn)則來(lái)評(píng)估預(yù)報(bào)模型的精度。
一、相對(duì)誤差=,這是反映單個(gè)預(yù)測(cè)值精度的指標(biāo)。
二、平均絕對(duì)百分比誤差這是反映一組預(yù)測(cè)值精度的指標(biāo)。
其中,是時(shí)刻t的預(yù)測(cè)值,yi是時(shí)刻t的原始值,n是預(yù)測(cè)數(shù)。
2? ? 廣州月度降水量時(shí)序模型
2.1 ARIMA模型的應(yīng)用
2.1.1 序列觀察
本文對(duì)1998年1月—2019年12月264個(gè)廣州月度降水量進(jìn)行分析。本文用前240個(gè)數(shù)據(jù)參與建模,并用2018、2019年的數(shù)據(jù)檢驗(yàn)?zāi)P偷臄M合效果,最后對(duì)2020年進(jìn)行預(yù)測(cè)。
首先作時(shí)序圖如圖1所示。
由圖1可以看出該序列具有以下特點(diǎn):有明顯的非零均值,有一定的周期性,周期為12個(gè)月,說(shuō)明該序列是非平穩(wěn)的。
因?yàn)榻邓繒r(shí)間序列是非平穩(wěn)時(shí)間序列,因此,我們先對(duì)初始時(shí)間序列進(jìn)行差分平穩(wěn)化后。
2.1.2 進(jìn)行1階差分
首先對(duì)原序列χt做1階差分,得到序列▽?duì)謙,接著進(jìn)行單位根檢驗(yàn)判斷序列▽?duì)謙的平穩(wěn)性。檢驗(yàn)結(jié)果見(jiàn)圖2。
由圖2可以看出,該序列單位根檢驗(yàn)的p值均小于0.0001。因此,在顯著性水平0.05下認(rèn)為序列▽?duì)謙是平穩(wěn)的。
2.1.3 擬合ARMA模型
根據(jù)2.1.2得出:序列▽?duì)謙是平穩(wěn)時(shí)間序列。因此可以采用ARMA模型來(lái)擬合序列▽?duì)謙。根據(jù)BIC準(zhǔn)則,本文選擇ARMA(8,1)模型來(lái)擬合序列▽?duì)謙。采用最小二乘法估計(jì)參數(shù),因?yàn)槟P虯RMA(8,1)的一些參數(shù)不顯著,所以需要重新估計(jì)。接著,逐步剔除掉模型中不顯著的參數(shù),直到模型剩下的參數(shù)均顯著為止。剔除的過(guò)程不在此處贅述,最后采用了無(wú)常數(shù)項(xiàng)的疏系數(shù)模型ARMA((4,5,6,7,8),1)來(lái)擬合序列▽?duì)謙。參數(shù)估計(jì)見(jiàn)圖3。
由圖3可以看出,變量“MA1,1”、“AR1,1”、“AR1,2”、“AR1,3”和“AR1,4”的t檢驗(yàn)的p值均小于0.05。因此,在顯著性水平0.05下可以認(rèn)為這5個(gè)參數(shù)顯著非零。而變量“AR1,5”的t檢驗(yàn)的p值為0.0537。因此在顯著性水平0.05下認(rèn)為該參數(shù)不顯著而在顯著性水平0.01下是顯著的。權(quán)衡了擬合后殘差的白噪聲檢驗(yàn)結(jié)果后決定將該參數(shù)加入模型中,即可用模型ARMA((4,5,6,7,8),1)來(lái)擬合序列 。
2.1.4 模型的檢驗(yàn)
為了檢驗(yàn)?zāi)P蛯?duì)序列 的擬合效果,我們首先對(duì)擬合后的殘差序列進(jìn)行白噪音檢驗(yàn),檢驗(yàn)結(jié)果見(jiàn)圖4。
由圖4可以看出,白噪聲檢驗(yàn)的p值均大于0.05。因此,在顯著性水平0.05下認(rèn)為殘差序列為白噪聲,說(shuō)明該模型的擬合效果好。
所以通過(guò)對(duì)1998年1月—2017年12月廣州降水量月度數(shù)據(jù)進(jìn)行擬合并優(yōu)化得到的具體模型是:
(2.1)
接下來(lái)需要通過(guò)比較模型的生成數(shù)據(jù)與現(xiàn)實(shí)的測(cè)度數(shù)據(jù)來(lái)觀察模型對(duì)廣州降水量的擬合效果。利用模型對(duì)2018年及2019年的廣州降水量月度數(shù)據(jù)做外推預(yù)報(bào)并計(jì)算相對(duì)誤差見(jiàn)表1。
由表1可以看出廣州市2018年實(shí)際降水量與預(yù)測(cè)值的相對(duì)誤差的平均值為1.23,而2019年為14.07。2018年相對(duì)誤差在30%以內(nèi)的比例為33.33%,而2019年相對(duì)誤差在30%以內(nèi)的比例為25%。因此,可以看出該模型對(duì)2018年降水量的擬合效果比2019年的好,從而可以看出,該模型不適用于長(zhǎng)期預(yù)測(cè)。
從預(yù)測(cè)結(jié)果可以得出以下結(jié)論:第一,疏系數(shù)模型模型作為廣州市降水量預(yù)測(cè)模型是可行的;第二,該模型適合短期預(yù)測(cè),隨著預(yù)測(cè)的延長(zhǎng),預(yù)測(cè)的誤差將逐漸增大。
2.2 綜合分析方法的應(yīng)用
2.2.1 求出季節(jié)效應(yīng)擬合
一、計(jì)算季節(jié)指數(shù)
根據(jù)式(1.3)計(jì)算各月季節(jié)指數(shù)數(shù)據(jù)見(jiàn)表2。
由表2可看出,廣州降水量1月與2月較平穩(wěn),且降水量較少,3月—5月急速上升,5月—6月較為平穩(wěn),7月至12月呈現(xiàn)下降趨勢(shì)。其中1、2、3、10、11和12月的季節(jié)指數(shù)小于1,到12月時(shí)達(dá)到最低谷。4月—9月的季節(jié)指數(shù)均大于1,在六月達(dá)到最高峰。
3.2.2 對(duì)隨機(jī)波動(dòng)It進(jìn)行擬合
2.2.1節(jié)已求出季節(jié)效應(yīng)擬合,下面以原時(shí)間序列值除以對(duì)應(yīng)的季節(jié)效應(yīng)擬合,得到的不包含季節(jié)效應(yīng)的隨機(jī)波動(dòng)的綜合值,即:,圖5為序列{Xt/St}的時(shí)序圖。
由圖5可以看出,序列{Xt/St}基本消除了季節(jié)性,且不具有趨勢(shì)性,可以初步判定序列{Xt/St}是平穩(wěn)時(shí)間序列。
為了進(jìn)一步的判斷序列{Xt/St}的平穩(wěn)性,接著對(duì)其進(jìn)行單位根檢驗(yàn),檢驗(yàn)結(jié)果為在顯著性水平0.05下認(rèn)為該序列是平穩(wěn)時(shí)間序列。
2.2.3 對(duì)隨機(jī)波動(dòng) 擬合ARMA模型
將隨機(jī)波動(dòng)作為一個(gè)新的序列,按照1.1.2節(jié)介紹的方法建立ARMA模型來(lái)進(jìn)行擬合,根據(jù)BIC準(zhǔn)則:本文選擇ARMA(1,1)模型進(jìn)行建模。
接著,我們采用無(wú)常數(shù)項(xiàng)ARMA(1,1)模型擬合隨機(jī)波動(dòng)序列{Xt/St},參數(shù)估計(jì)見(jiàn)圖6。
圖6? 隨機(jī)波動(dòng)模型參數(shù)估計(jì)結(jié)果
由圖6可以看出,變量“MA1,1”和變量“AR1,1”的t檢驗(yàn)p值均小于0.0001。因此,在顯著性水平0.05下認(rèn)為該參數(shù)顯著非零。
隨機(jī)波動(dòng)模型如下:
(2.2)
從而最終模型為:
(2.3)
2.2.4 模型檢驗(yàn)
為了檢驗(yàn)?zāi)P停?.3)的擬合效果,首先對(duì)擬合后的殘差序列進(jìn)行白噪音檢驗(yàn),檢驗(yàn)結(jié)果為在顯著性水平0.01下無(wú)法拒絕殘差序列為白噪聲。說(shuō)明模型(2.3)提取信息充分,擬合效果較好。
為了對(duì)模型進(jìn)行檢驗(yàn),下面利用模型對(duì)于2018年及2019年的廣州降水量月度數(shù)據(jù)做外推預(yù)報(bào),得到的預(yù)報(bào)值見(jiàn)表3。
由表3可以看出廣州市2018年實(shí)際降水量與預(yù)測(cè)值的相對(duì)誤差的平均值為0.50,而2019年為7.00。2018年預(yù)測(cè)相對(duì)誤差在30%以內(nèi)的比例為33.33%,而2019年預(yù)測(cè)相對(duì)誤差在30%以內(nèi)的比例為25%。因此,可以看出該模型對(duì)廣州市2018年降水量的擬合效果比2019年的好,且該模型不適用于長(zhǎng)期預(yù)測(cè)。
從預(yù)測(cè)結(jié)果可以得出以下結(jié)論:第一,綜合分析方法作為廣州市降水量預(yù)測(cè)模型是可行的;第二,該模型適合短期預(yù)測(cè),隨著預(yù)測(cè)的延長(zhǎng),預(yù)測(cè)的誤差將逐漸增大。
2.3 兩種模型的對(duì)比與預(yù)測(cè)
根據(jù)2.1和2.2的分析,兩種模型均不適用于長(zhǎng)期預(yù)測(cè)。因此,我們將根據(jù)兩種模型的短期預(yù)測(cè)效果即對(duì)2018年降水量的預(yù)測(cè)效果來(lái)判斷兩種模型的好壞,并用相對(duì)較好的模型來(lái)對(duì)廣州2020年的降水量進(jìn)行預(yù)測(cè)。
2.3.1 兩種模型的對(duì)比
本文通過(guò)兩個(gè)角度來(lái)對(duì)比兩種模型,其一是兩種模型預(yù)測(cè)精度的比較;其二是預(yù)測(cè)結(jié)果的整體規(guī)律比較。
2.3.1.1 預(yù)測(cè)精度比較
由表1和表3可以看出,采用ARIMA模型擬合的2018年降水量的相對(duì)誤差低于50%的占比33.33%;而采用綜合分析方法預(yù)測(cè)的相對(duì)誤差低于50%的占比為58.33%,比ARIMA模型高出25%。因此,從預(yù)測(cè)精度看,綜合分析方法要優(yōu)于ARIMA模型。
2.3.1.2 預(yù)測(cè)結(jié)果的整體規(guī)律比較
分別計(jì)算實(shí)際數(shù)據(jù)以及兩種模型擬合2018年降水量的平均數(shù)、中位數(shù)、極差,見(jiàn)表4。
由表4可得疏系數(shù)模型擬合值的平均數(shù)、中位數(shù)和極差與實(shí)測(cè)值的平均數(shù)、中位數(shù)和極差的差值分別均大于綜合分析方法。因此,從預(yù)測(cè)結(jié)果的整體規(guī)律看,綜合分析方法要優(yōu)于ARIMA模型。
綜上所述,我們認(rèn)為綜合分析方法更適用于擬合廣州市月降水量。
2.3.2 模型的預(yù)測(cè)
根據(jù)2018年1月—2019年12月觀測(cè)的實(shí)際值進(jìn)一步修正模型后,得到廣州市2020年1—12月降水量預(yù)測(cè)值及其置信區(qū)間,見(jiàn)表5。
從對(duì)2020年的預(yù)測(cè)結(jié)果上看,廣州市降水量仍然延續(xù)以往的發(fā)展規(guī)律。2020年1月—2月降水量小且平緩,3月—6月急速增長(zhǎng)且在六月達(dá)到最高峰,然后6月—9月總體呈現(xiàn)急速下降的趨勢(shì),但是7月—8月降水量增加,在10月—12月降水量較小且變化平緩。
3? ? 結(jié)論分析與建議
本文基于ARIMA((4,5,6,7,8),1,1)模型擬合廣州市降水量序列,所得到的模型BIC值為3001.104,AIC值為2980.245,而綜合分析模型為3048.52和3041.559。根據(jù)模型對(duì)2018年和2019年降水量數(shù)據(jù)的擬合結(jié)果得出兩種模型均只適用于短期預(yù)測(cè)。
最后根據(jù)模型對(duì)2018年的擬合結(jié)果選擇最優(yōu)模型。兩種模型對(duì)2018年數(shù)據(jù)的擬合情況為:疏系數(shù)模的預(yù)測(cè)相對(duì)誤差小于50%的比例為33.33%;而綜合分析模型為58.33%。疏系數(shù)模型擬合值的平均數(shù)、中位數(shù)和極差與實(shí)測(cè)值的差值均大于綜合分析模型。因此,采用綜合分析模型(2.3)對(duì)廣州市2020的降水量數(shù)據(jù)進(jìn)行預(yù)測(cè),預(yù)測(cè)結(jié)果見(jiàn)表5。但隨著預(yù)測(cè)期的延長(zhǎng),預(yù)測(cè)精度降低。建議在使用綜合分析模型預(yù)測(cè)年降水量時(shí),盡量保證數(shù)據(jù)序列足夠的情況下,采用逐年實(shí)時(shí)校正的預(yù)測(cè)方法。然后參考預(yù)測(cè)的結(jié)果做出相應(yīng)的水資源調(diào)配以及防洪措施。
參考文獻(xiàn)
[1] 張吉英.基于ARIMA模型的沈陽(yáng)市月降水量時(shí)間序列分析[J].內(nèi)蒙古水利,2019(6):13-14.
[2] 張改紅.基于ARIMA模型的渭南市降水量趨勢(shì)分析與預(yù)測(cè)[J].價(jià)值工程,2019,38(34):197-199.
[3] 呂志濤.時(shí)間序列分析方法在鄭州市降水量預(yù)報(bào)中的應(yīng)用[J].南水北調(diào)與水利科技,2014,12(4):35-37,56.
[4] 國(guó)家統(tǒng)計(jì)局.中國(guó)統(tǒng)計(jì)年鑒(2020)[M].北京:中國(guó)統(tǒng)計(jì)出版社,2020.
[5] 王燕.應(yīng)用時(shí)間序列分析[M].北京:中國(guó)人民大學(xué)出版社,2005.