郝慧慧,朱涵鈺
(華北水利水電大學管理與經(jīng)濟學院,鄭州450046)
降水量和日常生活的旱澇預報、水文水情分析的研究息息相關[1]。隨著人類活動加劇,大量溫室氣體排放,全球溫度不斷升高。干旱和極端降水頻繁發(fā)生,給國家經(jīng)濟發(fā)展和人類生產(chǎn)、生活造成嚴重影響,甚至威脅到人類生命財產(chǎn)安全[2]。降水量的多少直接關系到農(nóng)業(yè)發(fā)展以及各項政策的制定與實施,建立有效的降水量預測預警模型對我國各行各業(yè)的發(fā)展具有重大意義[3]。因此,對降水量數(shù)據(jù)序列進行分析與預測,可為區(qū)域水資源合理利用和防汛減災工作提供數(shù)據(jù)支撐,對保證國民經(jīng)濟和社會發(fā)展具有重要意義[4]。
降水量預測模型可以概括為解釋型和數(shù)據(jù)驅動型[5]。對于解釋型模型,Priya 等[6]采用ARIMA 模型進行了印度西部季風前降雨數(shù)據(jù)的趨勢分析。張帥等[7]選取了遞歸神經(jīng)網(wǎng)絡模型(RNN)解決了降雨量長期預測問題,并選用前饋神經(jīng)網(wǎng)絡模型(FNN)、小波神經(jīng)網(wǎng)絡模型(WNN)和整合移動平均自回歸模型(ARIMA)進行對比分析。Byung 等[8]采用ARIMA 模型進行了蒙古地區(qū)降水量時空變異性評價和季節(jié)性預測。對于數(shù)據(jù)驅動型模型,宋帆等[9]基于聚類分析的模糊馬爾科夫鏈模型,對全國16 個站點的降雨量進行預測。盧維學等[10]采用隨機森林算法的偏最小二乘回歸(PLS)模型,對城市的降水量進行預測。梁顯麗等[11]基于加權馬爾可夫預測模型對鄂爾多斯市1961?2019年的降水量數(shù)據(jù)進行預測。熊文真等[12]采用HP?ENN?MC 模型預測了某地區(qū)1990?2015年植物生育期的降雨量。上述模型對時間序列的數(shù)據(jù)要求比較苛刻,同時不能很好地描述數(shù)據(jù)序列的復雜性,限制了模型的使用與發(fā)展。
隨著灰色系統(tǒng)模型的提出與發(fā)展,諸多學者開始轉向利用灰色預測模型對降水量數(shù)據(jù)進行預測和仿真研究。任曄等[13]采用灰色神經(jīng)網(wǎng)絡組合預測模型對黑龍江省慶安縣年降雨量進行了預測建模。嚴小華[14]采用GM(1,N)模型進行了巢湖區(qū)域主汛期降水量長期預測。吳秀明等[15]基于離散型灰色DGM(1,1)預測模型對鞍山市1959?2006年的降雨量進行澇災預測。謝道文等[16]基于灰色系統(tǒng)分析理論建立了優(yōu)選模型對降雨量監(jiān)測點進行了選擇。結果表明灰色模型對具有貧信息、不確定性、指數(shù)特征的數(shù)據(jù)序列具有很好的預測效果。而實際的降水量具有非線性、非平穩(wěn)的特點,受自然和人為因素的影響,降水量隨時可能產(chǎn)生跳躍、擺動的特征,導致模型預測效果不夠理想。因此,針對數(shù)據(jù)特征波動不穩(wěn)定的特點,引入分位數(shù)構建非等間隔等高線;針對數(shù)據(jù)具有上升或下降的波動特點,引入斜率等高線;本文構建了斜率非等間隔灰色波形預測模型。并對河南省降水量進行預測,驗證了模型的有效性。
河南省位于中國中東部地區(qū),地理位置為北緯31°23'~36°22',東經(jīng)110°21'~116°39',東連安徽、山東,南靠河北、山西,北鄰湖北,土地面積為16.7 萬km2,有17 個省直轄市和1 個省直管市。河南省地處亞熱帶和暖溫帶氣候區(qū),地形、地貌、土壤、氣候都有明顯的過渡性特征。地勢西高東低,中東部為平原,西南部為丘陵,降水量多年分布不均,年際間變化較大。本文選取1990?2019年河南省降水量數(shù)據(jù),數(shù)據(jù)來源于《河南省統(tǒng)計年鑒》《河南省農(nóng)村年鑒》,如圖1所示。
圖1 河南省1990-2019年的降水量趨勢圖Fig.1 Precipitation trend chart of Henan Province from 1990 to 2019
灰色波形預測是對數(shù)據(jù)序列的整體發(fā)展變化進行預測,該類數(shù)據(jù)具有變化不規(guī)則的特點,通過對等間隔的等高線與數(shù)據(jù)序列波動圖形折線的交點橫坐標進行GM(1,1)建模。該方法對擺動幅度較為固定,或者具有近似正弦波動的數(shù)據(jù)序列(圖2)具有很好的預測效果。等高線的選取、確定等高時刻序列、對等高時刻序列進行GM(1,1)建模為灰色波形預測模型的3個步驟。等高線的選取和確定等高時刻序列可以看做是提取數(shù)據(jù)圖形信息的過程,根據(jù)等高線和數(shù)據(jù)折線的交點提取規(guī)律信息進行GM(1,1)建模。
圖2 具有正弦波動趨勢Fig.2 It has a sinusoidal trend
傳統(tǒng)的灰色波形預測模型是選取等間隔的水平等高線建立GM(1,1)模型群,該方法對于平穩(wěn)周期性水平波動的數(shù)據(jù)具有較好的預測效果。對于呈現(xiàn)上升(圖3)、下降(圖4)或波動幅度不穩(wěn)定(圖5)的數(shù)據(jù)序列,無法根據(jù)數(shù)據(jù)波動特征準確高效的提取圖形信息。因此本文引入分位數(shù)構建非等間隔斜率等高線波形預測模型。
圖3 具有上升波動趨勢Fig.3 It has an upward trend of fluctuation
圖4 具有下降波動趨勢Fig.4 It has a downward trend of fluctuation
圖5 具有不穩(wěn)定波動趨勢Fig.5 It has the tendency of unstable fluctuation
定義1:設原始序列X=(x(1),x(2),…,x(i),…,x(n)),則稱xk=x(k)+(t?k)[x(k+1)?x(k)]為序列X的(k)~(k+1)段的線段,其中k∈[1,n]為整數(shù),t∈[k,k+1]為未知參數(shù)。稱{xk=x(k)+(t?k)[x(k+1)?x(k)],|k=1,2,…,n?1}為序列X的折線,即為X={xk=x(k)+(t?k)[x(k+1)?x(k)],|k=1,2,…,n?1}。
定義2:(斜率等高線)設原始序列為X=(x(1),x(2),…,x(i),…,x(n)),擬合線性回歸方程為:
式中:ε為線性誤差項;k∈[1,n]為整數(shù)。
定義3:(非等間隔等高線) 令原始序列為X=(x(1),x(2),…,x(i),…,x(n)),設原始序列的最大最小值分別為xα(i)和xα(j)。則有1°原始序列最低等高線和最高等高線為ξ0=α0+α1k和ξs=αs+α1k,其中α0=xα(i)?α1i,αs=xα(j)?α1j。2°令(ξ1,ξ2,…,ξs?1)為數(shù)據(jù)序列的s等分位,則定義ξi=α1k+α0++ξ'i,i=1,2,…,s?1。其中ξ'i=則稱 (ξ0,ξ1,ξ2,…,ξs?1,ξs)所確定的斜率非等間隔等高線為原始數(shù)據(jù)的s+1條等高線。
根據(jù)2.1 節(jié)確定的非等間隔等高線,按照等高線序列出現(xiàn)的時間先后順序確定等高時刻序列。
定義4:(等高點) 設方程組(2) 的解為(tl,x(tl)),l=1,2,…,則(tl,x(tl)),l=1,2,…為ξi?等高點,是折線X與ξi?等高線的交點。
命題1:若X的第(k)~(k+1)段上有ξi?等高點,則其坐標為 :
證明:第(k)~(k+1) 段折線方程為xk=x(k)+(t?k)[x(k+1)?x(k)],聯(lián)立令ξi(k)=α1k+αi,ξi(k+1)=α1(k+1)+αi,則有αi=ξi(k)?α1k,α1=ξi(k+1)?ξi(k),帶入聯(lián)立方程可得X的第(k)~(k+1) 段上與ξi?等高線交點的橫坐標為k+
定義5:(等高時刻序列)設Xξi=(P1,P2,…,Pmi)為ξi?等高點序列,其中Pj位于第(kj)~(kj+1)段折線上,其坐標為:記qj=kj+則稱Q(i0)=(qi(1),qi(2),…,qi(mi)),i=0,1,2,…,s為ξi?等高時刻序列。
經(jīng)典GM(1,1)建模至少需要4個數(shù)據(jù)才能完成。因此,本文構建的非等間隔斜率等高線波形預測模型對含有4 個及4 個以上元素等高序列的橫坐標建模。
定義6:設Q(i0)=(qi(1),qi(2),…,qi(mi)),i=0,1,2,…,s為ξi?等高時刻序列,為ξi?等高時刻序列GM(1,1)預測值,刪除無效預測時刻,并將剩余預測值從小到大進行排序,得到(1) <(2) <…<(ns),其中若X=ξq(k)為q(k)所對應的斜率等高線,則X(0)的預測波形為其中
依據(jù)上述分析步驟,進行等高線選取。當s=9 時,10 條等高線斜率為?4.48,常數(shù)項分別為(α0,α1,…,α9)=(663.5,720.79,777.08,833.87,890.66,946.96,1 003.75,1 060.54,1 116.83,1 173.62)。由此確定10條等高時刻序列如下:
由GM(1,1)建模性質(zhì)可知,GM(1,1)建模至少需要4個數(shù)據(jù),故本文對組等高時刻序列進行GM(1,1)建模,得到各等高時刻序列的時間響應式為:
根據(jù)等高時刻預測序列和GM(1,1)建模,得到非等間隔斜率等高線波形預測結果,如圖6所示。為了驗證本文模型的有效性,選用傳統(tǒng)的灰色波形預測模型和經(jīng)典的GM(1,1)預測模型進行對比分析,結果如圖7和圖8所示。由圖7可知,傳統(tǒng)的灰色波形預測波動性較大,主要原因是傳統(tǒng)灰色波形預測選取水平等間隔的等高線,在提取數(shù)據(jù)時,沒有考慮數(shù)據(jù)的下降趨勢和分布特征,從而導致擬合數(shù)據(jù)波動性較大,擬合結果誤差較高。由圖8可知,經(jīng)典GM(1,1)預測擬合值雖然出現(xiàn)明顯的下降趨勢,但忽略了數(shù)據(jù)的波動性特征,擬合誤差較大。
圖6 改進灰色波形預測Fig.6 Improved grey waveform prediction
圖7 傳統(tǒng)灰色波形預測Fig.7 Traditional grey waveform prediction
圖8 經(jīng)典GM(1,1)預測Fig.8 Classical GM(1,1)prediction
在預測精度方面,選用均方根誤差和平均相對誤差對模型精度進行檢驗,結果如表1所示。由表1可知,改進的灰色波形預測模型在均方根誤差和平均相對誤差方面均優(yōu)于傳統(tǒng)的灰色波形預測模型和經(jīng)典的GM(1,1)預測模型。
表1 預測精度對比Tab.1 Comparison of prediction accuracy
針對降水量年際間非平穩(wěn)、非線性的特點,本文在已有波形預測模型的基礎上,引入斜率非等間隔波形預測模型,選取1990?2019年河南省降水量數(shù)據(jù)進行驗證。結果表明,斜率非等間隔灰色波形預測模型在預測降水量時的精度明顯提高。通過對比分析可知,改進的灰色波形預測方法對于具有非平穩(wěn)、非線性特征的數(shù)據(jù)序列具有較好的預測效果。目前,采用灰色波形預測模型對降水量預測的應用較少,值得研究和改進的部分還有很多,不僅體現(xiàn)在對模型的改進,結合其他模型對灰色波形預測模型進行優(yōu)化也是未來工作的一部分。