陸靜良
(遼寧省鐵嶺水文局,遼寧 鐵嶺 112000)
水資源量的準確預測將直接對農業(yè)灌溉及人類生產生活產生直接影響,其中地下水、地表水資源主要是依靠降水量進行補給。隨著科技的發(fā)展與進步,降水量時間序列預測的方法發(fā)生巨大的變化,基于人工智能的人工神經網絡、SVR支持向量回歸機等方法在降水量預測分析中得到廣泛的應用[1]。研究表明,相對于傳統(tǒng)的人工神經網絡法支持向量回歸機對降水量預測分析表現(xiàn)出更優(yōu)異的使用性能[2]。但是,降水量受氣候、自然環(huán)境等作用影響,其過程是一個非線性的高度負責系統(tǒng),在時間序列內往往包含著眾多極其負責的條件信息。據(jù)此,通過采取一定的方法和途徑有必要對時間序列所包含的不同信息進行提取和處理。目前,對非穩(wěn)態(tài)、非線性即混沌信號進行處理的有效方法是進行SSA奇異譜分析,可準確地對時間序列的準周期或變化趨勢成分進行提取,并將時間序列化解為獨立的、可解釋的組分,SSA法在金融時序預測、交通流量預測以及徑流量預測等領域已得到廣泛的應用。該方法與SVR向耦合并應用于降雨量預測的的研究相對較少。據(jù)此,本文基于奇異譜分析-支持向量回歸機的耦合作用關系,構建了應用降水量預測的耦合模型,并以遼寧省某氣象站點為研究對象,對所構建的預測模型的有效性和科學性進行了可靠驗證[3- 7]。
分解與重構是奇異譜分析的兩個主要階段,設定T={x1,x2,,xn}為長度N>2的時間序列,進行-L×K介軌跡矩陣的轉化形式如下所示:
(1)
式中,L(L≤N/2)—序列窗口長度;K=N-L+1。
對軌跡矩陣X按照下述公式進行奇異值的分解(SVD):
X=USVT
(2)
式中,S—與X相對應的奇異值,并與矩陣XXT的特征值的平方根相等價;U—與X相對應的左奇異向量,并與矩陣XXT的特征向量相等價;V—與X相對應的右奇異向量,并與XTX的特征向量相等價。
利用奇異譜對時間序列T進行展開分析:
(3)
式中,Ekj—XXT的特征向量,其中E為時間經驗正交函數(shù);aik—時間序列主成分。
(4)
利用對角平均法,通過對原序列進行分解,可得到具有M個長度的N個新序列。
引入一組訓練樣本集,表達式如下:
(x1,y1),(x2,y2),,(xl,yl)
(5)
式中,xi—第i個樣本的輸入列向量;yi—第i個樣本的輸出值;l—訓練樣本集中的樣本總個數(shù)。
對輸入樣本xp進行支持向量回歸機的預測,其輸出值可采用下式進行表述:
(6)
式中,α、α*—均為拉格朗日乘子;b—拉格朗日偏置;K(xpxi)—核函數(shù)。
本研究利用的核函數(shù)為RBF,其公式如下所示:
(7)
式中,γ—與核函數(shù)相對應的參數(shù),其他字母含義同上。
本文以遼寧省東北部地區(qū)某氣象站在1966~2015年共600個的月降水量資料為依據(jù),構建了基于時間序列的降水量預測模型,且對模型進行訓練的樣本數(shù)大于檢驗樣本,其中訓練樣本和檢驗樣本分別占總樣本的85%和15%,即選取時間序列的前42年降水量資料為模型訓練樣本,并構建預測模型;時間序列的后8年降水量資料為模型檢驗樣本,對模型的預測效果和準確性進行檢驗。設定模型預測步長分別為1、3、6個月3種預測步長,以此提高模型預測結果的精度和準確性,并采用迭代預測法進行降水量預測[8]。
2.1.1 輸入模型預測值
基于時間序列的降水量預測模型的輸入值往往采用偏自相關和自相關函數(shù)進行確定,本文對氣象站的月降水量相關函數(shù)進行繪制,如圖1所示。由圖可知,自相關函數(shù)峰值發(fā)生在第12個月處,而偏相關函數(shù)保持在置信區(qū)間范圍內的月份發(fā)生在第12個月后,研究表明前12個月的降水量與某月降水量存在密切關系。據(jù)此,建立訓練和檢驗樣所需的某月降水量輸入值可取與其相對應的前12個月的降水量。
圖1 自相關與偏自相關函數(shù)圖
2.1.2 對原始數(shù)據(jù)進行預處理
對初始月降雨量序列進行奇異譜分析處理,將其分解為多個香菇獨立的子序列。對子序列個數(shù)的確定將直接影響到預測結果的可靠性,若子序列分解數(shù)量太少,則不能保證初始數(shù)據(jù)序列所包含的各成分進行全部的提??;若對子序列分解數(shù)量太多,則可導致預測模型的工作計算量增大,計算效率效率降低。本文首先按照20個子序列數(shù)對初始降水量數(shù)據(jù)進行分解,然后對各子序列所占原始序列的比重進行計算,并以此確定子序列個數(shù),如圖2所示。由圖2可知,當子序列為8個時所占初始序列的比重極小為1.326%,可對其所包含的有效信息忽略。據(jù)此,本文對初始降水量數(shù)據(jù)進行7個子序列的分解,可完全對初始序列所包含的有效成分和信息進行提取,其頻率和周期等信息隨子序列的不同而存在明顯的差異,且按照由大到小1~7的順序,子序列頻率值逐漸增大。為了便于對小波分析的對比,將初始序列按照小波分析同樣可分解為7個相互獨立的子序列[9]。
2.1.3 構建月降水量預測耦合模型
對上述采用奇異譜和小波分析分解出來的7個子序列采用支持向量回歸機法進行分析,并構建與各子序列對應的預測模型。因不同評價指標的單位和量綱存在一定的差異,為消除不同指標間的不可通透性,需對數(shù)值進行歸一化處理,其值取值區(qū)間為[0,1]。對核參數(shù)γ和懲罰因子C兩個關鍵性參數(shù)利用支持向量回歸機及粒子群法進行尋優(yōu)計算。為探討數(shù)據(jù)處理法對預測模型評價結果的精度作用,對未分解處理的初始數(shù)據(jù)同時進行支持向量回歸機耦合模型的預測分析[10]。
耦合模型對降水量預測結果精度的評判標準選取NNSE納什系數(shù)、RRMSE均方根誤差以及平均絕對誤差MMAE指標進行評價。采用不同預測模型分別按照1、3、6個月3種步長類型對訓練和檢驗樣本的評價指標進行計算,統(tǒng)計計算結果見表1。
表1 不同評價模型對各評價指標的統(tǒng)計計算結果
由表1計算結果可知,預測步長為1個月時所構建的SVR模型對訓練樣本和檢驗樣本的RRMSE、MMAE、NNSE分別為25.671、15.372、0.572和28.862、17.250、0.425。WA-SVR模型以及SSA-SVR模型各精度評價指標相對于SVR模型表現(xiàn)出較高的精度,如檢驗樣本的RRMSE、MMAE、NNSE值分別為4.805、3.524、0.982,其RRMSE、MMAE評價指標值相對于SVR模型分別降低了24.057和13.726,而指標NNSE提高了0.557;SSA-SVR模型相對于SVR模型,其RRMSE、MMAE指標值為5.131、3.026分別降低了23.695、14.224,而NNSE為0.984提高了0.559。通過對比分析SSA-SVR和WA-SVR模型的評價指標可知,WA-SVR模型的RRMSE、MMAE評價指標值相對較大,而NNSE值較小,表明WA-SVR模型略優(yōu)于SSA-SVR模型,而兩者對月降水量預測結果的準確性相差不大。
對于月降水量預測模型步長為3、6個月的預測結果顯示,SVR模型對降水量預測結果仍不如期望要求,且明顯低于WA-SVR和SSA-SVR模型。以預測步長為3個月的檢驗樣本為例,WA-SVR和SSA-SVR模型的RRMSE、MMAE、NNSE計算結果值分別為15.157、8.872、0.844和8.724、4.828、0.951,WA-SVR模型的RRMSE、MMAE值相對較大,而NNSE值較小,且兩種模型的精確性評價指標具有明顯的差異性,研究表明對于計算步長為3月的預測分析,SSA-SVR對降水量預測結果優(yōu)于WA-SVR。對于模型預測步長為6個月時,WA-SVR和SSA-SVR模型的RRMSE、MMAE、NNSE值分別為18.764、11.916、0.752和11.341、6.561、0.916,WA-SVR模型的各參數(shù)指標值相對較大,而其NNSE值相對較小,研究表明對計算步長為6個月的月降水量SSA-SVR預測模型優(yōu)于WA-SVR模型,且計算精度相對于3個月計算步長效果有所增大。通過對比分析不同預測步長可知,WA-SVR和SSA-SVR模型對月降水量預測精度從1月至6月逐漸表現(xiàn)出降低趨勢,例如對于檢驗樣本NNSE值的SSA-SVR模型由0.984減少為0.951并降至0.916,其原因主要和預測結果的誤差積累相關;而對于SVR模型其變化趨勢不明顯。
通過上述分析可知:通過對月降水量初始數(shù)據(jù)進行預處理可明顯提高模型的預測精度;相對于短期內的降水量預測,小波分析和奇異譜分析均可明顯提高模型的預測精度,且前者略優(yōu)于后者,但二者的預測精度相差不大;相對于長期內的降水量預測,基于奇異譜分析的降水量預測精度明顯優(yōu)于小波分析,且優(yōu)越性相差趨勢逐漸增大,研究表明奇異譜分析法可明顯提高月降水量預測精度[11]。
為對不同模型的預測結果進行更加直觀、準確的分析,本文以步長為6個月的降水量預測模型為例,對比分析了月降水量實測值和預測值結果。研究表明:基于SSA-SVR模型的月降水量實測值與預測值之間的貼近程度最好,除個別峰值與實測值相差偏大之外,其余各值均勻實測值大致相同,進一步表明該模型具有更好的精確性和可靠性。
本文在詳細分析了小波分析、奇異譜分析和支持向量回歸機基本理論的基礎之上,構建了用于月降水量預測分析的評價模型,并以遼寧省某氣象站為例進行降雨數(shù)據(jù)的分析。研究表明:通過對月降水量初始數(shù)據(jù)進行預處理可明顯提高模型的預測精度;相對于短期內的降水量預測,小波分析和奇異譜分析均可明顯提高模型的預測精度,且前者略優(yōu)于后者,但二者的預測精度相差不大;相對于長期內的降水量預測,基于奇異譜分析的降水量預測精度明顯優(yōu)于小波分析,且優(yōu)越性相差趨勢逐漸增大,研究表明奇異譜分析法可明顯提高月降水量預測精度。