李海波 廈門大學(xué)嘉庚學(xué)院
降水是生態(tài)環(huán)境對(duì)氣候變化響應(yīng)的一個(gè)重要變量,未來(lái)一定時(shí)期降水量的預(yù)測(cè),對(duì)于區(qū)域水資源規(guī)劃和分配至關(guān)重要,關(guān)系國(guó)計(jì)民生。然而,降水量受各種因素的影響,且影響程度和方式很難確定。對(duì)于降水量的預(yù)測(cè)目前主要有兩種方法:一種是采用統(tǒng)計(jì)模型進(jìn)行預(yù)測(cè);一種是結(jié)合回歸分析進(jìn)行預(yù)測(cè)。這兩種方法在國(guó)內(nèi)外運(yùn)用較為廣泛,也取得了相應(yīng)的研究成果。
混沌最開始是研究天氣預(yù)報(bào)的“蝴蝶效應(yīng)”,從時(shí)間序列來(lái)研究混沌,開始于Packard 等人提出的重構(gòu)相空間理論。目前,已經(jīng)有很多種方法被應(yīng)用于混沌時(shí)間序列預(yù)測(cè)研究中,如基于神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)和最小二乘支持向量機(jī)預(yù)測(cè)方法。
由于氣候具有一定的持續(xù)性,月降水量與過(guò)去幾年的數(shù)據(jù)相關(guān)性更大,在短期內(nèi)系統(tǒng)的動(dòng)力學(xué)特性具有一定的混沌特性。本文采用最小二乘支持向量機(jī)(LS-SVM)預(yù)測(cè)方法,用前t 年數(shù)據(jù)作為樣本,以預(yù)測(cè)后一年數(shù)據(jù)。本文使用的資料是國(guó)家氣候中心整編的1951 ~1995 年中國(guó)160 站月降水量資料。
要對(duì)混沌時(shí)間序列預(yù)測(cè),首先要進(jìn)行相空間重 構(gòu)。 對(duì) 混 沌 時(shí) 間 序 列{y(i)}, 進(jìn) 行 重 構(gòu) 相 空 間,其中yi為重構(gòu)矢量,τ為時(shí)間延遲,m 為嵌入維,T 表示轉(zhuǎn)置。
支持向量機(jī)(Support Vector Machine,SVM)[10] 是Vapnik等人首先提出的。支持向量機(jī)是建立在統(tǒng)計(jì)學(xué)習(xí)理論(VC 維理論)和結(jié)構(gòu)風(fēng)險(xiǎn)最小化原則基礎(chǔ)上的,在有限的樣本下,能夠獲得最好的泛化能力。
最小二乘支持向量機(jī) (Least Squares Support Vector Machine,LS-SVM) 和SVM 的 區(qū) 別 就 在 于,LS-SVM 把SVM 中的不等式約束變?yōu)榈仁郊s束,SVM 中的問(wèn)題是QP 問(wèn)題,而在LSSVM 中則簡(jiǎn)化為解一個(gè)線性方程組。與人工神經(jīng)網(wǎng)絡(luò)相比,它能克服訓(xùn)練時(shí)間長(zhǎng)、訓(xùn)練結(jié)果存在隨機(jī)性以及過(guò)學(xué)習(xí)的不足。
LS-SVM 回 歸 模 型:y(X)= ∑αiK(X,Xi)+b〗,其 中K(X,Xi)稱為核函數(shù),b 為偏置量。通過(guò)求解上述線性方程組,得到優(yōu)化變量α 和b 的值。
以某地區(qū)為研究區(qū)域,數(shù)據(jù)選取該地區(qū)1980—1992 年每月的降水量。首先計(jì)算最大Lyapunov指數(shù)為0.21,說(shuō)明該時(shí)間序列是混沌的,并可預(yù)測(cè)。用Liangyue Cao 算法計(jì)算嵌入維得m=2,用C-C 算法[13]計(jì)算時(shí)間延遲得τ=4。LS-SVM 模型參數(shù)設(shè)置為:[x(k),x(k-τ)]作為輸入樣本,x(k+1)作為目標(biāo)樣本,RBF_kernel 作為徑向基核函數(shù),回歸參數(shù)設(shè)置為gam=100,核函數(shù)設(shè)置為sig2=1。1980-1989 年共10 年數(shù)據(jù)作為訓(xùn)練數(shù)據(jù),1990 年數(shù)據(jù)作為測(cè)試數(shù)據(jù),得到表1 和圖1;1981-1990 年共10 年數(shù)據(jù)作為訓(xùn)練數(shù)據(jù),1991 年數(shù)據(jù)作為測(cè)試數(shù)據(jù),得到表2 和圖2;1982-1991 年共10 年數(shù)據(jù)作為訓(xùn)練數(shù)據(jù),1992年數(shù)據(jù)作為測(cè)試數(shù)據(jù),得到表3 和圖3。
表1 1990 年月預(yù)測(cè)降水量和實(shí)測(cè)降水量對(duì)比分析結(jié)果
圖1 1990 年預(yù)測(cè)月降水量和實(shí)測(cè)降水量對(duì)比圖(實(shí)線為預(yù)測(cè)值,圈號(hào)為實(shí)測(cè)值)
表2 1991 年月預(yù)測(cè)降水量和實(shí)測(cè)降水量對(duì)比分析結(jié)果
圖2 1991年預(yù)測(cè)月降水量和實(shí)測(cè)降水量對(duì)比圖(實(shí)線為預(yù)測(cè)值,圈號(hào)為實(shí)測(cè)值)
表3 1992 年月預(yù)測(cè)降水量和實(shí)測(cè)降水量對(duì)比分析結(jié)果
圖3 1992 年預(yù)測(cè)月降水量和實(shí)測(cè)降水量對(duì)比圖(實(shí)線為預(yù)測(cè)值,圈號(hào)為實(shí)測(cè)值)
表1、表2 和表3 為研究區(qū)域LS_SVM 模型預(yù)測(cè)的月降水量和實(shí)際降水量之間的對(duì)比,從三個(gè)表中可以看出,LS_SVM 模型預(yù)測(cè)的月降水量和實(shí)測(cè)的月降水量之間大部分?jǐn)?shù)據(jù)的相對(duì)誤差不大,但是降水量少的月份相對(duì)誤差很大,這是因?yàn)楫?dāng)月降水量太小,造成相對(duì)誤差很大。圖1、圖2 和圖3 為L(zhǎng)S_SVM 模型預(yù)測(cè)的1990 年、1991年和1992 年的月降水量和實(shí)測(cè)的月降水量對(duì)比圖??梢钥闯?,LS_SVM 模型對(duì)這三年預(yù)測(cè)的月降水量和實(shí)測(cè)的月降水量均具有較好的趨勢(shì)吻合度。
由于月平均降水量的變化具有混沌的特性,建立了基于LSSVM 的時(shí)間序列模型預(yù)測(cè)月平均降水量。得出如下結(jié)論:該預(yù)測(cè)模型可以對(duì)降水量的量值和趨勢(shì)同時(shí)進(jìn)行預(yù)測(cè),在該地區(qū)月降水量預(yù)測(cè)值和實(shí)測(cè)值具有較高趨勢(shì)吻合度。該模型僅用歷史降水量來(lái)預(yù)測(cè)未來(lái)降水量,然而降水量受諸多因素的影響,本模型沒(méi)有添加這些因素,因此在預(yù)測(cè)精度上還有欠缺,下一步需要細(xì)化各種因素,使之進(jìn)入預(yù)測(cè)模型,使模型更加完善,以期更加符合實(shí)際情況。