摘要:介紹了SVM的基本原理,指出了其在解決樣本非線性問題中表現(xiàn)的特有優(yōu)勢,并將SVM和BP神經(jīng)網(wǎng)絡(luò)在葉爾羌河年徑流量預(yù)測結(jié)果進(jìn)行了對比。結(jié)果表明SVM方法預(yù)測精度要略優(yōu)于BP神經(jīng)網(wǎng)絡(luò)方法。
關(guān)鍵詞:徑流量預(yù)測;神經(jīng)網(wǎng)絡(luò);SVM模型;葉爾羌河
前言
水文系統(tǒng)中影響預(yù)測對象的因子眾多,影響因子與預(yù)測對象之間關(guān)系復(fù)雜,目前較多地用顯式的統(tǒng)計(jì)模型進(jìn)行預(yù)測。但是統(tǒng)計(jì)模型缺乏自適應(yīng)性,更新困難,具有不確定性,擬合歷史資料的精度較高,而預(yù)測檢驗(yàn)的精度卻時好時壞,不是十分穩(wěn)定。許多事實(shí)己經(jīng)說明,水文系統(tǒng)中很多變量間的復(fù)雜非線性關(guān)系遠(yuǎn)非簡單的代數(shù)方程所能有效表達(dá)。
近年來,支持向量機(jī)(Support Vector Machines,簡稱SVM)的研究在各個領(lǐng)域廣泛開展。SVM是Vapnik等根據(jù)統(tǒng)計(jì)學(xué)習(xí)理論(Statistical Learning Theory,簡稱SLT)提出的一種新的機(jī)器學(xué)習(xí)方法,在解決小樣本、非線性問題中表現(xiàn)出許多特有的優(yōu)勢,并在模式識別、函數(shù)逼近和概率密度估計(jì)等方面取得了良好的效果。本文采用SVM模型對葉爾羌河多年徑流量進(jìn)行年徑流量預(yù)測,旨在為國內(nèi)相關(guān)研究提供參考。
1 SVM模型基本原理
SVM方法是從線性可分情況下的最優(yōu)分類面(Optimal Hyper Plane)提出的。假設(shè)d維空間中線性判別函數(shù)的一般形式為,分類面方程為
對判別函數(shù)進(jìn)行歸一化,使兩類樣本都滿足≥1,即使離分類面最近的樣本的=1,這樣分類間隔就等于,因此間隔最大等價于使(或)最小。而要求分類線對所有樣本正確分類,就是要求其滿足
式中:ai為拉格朗日乘子;c為常數(shù);為可調(diào)的權(quán)重向量;為松馳變量。
最優(yōu)分類面問題可以表示成如下的約束優(yōu)化問題,即在式(2)的約束下,求函數(shù)
的最小值。這是一個二次規(guī)劃問題,可定義以下的拉格朗日函數(shù):
求式(3)的極小值就是對w和b求拉氏函數(shù)的極小值。求L對W和b的偏微分,并令其等于0,可轉(zhuǎn)化為如下的對偶問題。
2 應(yīng)用實(shí)例
2.1 建模方式
(1)樣本歸一化處理。歸一化處理有利于避免各個因子之間的量級差異,消除量綱和單位不同對各個因子的影響,因此應(yīng)對樣本的輸入、輸出參數(shù)進(jìn)行(0,1)歸一化處理。
(2)確定核函數(shù)。由于核函數(shù)對算法的影響較大,因此選擇一個最好的核函數(shù)極為重要。這里以徑向基函數(shù)作為SVM方法中的核函數(shù),建立推理試驗(yàn)?zāi)P汀?/p>
(3)核參數(shù)的選擇。采用Cross-validation方法便可得到核的參數(shù)。
2.2 模型參數(shù)的確定
選取葉爾羌河卡群水文站的年徑流量實(shí)測資料(1958~2015年)作為研究對象,其中1958~2010年的數(shù)據(jù)作為訓(xùn)練數(shù)據(jù),2011~2015年的數(shù)據(jù)作為檢驗(yàn)數(shù)據(jù)。在預(yù)報建模中假設(shè)未來值和過去值存在某種確定的函數(shù)關(guān)系,利用過去的觀測值估計(jì)未來值:
式中:q(t)為當(dāng)前時段徑流量;q(t-n)為n個時段前徑流量。
根據(jù)實(shí)際經(jīng)驗(yàn)以及研究方便,取n為3,以相對誤差和相對誤差絕對值所占區(qū)域來衡量預(yù)報結(jié)果。
按前述方法建立SVM的中長期預(yù)報模型,其中模型參數(shù)(c,,)取(0.3,0.1,0.25)。選用3層BP模型進(jìn)行比較,并通過試驗(yàn)確定最優(yōu)的ANN隱層數(shù)為7。同時把歸一化后的數(shù)據(jù)輸入SVM與BP模型,比較預(yù)報效果。檢驗(yàn)段的實(shí)測值及SVM、BP的預(yù)報值見表1。
從表1可以看出:在預(yù)測階段,SVM模型要比BP模型效果要好,平均相對誤差分別為0.9%和6.4%,說明支持向量機(jī)用于徑流量預(yù)測比BP神經(jīng)網(wǎng)絡(luò)有更高的精度和魯棒性,是可行的。
3 結(jié)論
SVM是一種基于SRM的小樣本學(xué)習(xí)方法,克服了BP網(wǎng)絡(luò)結(jié)構(gòu)難以確定和不易達(dá)到全局最優(yōu)的缺陷。SVM算法將問題轉(zhuǎn)化為二次優(yōu)化問題,得到的解是全局最優(yōu)解;而用BP網(wǎng)絡(luò)進(jìn)行預(yù)測得到的解可能是局部最優(yōu)解。因此,SVM預(yù)測方案解決了BP網(wǎng)絡(luò)方法中無法避免的局部極值問題,在精度上優(yōu)于BP網(wǎng)絡(luò)預(yù)測方案。
參考文獻(xiàn):
[1]陳永義,俞小鼎,高學(xué)浩,等.處理非線性分類和回歸問題的一種新方法(I)——支持向量機(jī)方法簡介[J].應(yīng)用氣象學(xué)報,2004,15(3):351-352.
[2]馮漢中,陳永義.支持向量機(jī)回歸方法在實(shí)時業(yè)務(wù)預(yù)報中的應(yīng)用[J].氣象,2005,31(1):41-44.
[3]黃奕銘.支持向量機(jī)在雷雨天氣預(yù)報中的應(yīng)用[J].廣東氣象,2006,28(1):22-24.
[4]張偉,何新林,劉兵.SVM在瑪納斯河流域徑流預(yù)測中的應(yīng)用與研究[J].人民黃河,2008,30(5):35-36.
作者簡介:楊磊(1986- )男,新疆庫爾勒人,大學(xué)本科,主要從事水利工程及水政水資源管理工作。