李潔
(廣西科技師范學(xué)院 數(shù)學(xué)與計算機科學(xué)學(xué)院,廣西 來賓546199)
降雨是一種常見的自然現(xiàn)象,一個地區(qū)降雨量的多少直接影響和制約著國民經(jīng)濟的發(fā)展和生產(chǎn)生活安全。近年來,水災(zāi)和旱災(zāi)導(dǎo)致的國民經(jīng)濟損失日益加大。因此,為了有效防治、管理和控制災(zāi)情,準確的降水預(yù)報具有現(xiàn)實的指導(dǎo)意義[1]。
然而,降雨自然現(xiàn)象的形成是一個復(fù)雜的過程,受地表、溫度、濕度、人文因素等多種因素影響,使得預(yù)測變得更加困難。單層前饋神經(jīng)網(wǎng)絡(luò)(SLFN)以其良好的學(xué)習(xí)能力在許多領(lǐng)域得到了廣泛的應(yīng)用,然而傳統(tǒng)的學(xué)習(xí)算法,具有訓(xùn)練速度慢,容易陷入局部最小值,學(xué)習(xí)率敏感等特點[2]。本文采用一種新的SLFN 的算法——極限學(xué)習(xí)機(ELM)對廣西降雨歷史資料進行訓(xùn)練建模預(yù)測,通過計算預(yù)測結(jié)果的均方根誤差進行模型評估。
其中,wi和bi是隱藏層節(jié)點參數(shù),g(wi,bi,x)是激活函數(shù),該函數(shù)是一個滿足ELM 通用逼近能力定理的非線性分段連續(xù)函數(shù),本模型使用Sigmoid 函數(shù),故g 函數(shù)為:
極限學(xué)習(xí)機(ELM)是一種針對單隱含層前饋神經(jīng)網(wǎng)絡(luò)(Single-hidden Layer Feedforward Neural Network,SLFN)的新算法。由三層節(jié)點構(gòu)成,分別為輸入層、隱含層和輸出層。其結(jié)構(gòu)如圖1 所示。
將wix+bi代入公式x 即可。
數(shù)據(jù)經(jīng)隱層后進入輸出層,根據(jù)圖1 及公式,則用于“廣義”的單隱藏層前饋神經(jīng)網(wǎng)絡(luò)ELM 的輸出是:
ELM 訓(xùn)練SLFN 可分為兩個主要階段:
1.2.1 隨機特征映射
初始化隨機產(chǎn)生輸入層權(quán)重和隱藏層偏置,利用一些非線性映射作為激活函數(shù),將輸入數(shù)據(jù)映射到一個新的特征空間。與傳統(tǒng)的BP 神經(jīng)網(wǎng)絡(luò)相比,ELM 隱藏層節(jié)點參數(shù)ω 和b 根據(jù)任意連續(xù)的概率分布隨機生成,與訓(xùn)練數(shù)據(jù)無關(guān),而不是經(jīng)過訓(xùn)練確定的,從而在相比在效率上占有較大優(yōu)勢。隨機確定好參數(shù)ω 和b 后,根據(jù)公式(1)和(2)計算出隱層輸出H。
1.2.2 線性參數(shù)求解
為了得到在訓(xùn)練樣本集上的較好β, 需要保證訓(xùn)練誤差最小。采用網(wǎng)絡(luò)輸出Hβ 與樣本期望輸出T 的最小誤差平方和最小為目標函數(shù),對連接隱藏層和輸出層權(quán)值β 進行求解,目標函數(shù)為:
其中H 是隱藏層的輸出矩陣,T 是訓(xùn)練數(shù)據(jù)的目標矩陣:
由矩陣論得公式(5)的最優(yōu)解為:
其中H+為矩陣H 的廣義逆矩陣。當H+H 為非奇異時使用正交投影法,利用公式(8)即可求解得H 的廣義逆矩陣H+。
本文選取廣西三區(qū)2003-2008 年這6 年期間5 月份廣西水文監(jiān)測站點監(jiān)測到的實際測量因子作為實驗樣本,用2003-2007 前5 年5 月的數(shù)據(jù)(包括30 個輸入因子,1 個輸出)作為ELM 訓(xùn)練樣本,預(yù)報三區(qū)2008 年5 月的逐日降水量。
將五月三區(qū)的179 個數(shù)據(jù)樣本分成兩組,前148 個用于訓(xùn)練,后31 個用于測試。將數(shù)據(jù)標準化處理,歸一到單位方差和零方差。隨機產(chǎn)生偏差,置隱層節(jié)點數(shù)50,采用公式(3)作為激活函數(shù),將148 個訓(xùn)練樣本輸入到ELM 網(wǎng)絡(luò)模型,訓(xùn)練出權(quán)重,用訓(xùn)練得到的權(quán)重計算出31 個測試樣本的輸出值。
圖2 是ELM 對前148 個樣本的模型擬合效果。圖3 是后31個樣本,即2008 年5 月31 天逐日預(yù)報效果及每天誤差值。圖中,Actual rainfall 代表站點實測雨量,ELM fitting 代表樣本擬合 值,ELM prediction 是ELM 模 型 預(yù) 測 值,t213 prediction 是T213 模式預(yù)報值。
圖2 ELM 對5 月三區(qū)148 個建模樣本擬合效果
為分析模型優(yōu)劣,將ELM 模型結(jié)果T213 模式進行分析對比,表1 給出預(yù)測2008 年5 月三區(qū)結(jié)果的各項指標。
圖3 ELM 模型對5 月三區(qū)31 天的逐日預(yù)報對比及誤差對比
表1 ELM 預(yù)報與T213 預(yù)報的各項指標誤差對比分析
從表1 可以看出,本文建立ELM 模型在均方根誤差、最大絕對誤差兩個重要衡量指標上,均優(yōu)于T213 模式。ELM 模型能獲得更好的預(yù)測結(jié)果,預(yù)測精度較高。
結(jié)束語
可見,即使隨機生成隱藏層節(jié)點及偏置,ELM 仍保持了SLFN 的通用逼近能力。實驗結(jié)果表明,極限學(xué)習(xí)機具有訓(xùn)練參數(shù)少、學(xué)習(xí)速度快、泛化能力強的優(yōu)點,用在降雨氣象建模上具有良好的效果。后續(xù)研究中為進一步提高傳統(tǒng)極限學(xué)習(xí)機的穩(wěn)定性和泛化能力,可以考慮優(yōu)化等式約束的極限學(xué)習(xí)機,在目標函數(shù)中增加權(quán)值范數(shù)的約束項來重新求解輸出權(quán)重。