李潔
(廣西科技師范學(xué)院 數(shù)學(xué)與計(jì)算機(jī)科學(xué)學(xué)院,廣西 來賓546199)
降雨是一種常見的自然現(xiàn)象,一個(gè)地區(qū)降雨量的多少直接影響和制約著國民經(jīng)濟(jì)的發(fā)展和生產(chǎn)生活安全。近年來,水災(zāi)和旱災(zāi)導(dǎo)致的國民經(jīng)濟(jì)損失日益加大。因此,為了有效防治、管理和控制災(zāi)情,準(zhǔn)確的降水預(yù)報(bào)具有現(xiàn)實(shí)的指導(dǎo)意義[1]。
然而,降雨自然現(xiàn)象的形成是一個(gè)復(fù)雜的過程,受地表、溫度、濕度、人文因素等多種因素影響,使得預(yù)測變得更加困難。單層前饋神經(jīng)網(wǎng)絡(luò)(SLFN)以其良好的學(xué)習(xí)能力在許多領(lǐng)域得到了廣泛的應(yīng)用,然而傳統(tǒng)的學(xué)習(xí)算法,具有訓(xùn)練速度慢,容易陷入局部最小值,學(xué)習(xí)率敏感等特點(diǎn)[2]。本文采用一種新的SLFN 的算法——極限學(xué)習(xí)機(jī)(ELM)對廣西降雨歷史資料進(jìn)行訓(xùn)練建模預(yù)測,通過計(jì)算預(yù)測結(jié)果的均方根誤差進(jìn)行模型評估。
其中,wi和bi是隱藏層節(jié)點(diǎn)參數(shù),g(wi,bi,x)是激活函數(shù),該函數(shù)是一個(gè)滿足ELM 通用逼近能力定理的非線性分段連續(xù)函數(shù),本模型使用Sigmoid 函數(shù),故g 函數(shù)為:
極限學(xué)習(xí)機(jī)(ELM)是一種針對單隱含層前饋神經(jīng)網(wǎng)絡(luò)(Single-hidden Layer Feedforward Neural Network,SLFN)的新算法。由三層節(jié)點(diǎn)構(gòu)成,分別為輸入層、隱含層和輸出層。其結(jié)構(gòu)如圖1 所示。
將wix+bi代入公式x 即可。
數(shù)據(jù)經(jīng)隱層后進(jìn)入輸出層,根據(jù)圖1 及公式,則用于“廣義”的單隱藏層前饋神經(jīng)網(wǎng)絡(luò)ELM 的輸出是:
ELM 訓(xùn)練SLFN 可分為兩個(gè)主要階段:
1.2.1 隨機(jī)特征映射
初始化隨機(jī)產(chǎn)生輸入層權(quán)重和隱藏層偏置,利用一些非線性映射作為激活函數(shù),將輸入數(shù)據(jù)映射到一個(gè)新的特征空間。與傳統(tǒng)的BP 神經(jīng)網(wǎng)絡(luò)相比,ELM 隱藏層節(jié)點(diǎn)參數(shù)ω 和b 根據(jù)任意連續(xù)的概率分布隨機(jī)生成,與訓(xùn)練數(shù)據(jù)無關(guān),而不是經(jīng)過訓(xùn)練確定的,從而在相比在效率上占有較大優(yōu)勢。隨機(jī)確定好參數(shù)ω 和b 后,根據(jù)公式(1)和(2)計(jì)算出隱層輸出H。
1.2.2 線性參數(shù)求解
為了得到在訓(xùn)練樣本集上的較好β, 需要保證訓(xùn)練誤差最小。采用網(wǎng)絡(luò)輸出Hβ 與樣本期望輸出T 的最小誤差平方和最小為目標(biāo)函數(shù),對連接隱藏層和輸出層權(quán)值β 進(jìn)行求解,目標(biāo)函數(shù)為:
其中H 是隱藏層的輸出矩陣,T 是訓(xùn)練數(shù)據(jù)的目標(biāo)矩陣:
由矩陣論得公式(5)的最優(yōu)解為:
其中H+為矩陣H 的廣義逆矩陣。當(dāng)H+H 為非奇異時(shí)使用正交投影法,利用公式(8)即可求解得H 的廣義逆矩陣H+。
本文選取廣西三區(qū)2003-2008 年這6 年期間5 月份廣西水文監(jiān)測站點(diǎn)監(jiān)測到的實(shí)際測量因子作為實(shí)驗(yàn)樣本,用2003-2007 前5 年5 月的數(shù)據(jù)(包括30 個(gè)輸入因子,1 個(gè)輸出)作為ELM 訓(xùn)練樣本,預(yù)報(bào)三區(qū)2008 年5 月的逐日降水量。
將五月三區(qū)的179 個(gè)數(shù)據(jù)樣本分成兩組,前148 個(gè)用于訓(xùn)練,后31 個(gè)用于測試。將數(shù)據(jù)標(biāo)準(zhǔn)化處理,歸一到單位方差和零方差。隨機(jī)產(chǎn)生偏差,置隱層節(jié)點(diǎn)數(shù)50,采用公式(3)作為激活函數(shù),將148 個(gè)訓(xùn)練樣本輸入到ELM 網(wǎng)絡(luò)模型,訓(xùn)練出權(quán)重,用訓(xùn)練得到的權(quán)重計(jì)算出31 個(gè)測試樣本的輸出值。
圖2 是ELM 對前148 個(gè)樣本的模型擬合效果。圖3 是后31個(gè)樣本,即2008 年5 月31 天逐日預(yù)報(bào)效果及每天誤差值。圖中,Actual rainfall 代表站點(diǎn)實(shí)測雨量,ELM fitting 代表樣本擬合 值,ELM prediction 是ELM 模 型 預(yù) 測 值,t213 prediction 是T213 模式預(yù)報(bào)值。
圖2 ELM 對5 月三區(qū)148 個(gè)建模樣本擬合效果
為分析模型優(yōu)劣,將ELM 模型結(jié)果T213 模式進(jìn)行分析對比,表1 給出預(yù)測2008 年5 月三區(qū)結(jié)果的各項(xiàng)指標(biāo)。
圖3 ELM 模型對5 月三區(qū)31 天的逐日預(yù)報(bào)對比及誤差對比
表1 ELM 預(yù)報(bào)與T213 預(yù)報(bào)的各項(xiàng)指標(biāo)誤差對比分析
從表1 可以看出,本文建立ELM 模型在均方根誤差、最大絕對誤差兩個(gè)重要衡量指標(biāo)上,均優(yōu)于T213 模式。ELM 模型能獲得更好的預(yù)測結(jié)果,預(yù)測精度較高。
結(jié)束語
可見,即使隨機(jī)生成隱藏層節(jié)點(diǎn)及偏置,ELM 仍保持了SLFN 的通用逼近能力。實(shí)驗(yàn)結(jié)果表明,極限學(xué)習(xí)機(jī)具有訓(xùn)練參數(shù)少、學(xué)習(xí)速度快、泛化能力強(qiáng)的優(yōu)點(diǎn),用在降雨氣象建模上具有良好的效果。后續(xù)研究中為進(jìn)一步提高傳統(tǒng)極限學(xué)習(xí)機(jī)的穩(wěn)定性和泛化能力,可以考慮優(yōu)化等式約束的極限學(xué)習(xí)機(jī),在目標(biāo)函數(shù)中增加權(quán)值范數(shù)的約束項(xiàng)來重新求解輸出權(quán)重。