魏爽,王麗吉,吳書成,魯奕岑
(浙江省氣象信息網(wǎng)絡(luò)中心,杭州310017)
隨著全球氣溫的升高,氣候變化已經(jīng)引起人們的普遍關(guān)注。由于影響氣溫變化的機(jī)制和因素十分復(fù)雜,長期氣溫預(yù)報主要依靠的統(tǒng)計(jì)預(yù)報方法對復(fù)雜變化過程的擬合有較大局限性,所以預(yù)測的準(zhǔn)確率難以令人滿意。人工神經(jīng)網(wǎng)絡(luò)模型結(jié)構(gòu)靈活并具有模擬非線性關(guān)系的能力,因而在氣象等領(lǐng)域有較廣泛的應(yīng)用。嚴(yán)紹瑾等人[1]利用神經(jīng)網(wǎng)絡(luò)BP 型多映射模式對月平均溫度進(jìn)行了預(yù)測,馬學(xué)款等人[2]也利用BP(Back-Propagation)型神經(jīng)網(wǎng)絡(luò)對西藏中短期極端溫度預(yù)測方法進(jìn)行了研究。
近年來,氣象預(yù)測研究中經(jīng)常采用BP 型網(wǎng)絡(luò),由于其所用的梯度下降方法容易造成收斂速度慢和局部極小的不足,采用能逼近任意精度的RBF 神經(jīng)網(wǎng)絡(luò)作為預(yù)測模型,克服BP 網(wǎng)絡(luò)函數(shù)值的不緊密性,使收斂速度大大加快,并嘗試?yán)没谶z傳操作的粒子群算法優(yōu)化RBF 網(wǎng)絡(luò)的關(guān)鍵參數(shù),通過增加交叉、變異操作,擴(kuò)大了粒子群的搜索范圍,能夠避免粒子群早熟現(xiàn)象。應(yīng)用該方法對月平均溫度進(jìn)行預(yù)測實(shí)驗(yàn),通過實(shí)驗(yàn)結(jié)果說明算法的有效性。
RBF 神經(jīng)網(wǎng)絡(luò)[3-4]是具有三層結(jié)構(gòu)的前向型神經(jīng)網(wǎng)絡(luò)??紤]采用Gaussian 型徑向基函數(shù),對于給定輸入向量x∈Rn×1,RBF 網(wǎng)絡(luò)將其映射到輸出向量y∈Rm×1,此時網(wǎng)絡(luò)輸出定義為:
其中,ci為隱含層第i 個基函數(shù)的中心;‖·‖為歐氏范數(shù);σ為函數(shù)的基寬度;wi為第i 個隱節(jié)點(diǎn)至輸出的連接權(quán)值;h 為隱層單元數(shù)。
在徑向基函數(shù)網(wǎng)絡(luò)中,需要優(yōu)化確定的關(guān)鍵參數(shù)[5]有兩類:①基函數(shù)的中心ci和基寬度σ;②隱層與輸出層間的連接權(quán)值wi。
粒子群算法[6]是一種基于種群搜索的自適應(yīng)進(jìn)化計(jì)算技術(shù)。其思想是受鳥類群體行為研究結(jié)果的啟發(fā),用組織社會行為代替了進(jìn)化算法的自然選擇機(jī)制,通過種群間個體協(xié)作來實(shí)現(xiàn)對問題最優(yōu)解的搜索。
假設(shè)搜索空間為N 維,第i 個粒子在N 維空間的位置表示為xi=(xi1,xi2,…,xiN),飛行速度為vi=(vi1,vi2,…,viN),每個粒子都有一個由被優(yōu)化目標(biāo)函數(shù)決定的適應(yīng)值(Fitness value),各個粒子記憶、追隨當(dāng)前的最優(yōu)粒子,在解空間中搜索。每一次迭代中,粒子通過跟蹤兩個“極值”來更新自己:第一個是粒子自身搜索到的最優(yōu)解,叫做個體極值點(diǎn),用pbest表示;另一個是目前整個群體所發(fā)現(xiàn)的最優(yōu)解,叫做全局極值點(diǎn),用gbest表示。
每個粒子的速度和位置按式(2)、式(3)進(jìn)行迭代修改:
其中,w 為慣性權(quán)重;r1、r2是均勻分布在[0,1]的兩個隨機(jī)數(shù);c1、c2為學(xué)習(xí)因子;k 為迭代次數(shù)。
實(shí)際應(yīng)用中,PSO 算法容易陷入局部最優(yōu)點(diǎn),導(dǎo)致得不到全局最優(yōu)解。其原因是PSO 算法容易喪失種群多樣性,致使群體中的大部分個體聚集在一個很小的范圍內(nèi),從而失去了大范圍搜索的能力。因此,在PSO算法的基礎(chǔ)上結(jié)合遺傳操作[7],可以使種群多樣性不致喪失過快或始終保持一定的多樣性水平,當(dāng)算法陷入局部最優(yōu)時,使之能夠跳出局部最優(yōu)點(diǎn),有利于算法的全局搜索,并且可以提高搜索精度。
現(xiàn)在設(shè)置遺傳操作觸發(fā)的條件為:當(dāng)算法未達(dá)到總迭代次數(shù)M,若連續(xù)t 次迭代,得到的最優(yōu)解都不改變,則認(rèn)為算法陷入局部最優(yōu)點(diǎn),此時觸發(fā)遺傳操作,具體如下:
(1)選擇:采用隨機(jī)競爭選擇方式[8]。先計(jì)算出適應(yīng)度值,然后采用輪盤賭方法選出染色體對,通過染色體對之間的比較,選出高適應(yīng)度值的個體進(jìn)入交配池。
(2)交叉:根據(jù)染色體結(jié)構(gòu),采用算術(shù)交叉方法[8],保證產(chǎn)生的子代均在可行區(qū)域內(nèi)。假設(shè)X1和X2為要進(jìn)行交叉父代個體,則交叉后的子代個體如式(4)。
其中r∈[0,1]。
(3)變異:采用均勻變異[9],使搜索點(diǎn)可以在整個搜索空間內(nèi)自由的移動,從而增加種群多樣性。假設(shè)個體X=x1x2…xk…xl,xk為變異點(diǎn),取值范圍為新個體為X=x1x2…xk'…xl,則新基因值如式(5),其中r'∈[0,1]的一個隨機(jī)數(shù)。
(4)交叉和變異概率的選擇:為了防止算法不能收斂或收斂過程過長,應(yīng)設(shè)定交叉概率隨著迭代次數(shù)逐漸變小,最后趨于某一穩(wěn)定值,同時使變異概率逐漸變大,防止個體出現(xiàn)未成熟收斂的情況。所以采用基于捕食搜索策略[10]的遺傳算法,使交叉概率pc和變異概率pm隨著進(jìn)化代數(shù)動態(tài)改變。
其中,k 為迭代次數(shù),M 為總迭代次數(shù),pcmax、pcmin分別為最大、最小交叉概率;pmmax、pmmin分別為最大、最小變異概率。
傳統(tǒng)的RBF 網(wǎng)絡(luò)學(xué)習(xí)算法[11]對RBF 參數(shù)的設(shè)置是基于參數(shù)空間局部信息的,不是參數(shù)空間的全局最優(yōu)。為獲得具有最優(yōu)結(jié)構(gòu)的RBF 網(wǎng)絡(luò),提出一種基于PSO-GA 混合優(yōu)化的RBF 網(wǎng)絡(luò)算法。
首先確定神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu):輸入層為n 個輸入,隱層單元數(shù)為h,輸出層為m 個神經(jīng)元。對粒子群的位置向量xi進(jìn)行實(shí)數(shù)編碼,一個編碼代表一個可行解,分別按行展開,結(jié)構(gòu)如式(7)。
然后利用PSO-GA 混合算法搜索最優(yōu)位置,適應(yīng)度函數(shù)采用平均絕對誤差(Mean Absolute Error,MAE)公式加上1 的倒數(shù),即:
其中,N 為訓(xùn)練樣本總數(shù),yi為理想輸出值,yi'為實(shí)際輸出值。適應(yīng)度函數(shù)值越大,表示預(yù)測效果越好。表1 給出了實(shí)驗(yàn)初始化參數(shù)。
表1 初始化參數(shù)表
(1)初始化參數(shù)。給定粒子群規(guī)模S,隱層單元數(shù)h,迭代計(jì)數(shù)器t 和總迭代次數(shù)M。
(2)初始化粒子群。設(shè)定學(xué)習(xí)因子c1,c2,慣性權(quán)重w,隨機(jī)產(chǎn)生規(guī)模為S 的粒子群和每個粒子的初始速度vi,對每個粒子位置采用式(7)結(jié)構(gòu)進(jìn)行編碼。
(3)用式(2)和式(3)對每個粒子的速度和位置進(jìn)行更新,產(chǎn)生下一代粒子群。
(4)對每個粒子,根據(jù)式(8)求出每個粒子適應(yīng)度值,并更新當(dāng)前個體極值pbest和全局極值gbest。
(5)檢查是否陷入局部最優(yōu),若陷入則觸發(fā)遺傳操作,否則轉(zhuǎn)向步驟(6)。
(6)判斷是否達(dá)到總迭代次數(shù),若是則輸出最優(yōu)粒子位置編碼。否則轉(zhuǎn)向步驟(3)。
(7)用梯度下降法進(jìn)一步修正最優(yōu)粒子編碼,再將得到的基函數(shù)的中心ci、基寬度σ和輸出層與隱層間的連接權(quán)值wi代入RBF 網(wǎng)絡(luò)中,得到月平均氣溫預(yù)測序列。
算法流程圖如圖1 所示。
圖1 基于PSO-GA混合優(yōu)化RBF神經(jīng)網(wǎng)絡(luò)流程圖
為驗(yàn)證混合算法在預(yù)測應(yīng)用中的性能,選用浙江省杭州站1985~2018 年月平均氣溫資料,以1985~2014 年30 年的數(shù)據(jù)作為訓(xùn)練數(shù)據(jù),用以預(yù)測2015~2017 年的月平均氣溫,并利用平均絕對百分比誤差(MAPE)和均方誤差(RMSE)2 個統(tǒng)計(jì)指標(biāo)將預(yù)測值與實(shí)況值進(jìn)行比較,以分析預(yù)測的準(zhǔn)確程度。
將多年月平均溫度看成是一個離散的時間序列y(t),認(rèn)為每一時間點(diǎn)的數(shù)據(jù)值與此前n 個時間值有關(guān)(n 稱為時延或時滯),即有一函數(shù)F,使時間序列y(t)滿足
為了確定參數(shù)n 的值,以30 年的訓(xùn)練數(shù)據(jù)為基礎(chǔ),初步限定時延窗口在3~7 的范圍內(nèi),進(jìn)行重復(fù)迭代訓(xùn)練得到平均絕對誤差MAE,如表2 所示。其中,最小的平均絕對誤差是1.12,因此選取時延n=6,即以過去的6 個值來預(yù)測當(dāng)前值。
表2 不同輸入?yún)?shù)得到的MAE 值
將樣本按前述劃分方法分為訓(xùn)練集和測試集,得到2015~2017 年各月平均氣溫預(yù)測值,并與標(biāo)準(zhǔn)的RBF 網(wǎng)絡(luò)和BP 網(wǎng)絡(luò)同期對應(yīng)的預(yù)測結(jié)果進(jìn)行比較,將月尺度的預(yù)測值按時間順序連成一條曲線,由圖2 可見,混合優(yōu)化RBF 網(wǎng)絡(luò)模型預(yù)測結(jié)果比傳統(tǒng)神經(jīng)網(wǎng)絡(luò)對實(shí)況溫度擬合效果更好,預(yù)測的溫度變化趨勢和相位與實(shí)際情況更一致。
圖2 2015~2017年各月平均氣溫實(shí)測及預(yù)測值對比
計(jì)算三種網(wǎng)絡(luò)模型對2015~2017 年3 年月平均溫度預(yù)測的統(tǒng)計(jì)指標(biāo)值(表3)??梢姡旌蟽?yōu)化的RBF網(wǎng)絡(luò)模型各種誤差整體上比傳統(tǒng)的RBF 和BP 網(wǎng)絡(luò)模型相應(yīng)的誤差值更小。表明混合優(yōu)化的RBF 網(wǎng)絡(luò)模型對南京站月平均氣溫的擬合預(yù)測效果是理想的。
為了檢驗(yàn)基于PSO-GA 混合優(yōu)化的RBF 網(wǎng)絡(luò)模型的預(yù)測能力和穩(wěn)定性,對2018 年1~12 月進(jìn)行了逐月平均氣溫預(yù)測。如圖3。三種模型都比較成功的預(yù)測了2018 年月平均溫度的變化趨勢,同樣進(jìn)行誤差分析,如表4 所示。混合優(yōu)化的RBF 網(wǎng)絡(luò)模型預(yù)測的各種誤差仍然很小,平均絕對誤差比傳統(tǒng)的RBF 和BP網(wǎng)絡(luò)模型分別小了6.44%和7.65%,均方誤差同樣小了0.64℃和1.03℃。
表3 2015~2017 年三種模型月平均氣溫預(yù)測指數(shù)對比
為了檢驗(yàn)基于PSO-GA 混合優(yōu)化的RBF 網(wǎng)絡(luò)模型的預(yù)測能力和穩(wěn)定性,對2018 年1~12 月進(jìn)行了逐月平均氣溫預(yù)測。如圖3。三種模型都比較成功的預(yù)測了2018 年月平均溫度的變化趨勢,同樣進(jìn)行誤差分析,如表4 所示。混合優(yōu)化的RBF 網(wǎng)絡(luò)模型預(yù)測的各種誤差仍然很小,平均絕對誤差比傳統(tǒng)的RBF 和BP網(wǎng)絡(luò)模型分別小了6.44%和7.65%,均方誤差同樣小了0.64℃和1.03℃。
圖3 2018年1~12月各月平均氣溫預(yù)測值與實(shí)測值對比
最后,對浙江省溫州、奉化、麗水3 個站點(diǎn)2018 年1~12 月月平均氣溫利用上述方法建模,如表5 所示。結(jié)果同樣表明,混合優(yōu)化的RBF 網(wǎng)絡(luò)模型在預(yù)測精度上仍優(yōu)于標(biāo)準(zhǔn)的RBF 和BP 網(wǎng)絡(luò)模型,具有普遍的適用性。
表4 2018 年1~12 月三種模型預(yù)測值及預(yù)測指數(shù)對比
表5 2018 年1~12 月三種模型預(yù)測指數(shù)對比
為解決傳統(tǒng)的RBF 網(wǎng)絡(luò)學(xué)習(xí)算法對關(guān)鍵參數(shù)的設(shè)置基于空間局部信息的不足這一問題,提出一種基于遺傳操作的粒子群混合優(yōu)化的RBF 網(wǎng)絡(luò)預(yù)測算法,通過增加選擇、交叉和變異操作,融合PSO 與GA 兩者的優(yōu)勢,從而避免了PSO 早熟現(xiàn)象。實(shí)驗(yàn)證明,與傳統(tǒng)的RBF 和BP 網(wǎng)絡(luò)模型相比,混合優(yōu)化的RBF 網(wǎng)絡(luò)模型預(yù)測的溫度變化趨勢和相位與實(shí)際情況更一致,具有預(yù)報精度高,預(yù)測能力穩(wěn)定等特點(diǎn),可以為短期氣候預(yù)測提供借鑒和參考。