周 韋, 孫憲坤, 萬俊杰
(上海工程技術(shù)大學(xué), 電子電氣工程學(xué)院, 上海 201620)
城市環(huán)境污染不僅影響社會經(jīng)濟的發(fā)展,對人們的身體也會造成有害的影響。 據(jù)統(tǒng)計,中國空氣污染區(qū)域占國土面積的1/4,受影響的人口近7 億。因此實現(xiàn)對空氣質(zhì)量指數(shù)(AQI)進行準確有效地預(yù)測成為重中之重。
目前,國內(nèi)外空氣質(zhì)量預(yù)測模型主要有回歸統(tǒng)計分析模型、時間序列模型、灰色理論模型等。 但是AQI 數(shù)據(jù)是混沌的、非平穩(wěn)的,導(dǎo)致上述模型的預(yù)測精度不高。 神經(jīng)網(wǎng)絡(luò)模型具有良好的學(xué)習(xí)能力,受到廣大學(xué)者的關(guān)注。 文獻[1] 將 BP (Back Propagation)神經(jīng)網(wǎng)絡(luò)應(yīng)用到了空氣質(zhì)量預(yù)測中,取得了良好的預(yù)測效果;文獻[2] 提出了一種RBF(Radial Basis Function)神經(jīng)網(wǎng)絡(luò)空氣質(zhì)量預(yù)測模型,相比BP 神經(jīng)網(wǎng)絡(luò),效果有所提升。 然而神經(jīng)網(wǎng)絡(luò)具有學(xué)習(xí)速度慢,易陷入局部極值等缺陷。
文獻[3]提出極限學(xué)習(xí)機(ELM),是一種前饋神經(jīng)網(wǎng)絡(luò),具有學(xué)習(xí)速度快、泛化能力強等優(yōu)點;文獻[4] 提出了一種 PSO ( Particle Swarm Optimization)-ELM 的空氣質(zhì)量預(yù)測模型,該模型可以有效提高空氣質(zhì)量預(yù)測精度;文獻[5]提出了一種基于IPSO(Improved Particle Swarm Optimization)-ELM 的空氣質(zhì)量預(yù)測模型,相比傳統(tǒng)的基于BP 和ELM 的神經(jīng)網(wǎng)絡(luò)模型,該模型具有更高的精度。 但是ELM 也存在一些缺點,比如網(wǎng)絡(luò)的隱層節(jié)點個數(shù)難以確定、不同的參數(shù)對預(yù)測結(jié)果有不同的影響等。因此文獻[3]又引入了支持向量機中的核函數(shù),使得極限學(xué)習(xí)機無需設(shè)置隱藏層神經(jīng)元個數(shù)和輸入權(quán)值參數(shù),解決了ELM 過擬合和易陷入局部極值的問題。
為了進一步提高空氣質(zhì)量預(yù)測模型的預(yù)測精度,本文提出了一種基于IAO 優(yōu)化混合核極限學(xué)習(xí)機(HKELM)的空氣質(zhì)量指數(shù)預(yù)測模型。 首先,為提高天鷹優(yōu)化器(AO)的尋優(yōu)能力,引入改進的混沌初始化策略和自適應(yīng)t 分布策略對其進行改進,得到改進的天鷹優(yōu)化器(IAO);其次,結(jié)合徑向基核函數(shù)和多項式核函數(shù)構(gòu)造具有更強泛化能力的混合核極限學(xué)習(xí)機模型,利用IAO 算法來優(yōu)化HKELM 模型的參數(shù);最后,將IAO-HKELM 模型應(yīng)用于實際案例中,并與其他模型的預(yù)測結(jié)果及誤差進行對比。 結(jié)果表明,本文所設(shè)計模型具有更高的穩(wěn)定性和預(yù)測精度。
極限學(xué)習(xí)機(ELM)作為一種新型單隱藏層的前饋神經(jīng)網(wǎng)絡(luò)模型,具有學(xué)習(xí)能力快,泛化能力強等優(yōu)點,在處理非線性回歸方面具有良好的效果[6]。假設(shè)有D個訓(xùn)練樣本{(xi,yi),i=1,2,…,D},ELM輸回歸模型可以表示為式(1):
其中,x表示輸入數(shù)據(jù)向量;f(x) 表示網(wǎng)絡(luò)輸出;h(x) 和H表示隱藏層映射產(chǎn)生的矩陣;β表示隱藏層與輸出層之間的權(quán)值。
為使模型具有更好的泛化能力,引入對角矩陣I0和懲罰系數(shù)C,然后根據(jù)廣義逆矩陣原理可得式(2):
其中,y=[y1,y2,…,yD] 為期望輸出。
為了進一步增加模型的穩(wěn)定性,文獻[3]引入核方法, KELM (Kernel Based Extreme Learning Machine)的核矩陣表示為式(3):
KELM 用核矩陣ΩKELM代替了ELM 中HHT,并通過核函數(shù)將輸入樣本映射到高維隱層特征空間中,可得式(4):
其中,K(xi,xj) 為核函數(shù)。
常見的核函數(shù)主要有以下4 種:
(1)高斯核函數(shù),式(5):
(2)多項式核函數(shù),式(6):
(3)線性核函數(shù),式(7):
(4)感知器核函數(shù),式(8):
其中,σ、m、n和d為混合核參數(shù),λ為多項式核函數(shù)的權(quán)系數(shù)。
KELM 的性能由核函數(shù)決定[7]。 本文結(jié)合了多項式核函數(shù)和高斯核函數(shù)作為KELM 的核函數(shù),以提高模型的性能。 多項式核函數(shù)是一種全局核函數(shù),擁有較差的局部學(xué)習(xí)能力,多項式核函數(shù)曲線如圖1 所示,其中測試點X=0.5,m=1,n=1,d取1、2、3 和4,由圖1 可以看出多項式核函數(shù)的全局特性體現(xiàn)在與測試點相距較遠的點影響較大。
圖1 多項式核函數(shù)曲線Fig. 1 Polynomial kernel function curve
高斯核函數(shù)是一種局部核函數(shù),具有很好的局部學(xué)習(xí)能力,但是對超出一定范圍的樣本無法進行準確有效地預(yù)測,高斯核函數(shù)曲線如圖2 所示,其中測試點X=0.5,σ取0.1、0.2、0.3 和0.4。 由圖2 可以看出高斯核函數(shù)的局部特性體現(xiàn)在與測試點相距較近的點影響較大。
圖2 高斯核函數(shù)曲線Fig. 2 Gaussian kernel function curve
混合核函數(shù)可以同時兼顧兩者的優(yōu)點,將兩種核函數(shù)進行線性組合,形成混合核函數(shù),式(9):
混合核函數(shù)曲線如圖3 所示,其中測試點X=0.5,λ取0.1,0.2,0.3 和0.4,高斯核函數(shù)中σ取0.1,多項式核函數(shù)中m=1,n=1,d=2。 由圖3 可以看出,混合核函數(shù)不僅對測試點周圍的樣本點有影響,而且對距離測試點有一定距離的樣本點也有一定影響,因此混合核函數(shù)有效結(jié)合了高斯核函數(shù)和多項式核函數(shù)的優(yōu)點,彌補了單一核函數(shù)的不足。
圖3 混合核函數(shù)曲線Fig. 3 Mixed kernel function curve
訓(xùn)練混合核極限學(xué)習(xí)機(HKELM)時采用改進的麻雀搜索算法對參數(shù)σ、m、n、λ以及懲罰系數(shù)C進行優(yōu)化。
混合核極限學(xué)習(xí)機(HKELM)通過混合核函數(shù)將輸入樣本映射到高維的隱層特征空間中,用核映射代替了極限學(xué)習(xí)機中的隨機映射,增強了模型的學(xué)習(xí)能力和泛化能力,其擬合能力優(yōu)于非核的極限學(xué)習(xí)機[8]。 基于以上優(yōu)點,本文采用HKELM 實現(xiàn)空氣質(zhì)量指數(shù)預(yù)測。
AO 是一種新型智能優(yōu)化算法,該算法用數(shù)學(xué)模型模仿了天鷹在狩獵過程中的行為[9]。 AO 算法包括兩個階段,分別為探索階段和開發(fā)階段。當(dāng)k≤(2/3)?K,k為當(dāng)前迭代次數(shù),K為總迭代次數(shù),執(zhí)行探索階段,否則執(zhí)行開發(fā)階段。 探索階段又分為擴展探索和縮小范圍探索;開發(fā)階段又分為擴大開發(fā)和縮小范圍開發(fā)。
首先,AO 算法利用式(10)來確定N個個體的初始值。
其中,rand為[0,1]之間的隨機數(shù),i=1,2,…,N,j=1,2,…,d;N表示種群數(shù)量;d表示維數(shù);UBj和LBj分別表示維度為j的上限和下限。
2.1.1 擴展探索
天鷹在高空翱翔,確定探索空間區(qū)域,獵物在哪里,用公式(11)表示其行為:
其中,K表示最大迭代次數(shù);Xbest(k) 表示當(dāng)前最佳位置;XM(k) 表示在第k次迭代中個體位置的平均值;rand為0~1 之間的隨機數(shù)。
XM(k) 計算公式為(12):
其中,d表示優(yōu)化變量的維度。
2.1.2 縮小范圍探索
當(dāng)天鷹發(fā)現(xiàn)獵物區(qū)域,在目標(biāo)獵物上方盤旋,縮小獵物所在區(qū)域,準備進攻。 用公式(13)表示其行為:
飛行分布函數(shù)Levy(d) 如式(14) 所示:
其中,s=0.01,β=1.5,u和v為[0,1]之間的隨機數(shù)。
螺旋形狀y和x如式(15) 所示:
其中:
r1為[0,20] 之間的隨機數(shù),d1表示1 到d之間的正整數(shù),U=0.005 65,ω=0.005。
2.1.3 擴大開發(fā)
當(dāng)獵物區(qū)域被精準確定,天鷹垂直下降進行初步攻擊。 用公式(19)表示其行為:
其中,rand?[0,1],α=0.1,δ=0.1。UB和LB分別表示搜索空間的上界和下界。
2.1.4 縮小范圍開發(fā)
象鼩(qú),又名跳鼩,是原產(chǎn)于非洲的小型哺乳動物。之所以被稱為象鼩,是因為它們的長鼻子讓人聯(lián)想到大象,而它們的身形樣貌又和鼩鼱類似。不過,科學(xué)家經(jīng)過分析得出,象鼩和鼩鼱是兩類不同的動物,而小小的象鼩與大象的親緣關(guān)系反而更近。
當(dāng)天鷹接近獵物時,根據(jù)獵物的隨機運動在陸地上攻擊獵物。 用公式(20)表示其行為:
其中,QF是用于平衡搜索策略的質(zhì)量函數(shù),使用式(21)進行計算;G1表示獵食動物在獵食過程中用于追蹤獵物的各種動作,使用式(22) 進行計算;G2表示從2~0 的遞減值,使用式(23)進行計算。
AO 與其他群智能優(yōu)化算法相比,不僅尋優(yōu)精度高,而且收斂速度快。 然而,AO 同其他群智能算法一樣,在迭代后期會出現(xiàn)種群多樣性減少,易陷入局部最優(yōu)等問題。 本文提出了一種改進的AO,首先,利用Tent 混沌映射初始化種群,提高算法的全局搜索能力;其次,引入自適應(yīng)t 分布變異更新其位置,有效改善算法易陷入局部極值的缺陷。
改進策略如下:
2.2.1 Tent 混沌映射
AO 采用隨機生成的方式對種群初始化,會導(dǎo)致天鷹種群分布不均勻。 而混沌映射具有規(guī)律性,遍歷性等特點,因此本文采用混沌序列對天鷹的位置進行初始化。 Tent 映射分布直方圖如圖4(a)所示,可以看出Tent 映射分布較為均勻,張娜等人[10]指出Tent 混沌序列在迭代時存在陷入小周期點和不穩(wěn)定周期點的問題,因此在Tent 混沌映射表達式中加入了隨機變量rand(0,1)×(1/NT),改進后的Tent 混沌序列分布圖如圖4(b)所示,表達式(24)如下:
圖4 不同混沌序列分布直方圖Fig. 4 Distribution histogram of different chaotic sequences
經(jīng)過貝努利變換后的表達式(25)如下:
其中,NT表示混沌序列中粒子的數(shù)量,rand(0,1) 是[0,1] 之間的隨機數(shù)。
本文采用改進的Tent 混沌映射來初始化種群,使得初始種群的位置分布更均勻。 步驟如下:
(1)產(chǎn)生(0,1)之間的隨機數(shù)x0,即i=0;
(2)根據(jù)式(25)進行迭代計算,產(chǎn)生一個X序列,i自增1;
(3)當(dāng)i到達最大迭代次數(shù)時,保存好X序列;
(4)將X序列的元素按照式(26)映射到天鷹個體上,得到xnewi;
其中,UB和LB分別表示搜索空間的上下界。
2.2.2 自適應(yīng)t 分布策略
t 分布又稱學(xué)生分布,其分布函數(shù)曲線形態(tài)由參數(shù)自由度的值n決定。 t 分布、高斯分布和柯西分布圖如圖5 所示,當(dāng)自由度n越小,曲線的形態(tài)越平坦;當(dāng)自由度n=1 時,t 分布為柯西分布,即t(n=1) →C(0,1);當(dāng)自由度n越大時,曲線形態(tài)表現(xiàn)越高聳,曲線類似于標(biāo)準正態(tài)分布曲線;當(dāng)自由度n無限大時,t 分布為高斯分布,即t(n=∞)→N(0,1)。
圖5 t 分布、高斯分布和柯西分布函數(shù)分布圖Fig. 5 t distribution, Gaussian distribution and Cauchy distribution function
對天鷹位置利用自適應(yīng)t 分布進行更新,xti表示經(jīng)過t 變異后的天鷹的位置。 式(27):
其中,xi為第i個鷹個體的位置,t(k) 表明選擇當(dāng)前迭代次數(shù)為參數(shù)自由度的t 分布。
當(dāng)前期迭代次數(shù)k較小時,t 分布類似柯西分布變異,此時的t 分布算子取得較大值,位置變異的步長較大,使得算法擁有較好的全局搜索能力;在迭代中期,t 分布由柯西分布變異向高斯分布變異轉(zhuǎn)變,t分布算子取值相對折中,使得算法結(jié)合了兩者的優(yōu)勢,同時兼顧全局和局部搜索能力;當(dāng)后期迭代次數(shù)k較大時,t 分布類似高斯分布變異,此時的t 分布算子取得較小值,變異步長較小,使得算法擁有較好的局部搜索能力,該策略有利于算法找到全局最佳點。
為驗證IAO 算法的性能,本文使用了PSO(Particle Swarm Optimization)算法、GWO(Grey Wolf Optimizer)算法、AO 算法和IAO 算法對測試函數(shù)進行仿真實驗,各算法參數(shù)設(shè)置見表1。 每個算法的種群規(guī)模為30,最大迭代次數(shù)為1 000。 測試函數(shù)選取了多維單峰函數(shù)Sphere 和多維多峰函數(shù)Ackley,函數(shù)維度為50。 各算法獨立運行20 次,得到的測試函數(shù)優(yōu)化曲線如圖6 和圖7 所示,適應(yīng)度值為測試函數(shù)值。
表1 參數(shù)設(shè)置表Tab. 1 Parameter settings
圖6 Sphere 函數(shù)優(yōu)化曲線Fig. 6 Sphere function optimization curve
圖7 Griewank 函數(shù)優(yōu)化曲線Fig. 7 Griewank function optimization curve
從圖6 可以看出,單峰Sphere 函數(shù)在PSO、GWO 和AO 在尋優(yōu)的過程中早早就陷入局部極值且無法自拔,導(dǎo)致算法收斂性能較弱。 而IAO 相比其他算法不僅尋優(yōu)精度高,而且具有更快的收斂速度。 從圖7 可以看出,IAO 在相同的迭代次數(shù)中其多峰Griewank 函數(shù)能夠?qū)ふ业礁鼉?yōu)的值,而且在尋優(yōu)精度和收斂速度上IAO 總是優(yōu)于其他算法,曲線先出現(xiàn)拐點表明收斂速度快,適應(yīng)度值越低表明尋優(yōu)精度越高。
HKELM 模型的預(yù)測精度由混合核參數(shù)σ,m,n,λ以及懲罰系數(shù)C決定,因此參數(shù)的優(yōu)化尤為重要。 本文采用改進的天鷹優(yōu)化器來對5 個參數(shù)尋優(yōu),從而達到最佳的預(yù)測效果。
(1)數(shù)據(jù)集劃分。 將空氣質(zhì)量樣本數(shù)據(jù)劃分為訓(xùn)練集與測試集,并作歸一化處理。
(2)初始化參數(shù)。 設(shè)置參數(shù)σ、m、n、λ和C的優(yōu)化區(qū)間UB,LB,以及IAO 算法的相關(guān)參數(shù)值,利用式(26) (27)混沌映射初始化麻雀種群。
(3)選擇適應(yīng)度函數(shù),將訓(xùn)練樣本的預(yù)測值和真實值yi的均方誤差(MSE) 作為天鷹個體的適應(yīng)度值,由式(13)計算可得。
(4)計算天鷹個體的適應(yīng)度值,根據(jù)適應(yīng)度值確定當(dāng)前最佳Xbest(k),更新XM(k),G1,G2,Levy(d) 等。
(5)當(dāng)k≤(2/3)?K時,且rand≤0.5 時,利用式(11)更新天鷹個體的位置,否則根據(jù)式(13)更新天鷹個體的位置。
(6)當(dāng)(2/3) ?K≤k≤K時,且rand≤0.5 時,利用式(19)更新天鷹個體的位置,否則根據(jù)式(20)更新天鷹個體的位置。
(7)根據(jù)式(27)對天鷹位置進行t 分布變異擾動。
(8)計算每只天鷹進行t 分布后的適應(yīng)度值,將經(jīng)過t 分布操作后的新解適應(yīng)度值與原值進行比較,更新全局最優(yōu)信息。
(9)終止條件。 若已達到最大迭代次數(shù)K時,則輸出最優(yōu)天鷹個體位置對應(yīng)的參數(shù)(C,λ,q,σ2),并建立混合核IAO-HKELM 空氣質(zhì)量指數(shù)預(yù)測模型。 否則返回步驟5。
(10)利用建立好的混合核IAO-LSSVM 模型進行空氣質(zhì)量指數(shù)預(yù)測。
為比較各模型性能,選用均方根誤差(RMSE),平均絕對誤差百分比(MAPE) 和平均絕對誤差(MAE) 這3 個指標(biāo)作為模型的評價指標(biāo)。 各指標(biāo)的計算公式分別如式(28)~(30) 所示。
其中,表示預(yù)測值;Yi表示真實值;S為測試數(shù)據(jù)樣本總數(shù)。
實 驗 中 通 過 天 氣 后 報 數(shù) 據(jù) 網(wǎng) 站(http:/ /www.tianqihoubao.com/) 收集鄭州市2017年~2019 年750 組天氣數(shù)據(jù),部分數(shù)據(jù)見表2。 選擇其中650 組數(shù)據(jù)作為訓(xùn)練樣本,剩余100 組數(shù)據(jù)作為測試樣本,其中AQI 為模型輸出,NO2、O3、CO、PM2.5、PM10、SO2為模型輸入。
表2 部分實驗數(shù)據(jù)Tab. 2 Part of experimental data
為了驗證IAO-HKELM 模型的預(yù)測精度,選取了KELM、HKELM、PSO-HKELM、GWO-HKELM、AO-HKELM 和IAO-HKELM 模型,在相同的測試集上比較模型的精度。 各優(yōu)化算法參數(shù)設(shè)置與IAO性能測試相同,維度d=5,K=100。 KELM 模型選擇單一高斯核函數(shù),參數(shù)σ=10,C=10;HKELM 模型選用高斯核函數(shù)和多項式核函數(shù)結(jié)合的混合核函數(shù),參數(shù)λ=0.5,σ=10,m=1,n=1,C=10;其余模型中參數(shù)λ∈[0,1]; 剩余參數(shù)取值下界為[0.01,0.01,0.01,0.01],上界為[100,100,100,100]。各優(yōu)化算法優(yōu)化HKELM 得到的模型參數(shù)見表3 ,各模型預(yù)測結(jié)果如圖8 所示。
表3 HKELM 模型參數(shù)Tab. 3 HKELM model parameters
圖8 各模型的預(yù)測結(jié)果Fig. 8 Prediction results of different model
從圖8 可以看出,IAO-HKELM 模型對于預(yù)測樣本的預(yù)測精度上優(yōu)于其他模型。 各模型預(yù)測值與真實值的誤差見表4,選擇3 個評價指標(biāo)中的均方根誤差(RMSE) 來比較這幾個模型的性能,其中采用單一核函數(shù)的KELM 模型誤差較大為4.281 9,混合核函數(shù)HKELM 模型相比KELM 誤差有所減少為2.963 7,但是相比采用優(yōu)化算法優(yōu)化后的模型,還存在一定誤差。 PSO-HKELM、GWO-HKELM 和AO-HKELM模型的均方根誤差分別為2.963 7、2.640 7和2.145 6,而ISSA-HKELM 模型的均方誤差為1.771 2,誤差最小,說明IAO-HKELM 預(yù)測模型對于空氣質(zhì)量指數(shù)預(yù)測取得了很好的效果,相比其余幾個常用模型,誤差更小,精確度更高。
表4 誤差對比表Tab. 4 Error comparison
本文提出一種基于改進天鷹優(yōu)化器優(yōu)化混合核極限學(xué)習(xí)機的空氣質(zhì)量指數(shù)預(yù)測模型。 通過引入改進的混沌初始化策略和自適應(yīng)t 分布策略對天鷹優(yōu)化器進行改進;結(jié)合徑向基核函數(shù)和多項式核函數(shù)構(gòu)造具有更強泛化能力的混合核極限學(xué)習(xí)機模型,最終得到了IAO-HKELM 預(yù)測模型。 同過與其他模型進行實驗對比,最終驗證了該模型預(yù)測精準度更高,穩(wěn)定性更強,滿足實際的應(yīng)用。