郭利進(jìn) 井海明# 南亞翔 修春波
(1.天津工業(yè)大學(xué)電氣工程與自動(dòng)化學(xué)院,天津 300387; 2.天津工業(yè)大學(xué)電工電能新技術(shù)天津市重點(diǎn)實(shí)驗(yàn)室,天津 300387)
基于卡爾曼濾波融合算法的空氣質(zhì)量指數(shù)預(yù)測(cè)*
郭利進(jìn)1,2井海明1,2#南亞翔1,2修春波1,2
(1.天津工業(yè)大學(xué)電氣工程與自動(dòng)化學(xué)院,天津 300387; 2.天津工業(yè)大學(xué)電工電能新技術(shù)天津市重點(diǎn)實(shí)驗(yàn)室,天津 300387)
分析了卡爾曼濾波算法的基本原理及其對(duì)空氣質(zhì)量指數(shù)(AQI)的預(yù)測(cè)機(jī)制。利用自回歸滑動(dòng)平均模型(ARMA)為卡爾曼濾波建立數(shù)學(xué)模型,提出了將徑向基函數(shù)(RBF)神經(jīng)網(wǎng)絡(luò)融合于卡爾曼濾波,實(shí)現(xiàn)了新的融合算法對(duì)AQI進(jìn)行預(yù)測(cè)。根據(jù)AQI時(shí)間序列的特點(diǎn),建立了自回歸預(yù)測(cè)模型,進(jìn)而建立卡爾曼濾波的狀態(tài)方程和測(cè)量方程。采用隨機(jī)梯度逼近訓(xùn)練算法訓(xùn)練RBF神經(jīng)網(wǎng)絡(luò),用RBF神經(jīng)網(wǎng)絡(luò)的輸出作為卡爾曼濾波測(cè)量方程的觀測(cè)值。仿真結(jié)果表明,融合了RBF神經(jīng)網(wǎng)絡(luò)后的卡爾曼濾波預(yù)測(cè)算法改善了單一方法預(yù)測(cè)滯后的現(xiàn)象,減小了誤差,提高了預(yù)測(cè)精度。
卡爾曼濾波 空氣質(zhì)量指數(shù) 自回歸滑動(dòng)平均模型 徑向基函數(shù)
近年來(lái)我國(guó)經(jīng)濟(jì)快速發(fā)展,導(dǎo)致環(huán)境污染程度越來(lái)越大,城市空氣污染問(wèn)題尤為嚴(yán)重,空氣質(zhì)量問(wèn)題已經(jīng)影響到我國(guó)民眾的正常生活。我國(guó)環(huán)保部門(mén)對(duì)此十分重視,中國(guó)空氣質(zhì)量在線監(jiān)測(cè)分析平臺(tái)對(duì)空氣質(zhì)量指數(shù)(AQI)、PM10、PM2.5、SO2、NO2、O3、CO等數(shù)據(jù)進(jìn)行實(shí)時(shí)監(jiān)測(cè)并播報(bào)。然而,大氣空間是一個(gè)多因素干擾、強(qiáng)滯后的龐大系統(tǒng),且空氣污染物濃度還受污染物排放、復(fù)雜的地理情況及氣象條件等因素的影響[1],因此AQI具有較強(qiáng)的非線性特性[2]。在解決非線性系統(tǒng)中,人工神經(jīng)網(wǎng)絡(luò)是非常實(shí)用的工具,應(yīng)用十分廣泛。反向傳播(BP)神經(jīng)網(wǎng)絡(luò)能夠準(zhǔn)確描述AQI與影響因子之間的非線性特性關(guān)系[3-4],針對(duì)PM10、SO2、CO、NOx等污染物濃度的預(yù)測(cè),可以通過(guò)三維空氣質(zhì)量模型,形象地表示各種污染物對(duì)AQI的影響[5-7]。但BP神經(jīng)網(wǎng)絡(luò)也存在一定的缺陷,如預(yù)測(cè)結(jié)果誤差較大、風(fēng)速變化極點(diǎn)時(shí)易產(chǎn)生振幅、訓(xùn)練時(shí)易陷入局部最小值等缺點(diǎn)。本研究對(duì)卡爾曼濾波融合算法預(yù)測(cè)AQI及融合的機(jī)制進(jìn)行研究,利用自回歸滑動(dòng)平均模型(ARAM)建立數(shù)學(xué)預(yù)測(cè)模型,吸收多種方法的優(yōu)點(diǎn),提出徑向基函數(shù)(RBF)神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)數(shù)據(jù)融合在卡爾曼濾波的方法,提高了AQI預(yù)測(cè)精度。
1.1 卡爾曼濾波的基本原理
卡爾曼濾波實(shí)際是通過(guò)一種遞推算法,利用狀態(tài)方程遞推性以及最小均方差最優(yōu)估計(jì)[8],得到離散型觀測(cè)數(shù)據(jù),再對(duì)系統(tǒng)的觀測(cè)數(shù)據(jù)進(jìn)行線性化處理??柭鼮V波算法的前提是要建立線性模型,線性離散動(dòng)態(tài)系統(tǒng)可以由狀態(tài)方程(見(jiàn)式(1))和觀測(cè)方程(見(jiàn)式(2))表示:
X(t)=Φ(t,t-1)·X(t-1)+Γ(t,t-1)w(t)
(1)
Z(t)=H(t)X(t)+v(t)
(2)
式中:X(t)為t時(shí)刻的狀態(tài)向量;t為離散時(shí)間;Φ(t,t-1)為t-1時(shí)刻到t時(shí)刻的狀態(tài)轉(zhuǎn)移矩陣;Γ(t,t-1)為t-1時(shí)刻到t時(shí)刻的激勵(lì)轉(zhuǎn)移矩陣;w(t)為系統(tǒng)噪聲向量;Z(t)為t時(shí)刻的觀測(cè)向量;H(t)為t時(shí)刻的預(yù)測(cè)輸出轉(zhuǎn)移矩陣;v(t)為觀測(cè)噪聲向量。
在卡爾曼濾波算法基本方程中,假設(shè)w(t)和v(t)為高斯白噪聲,通常情況,可根據(jù)經(jīng)驗(yàn)給協(xié)方差矩陣賦值,通過(guò)卡爾曼濾波算法遞推預(yù)測(cè)方程,可以得到t時(shí)刻狀態(tài)的最優(yōu)估計(jì)值[9]。
1.2 建立線性離散動(dòng)態(tài)系統(tǒng)模型
建立狀態(tài)空間模型是系統(tǒng)獲得預(yù)測(cè)結(jié)果的重要條件。結(jié)合AQI時(shí)間序列平穩(wěn)連續(xù)的特點(diǎn),本研究采用時(shí)間序列模型建立卡爾曼濾波所需要的觀測(cè)方程和狀態(tài)方程[10]。自回歸滑動(dòng)平均(ARMA)模型是研究時(shí)間序列的重要方法,由自回歸模型(AR模型)與滑動(dòng)平均模型(稱(chēng)MA模型)為基礎(chǔ)“混合”構(gòu)成,應(yīng)用十分廣泛。ARMA模型中,假設(shè)某變量t時(shí)刻的數(shù)值為xt,t時(shí)刻前有p個(gè)過(guò)去時(shí)間點(diǎn),通過(guò)對(duì)過(guò)去時(shí)間點(diǎn)數(shù)值xt-1,xt-2,...xt-p進(jìn)行線性回歸,并與隨機(jī)干擾噪聲組成線性組合,獲取xt與過(guò)去值之間的表達(dá)式。ARMA模型表達(dá)式如下:
xt-φ1xt-1-…-φpxt-p=at-θ1at-1-…θqat-q
(3)
1.3 RBF神經(jīng)網(wǎng)絡(luò)獲取觀測(cè)值
神經(jīng)網(wǎng)絡(luò)系統(tǒng)在控制領(lǐng)域應(yīng)用比較廣泛,它具有能處理復(fù)雜情況、滿足高設(shè)計(jì)要求和控制不確定因素等優(yōu)勢(shì)[11]。RBF神經(jīng)網(wǎng)絡(luò)是一種前向型神經(jīng)網(wǎng)絡(luò),網(wǎng)絡(luò)由3層組成,即輸入層、隱含層和輸出層,結(jié)構(gòu)簡(jiǎn)單且逼近能力強(qiáng)。
輸入層為第1層,是由信號(hào)源節(jié)點(diǎn)組成;隱含層為第2層,單元數(shù)根據(jù)所描述的具體需要而定,如單層或多層的非線性處理神經(jīng)元;第3層為輸出層,根據(jù)輸入模式做出響應(yīng)。
RBF神經(jīng)網(wǎng)絡(luò)的基本思想:將徑向基函數(shù)作為單元的“基”構(gòu)成隱含層空間,將輸入矢量不通過(guò)權(quán)連接,而是直接映射到隱含層空間,當(dāng)徑向基函數(shù)中心點(diǎn)確定后,映射關(guān)系也隨之確定。
與BP神經(jīng)網(wǎng)絡(luò)相比,RBF神經(jīng)網(wǎng)絡(luò)隱含層節(jié)點(diǎn)函數(shù)為徑向函數(shù),克服了BP神經(jīng)網(wǎng)絡(luò)訓(xùn)練時(shí)間長(zhǎng)和計(jì)算復(fù)雜的不足。同時(shí),RBF神經(jīng)網(wǎng)絡(luò)具有良好的泛化能力、實(shí)時(shí)性好、更好的逼近能力和自適應(yīng)能力。RBF神經(jīng)網(wǎng)絡(luò)輸出層滿足映射f(x),方程式如(4)所示。
(4)
η(x)=exp(-x2/σ2)
(5)
式中:y為映射函數(shù)輸出向量;x為映射函數(shù)輸入向量;ωlk為第l個(gè)隱含層節(jié)點(diǎn)到第k個(gè)輸出層神經(jīng)元的加權(quán)值;ck為RBF神經(jīng)網(wǎng)絡(luò)中心點(diǎn)值;m為隱含層單元的個(gè)數(shù);N為輸出層神經(jīng)元個(gè)數(shù);ηk(x)為第k個(gè)輸出層的轉(zhuǎn)換函數(shù);σ為基函數(shù)寬度參數(shù)。
本研究中把t時(shí)刻的AQI數(shù)據(jù)作為RBF神經(jīng)網(wǎng)絡(luò)的輸出,把t-1~t-p時(shí)刻的AQI數(shù)據(jù)作為RBF神經(jīng)網(wǎng)絡(luò)的輸入,選取輸出層神經(jīng)元個(gè)數(shù)N=1的RBF結(jié)構(gòu)模型,如圖1所示。
圖1 RBF結(jié)構(gòu)圖Fig.1 RBF structure diagram
本研究采用隨機(jī)梯度訓(xùn)練算法,即用已知AQI數(shù)據(jù)作為訓(xùn)練樣本集。隨機(jī)梯度法在訓(xùn)練RBF神經(jīng)網(wǎng)絡(luò)時(shí)使輸出層的加權(quán)值,中心點(diǎn)值和基函數(shù)寬度參數(shù)同步進(jìn)行有監(jiān)督學(xué)習(xí)。所謂監(jiān)督學(xué)習(xí)是指分析訓(xùn)練樣本數(shù)據(jù),產(chǎn)生一個(gè)推斷的功能,其可有效地獲取神經(jīng)網(wǎng)絡(luò)輸出層的加權(quán)值、中心點(diǎn)值和基函數(shù)寬度參數(shù)。
RBF神經(jīng)網(wǎng)絡(luò)映射機(jī)制為:(1)非線性變換單元只對(duì)其中心點(diǎn)附近的輸入敏感,距離中心點(diǎn)越遠(yuǎn),非線性變換單元的輸出減小,直至一個(gè)很小值,表現(xiàn)為“局部敏感”;(2)非線性變換單元輸出減小的速度由σ決定,σ越大,減小速度越慢,反之,則減小速度越快;(3)非線性變換單元經(jīng)過(guò)輸出層的幅值調(diào)整,來(lái)獲得期望的輸出。
1.4 AQI預(yù)測(cè)誤差指標(biāo)
AQI預(yù)測(cè)誤差指標(biāo)是衡量預(yù)測(cè)方法優(yōu)劣的重要條件。在預(yù)測(cè)分析的過(guò)程中,可采用多種參數(shù)評(píng)價(jià)一個(gè)預(yù)測(cè)方法的精確度,如最大誤差、均方根誤差、平均絕對(duì)誤差、平均相對(duì)誤差等。在實(shí)際應(yīng)用中,一個(gè)或兩個(gè)參數(shù)很難保證預(yù)測(cè)的精確性,所以通常情況下,應(yīng)該綜合考慮多個(gè)參數(shù),才能衡量預(yù)測(cè)的準(zhǔn)確度。
2.1 數(shù)據(jù)來(lái)源
根據(jù)相關(guān)規(guī)定,地級(jí)及以上環(huán)境保護(hù)行政主管部門(mén)或其授權(quán)的環(huán)境監(jiān)測(cè)站需向公眾公開(kāi)空氣質(zhì)量數(shù)據(jù),包括AQI、PM10、PM2.5、SO2、NO2、O3、CO等數(shù)據(jù),并進(jìn)行時(shí)報(bào)和日?qǐng)?bào)。本研究使用的數(shù)據(jù)來(lái)源于中國(guó)空氣質(zhì)量在線監(jiān)測(cè)分析平臺(tái)。隨著納入考核的污染物種類(lèi)增多和計(jì)算方法復(fù)雜程度加大,AQI指數(shù)受到更多因素的影響,具有較強(qiáng)的非線性特性。根據(jù)《環(huán)境空氣質(zhì)量指數(shù)(AQI)技術(shù)規(guī)定(試行)》(HJ 633—2012),AQI等級(jí)劃分如表1所示。
表1 AQI等級(jí)劃分
本研究選取中國(guó)空氣質(zhì)量在線監(jiān)測(cè)分析平臺(tái)發(fā)布的天津市2015年1—8月份AQI數(shù)據(jù)作為RBF神經(jīng)網(wǎng)絡(luò)的訓(xùn)練樣本,9月份AQI數(shù)據(jù)作為RBF神經(jīng)網(wǎng)絡(luò)的預(yù)測(cè)性能測(cè)試樣本,經(jīng)測(cè)試,RBF神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)性能較好。由狀態(tài)方程和觀測(cè)方程可知,AQI預(yù)測(cè)精度為1 h,根據(jù)t時(shí)刻之前的AQI實(shí)際值,獲得t時(shí)刻的AQI預(yù)測(cè)值,形成連續(xù)預(yù)測(cè)。使用2015年10月1日起連續(xù)1 000 h的AQI作為實(shí)驗(yàn)樣本,由于數(shù)據(jù)過(guò)多,影響仿真效果,因此取10月1日起前300 h的AQI數(shù)據(jù)進(jìn)行仿真。
2.2 卡爾曼濾波算法預(yù)測(cè)AQI
根據(jù)時(shí)間序列分析法得到了高階自回歸模型,確定系統(tǒng)狀態(tài)方程參數(shù)。用卡爾曼濾波方法對(duì)AQI指數(shù)進(jìn)行預(yù)測(cè),預(yù)測(cè)結(jié)果如圖2所示。
圖2 卡爾曼濾波的AQI預(yù)測(cè)結(jié)果Fig.2 The AQI prediction result of kalman filtering
由圖2可見(jiàn),采用ARMA建立模型的卡爾曼濾波算法對(duì)AQI進(jìn)行預(yù)測(cè),預(yù)測(cè)的結(jié)果基本反映出AQI的變化趨勢(shì),但存在較大的滯后延遲現(xiàn)象,致使預(yù)測(cè)結(jié)果的誤差較大,并未達(dá)到預(yù)期的預(yù)測(cè)結(jié)果。
2.3 BP神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)AQI
利用BP神經(jīng)網(wǎng)絡(luò)對(duì)AQI進(jìn)行預(yù)測(cè),得到的預(yù)測(cè)結(jié)果如圖3所示。
圖3 BP神經(jīng)網(wǎng)絡(luò)的AQI預(yù)測(cè)結(jié)果Fig.3 The AQI prediction result of BP neural network
由圖3可見(jiàn),BP神經(jīng)網(wǎng)絡(luò)算法在AQI預(yù)測(cè)中具有一定的預(yù)測(cè)能力和預(yù)測(cè)精度,在某些點(diǎn)處有較強(qiáng)的非線性逼近能力。但在AQI波動(dòng)大的極點(diǎn)處影響了BP神經(jīng)網(wǎng)絡(luò)的泛化,產(chǎn)生振幅,致使預(yù)測(cè)效果和預(yù)測(cè)精度降低。
2.4 基于卡爾曼濾波的融合算法預(yù)測(cè)AQI
將RBF神經(jīng)網(wǎng)絡(luò)的預(yù)測(cè)結(jié)果作為卡爾曼濾波方程的觀測(cè)值,實(shí)現(xiàn)融合預(yù)測(cè),如圖4所示。
圖4 融合算法的AQI預(yù)測(cè)結(jié)果Fig.4 The AQI prediction result of fusion algorithm
由圖4可見(jiàn),利用卡爾曼濾波算法與ARMA建模并和RBF神經(jīng)網(wǎng)絡(luò)算法進(jìn)行融合,從而進(jìn)一步優(yōu)化預(yù)測(cè)結(jié)果,預(yù)測(cè)精度優(yōu)于單一采用卡爾曼濾波算法和單一BP神經(jīng)網(wǎng)絡(luò)算法。融合算法與單一卡爾曼濾波算法預(yù)測(cè)結(jié)果相比,延遲現(xiàn)象得到極大地改善;與BP神經(jīng)網(wǎng)絡(luò)算法相比,在數(shù)據(jù)極值點(diǎn)的預(yù)測(cè)結(jié)果誤差大大減小,預(yù)測(cè)效果有明顯改善。不同方法預(yù)測(cè)誤差指標(biāo)如表2所示。
表2 不同方法預(yù)測(cè)性能指標(biāo)
通過(guò)對(duì)表2中各種AQI預(yù)測(cè)算法誤差指標(biāo)對(duì)比可知,BP神經(jīng)網(wǎng)絡(luò)算法和ARMA卡爾曼濾波算法對(duì)AQI的預(yù)測(cè)結(jié)果都有較大的誤差,尤其是BP神經(jīng)網(wǎng)絡(luò)算法,誤差較為明顯。BP神經(jīng)網(wǎng)絡(luò)對(duì)歷史信息的利用率和記憶能力有限,從而增加了神經(jīng)元狀態(tài)錯(cuò)誤變化的機(jī)率?;诳柭鼮V波的融合算法吸收了RBF神經(jīng)網(wǎng)絡(luò)良好的泛化能力、適應(yīng)新數(shù)據(jù)能力強(qiáng)、學(xué)習(xí)速度快。該融合算法預(yù)測(cè)模型減少對(duì)真實(shí)數(shù)據(jù)的依賴(lài),調(diào)整能力大大增強(qiáng),提高了預(yù)測(cè)精度,減少了預(yù)測(cè)誤差。
通過(guò)對(duì)不同算法的預(yù)測(cè)機(jī)制進(jìn)行分析,利用ARMA模型建立卡爾曼濾波的狀態(tài)方程和觀測(cè)方程,利用RBF神經(jīng)絡(luò)的預(yù)測(cè)值作為卡爾曼濾波方程的觀測(cè)值,用卡爾曼濾波算法將ARMA和RBF神經(jīng)網(wǎng)絡(luò)融合在一起,實(shí)現(xiàn)了AQI的融合預(yù)測(cè)。仿真實(shí)驗(yàn)結(jié)果驗(yàn)證了融合算法的有效性,減小單一預(yù)測(cè)方法造成的誤差積累,并減少極值點(diǎn)較大波動(dòng)數(shù)據(jù)點(diǎn)的誤差。融合算法獲取了兩種算法的優(yōu)點(diǎn),預(yù)測(cè)結(jié)果十分理想。
[1] 白鶴鳴,沈潤(rùn)平,師華定,等.基于BP神經(jīng)網(wǎng)絡(luò)的空氣污染指數(shù)預(yù)測(cè)模型研究[J].環(huán)境科學(xué)與技術(shù),2013,36(3):186-189.
[2] 李小飛,張明軍,王圣杰,等.中國(guó)空氣污染指數(shù)變化特征及影響因素分析[J].環(huán)境科學(xué),2012,33(6):1936-1943.
[3] 王儉,胡筱敏,鄭龍熙,等.基于BP模型的大氣污染預(yù)報(bào)方法的研究[J].環(huán)境科學(xué)研究,2002,15(5):62-64.
[4] 白鶴鳴,沈潤(rùn)平,師華定,等.空氣中PM10濃度的BP神經(jīng)網(wǎng)絡(luò)預(yù)報(bào)研究[J].環(huán)境研究與監(jiān)測(cè),2010,23(2):29-32.
[5] YU Shaocai,MATHUR R,SARWAR G,et al.Eta-CMAQ air quality forecasts for O3and related species using three different photochemical mechanisms (CB4,CB05,SAPRC-99): comparisons with measurements during the 2004 ICARTT study[J].Atmospheric Chemistry & Physics,2010,10(6):3001-3025.
[6] EDER B,KANG Daiwen,RAO S T,et al.Using national air quality forecast guidance to develop local air quality index forecasts[J].Bulletin of the American Meteorological Society,2010,91(3):313-326.
[7] EDER B,KANG Daiwen,MATHUR R,et al.A performance evaluation of the national air quality forecast capability for the summer of 2007[J].Atmospheric Environment,2009,43(14):2312-2320.
[8] 張賢達(dá).確定ARMA模型MA階數(shù)的一種方法[J].自動(dòng)化學(xué)報(bào),1994,20(1):80-84.
[9] 修春波,任曉,李艷晴,等.基于卡爾曼濾波的風(fēng)速序列短期預(yù)測(cè)方法[J].電工技術(shù)學(xué)報(bào),2014,29(2):253-259.
[10] 王學(xué)林,周俊,姬長(zhǎng)英,等.基于卡爾曼濾波的RBF神經(jīng)網(wǎng)絡(luò)和PD復(fù)合控制研究[J].計(jì)算機(jī)測(cè)量與控制,2009,17(8):1551-1553.
[11] 劉進(jìn)寶,丁濤.基于徑向基函數(shù)神經(jīng)網(wǎng)絡(luò)的風(fēng)速預(yù)測(cè)[J].太陽(yáng)能報(bào),2012,33(7):1131-1135.
PredictionofairqualityindexbasedonKalmanfilteringfusionalgorithm
GUOLijin1,2,JINGHaiming1,2,NANYaxiang1,2,XIUChunbo1,2.
(1.CollegeofElectricalEngineeringandAutomation,TianjinPolytechnicUniversity,Tianjin300387;2.LaboratoryofNewTechnologyaboutEnergyandElectricalEngineering,TianjinPolytechnicUniversity,Tianjin300387)
The basic principle of the Kalman filtering algorithm and its prediction mechanism of air quality index (AQI) were analyzed. This paper using auto-regressive and moving average model (ARMA) to establish a mathematical model for Kalman filtering and put forward radial basis function (RBF) neural network merging with Kalman filtering to achieve a new fusion algorithm for AQI forecast. According to the characteristics of AQI time series,auto-regressive prediction model was established,then Kalman filtering state equation and measurement equation were established. The stochastic gradient approximation algorithm was used to train the RBF neural network,and the output of RBF neural network was used as the observation value of the Kalman filtering measurement equation. Simulation results showed that compared with a single method,the Kalman filtering prediction algorithm combined with RBF neural network had improved the lag phenomenon,reduced errors and raised the prediction accuracy.
Kalman filtering; air quality index; auto-regressive and moving average model; radial basis function
10.15985/j.cnki.1001-3865.2017.04.009
2016-08-20)
郭利進(jìn),男,1971年生,博士,教授,主要從事智能控制系統(tǒng)與數(shù)據(jù)挖掘等方面的研究。#
。
*國(guó)家自然科學(xué)基金資助項(xiàng)目(No.61203302);天津市應(yīng)用基礎(chǔ)與前沿技術(shù)研究計(jì)劃項(xiàng)目(No.14JCYBJC18900)。