楊 云,楊 毅
(陜西科技大學(xué) 電氣與信息工程學(xué)院,陜西 西安 710021)
?
基于GA-BP神經(jīng)網(wǎng)絡(luò)的供暖期空氣質(zhì)量指數(shù)預(yù)測(cè)分析
楊云,楊毅
(陜西科技大學(xué) 電氣與信息工程學(xué)院,陜西 西安710021)
摘要:空氣質(zhì)量指數(shù)(AQI)是定量描述空氣質(zhì)量狀況的無量綱指數(shù),其預(yù)報(bào)工作有利于減弱或預(yù)防空氣嚴(yán)重污染事件的發(fā)生.針對(duì)冬季供暖期AQI指數(shù)的預(yù)測(cè)問題,本文提出了一種基于遺傳算法優(yōu)化神經(jīng)網(wǎng)絡(luò)的預(yù)測(cè)方法.以西安市環(huán)境監(jiān)測(cè)站提供的數(shù)據(jù)作為研究對(duì)象,分別建立了基于BP神經(jīng)網(wǎng)絡(luò)的AQI預(yù)測(cè)模型和基于遺傳算法優(yōu)化的BP神經(jīng)網(wǎng)絡(luò)AQI預(yù)測(cè)模型,并對(duì)預(yù)測(cè)結(jié)果進(jìn)行了對(duì)比分析.結(jié)果表明,遺傳算法優(yōu)化后的神經(jīng)網(wǎng)絡(luò)(GA-BP)的預(yù)測(cè)結(jié)果在泛化能力上較BP神經(jīng)網(wǎng)絡(luò)要好,其模擬結(jié)果更接近于真實(shí)值,具有更高的精準(zhǔn)度和精確度.
關(guān)鍵詞:空氣質(zhì)量指數(shù);預(yù)測(cè);BP神經(jīng)網(wǎng)絡(luò);遺傳算法;優(yōu)化
0引言
近年來,隨著霧霾天氣的逐漸增多,空氣質(zhì)量受到了越來越多民眾的關(guān)注.空氣的質(zhì)量情況將直接影響著人們的身體健康,據(jù)世界衛(wèi)生組織統(tǒng)計(jì),每年平均有200萬未成年人死于空氣污染[1].中國科學(xué)院院士、前中國衛(wèi)生部部長(zhǎng)陳竺與專家合作發(fā)表于《柳葉刀》的報(bào)告稱:估計(jì)我國每年因室外空氣污染導(dǎo)致的早死人數(shù)在35~50萬之間.
我國是世界上大氣污染狀況比較嚴(yán)重的國家之一,其中城市大氣污染更為突出.統(tǒng)計(jì)顯示,從1961年到2012年間,發(fā)生大范圍霧霾事件的天數(shù)大概達(dá)到491天,其中冬季發(fā)生的天數(shù)超過360天,約占70%以上[2].尤其是在北方冬季采暖季節(jié),城市中的采暖鍋爐需要消耗大量煤炭,并且釋放大量的灰塵、SO2,CO等有害物質(zhì).此外,冬季氣象條件非常不利于污染物擴(kuò)散,這也是造成重污染天氣的原因.因此,面對(duì)冬季日益嚴(yán)重的空氣污染狀況,對(duì)供暖期的空氣質(zhì)量進(jìn)行預(yù)測(cè)勢(shì)在必行,這對(duì)于開展環(huán)境治理工作有著十分重要的意義.
目前,空氣質(zhì)量的預(yù)測(cè)多是針對(duì)單一的污染物質(zhì),而空氣中污染物的成分較為復(fù)雜,傳統(tǒng)預(yù)測(cè)模型的預(yù)測(cè)結(jié)果并不十分準(zhǔn)確[3,4].由于空氣質(zhì)量易受氣象條件影響,每日的空氣質(zhì)量指數(shù)呈非線性變化關(guān)系,很難通過常規(guī)方法進(jìn)行預(yù)測(cè).神經(jīng)網(wǎng)絡(luò)具有強(qiáng)大的非線性映射能力,在解決上述問題時(shí)展現(xiàn)出了強(qiáng)大的優(yōu)勢(shì),但單一的BP神經(jīng)網(wǎng)絡(luò)存在極易陷入局部最優(yōu)的缺陷,從而影響預(yù)測(cè)結(jié)果[5-7].
鑒于此,本文將遺傳算法和BP神經(jīng)網(wǎng)絡(luò)算法相結(jié)合,利用遺傳算法的全局搜索最優(yōu)解的特點(diǎn),解決了BP神經(jīng)網(wǎng)絡(luò)容易出現(xiàn)局部最優(yōu)的問題.可利用其最優(yōu)參數(shù)對(duì)冬季采暖期內(nèi)的空氣質(zhì)量指數(shù)預(yù)測(cè)模型進(jìn)行訓(xùn)練和預(yù)測(cè),從而提高預(yù)測(cè)結(jié)果的精度和正確率.
1空氣質(zhì)量指數(shù)(AQI)預(yù)測(cè)的原理
空氣質(zhì)量指數(shù)(AirQualityIndex,簡(jiǎn)稱AQI)是定量描述空氣質(zhì)量狀況的無量綱指數(shù).我國現(xiàn)行的空氣質(zhì)量評(píng)價(jià)標(biāo)準(zhǔn)是2012年初出臺(tái)的《環(huán)境空氣質(zhì)量標(biāo)準(zhǔn)》.參與評(píng)價(jià)的污染物質(zhì)為細(xì)顆粒物(PM2.5)、可吸入顆粒物(PM10)、臭氧(O3)、CO、SO2、NO2等六個(gè)指標(biāo)[8].
具體的AQI計(jì)算方法參照《環(huán)境空氣質(zhì)量標(biāo)準(zhǔn)》,以細(xì)顆粒物(PM2.5)、可吸入顆粒物(PM10)、二氧化硫(SO2)、二氧化氮(NO2)、臭氧(O3)、一氧化碳(CO)等6項(xiàng)污染物的實(shí)測(cè)濃度值分別計(jì)算得出空氣質(zhì)量分指數(shù)(IAQI)后,再從各項(xiàng)污染物的IAQI中選擇最大值確定為AQI.
由于污染物的遷移傳輸需要一定條件以及一定時(shí)間,故氣象條件對(duì)污染物質(zhì)的擴(kuò)散以及積累起著重要影響.AQI很大程度上也受到氣象條件的影響.因此,本文中空氣質(zhì)量預(yù)測(cè)將選用前一日的PM2.5、PM10、CO、SO2、O3、NO2濃度,前一日的AQI指數(shù)以及前一日風(fēng)力級(jí)別等8個(gè)因素作為影響因子.設(shè)空氣質(zhì)量指數(shù)的影響因子為X,所預(yù)測(cè)的后一日空氣質(zhì)量指數(shù)值為Y,則:
X={x1,x2,…,xm}
(1)
Y=f(x1,x2,…,xm)
(2)
式(1)~(2)中:xi表示第i個(gè)影響因子;m表示影響因子的總數(shù)目;f為預(yù)測(cè)函數(shù).通過對(duì)歷史數(shù)據(jù)的訓(xùn)練,得到后一日AQI指數(shù)與8個(gè)影響因子之間的關(guān)系,最終實(shí)現(xiàn)對(duì)AQI指數(shù)的預(yù)測(cè).
2仿真數(shù)據(jù)來源
本文所使用數(shù)據(jù)來自于中國空氣質(zhì)量在線監(jiān)測(cè)分析平臺(tái).對(duì)西安市區(qū)內(nèi)的高壓開關(guān)廠、小寨、高新西區(qū)、興慶小區(qū)、經(jīng)開區(qū)、曲江文化產(chǎn)業(yè)集團(tuán)、市人民體育場(chǎng)、廣運(yùn)潭、草灘、紡織城、長(zhǎng)安區(qū)、臨潼區(qū)、閻良區(qū)等13個(gè)空氣質(zhì)量監(jiān)測(cè)站點(diǎn)采集的數(shù)據(jù)進(jìn)行了匯總,然后對(duì)上述13個(gè)站點(diǎn)每小時(shí)數(shù)據(jù)計(jì)算求平均,從而得出了每日AQI指數(shù)以及各污染物濃度數(shù)據(jù).
3遺傳算法優(yōu)化BP神經(jīng)網(wǎng)絡(luò)的空氣質(zhì)量預(yù)測(cè)模型
3.1BP神經(jīng)網(wǎng)絡(luò)
BP(BackPropagation,簡(jiǎn)稱BP)神經(jīng)網(wǎng)絡(luò)在1986年由Rumelhart和McCelland為首的科學(xué)家小組提出,是一種按誤差逆?zhèn)鞑ニ惴ㄓ?xùn)練的多層前饋網(wǎng)絡(luò),是目前應(yīng)用最廣泛的神經(jīng)網(wǎng)絡(luò)模型之一.
如圖1所示,典型的BP神經(jīng)網(wǎng)絡(luò)為3層結(jié)構(gòu),即輸入層,隱含層和輸出層.BP神經(jīng)網(wǎng)絡(luò)的學(xué)習(xí)過程是由模式的正向傳播和誤差的反向傳播所組成.在正向傳播過程中,輸入信息通過隱含層處理并傳向輸出層,如果輸出層的信息與預(yù)期輸出不符的話,則進(jìn)入誤差的反向傳播過程.將期望輸出與實(shí)際輸出的誤差沿原通路進(jìn)行反向傳播,通過修改各連接層的權(quán)值以及閾值,使得期望輸出與實(shí)際輸出的誤差減小.不斷重復(fù)此過程,使得整個(gè)網(wǎng)絡(luò)朝著誤差減小的方向變化,直至誤差減小至目標(biāo)值.
圖1 BP神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)圖
3.2遺傳算法優(yōu)化網(wǎng)絡(luò)參數(shù)
遺傳算法(GeneticAlgorithms,簡(jiǎn)稱GA)是在1962年由美國Michigan大學(xué)Holland教授提出的模擬自然界遺傳機(jī)制和生物進(jìn)化論而成的一種過程搜索最優(yōu)解算法.引入自然界“優(yōu)勝劣汰,適者生存”的原理,按照所選擇的適應(yīng)度函數(shù)并通過遺傳中的選擇、交叉和變異對(duì)初始種群中的個(gè)體進(jìn)行篩選,其中適應(yīng)度值好的個(gè)體保留,而適應(yīng)度差的個(gè)體淘汰,從而形成了新的種群[9].新群體既繼承了上一代的信息,又優(yōu)于上一代.如此反復(fù),直至滿足條件,末代種群可以看做問題的最優(yōu)解.
遺傳算法優(yōu)化網(wǎng)絡(luò)參數(shù)的主要步驟如下:
(1)對(duì)種群進(jìn)行初始化,選擇合適的編碼方法.本文采用實(shí)數(shù)編碼,直接使用問題變量進(jìn)行編碼,使用實(shí)數(shù)參與遺傳操作,無需特定的編碼與解碼.該方法便于較大空間的遺傳搜索,提高了遺傳算法的精度要求[10],避免了編碼和解碼的過程,使遺傳算法更接近問題空間.
(2)選擇適應(yīng)度函數(shù).用訓(xùn)練數(shù)據(jù)訓(xùn)練BP神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)輸出,將預(yù)測(cè)輸出與期望輸出之間的誤差絕對(duì)值和E作為個(gè)體適應(yīng)度值F,其計(jì)算公式為:
(3)
式(3)中:n為網(wǎng)絡(luò)輸出節(jié)點(diǎn)數(shù);yi為BP神經(jīng)網(wǎng)絡(luò)第i個(gè)節(jié)點(diǎn)的期望輸出;oi為第i個(gè)節(jié)點(diǎn)的預(yù)測(cè)輸出;k為系數(shù).
(3)進(jìn)行選擇操作.本文采用輪盤賭法,即基于適應(yīng)度比例的選擇策略,每個(gè)個(gè)體i的選擇概率pi為:
fi=k/Fi
(4)
(5)
式(4)~(5)中:Fi為個(gè)體i的適應(yīng)度值;k為系數(shù);N為種群個(gè)體數(shù)目.
(4)進(jìn)行交叉操作.交叉操作是產(chǎn)生新個(gè)體的主要方法,決定了遺傳算法的全局搜索能力.由于本文采用實(shí)數(shù)編碼,因此交叉操作采用實(shí)數(shù)交叉法.第k個(gè)染色體ak和第l個(gè)染色體al在j位的交叉操作方法如下:
(6)
(5)進(jìn)行變異操作.變異操作是產(chǎn)生新個(gè)體的輔助方法,決定了遺傳算法的局部搜索能力[9].選取第i個(gè)個(gè)體的第j個(gè)基因aij進(jìn)行變異,具體操作如下:
(7)
式(7)中:amax為基因aij的上界;amin為基因aij的下界;f(g)=r2(1-g/Gmax)2,r2為一個(gè)隨機(jī)數(shù);g為當(dāng)前迭代次數(shù);Gmax為最大進(jìn)化次數(shù);r為[0,1]間的隨機(jī)數(shù).
通過重復(fù)以上步驟對(duì)BP神經(jīng)網(wǎng)絡(luò)的初始權(quán)值和閾值進(jìn)行優(yōu)化,從而可使得優(yōu)化后的BP神經(jīng)網(wǎng)絡(luò)能夠更好地預(yù)測(cè)函數(shù)輸出.
3.3基于GA-BP神經(jīng)網(wǎng)絡(luò)的預(yù)測(cè)模型
BP神經(jīng)網(wǎng)絡(luò)在解決非線性映射問題上具有強(qiáng)大的優(yōu)勢(shì),其通過學(xué)習(xí)過程產(chǎn)生的網(wǎng)絡(luò)模型對(duì)于測(cè)試樣本而言,具有很強(qiáng)的預(yù)測(cè)能力.但由于BP神經(jīng)網(wǎng)絡(luò)采用梯度下降的尋優(yōu)方式,容易陷入局部極小值,且在節(jié)點(diǎn)個(gè)數(shù)的選取以及權(quán)值的設(shè)定上尚未有明確的指導(dǎo),這些都將對(duì)輸出結(jié)果產(chǎn)生影響.
通過遺傳算法的引入,可有效地改善上述問題.遺傳算法優(yōu)化BP神經(jīng)網(wǎng)絡(luò),是使用遺傳算法來對(duì)BP神經(jīng)網(wǎng)絡(luò)的閾值和權(quán)值進(jìn)行優(yōu)化.通過選擇、交叉、變異等一系列操作,選擇搜索方向,對(duì)初始的網(wǎng)絡(luò)模型進(jìn)行一次優(yōu)化,在達(dá)到一定的收斂程度后,對(duì)BP神經(jīng)網(wǎng)絡(luò)進(jìn)行二次訓(xùn)練.
遺傳算法中每一代種群中的每個(gè)個(gè)體都包含了BP網(wǎng)絡(luò)中的所有權(quán)值和閾值,通過計(jì)算每個(gè)個(gè)體的適應(yīng)度值并對(duì)其進(jìn)行遺傳操作,從而找到適應(yīng)度最優(yōu)的個(gè)體.BP網(wǎng)絡(luò)最終使用這個(gè)最優(yōu)個(gè)體得到的權(quán)值和閾值再對(duì)網(wǎng)絡(luò)進(jìn)行賦值.利用遺傳算法對(duì)BP神經(jīng)網(wǎng)絡(luò)的權(quán)值及閾值進(jìn)行優(yōu)化,將提高整個(gè)預(yù)測(cè)模型的收斂速度以及精度,其算法流程如圖2所示.
圖2 GA-BP神經(jīng)網(wǎng)絡(luò)算法流程圖
4實(shí)驗(yàn)仿真
4.1數(shù)據(jù)介紹
本次仿真實(shí)驗(yàn)的數(shù)據(jù)選取西安市2014~2015年冬季供暖期空氣質(zhì)量監(jiān)測(cè)數(shù)據(jù).由于冬季氣象條件不利于污染物質(zhì)擴(kuò)散,加之氣候原因造成的提前供暖等因素,故在已獲取環(huán)境數(shù)據(jù)的基礎(chǔ)上對(duì)其進(jìn)行了篩選,剔除無效或者缺失數(shù)據(jù)后,保留了2014年1月28日~2014年3月17日、2014年11月13日~2015年3月17日以及2015年11月13日~2015年12月23日等三大時(shí)段,總計(jì)215條日空氣質(zhì)量監(jiān)測(cè)數(shù)據(jù).
使用樣本數(shù)據(jù)中70%的數(shù)據(jù)作為訓(xùn)練樣本,30%的數(shù)據(jù)作為測(cè)試樣本.訓(xùn)練樣本和測(cè)試樣本分別由兩組輸入矩陣和輸出矩陣組成,一組輸入輸出
矩陣進(jìn)行網(wǎng)絡(luò)訓(xùn)練,而另一組輸入輸出矩陣則對(duì)訓(xùn)練好的網(wǎng)絡(luò)進(jìn)行測(cè)試.
其中,輸入數(shù)據(jù)由一個(gè)8*m的矩陣所表示:
在矩陣P中,每列元素分別代表一個(gè)影響空氣質(zhì)量指數(shù)AQI的影響因子,am1~am8分別表示當(dāng)日PM2.5、PM10、CO、NO2、SO2、O3的日均濃度值、當(dāng)日風(fēng)力級(jí)別以及當(dāng)日AQI指數(shù)值,每行數(shù)據(jù)按照時(shí)間序列依次排列.
輸出數(shù)據(jù)由一個(gè)m*1的矩陣所表示:T=[b1b2…bm]T.在矩陣T中,b1~bm表示后一日的AQI指數(shù)值,輸出矩陣T中的每一行均與輸入矩陣P中的每一行相對(duì)應(yīng).
4.2數(shù)據(jù)預(yù)處理
數(shù)據(jù)的規(guī)范化處理是進(jìn)行仿真實(shí)驗(yàn)前必不可少的一個(gè)步驟,尤其是在涉及到神經(jīng)網(wǎng)絡(luò)使用的時(shí)候.BP神經(jīng)網(wǎng)絡(luò)采用梯度下降的尋優(yōu)方式,即使梯度值產(chǎn)生很小的變化,神經(jīng)網(wǎng)絡(luò)權(quán)值也會(huì)發(fā)生變化,取值范圍大的數(shù)據(jù)所取權(quán)值一般要比取值范圍小的數(shù)據(jù)所取權(quán)值大[11],因而會(huì)造成映射的失真,導(dǎo)致最終結(jié)果遠(yuǎn)離最優(yōu)的解值.
在本次仿真實(shí)驗(yàn)的樣本數(shù)據(jù)中,影響空氣質(zhì)量指數(shù)(AQI)的各影響因子無論是在數(shù)值范圍還是數(shù)值單位上都存在著一定的差異,具體如表1所示.表1中CO濃度的數(shù)值單位為mg/m3,而其它污染物質(zhì)的數(shù)值單位為μg/m3.例如,某一日的風(fēng)力級(jí)別為2.429,而AQI指數(shù)卻為101,相差幾十倍,因此需要將這些有量綱數(shù)據(jù)轉(zhuǎn)變?yōu)闊o量綱數(shù)據(jù).
表1 部分樣本數(shù)據(jù)
(8)
式(8)中:ymin與ymax是人為設(shè)定的上界與下界(在Matlab中分別是-1和1),dmin和dmax是數(shù)據(jù)樣本的最大值與最小值[12].對(duì)數(shù)據(jù)樣本進(jìn)行歸一化處理后的數(shù)據(jù)如表2所示.
表2 歸一化后的數(shù)據(jù)
4.3Matlab下實(shí)現(xiàn)仿真
4.3.1基于BP神經(jīng)網(wǎng)絡(luò)的AQI指數(shù)預(yù)測(cè)
采用Matlab平臺(tái)進(jìn)行仿真實(shí)驗(yàn).根據(jù)Kolmogorov定理,具有單隱含層的BP神經(jīng)網(wǎng)絡(luò)能在閉集上以任意精度逼近任意非線性連續(xù)函數(shù)[13].因此,本次仿真實(shí)驗(yàn)選取單隱藏層BP神經(jīng)網(wǎng)絡(luò),并根據(jù)實(shí)際需要選取網(wǎng)絡(luò)模型的各個(gè)參數(shù).部分參數(shù)的選取參照已有經(jīng)驗(yàn)公式.其中,輸入層節(jié)點(diǎn)個(gè)數(shù)為8,輸出層節(jié)點(diǎn)個(gè)數(shù)為1,隱藏層節(jié)點(diǎn)個(gè)數(shù)參照經(jīng)驗(yàn)公式(9)進(jìn)行計(jì)算:
(9)
式(9)中:k表示隱藏層節(jié)點(diǎn)的個(gè)數(shù);m表示數(shù)據(jù)層節(jié)點(diǎn)個(gè)數(shù);n表示輸出層節(jié)點(diǎn)個(gè)數(shù);a為[1,10]之間的任意整數(shù).通過計(jì)算,可知k的取值范圍在4~13之間,因此,分別對(duì)隱藏層節(jié)點(diǎn)的取值進(jìn)行實(shí)驗(yàn).
在Matlab下編寫完整的BP神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)程序,以平均絕對(duì)百分比誤差(Mean Absolute Percent Error,MAPE)這個(gè)指標(biāo)來定量評(píng)判預(yù)測(cè)模型的性能.
(10)
式(10)中:M是檢測(cè)樣本的個(gè)數(shù);vc是預(yù)測(cè)模型的輸出;vd是模型期望的輸出.通過計(jì)算誤差可得出預(yù)測(cè)的精度,其結(jié)果如表3所示.
表3 不同隱藏層節(jié)點(diǎn)數(shù)BP神經(jīng)網(wǎng)絡(luò)的預(yù)測(cè)精度
由表3可知,當(dāng)隱藏層節(jié)點(diǎn)個(gè)數(shù)為9時(shí),預(yù)測(cè)效果最佳.因此,基于BP神經(jīng)網(wǎng)絡(luò)的AQI指數(shù)預(yù)測(cè)模型的隱藏層節(jié)點(diǎn)個(gè)數(shù)為9,預(yù)測(cè)準(zhǔn)確率為71.703%,其擬合曲線如圖3所示.
圖3 BP神經(jīng)網(wǎng)絡(luò)的AQI預(yù)測(cè)結(jié)果
4.3.2基于GA-BP神經(jīng)網(wǎng)絡(luò)的AQI指數(shù)預(yù)測(cè)
遺傳算法優(yōu)化BP神經(jīng)網(wǎng)絡(luò)分為BP神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)的確定、遺傳算法優(yōu)化和BP神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)等3個(gè)部分.該網(wǎng)絡(luò)的輸入數(shù)據(jù)維數(shù)為8,輸出數(shù)據(jù)維數(shù)為1.根據(jù)輸入/輸出數(shù)據(jù)的維數(shù),通過不斷實(shí)驗(yàn),發(fā)現(xiàn)當(dāng)隱藏層節(jié)點(diǎn)個(gè)數(shù)為9的時(shí)候,網(wǎng)絡(luò)預(yù)測(cè)結(jié)果最佳.因此,確定網(wǎng)絡(luò)結(jié)構(gòu)為8-9-1,網(wǎng)絡(luò)初始權(quán)值為8*9+9*1=81個(gè),閾值為9+1=10個(gè),遺傳算法的個(gè)體編碼長(zhǎng)度為81+10=91.
遺傳算法的初始種群數(shù)如果太小,會(huì)導(dǎo)致算法性能較差,得不到可行的解;若初始種群過大,雖然會(huì)增加優(yōu)化信息,但是也會(huì)增加計(jì)算量[14].因此,本實(shí)驗(yàn)選取遺傳算法種群規(guī)模為10,進(jìn)化次數(shù)為50,交叉概率為0.4,變異率為0.2.將預(yù)測(cè)輸出與期望輸出之間的誤差絕對(duì)值和作為個(gè)體適應(yīng)度值,得到如圖4所示的適應(yīng)度進(jìn)化曲線.
圖4 適應(yīng)度進(jìn)化曲線
由于本文采用BP網(wǎng)絡(luò)的訓(xùn)練誤差絕對(duì)值作為個(gè)體適應(yīng)度值,故適應(yīng)度值越低,個(gè)體的適應(yīng)度越高.由圖4可以得知,當(dāng)進(jìn)化代數(shù)在0~10代之間時(shí),平均適應(yīng)度值下降得最為迅速;當(dāng)在10~30代之間時(shí),平均適應(yīng)度值下降趨于平緩;當(dāng)30代之后,平均適應(yīng)度值保持穩(wěn)定狀態(tài).
遺傳算法采用自適應(yīng)的優(yōu)化方法,在網(wǎng)絡(luò)達(dá)到一定的收斂程度時(shí),找到適應(yīng)度最優(yōu)的個(gè)體,該個(gè)體的初始權(quán)值和閾值為優(yōu)化后的權(quán)值閾值.因此,將進(jìn)化30代之后的最優(yōu)個(gè)體的權(quán)值以及閾值賦給BP神經(jīng)網(wǎng)絡(luò),所得到的最優(yōu)初始權(quán)值、閾值如表4所示.
表4 最優(yōu)初始權(quán)值、閾值
使用歸一化處理后的數(shù)據(jù)進(jìn)行網(wǎng)絡(luò)訓(xùn)練,在進(jìn)行200次迭代過程之后,得到的擬合曲線如圖5所示.從圖5可以看出,經(jīng)遺傳算法優(yōu)化后的BP神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)結(jié)果與期望輸出兩者之間存在一定的誤差,但是誤差范圍較小,雖然局部波動(dòng)較大,但在整體趨勢(shì)上與期望的結(jié)果大體一致,且經(jīng)過優(yōu)化后的BP神經(jīng)網(wǎng)絡(luò)的預(yù)測(cè)精度達(dá)到了85.703%.
圖5 GA-BP神經(jīng)網(wǎng)絡(luò)的AQI指數(shù)預(yù)測(cè)結(jié)果
4.4實(shí)驗(yàn)結(jié)果分析
使用同一數(shù)據(jù),分別建立基于BP神經(jīng)網(wǎng)絡(luò)以及基于遺傳算法優(yōu)化的BP神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)模型.BP神經(jīng)網(wǎng)絡(luò)采用8-9-1的網(wǎng)絡(luò)結(jié)構(gòu),隱含層傳遞函數(shù)采用logsig,輸出層傳遞函數(shù)選擇purelin,訓(xùn)練函數(shù)選擇traingdx,閾值和權(quán)值學(xué)習(xí)函數(shù)采用learngd,訓(xùn)練樣本及測(cè)試樣本的歸一化方法與GA-BP相同.該兩種預(yù)測(cè)模型的預(yù)測(cè)結(jié)果如圖6所示.
從圖6可以明顯看出,經(jīng)遺傳算法優(yōu)化過的BP神經(jīng)網(wǎng)絡(luò)的擬合程度明顯好于單一的BP神經(jīng)網(wǎng)絡(luò).對(duì)兩者進(jìn)行比較,可以得出表5所示的對(duì)比結(jié)果.
圖6 BP神經(jīng)網(wǎng)絡(luò)與GA-BP神經(jīng)網(wǎng)絡(luò)對(duì)比
BP神經(jīng)網(wǎng)絡(luò)GA-BP神經(jīng)網(wǎng)絡(luò)AQI指數(shù)預(yù)測(cè)正確率/%71.70385.703
5總結(jié)
本文針對(duì)冬季供暖期的空氣質(zhì)量指數(shù)(AQI)預(yù)測(cè)問題,提出了一種基于遺傳算法優(yōu)化的神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)方法.采用遺傳算法對(duì)BP神經(jīng)網(wǎng)絡(luò)的權(quán)值及閾值進(jìn)行優(yōu)化,使其具備了較強(qiáng)的非線性映射能力,從而優(yōu)化后的網(wǎng)絡(luò)模型能夠在全局范圍內(nèi)進(jìn)行最優(yōu)值的尋找[15],解決了BP神經(jīng)網(wǎng)絡(luò)容易陷入局部最小值的缺陷.因此,經(jīng)遺傳算法優(yōu)化后的BP神經(jīng)網(wǎng)絡(luò)在預(yù)測(cè)空氣質(zhì)量指數(shù)的問題上要優(yōu)于單一BP神經(jīng)網(wǎng)絡(luò),具有良好的應(yīng)用前景.
參考文獻(xiàn)
[1] 馮奇,徐勝,吳勝軍,等.大氣細(xì)顆粒物(PM2.5)在環(huán)境科學(xué)中的研究簡(jiǎn)述[J].環(huán)境科學(xué)與技術(shù),2012,35(61):167-170.
[2] 佟彥超.中國重點(diǎn)城市空氣污染預(yù)報(bào)及其進(jìn)展[J].中國環(huán)境監(jiān)測(cè),2006,22(2):69-71.
[3] 郭慶春,何振芳,李力,等.人工神經(jīng)網(wǎng)絡(luò)在大氣污染預(yù)測(cè)中的應(yīng)用研究[J].工業(yè)儀表與自動(dòng)化裝置,2012(4):18-22.
[4] 孫榮基,趙松,張小琴,等.一種基于BP神經(jīng)網(wǎng)絡(luò)改進(jìn)算法的PM2.5預(yù)測(cè)方法[J].四川環(huán)境,2015,34(4):85-90.
[5] 祝翠玲,蔣志方,王強(qiáng).基于BP神經(jīng)網(wǎng)絡(luò)的環(huán)境空氣質(zhì)量預(yù)測(cè)模型[J].計(jì)算機(jī)工程與應(yīng)用,2007,43(22):223-227.
[6] Kim T,Valdés J B.Nonlinear model for drought forecasting based on a conjunction of wavelet transforms and neural networks[J].American Society of Civil Engineers,2014,8(6):319-328.
[7] 王琨,王文帥,張夏,等.基于BP神經(jīng)網(wǎng)絡(luò)模型的森林空氣質(zhì)量評(píng)價(jià)[J].哈爾濱工業(yè)大學(xué)學(xué)報(bào),2010,42(8):1 278-1 281.
[8] 國家環(huán)境保護(hù)部.環(huán)境空氣質(zhì)量標(biāo)準(zhǔn)(HJ 633-2012)[M].北京:中國環(huán)境科學(xué)出版社,2012.
[9] 楊海濱,韓朋.遺傳算法淺析[J].黑龍江科技信息,2009(11):139,53.
[10] 水勇.遺傳算法的研究與應(yīng)用[J].軟件,2014,35(3):107,110.
[11] 楊娟麗,徐梅,王福林,等.基于BP神經(jīng)網(wǎng)絡(luò)的時(shí)間序列預(yù)測(cè)問題研究[J].數(shù)學(xué)的實(shí)踐與認(rèn)識(shí),2013,43(4):158-164.
[12] 柳小桐.BP神經(jīng)網(wǎng)絡(luò)輸入層數(shù)據(jù)歸一化研究[J].機(jī)械工程與自動(dòng)化,2010(3):122-123,126.
[13] Gupta.River-flow forecasting using higher-order neural networks[J].American Society of Civil Engineers,2014,17(5):655-666.
[14] 黃建國,羅航,王厚軍,等.運(yùn)用GA-BP神經(jīng)網(wǎng)絡(luò)研究時(shí)間序列的預(yù)測(cè)[J].電子科技大學(xué)學(xué)報(bào),2009,38(5):687-692.
[15] 王德明,王莉,張廣明.基于遺傳BP神經(jīng)網(wǎng)絡(luò)的短期風(fēng)速預(yù)測(cè)模型[J].浙江大學(xué)學(xué)報(bào)(工學(xué)版),2012,46(5):837-841,904.
【責(zé)任編輯:晏如松】
PredictionandanalysisofairqualityindexinheatingperiodbasedonGA-BPneuralnetwork
YANGYun,YANGYi
(CollegeofElectricalandInformationEngineering,ShaanxiUniversityofScience&Technology,Xi′an710021,China)
Abstract:Air quality index (AQI) is a non dimensional index to quantitatively describe the condition of air quality,the forecast work helps to weaken or prevent the occurrence of serious air pollution incidents.According to the prediction of AQI in heating season,a prediction method based on GA-BP is proposed in this paper.Using the monitoring data of Xi′an monitoring station as study object,a AQI prediction model based on BP neural network and a AQI prediction model based on BP neural network optimized by the genetic algorithm are established respectively,compare and analyze the predicted results of these two models.The results show that the generalization ability of GA-BP model are better than BP model,and the simulation result is close to reality,has higher accuracy and precision.
Key words:air quality index (AQI); prediction; back propagation neural network; genetic algorithm; optimization
*收稿日期:2016-04-17
基金項(xiàng)目:陜西省科技廳社會(huì)發(fā)展科技攻關(guān)計(jì)劃項(xiàng)目(2015SF277);陜西省科技廳科學(xué)技術(shù)研究發(fā)展計(jì)劃項(xiàng)目(2014K15-03-06);西安市科技計(jì)劃項(xiàng)目 (NC1403(2),NC1319(1))
作者簡(jiǎn)介:楊云 (1965-),女,陜西咸陽人,教授,博士,研究方向:數(shù)據(jù)倉庫與數(shù)據(jù)挖掘
文章編號(hào):1000-5811(2016)04-0171-06
中圖分類號(hào):TP183;X831
文獻(xiàn)標(biāo)志碼:A