姚 寧,馬青蘭,張 晶,文 印
1.太原理工大學(xué):a.環(huán)境科學(xué)與工程學(xué)院,b.現(xiàn)代科技學(xué)院,山西 太原 030024
2.廣西大學(xué)林學(xué)院,廣西 南寧 530004
3.亞熱帶農(nóng)業(yè)生物資源保護與利用國家重點實驗室,廣西 南寧 530004
近年來,隨著國家對大氣污染防治的重視,全國城市空氣質(zhì)量總體保持穩(wěn)定,但以二氧化硫、氮氧化物和顆粒物為主的大氣污染依然較為嚴(yán)重[1],尤其是霧霾現(xiàn)象逐漸引起公眾的關(guān)注??諝馕廴緦夂颉⑸鷳B(tài)系統(tǒng)、土壤以及人體健康帶來的危害是巨大的,因此,大氣污染物濃度的預(yù)測將會成為未來氣象預(yù)報的重要內(nèi)容,也會成為未來環(huán)境管理和預(yù)警的重要參考[2]。
經(jīng)典的大氣污染物濃度預(yù)測方法主要依靠以污染物排放源為基礎(chǔ)的數(shù)學(xué)模型,這些數(shù)學(xué)模型主要研究污染物擴散因子之間的關(guān)系,典型的有無界高斯煙流擴散模式、靜小風(fēng)擴散模式、封閉性擴散模式、線源擴散模式、面源擴散模式等[3]。隨著模糊數(shù)學(xué)、系統(tǒng)工程學(xué)、GIS空間分析在環(huán)境科學(xué)領(lǐng)域的深入,以及現(xiàn)代人工智能技術(shù)的不斷完善,出現(xiàn)了一系列基于環(huán)境因子的新型預(yù)測方法,如模糊識別法、人工神經(jīng)網(wǎng)絡(luò)預(yù)測、GIS空間插值預(yù)測[4]等。
本研究建立污染物濃度與影響因子之間的BP神經(jīng)網(wǎng)絡(luò),對城市中各監(jiān)測點位的次日大氣污染物濃度進行預(yù)測,并運用GIS的插值分析進行污染物空間分布預(yù)測,其中BP神經(jīng)網(wǎng)絡(luò)的輸入向量采用AGNES算法進行處理,總體結(jié)構(gòu)如圖1所示。
圖1 系統(tǒng)總體結(jié)構(gòu)
BP(Back-Propagation)神經(jīng)網(wǎng)絡(luò)是目前使用最廣泛的人工神經(jīng)網(wǎng)絡(luò),對于非線性關(guān)系可以做出很好的模擬和預(yù)測。該網(wǎng)絡(luò)是基于誤差逆?zhèn)鞑ニ惴ㄓ?xùn)練的多層前饋網(wǎng)絡(luò)[5],BP神經(jīng)網(wǎng)絡(luò)的學(xué)習(xí)特點是誤差反向傳播。如圖2所示,根據(jù)輸出節(jié)點的誤差反饋,調(diào)整輸入節(jié)點的權(quán)重系數(shù),以達到最佳的神經(jīng)網(wǎng)絡(luò)模型[6]。
研究表明,氣溫、濕度、降水量、氣壓、風(fēng)速等氣象因素是大氣污染物擴散的主要影響因子[7],當(dāng)天的污染物濃度還與前5天的歷史濃度有著比較強的非線性關(guān)系[8]。本研究采用氣溫、濕度、降水量、換算后成海平面氣壓的大氣壓強、風(fēng)速和前5天的污染物濃度等10個參數(shù)作為神經(jīng)網(wǎng)絡(luò)的輸入數(shù)據(jù),用X=[x1,x2…x10]表示,輸入層神經(jīng)元個數(shù)為10。根據(jù)萬能逼近定理[9],存在一個可以以任意精度逼近任意連續(xù)函數(shù)的高斯型模糊邏輯系統(tǒng),所以對于3層BP神經(jīng)網(wǎng)絡(luò)來說,只要隱藏層的神經(jīng)元個數(shù)足夠多,是能夠做出高精度預(yù)測的。設(shè)隱藏層輸出向量為 Y=[y1,y2…yn],神經(jīng)元個數(shù)為n,隱藏層輸入函數(shù)為f1,輸出層為監(jiān)測點位的污染物濃度值,神經(jīng)元個數(shù)為1,輸出函數(shù)為f2,輸出值設(shè)為a,ω為各層神經(jīng)元之間的連接權(quán)重系數(shù),θ為各神經(jīng)元的閾值。隱藏層的輸出為式中:k為輸出層神經(jīng)元的下標(biāo),本文中k=1。
用MATLAB中的newff函數(shù)創(chuàng)建一個反射傳播算法的BP神經(jīng)網(wǎng)絡(luò),隱藏層神經(jīng)元個數(shù)的確定根據(jù)經(jīng)驗公式[10],取3 ~14。
圖2 BP神經(jīng)網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu)示意圖
數(shù)據(jù)歸一化是為了避免因離散值存在而造成的數(shù)據(jù)模型不收斂的情況[11],采用 MATLAB軟件中的premnmx函數(shù)進行數(shù)據(jù)歸一化處理,模型輸出值用postmnmx函數(shù)進行反歸一化,以得到相應(yīng)量綱的數(shù)據(jù)。
采用研究城市最近200天的10個影響參數(shù)和對應(yīng)該日污染物濃度值(來源于當(dāng)?shù)丨h(huán)境保護局空氣質(zhì)量發(fā)布系統(tǒng))作為輸入矩陣對BP神經(jīng)網(wǎng)絡(luò)進行訓(xùn)練,訓(xùn)練函數(shù)采用traingdm函數(shù),訓(xùn)練完成即可進行預(yù)測仿真。
AGNES(Agglomerative Nesting)是凝聚的層次聚類算法[12],首先找出對象間歐式距離最小的兩個簇,合并為一個新的簇,然后將其包含在下一次的聚類對象中,繼續(xù)尋找合并,直到所有的簇都合并成為一個最大的簇,建立層次聚類表,按照條件選出最佳聚類方案。將歸一化之后的訓(xùn)練輸入數(shù)據(jù)進行AGNES算法聚類,然后找出每一類中偏差最大的一組數(shù)據(jù)(某一天的10個參數(shù))剔除,這樣做有助于減少個別離散值對BP神經(jīng)網(wǎng)絡(luò)帶來的影響,對提高網(wǎng)絡(luò)的精確性有幫助。
GIS的空間插值分析主要是從有限個點的觀測數(shù)據(jù)中找到一組函數(shù)關(guān)系,并根據(jù)這組函數(shù)關(guān)系推求出更多點的值或是整個區(qū)域值的分布,表1列出了ArcGIS中5種插值方法的比較[13-16]。根據(jù)環(huán)保部門發(fā)布的各國控監(jiān)測點位污染物濃度和氣象預(yù)報,結(jié)合BP神經(jīng)網(wǎng)絡(luò)和GIS空間差值法,可以實現(xiàn)污染物的分布預(yù)測。由于自動監(jiān)測技術(shù)有限,各城市檢測點位普遍不多[17],所以采用ArcGIS中的Kriging插值法。
表1 ArcGIS中5種插值方法的比較
采用太原市環(huán)保局AQI發(fā)布系統(tǒng)公布的SO2、PM10日均值濃度(2013年10月28日—2014年5月17日,第N天到第(N+4)天的濃度作為(N+5)天的參數(shù))和中央氣象臺發(fā)布的太原市氣象數(shù)據(jù)(2013年11月2日—2014年5月22日,包括平均溫度、平均濕度、降水量、海平面氣壓、平均風(fēng)速)作為研究對象,把這些數(shù)據(jù)按照1∶1分為訓(xùn)練集和驗證集,訓(xùn)練集數(shù)據(jù)經(jīng)過歸一化、AGNES算法聚類和剔除離散值,可以作為BP神經(jīng)網(wǎng)絡(luò)的訓(xùn)練矩陣和目標(biāo)矩陣,設(shè)置最大訓(xùn)練次數(shù)為90 000 次,計算精度 10-2,速率為10-2。
試驗結(jié)果顯示,預(yù)測SO2、PM10濃度的BP神經(jīng)網(wǎng)絡(luò)訓(xùn)練效果均較好(圖3)。
圖3 預(yù)測SO2、PM10的BP神經(jīng)網(wǎng)絡(luò)訓(xùn)練效果
將這兩種污染物的驗證集輸入訓(xùn)練好的神經(jīng)網(wǎng)絡(luò)進行仿真預(yù)測,把預(yù)測結(jié)果(反歸一化前)和實際污染物濃度(歸一化后)做相關(guān)性分析,如圖4、圖5所示。結(jié)果表明,預(yù)測結(jié)果與實際濃度顯著相關(guān)。
圖4 SO2預(yù)測濃度與實際濃度的相關(guān)性
圖5 PM10預(yù)測濃度與實際濃度的相關(guān)性
運用上述BP神經(jīng)網(wǎng)絡(luò),預(yù)測2014年5月27日太原南寨、澗河、尖草坪、桃園、塢城、小店、金勝、晉源8個監(jiān)測點位SO2和PM10的濃度值。使用ArcGIS的坐標(biāo)轉(zhuǎn)換功能,將上述8個點位導(dǎo)入圖層(北京54坐標(biāo)系),創(chuàng)建點文件,以污染物濃度預(yù)測值作為Z值字段,對文件進行正態(tài)分布分析、協(xié)方差分析、空間相關(guān)性分析,導(dǎo)出Kriging插值分析圖,把太原市區(qū)行政圖的柵格文件導(dǎo)入作為對照。
兩種污染物濃度趨勢大體都為從南向北增大,這主要是由于該區(qū)域內(nèi)國控大氣污染企業(yè)的分布大體呈現(xiàn)北密南疏的趨勢,污染物濃度最高的區(qū)域為市中心,生活污染源和交通線源污染對其濃度的貢獻不容忽視,加之太原西、北、東三面環(huán)山的地形特點,使得太原地區(qū)的空氣常處于沉積、滯留狀態(tài)[18],污染物的分布如圖6、圖7所示。
圖6 SO2濃度分布預(yù)測圖(μg/m3)
圖7 PM10濃度分布預(yù)測圖(μg/m3)
為了進一步評價污染物分布情況,筆者在該圖上標(biāo)注出區(qū)域內(nèi)所有國控大氣污染重點企業(yè),并對污染物分布和國控企業(yè)分布做了空間相關(guān)性分析。結(jié)果表明,兩種污染物的分布預(yù)測與國控企業(yè)分布顯著相關(guān),Pearson相關(guān)系數(shù)分別為0.969、0.949。
1)基于AGNES算法優(yōu)化的BP神經(jīng)網(wǎng)絡(luò),可以減少個別離散值對BP神經(jīng)網(wǎng)絡(luò)帶來的影響,將輸入數(shù)據(jù)分為訓(xùn)練集和驗證集,能夠較好地反映出BP神經(jīng)網(wǎng)絡(luò)的訓(xùn)練效果;把氣象數(shù)據(jù)和污染物濃度歷史數(shù)據(jù)共同作為影響因子,可以更加真實地反映出污染物濃度的時空變化趨勢,為大氣環(huán)境質(zhì)量預(yù)測和預(yù)警提供有效參考。
2)通過對太原市大氣污染物濃度的預(yù)測可知,試驗所建立的AGNES優(yōu)化BP神經(jīng)網(wǎng)絡(luò)基本上可以預(yù)測出污染物濃度,對SO2和PM10濃度的預(yù)測較為準(zhǔn)確。
3)通過BP神經(jīng)網(wǎng)絡(luò)預(yù)測各監(jiān)測位點的污染物濃度,結(jié)合GIS空間插值分析可以繪制出污染物分布預(yù)測圖,可以對城市大氣污染物的分布作出預(yù)測,為區(qū)域環(huán)境規(guī)劃和管理提供科學(xué)依據(jù)。由于影響大氣污染物擴散的因素還包括大氣穩(wěn)定度、實際地形地貌、建筑物阻擋、建筑施工等,所以該實驗方法只能對分布趨勢做大致預(yù)測,不能體現(xiàn)局部細節(jié)。
[1]2013 中國環(huán)境狀況公報[R].中華人民共和國環(huán)境保護部,2014-5-27.
[2]雷蕾,秦俠,姚小麗.人工神經(jīng)網(wǎng)絡(luò)在環(huán)境科學(xué)中的應(yīng)用[J].環(huán)境研究與監(jiān)測,2007,20(1):50-52,56.
[3]馬太玲,張江山.環(huán)境影響評價[M].武漢:華中科技大學(xué)出版社,2009.08:116-117.
[4]Corw in D L,Wagenet R J.Application of GIS to the modeling of nonpoint source pollutants in the Vadose zone:a conference overview [J]. Journal of Environmental Quality,1996,25:403-411.
[5]BaawainM S,AlSerihi A S.Systematic approach for the prediction of ground-level air pollution(around an Industrial Port)using an Artificial Neural Network[J].Aerosol Air Quality Research,2014,14(1):124-134.
[6]Qimeng W,Ming W.A mathematical expression for air ESD current waveform using BP neural network[J].Journal of Ekectrostatics,2013,71(2):125-129.
[7]閆妍,張云鵬,李鎧月,等.基于BP神經(jīng)網(wǎng)絡(luò)的西安環(huán)境空氣質(zhì)量的預(yù)測[J].電子設(shè)計工程,2013,21(21):54-57.
[8]歐陽鈞,王愛枝.基于Matlab的BP神經(jīng)網(wǎng)絡(luò)在大氣污染物濃度預(yù)測中的應(yīng)用[J].環(huán)境科學(xué)與管理,2009,34(11):176-180.
[9]李士勇,李妍.智能優(yōu)化算法原理與應(yīng)用[M].哈爾濱:哈爾濱工業(yè)大學(xué)出版社,2012:13-17.
[10]徐明德,閻正坤,朱秋麗,等.基于BP神經(jīng)網(wǎng)絡(luò)-隸屬度的河流黑臭評價研究[J].?dāng)?shù)學(xué)的實踐與認(rèn)識,2012,42(17):55-61.
[11]Iliadis L,Jayne C.Engineering applications of neural networks[M].London:Springer,2011:20-24.
[12]許國根.模式識別與智能計算的 MATLAB實現(xiàn)[M].北京:北京航空航天大學(xué)出版社,2012:24-25.
[13]BhattaC S,Mitra,P,Ghosh SK.Spatial interpolation to predict missing attributes in GIS using semantic kriging[J].Ieee Transactions on Geoscience And Remote Sensing,2014,52(8):4771-4780.
[14]GulerM,Kara T.A comparison of different interpolation techniques used in mapping monthly precipitation in northern turkey[J].Fresenius Environmental Bulletin,2014,23(2):341-347.
[15]El-Hoz M,Mohsen A,Iaaly A.Assessing groundwater quality in a coastal area using the GIS technique[J].Desalination and Water Treatment,2014,52(10):1 980-1 989.
[16]Richard L,Glenn G.An interpolation approach for fitting computationally intensive models[J].Cognitive Systems Research,2014,29-30:53-65.
[17]國家環(huán)境監(jiān)測“十二五”規(guī)劃[R].北京:中華人民共和國環(huán)保部,2011.
[18]李艷紅,周晉紅,張春梅.太原市大氣污染形成原因初探[J].山西煤炭科技,2006,11:31-32,43.