董紅召,廖世凱,楊 強(qiáng),應(yīng) 方 (.浙江工業(yè)大學(xué),智能交通系統(tǒng)研究所,浙江 杭州 004;.杭州環(huán)研科技有限公司,浙江 杭州 ;.浙江省杭州生態(tài)環(huán)境監(jiān)測(cè)中心,浙江 杭州 0004)
研究表明,工業(yè)生產(chǎn)和廢氣排放與區(qū)域PM2.5濃度高度正相關(guān)[1].從大氣環(huán)境容量(AEC)的角度看,大氣污染程度取決于污染物排放量與大氣環(huán)境容量間的平衡,在無源的情景下,大氣中污染物濃度衰減的快慢取決于大氣自凈能力的大小[2-4].通過大氣自凈能力可得到大氣污染物排放量與污染物濃度間的影響規(guī)律,繼而在大氣自凈能力不變時(shí),由污染物濃度反演得到理想排放限值,實(shí)現(xiàn)對(duì)工業(yè)園區(qū)排放量的精準(zhǔn)管控.
目前 PM2.5濃度預(yù)測(cè)模型主要包括機(jī)理模型和統(tǒng)計(jì)學(xué)模型[5].機(jī)理模型通過物理化學(xué)原理對(duì)大氣污染物的理化反應(yīng)進(jìn)行模擬分析,需要有各類氣象數(shù)據(jù)和污染源排放清單.主要包括通用多尺度空氣質(zhì)量模型[6](CAMQ模式)、氣象-化學(xué)耦合模型[7](WRF-Chem模式)和嵌套空氣質(zhì)量預(yù)報(bào)模式系統(tǒng)[8](NAQPMS模式)等.在缺少各類氣象數(shù)據(jù)和污染源排放清單時(shí),機(jī)理模型難以精準(zhǔn)預(yù)測(cè) PM2.5濃度.統(tǒng)計(jì)學(xué)模型則利用機(jī)器學(xué)習(xí)、深度學(xué)習(xí)和統(tǒng)計(jì)學(xué)分析其歷史監(jiān)測(cè)數(shù)據(jù)發(fā)現(xiàn)變化規(guī)律并給出合理預(yù)測(cè).模型預(yù)測(cè)精度高,在缺少探空氣象數(shù)據(jù)和污染源排放清單時(shí)也能保證較好的預(yù)測(cè)效果.目前統(tǒng)計(jì)模型主要有:支持向量回歸模型[9-11]、隨機(jī)森林[12-14]、BP神經(jīng)網(wǎng)絡(luò)[15]以及 LSTM[16-19]、BILSTM[20-21]神經(jīng)網(wǎng)絡(luò)等單機(jī)器學(xué)習(xí)模型.為進(jìn)一步提高預(yù)測(cè)精度,多機(jī)器學(xué)習(xí)模型應(yīng)運(yùn)而生.Liu等[22]構(gòu)建了DBN、LSTM和多層神經(jīng)網(wǎng)絡(luò)(MLP)的組合模型.康俊鋒等[23]建立XGBoost、LSTM組合模型進(jìn)行PM2.5濃度短期預(yù)測(cè).梁澤等[24]耦合遺傳算法和RBF神經(jīng)網(wǎng)絡(luò)構(gòu)建PM2.5預(yù)測(cè)模型,具有依賴變量少、預(yù)測(cè)精度高和運(yùn)算效率高等特征.AEC源于機(jī)理模型,其變化反映出污染物在大氣中的物理化學(xué)反應(yīng),但現(xiàn)有研究未實(shí)現(xiàn)機(jī)理模型和非機(jī)理模型的有機(jī)結(jié)合,未考慮 AEC變化對(duì)污染物濃度的影響,且往往籠統(tǒng)的將所有站點(diǎn)看作獨(dú)立個(gè)體,未考慮大氣污染物濃度的時(shí)空特征,即站點(diǎn)的空間相關(guān)性和污染物濃度變化的周期性[25-26].
本研究提出一種集成 AEC和時(shí)空特征的工業(yè)園區(qū)PM2.5預(yù)測(cè)模型,將工業(yè)園區(qū)氣象數(shù)據(jù)、空氣污染物數(shù)據(jù)、PM2.5歷史濃度數(shù)據(jù)及排放數(shù)據(jù)結(jié)合,在大氣自凈能力-排放源-PM2.5濃度的大氣環(huán)境容量理念下,構(gòu)建 CNN-BILSTM 網(wǎng)絡(luò)來捕捉工業(yè)園PM2.5濃度的變化規(guī)律,對(duì)未來24h平均PM2.5濃度進(jìn)行預(yù)測(cè),為工業(yè)園區(qū)大氣重污染預(yù)警和企業(yè)排放控制提供理論支持.
濮陽(yáng)市工業(yè)園區(qū)坐落于河南省濮陽(yáng)市,濮陽(yáng)市為石油化工型城市,污染物排放量較大,重污染天氣頻發(fā),化工、新能源新材料和裝備制造為其三大主導(dǎo)產(chǎn)業(yè).濮陽(yáng)市工業(yè)園區(qū)二、三類工業(yè)企業(yè)數(shù)量較多,對(duì)城區(qū)環(huán)境質(zhì)量影響較大[27].工業(yè)園區(qū)企業(yè)粉塵、廢氣無組織排放的監(jiān)管督辦力度自2018年起逐步加大,違者停業(yè)整頓.但污染排放量基數(shù)龐大,空氣質(zhì)量狀況不容樂觀[28-29].根據(jù)濮陽(yáng)市工業(yè)園區(qū)2018年大氣源清單,各類源 PM2.5主要前體物排放量如表1所示.
表1 工業(yè)園區(qū)2018年P(guān)M2.5主要前體物排放量統(tǒng)計(jì)(t)Table 1 Emission statistics of main precursor of PM2.5 in industrial parks in 2018 (t)
由表1可知,工業(yè)園區(qū)污染排放主要來自工業(yè)源, PM2.5主要前體物,如煙塵、二氧化碳、氮氧化物的排放量均為最高,平均占比達(dá)到 90%.工業(yè)源排放主要來自于各化工或其它制造企業(yè)的生產(chǎn)活動(dòng),相比于移動(dòng)源、揚(yáng)塵源等,可控性更強(qiáng),將其作為輸入變量構(gòu)建模型更利于實(shí)現(xiàn)工業(yè)園區(qū)排放管控.
使用的大氣污染物濃度數(shù)據(jù)為2018年1月1日~2020年12月31日濮陽(yáng)市工業(yè)園區(qū)和周圍共計(jì)12個(gè)空氣自動(dòng)監(jiān)測(cè)站點(diǎn)(圖1)逐小時(shí)監(jiān)測(cè)數(shù)據(jù),包括 PM2.5、PM10、CO、SO2及 O3質(zhì)量濃度.其中氣象數(shù)據(jù)來源于濮陽(yáng)市地面氣象站,主要包括氣溫、相對(duì)濕度、氣壓、降水、風(fēng)速風(fēng)向及露點(diǎn)溫度等.排放數(shù)據(jù)來源于河南省重點(diǎn)污染源自動(dòng)監(jiān)控系統(tǒng),監(jiān)測(cè)排口主要為園區(qū)內(nèi)大型石油化工、火力發(fā)電企業(yè)等重點(diǎn)污染源的窯爐排放口、煙囪排放口和脫硫出口等,主要排放物包括二氧化硫、氮氧化物及煙塵等.
圖1 空氣自動(dòng)監(jiān)測(cè)站點(diǎn)位置分布Fig.1 Position of air automatic monitoring points
1.2.1 大氣自凈能力指數(shù)及其計(jì)算方法 大氣自凈指數(shù)用來表征大氣自身運(yùn)動(dòng)中對(duì)大氣中污染物的擴(kuò)散、稀釋和清除能力.根據(jù)平均濃度預(yù)報(bào)方程和箱模型,采用平均體積法可推導(dǎo)出單位時(shí)間、單位面積上大氣平流擴(kuò)散和降水所能清除的最大污染物總量大氣自凈能力指數(shù)ASI[3],即
式中:Q為大氣污染物在一定空氣體積內(nèi)的排放量,kg;S為底面積,km2;VE為大氣通風(fēng)量,m2/s;Wt為雨洗常數(shù),無量綱;R為單位時(shí)間內(nèi)的降水量,mm/h; CS為污染物達(dá)標(biāo)濃度,m g/m3.
大氣自凈能力指數(shù)越大,代表大氣對(duì)污染物的清除能力越強(qiáng),反之,代表其越弱.
1.2.2 CNN-BILSTM 預(yù)測(cè)模型 氣象、大氣污染物濃度和污染源強(qiáng)之間的變化呈高度復(fù)雜性、非線性,采用傳統(tǒng)模擬方法難以快速準(zhǔn)確的達(dá)到模擬效果.因此采用融合歷史氣象、排放和空氣質(zhì)量數(shù)據(jù)的深度學(xué)習(xí)模型來擬合三者變化規(guī)律.大氣污染物濃度的影響因子變化復(fù)雜且數(shù)量繁多,包括氣象因子、排放因子和及其他大氣污染物,故利用卷積神經(jīng)網(wǎng)絡(luò)(CNN)進(jìn)行關(guān)鍵特征提取,減少冗余信息;污染物濃度變化具有強(qiáng)自相關(guān)性和周期性,污染物濃度變化不僅受過去的信息特征影響,而且與未來的特征變化亦息息相關(guān).而雙向長(zhǎng)短期記憶網(wǎng)絡(luò)(BILSTM)兼顧雙向時(shí)間序列中所有值的關(guān)鍵歷史長(zhǎng)期和短期依賴關(guān)系.因此采用CNN-BILSTM組合模型擬合工業(yè)園區(qū)內(nèi)PM2.5濃度變化規(guī)律.
如圖2所示,數(shù)據(jù)建模包括時(shí)間序列建模和歸一化處理,時(shí)間序列建模將原始數(shù)據(jù)劃分為不同時(shí)間步樣例,與PM2.5濃度相關(guān)的氣象、排放和其他大氣污染物濃度數(shù)據(jù)作為特征集,數(shù)據(jù)歸一化采用Min-Max標(biāo)準(zhǔn)化方法.CNN包括卷積層、池化層和全連接層;BILSTM包括前向LSTM層和后向LSTM層.模型輸入為氣象、排放和大氣污染物濃度時(shí)序數(shù)據(jù),輸出為未來1hPM2.5濃度.預(yù)測(cè)建模包括CNN卷積層將時(shí)序數(shù)據(jù)映射為n×s矩陣,其中,n代表時(shí)序數(shù)據(jù)樣例數(shù),s代表數(shù)據(jù)維度,經(jīng)過濾波器處理后進(jìn)入池化層,提取局部特征,減少冗余信息,將提取后的多組特征向量輸入BILSTM層、Dropout層和全連接層中,得到未來 PM2.5濃度輸出結(jié)果.此外,為了增強(qiáng) CNN-BILSTM 網(wǎng)絡(luò)模型的泛化性和魯棒性,選擇Adam作為優(yōu)化算法.
圖2 CNN-BILSTM框架Fig.2 The framework of CNN-BILSTM
1.2.3 組合預(yù)測(cè)模型流程 預(yù)測(cè)模型構(gòu)建流程如圖3所示,包括預(yù)處理、模型構(gòu)建和模型預(yù)測(cè).
圖3 CNN-BILSTM模型預(yù)測(cè)流程Fig.3 CNN-BILSTM model prediction process
(1)預(yù)處理:預(yù)處理包括數(shù)據(jù)預(yù)處理、特征獲取和構(gòu)建訓(xùn)練集.數(shù)據(jù)預(yù)處理主要包括對(duì)氣象數(shù)據(jù)、大氣污染物數(shù)據(jù)和排放數(shù)據(jù)進(jìn)行異常值處理、缺失值填補(bǔ)和歸一化處理,異常值處理方法為3σ準(zhǔn)則,缺失值填補(bǔ)采用均值填充和 MICE算法,歸一化處理采用Min-Max標(biāo)準(zhǔn)化方法;特征獲取包括通過有限體積法得到大氣自凈能力指數(shù),結(jié)合排放數(shù)據(jù)組成大氣自凈能力-排放變化特征,通過小波分析得到PM2.5濃度變化的主周期,作為時(shí)間特征,相關(guān)性分析得到其濃度變化相似的站點(diǎn)數(shù)據(jù)和輔助氣象及大氣污染物,作為空間特征和輔助特征;最后利用獲取的特征構(gòu)建訓(xùn)練集.
(2)模型構(gòu)建:秋冬季重污染天氣頻發(fā),為了保證模型污染預(yù)警能力,測(cè)試集選擇在秋冬季,數(shù)據(jù)集按照訓(xùn)練集、驗(yàn)證集和測(cè)試集為6:2:2的比例劃分,劃分方法為留出法,算法優(yōu)化器為Adam,以實(shí)測(cè)值和預(yù)測(cè)值的相關(guān)系數(shù)作為標(biāo)準(zhǔn)對(duì)結(jié)果進(jìn)行評(píng)估,最終獲取模型的最佳參數(shù),保存最優(yōu)模型.
(3)模型預(yù)測(cè):將測(cè)試集數(shù)據(jù)輸入模型中,對(duì)預(yù)測(cè)值和實(shí)測(cè)值進(jìn)行數(shù)學(xué)分析,統(tǒng)計(jì)其對(duì)應(yīng)污染等級(jí)情況并分析預(yù)測(cè)結(jié)果.
1.2.4 評(píng)價(jià)指標(biāo) 組合預(yù)測(cè)模型精度通過均方根誤差(RMSE)、平均絕對(duì)誤差(MAE)、相關(guān)系數(shù)(R2)來對(duì)預(yù)測(cè)結(jié)果進(jìn)行評(píng)價(jià).
2.1.1 AEC特征 如表2所示, ASI與PM2.5濃度呈負(fù)相關(guān),當(dāng)大氣自凈能力增強(qiáng)時(shí),大氣擴(kuò)散清除能力增強(qiáng), PM2.5濃度呈下降趨勢(shì); 3種主要污染排放與PM2.5呈顯著正相關(guān), 表明當(dāng)園區(qū)內(nèi)排放量增加會(huì)導(dǎo)致PM2.5濃度上升.由圖4可知,污染物排放量與 PM2.5濃度之間呈明顯的正比關(guān)系,當(dāng)污染物排放量增大時(shí),PM2.5濃度呈上升趨勢(shì);當(dāng)排放量在一定范圍內(nèi)時(shí),隨著污染物濃度增大,ASI呈減小趨勢(shì);即當(dāng) PM2.5濃度呈上升趨勢(shì)時(shí),排放量呈增大趨勢(shì),而 ASI逐漸減小.此外,大氣自凈能力與排放都呈現(xiàn)明顯的季節(jié)變化,濮陽(yáng)市工業(yè)園區(qū)屬于暖溫帶半濕潤(rùn)季風(fēng)型大陸性氣候,不同季節(jié)氣候差異明顯,園區(qū)企業(yè)不同季節(jié)生產(chǎn)計(jì)劃不同,污染排放量也不盡相同.
圖4 PM2.5、ASI和排放量的日均數(shù)據(jù)分布Fig.4 Daily data distribution of PM2.5, ASI and emissions
表2 PM2.5日均濃度與ASI和排放量相關(guān)性統(tǒng)計(jì)Table 2 Correlation statistics of PM2.5 daily average concentration with ASI and emissions
季節(jié)劃分:3~5月為春季,6~8月為夏季,9~11月為秋季,12月和次年的1、2月為冬季[30].如圖5所示,隨著春夏秋冬時(shí)間線的推進(jìn),PM2.5濃度逐漸上升,污染物排放量逐漸增大.將ASI、大氣污染物排放和季節(jié)作為AEC特征輸入模型.
圖5 PM2.5和大氣污染物排放的季節(jié)變化Fig.5 Seasonal variations in PM2.5 and air pollutant emissions
2.1.2 時(shí)間特征 如圖6所示,2018~2020年濮陽(yáng)市工業(yè)園區(qū) PM2.5日均濃度時(shí)間序列呈現(xiàn)明顯的周期性特征.對(duì) PM2.5時(shí)間序列進(jìn)行小波分析,繪制小波方差圖(圖7),小波方差圖中波峰對(duì)應(yīng)的尺度為PM2.5的主周期,由圖7可知,在70d以內(nèi),PM2.5時(shí)間序列存在 2個(gè)振蕩周期,分別為10~20d和 30~50d,第 1主周期為37d,第 2主周期為14d.結(jié)合圖8可知,PM2.5時(shí)間序列具有較強(qiáng)的自相關(guān)性,但是在滯后天數(shù)大于 52d時(shí),相關(guān)系數(shù)低于 0.2,在滯后天數(shù)為14d時(shí)相關(guān)性最高, 因此選擇日前14d的PM2.5濃度作為時(shí)間特征輸入模型.
圖6 2018~2020年工業(yè)園區(qū)PM2.5日均濃度時(shí)間序列Fig.6 Time series of PM2.5 daily average concentration in industrial parks from 2018 to 2020
圖7 PM2.5時(shí)間序列小波方差Fig.7 Wavelet variance diagram of PM2.5 time series
圖8 PM2.5時(shí)間序列時(shí)間滯后自相關(guān)系數(shù)Fig.8 Lagging self-correlation coefficient of PM2.5 time series
2.1.3 空間特征 空間特征分析主要是工業(yè)園區(qū)內(nèi)監(jiān)測(cè)站點(diǎn)與周圍監(jiān)測(cè)站點(diǎn)PM2.5濃度序列的相關(guān)性分析.由于工業(yè)園區(qū)緊鄰的華龍區(qū)內(nèi)有其小工業(yè)園,區(qū)域污染可能有其他貢獻(xiàn)源,故華龍區(qū)3個(gè)站點(diǎn)數(shù)據(jù)均用于分析;工業(yè)園區(qū)北面、南面及東面的清豐縣、范縣及濮陽(yáng)縣均有 3個(gè)空氣質(zhì)量監(jiān)測(cè)站點(diǎn),由于監(jiān)測(cè)站點(diǎn)位置集中及與工業(yè)園區(qū)站點(diǎn)較遠(yuǎn),因此取各縣區(qū)域內(nèi) 3個(gè)站點(diǎn)的平均值用于分析.如表3所示,華龍區(qū)的3個(gè)站點(diǎn)PM2.5濃度變化與工業(yè)園區(qū) PM2.5濃度變化有極強(qiáng)的相關(guān)性,經(jīng)過實(shí)驗(yàn)分析,相關(guān)性過高會(huì)產(chǎn)生冗余,導(dǎo)致精度降低[24].故只將清豐縣、范縣和濮陽(yáng)縣3個(gè)縣區(qū)的站點(diǎn)平均值作為空間特征輸入.
表3 工業(yè)園區(qū)站點(diǎn)與相鄰站點(diǎn)PM2.5濃度相關(guān)性統(tǒng)計(jì)Table 3 Correlation statistics of PM2.5 concentration between industrial park sites and adjacent sites
2.1.4 輔助特征 PM2.5濃度變化的輔助因素包括氣象因素和其他大氣污染物濃度.如表4所示,PM2.5與降水、相對(duì)濕度和風(fēng)向相關(guān)性不高,濮陽(yáng)市位于中緯地帶,常年受東南季風(fēng)環(huán)流的控制和影響,屬暖溫帶半濕潤(rùn)季風(fēng)型大陸性氣候.年平均日照時(shí)數(shù)2300~2500h,是河南省日照高值區(qū).由于氣溫變化大,降水時(shí)空分布不均,氣象災(zāi)害頻繁,干旱占突出地位[31];年平均風(fēng)速 2.7m/s,常年主導(dǎo)風(fēng)向是南風(fēng)、東南風(fēng),因此降水、相對(duì)濕度和風(fēng)向的變化與 PM2.5相關(guān)性不高.PM2.5與PM10、NO2和CO相關(guān)性很強(qiáng),與SO2的相關(guān)性較低,這與前人的研究結(jié)果相同[32-33].PM2.5與O3呈負(fù)相關(guān),這是因?yàn)楦邼舛鹊腜M2.5和 PM10會(huì)導(dǎo)致氣溶膠光學(xué)厚度增大而降低光化學(xué)速率,從而減少O3生成[26].
表4 PM2.5濃度與氣象因素和輔助大氣污染物相關(guān)性統(tǒng)計(jì)Table 4 Correlation statistics of PM2.5 concentration with meteorological factors and air pollutants
綜上所述,將氣溫、氣壓、風(fēng)速和露點(diǎn)溫度4個(gè)氣象因素及PM10、NO2、CO和O34個(gè)污染物變量作為輔助特征輸入.
2.2.1 PM2.5預(yù)測(cè)結(jié)果 為了實(shí)現(xiàn)大氣污染預(yù)警且保證工業(yè)園區(qū)管控策略有效實(shí)施,選擇未來1d PM2.5的日均濃度作為預(yù)測(cè)變量.考慮到計(jì)算時(shí)長(zhǎng)及BILSTM 的雙向搜索,設(shè)置當(dāng)前模型輸入步長(zhǎng)為1,BILSTM 中前向和后向 LSTM 隱層狀態(tài)的維度l=l'=32,64,128,測(cè)試訓(xùn)練后的編碼器-解碼器結(jié)構(gòu),結(jié)果如表5所示.當(dāng) BILSTM 隱層狀態(tài)維度最大為128時(shí),預(yù)測(cè)精度最高.隨著維度增加,結(jié)構(gòu)參數(shù)和訓(xùn)練難度均在增加,不過,當(dāng)維度從32升高到64時(shí),精度略有下降,因此,簡(jiǎn)單提升網(wǎng)絡(luò)規(guī)模不能夠顯著增加預(yù)測(cè)準(zhǔn)確度.
表5 不同隱層狀態(tài)維度的預(yù)測(cè)結(jié)果評(píng)價(jià)Table 5 Prediction results evaluation of different hidden layer state dimensions
CNN模型和LSTM模型在短時(shí)序列預(yù)測(cè)中表現(xiàn)優(yōu)異[34-37],為檢驗(yàn)集成 AEC和時(shí)空特征的CNN-BILSTM預(yù)測(cè)模型能否提高PM2.5濃度預(yù)測(cè)精度,分別建立 CNN傳統(tǒng)模型、LSTM 傳統(tǒng)模型、CNN-BILSTM 傳統(tǒng)模型、含時(shí)空特征的 CNNBILSTM 預(yù)測(cè)模型、集成 AEC特征的 CNNBILSTM 預(yù)測(cè)模型、集成 AEC和時(shí)空特征的CNN-BILSTM預(yù)測(cè)模型進(jìn)行對(duì)比驗(yàn)證.如圖9所示,其中CNN模型、LSTM模型和集成AEC和時(shí)空特征的CNN-BILSTM預(yù)測(cè)模型作縱向?qū)Ρ?用于驗(yàn)證組合模型優(yōu)越性;CNN-BILSTM傳統(tǒng)模型、僅含時(shí)空特征或AEC特征的CNN-BILSTM預(yù)測(cè)模型及集成AEC和時(shí)空特征的CNN-BILSTM預(yù)測(cè)模型作橫向?qū)Ρ?驗(yàn)證AEC和時(shí)空特征對(duì)模型的精度增益.
圖9 預(yù)測(cè)和實(shí)測(cè)結(jié)果對(duì)比Fig.9 Comparison of predicted and true values
由圖9可見,CNN和LSTM模型在濃度預(yù)測(cè)精度上遜色于 CNN-BILSTM 模型; 在加入時(shí)空特征后,預(yù)測(cè)值的波動(dòng)減小,加入 AEC和時(shí)空特征后,濃度預(yù)測(cè)精度在高值區(qū)和低值區(qū)表現(xiàn)均優(yōu)異,集成AEC特征的CNN-BILSTM模型表現(xiàn)較好,集成AEC特征而未集成時(shí)空特征的CNN-BILSTM模型發(fā)生預(yù)測(cè)值大于實(shí)測(cè)值的情況較多,而集成時(shí)空特征未集成AEC特征的 CNN-BILSTM 模型捕捉濃度高值的能力較差,集成AEC和時(shí)空特征的CNN- BILSTM模型既能在實(shí)測(cè)濃度范圍內(nèi)預(yù)測(cè),又可以捕捉污染突變,綜合表現(xiàn)最好.同時(shí),實(shí)驗(yàn)表明增加了工業(yè)源排放數(shù)據(jù)的深度學(xué)習(xí)模型預(yù)測(cè) PM2.5濃度的精度大幅提升,顯然,只有深度學(xué)習(xí)的數(shù)據(jù)集完備且準(zhǔn)確的情況下,預(yù)測(cè)精度才能明顯提升,這也側(cè)面印證了研究的園區(qū)內(nèi)工業(yè)源是造成PM2.5污染峰值的主要來源.
如圖10所示,集成 AEC和時(shí)空特征的 CNNBILSTM 模型擬合效果最好,各項(xiàng)評(píng)價(jià)指標(biāo)最優(yōu).從擬合線和輔助線的偏離情況來看,集成AEC和時(shí)空特征的CNN-BILSTM模型在高值區(qū)的擬合效果最好,其 RMSE值為12.912,相比傳統(tǒng)的 LSTM 模型,精度提高10%.證明集成AEC和時(shí)空特征的CNNBILSTM模型有更高的預(yù)測(cè)精度.
圖10 不同模型預(yù)測(cè)性能對(duì)比Fig.10 Comparison of prediction performance of different models
2.2.2 PM2.5污染等級(jí)預(yù)測(cè)結(jié)果 根據(jù)國(guó)家環(huán)境保護(hù)標(biāo)準(zhǔn)空氣質(zhì)量指數(shù)技術(shù)規(guī)定[38],分別對(duì)PM2.5濃度的真實(shí)值和預(yù)測(cè)值進(jìn)行污染程度劃分,統(tǒng)計(jì)污染天數(shù)和中度污染(4級(jí))以上的預(yù)測(cè)準(zhǔn)確率,為了量化估計(jì)模型的不確定性,利用置信區(qū)間來獲得模型的污染等級(jí)分類的真實(shí)誤差,置信半徑的計(jì)算公式如下所示:
式中,Rint是置信空間半徑;vacc是分類準(zhǔn)確率;n是樣本大小;z是高斯分布臨界值,當(dāng)顯著性水平為95%時(shí)取值z(mì)=1.96.
如表6所示,CNN-BILSTM模型對(duì)PM2.5的濃度高值捕捉能力明顯提升,在污染天數(shù)和重度污染及嚴(yán)重污染的預(yù)測(cè)準(zhǔn)確率均為最高,分別為93%和83%.根據(jù)其置信區(qū)間可知其真實(shí)誤差為±3.4%和±0.3%.其中集成 AEC和時(shí)空特征后的 CNNBILSTM預(yù)測(cè)模型比傳統(tǒng)模型在預(yù)測(cè)污染天數(shù)上的準(zhǔn)確率平均提高 13.5%;集成 AEC和時(shí)空特征的CNN-BILSTM 模型比傳統(tǒng)模型在重度污染和嚴(yán)重污染以上的預(yù)測(cè)準(zhǔn)確率平均提升50%.
表6 不同模型污染預(yù)測(cè)準(zhǔn)確率對(duì)比Table 6 Comparison of pollution prediction accuracy of different models
2.2.3 不同季節(jié)預(yù)測(cè) 由圖11可知,模型在秋季和冬季的預(yù)測(cè)結(jié)果較好,其中冬季的預(yù)測(cè)精度最高,RMSE、MAE和R2各指標(biāo)值分別為13.846、11.482和 0.889;而在春夏季的預(yù)測(cè)結(jié)果較差,其中夏季的預(yù)測(cè)結(jié)果最差,各指標(biāo)值為12.569、10.033、0.253.結(jié)合濮陽(yáng)市氣候特點(diǎn)即工業(yè)園區(qū)排放特點(diǎn),造成夏季預(yù)測(cè)結(jié)果較差原因是由于夏季雨量充沛,大氣擴(kuò)散清除能力好;而在秋冬季預(yù)測(cè)精度高是由于大氣擴(kuò)散條件差,園區(qū)排放量大,PM2.5濃度與影響因子的相關(guān)性更好.
圖11 組合模型不同季節(jié)預(yù)測(cè)結(jié)果Fig.11 Combination model forecast results in different seasons
3.1 工業(yè)園區(qū)日均PM2.5濃度存在顯著的周期性變化且時(shí)間變化主周期為14d;空間上PM2.5日均濃度變化存在差異性,相鄰站點(diǎn)的PM2.5日均濃度變化具有高度相似性.
3.2 CNN-BILSTM組合模型具有更高的預(yù)測(cè)精度和穩(wěn)定性.與CNN和LSTM模型相比, 在污染天數(shù)上的預(yù)測(cè)準(zhǔn)確率平均提高 13.5%,在重度污染和嚴(yán)重污染天數(shù)的預(yù)測(cè)準(zhǔn)確率平均提升 50%.可用于工業(yè)園區(qū)重污染事件預(yù)警預(yù)報(bào).
3.3 AEC特征和時(shí)空特征不僅考慮了氣象、工業(yè)排放和 PM2.5濃度間的理化反應(yīng),又兼顧 PM2.5濃度變化的周期性、自相關(guān)性和空間相關(guān)性,因此集成AEC和時(shí)空特征的工業(yè)園區(qū)PM2.5預(yù)測(cè)模型相對(duì)于未集成 AEC和時(shí)空特征的模型具有更高的預(yù)測(cè)精度,且由于模型建立了工業(yè)排放和PM2.5濃度的映射關(guān)系,既提高了模型對(duì) PM2.5峰值的捕捉能力,亦有助于實(shí)現(xiàn)工業(yè)園企業(yè)污染排放精準(zhǔn)管控.
3.4 由于季節(jié)特征差異,模型在不同季節(jié)的預(yù)測(cè)能力有所差異,秋冬季預(yù)測(cè)結(jié)果較好,而在春夏季預(yù)測(cè)能力較差.