宮同偉,張 洋,劉炳春
1.天津城建大學(xué)建筑學(xué)院,天津 300384
2.天津理工大學(xué)管理學(xué)院,天津 300384
隨著中國經(jīng)濟(jì)的快速發(fā)展,各種大氣污染物的排放量不斷增多,造成經(jīng)濟(jì)發(fā)展與環(huán)境保護(hù)的矛盾加劇,生態(tài)環(huán)境持續(xù)遭受破壞[1]。 京津冀城市群是該類矛盾表現(xiàn)最突出的區(qū)域之一,尤其是工業(yè)排放和機(jī)動(dòng)車尾氣排放帶來的大量氮氧化物(NOx)、二氧化硫(SO2)和煙塵,導(dǎo)致區(qū)域性霧霾頻發(fā),空氣污染嚴(yán)重[2-3]。 二氧化氮(NO2)在常溫狀態(tài)下呈現(xiàn)為具有刺激性氣味的有毒氣體。 除了雷電與土壤排放等自然來源之外,空氣中大量的NO2主要由化石燃料的使用、汽車尾氣排放等人為活動(dòng)產(chǎn)生[4]。 NO2通過呼吸進(jìn)入人體,會(huì)嚴(yán)重影響人體健康,在腐蝕呼吸道的同時(shí),可能引發(fā)遲發(fā)性肺水腫等疾病[5]。 因此,對(duì)京津冀地區(qū)NO2日均濃度進(jìn)行精準(zhǔn)預(yù)測(cè),探究其時(shí)空分布變化,對(duì)于NO2污染的預(yù)警與防治尤為重要。 通過模型預(yù)測(cè)揭示京津冀城市群NO2時(shí)空變化特點(diǎn),探究其發(fā)展變化的趨勢(shì)和原因,可為京津冀城市群NO2污染防治工作提供科學(xué)參考。
當(dāng)前,大氣污染物濃度預(yù)測(cè)研究主要集中在數(shù)值模式預(yù)測(cè)和統(tǒng)計(jì)模式預(yù)測(cè)兩方面。 數(shù)值模式需基于大氣污染物觀測(cè)實(shí)況、污染源排放情況和氣象資料,利用初始值和邊界值,通過模擬大氣運(yùn)動(dòng)狀態(tài)實(shí)現(xiàn)預(yù)測(cè)[6];傳統(tǒng)統(tǒng)計(jì)模型往往需要大量空氣污染物歷史觀測(cè)數(shù)據(jù),利用回歸分析等擬合方法建立污染物歷史數(shù)據(jù)與被預(yù)測(cè)變量之間的關(guān)系[7]。 李華嬌等[8]開展了利用基于動(dòng)態(tài)模糊綜合評(píng)價(jià)的混合模型,在我國建立空氣質(zhì)量預(yù)測(cè)預(yù)警系統(tǒng)的研究與應(yīng)用[8]。 WANG 等[9]結(jié)合模糊時(shí)間序列預(yù)測(cè)技術(shù)和數(shù)據(jù)后處理方法,對(duì)主要大氣污染物進(jìn)行了預(yù)測(cè)。 機(jī)器學(xué)習(xí)和傳統(tǒng)回歸模型逐漸無法滿足大數(shù)據(jù)預(yù)測(cè)所需的數(shù)據(jù)承載能力,神經(jīng)網(wǎng)絡(luò)算法成為預(yù)測(cè)領(lǐng)域的熱點(diǎn)方法[10]。WANG 等[11]結(jié)合全年污染來源的排放模式,從日??捎脷庀髤?shù)中提取關(guān)鍵信息,建立了基于物理的人工神經(jīng)網(wǎng)絡(luò)(ANN)空氣污染物預(yù)測(cè)工具,可以充分捕捉特定場(chǎng)景下空氣污染物濃度的時(shí)間變化。 然而在污染物濃度非常高的情況下,對(duì)PM2.5和PM10等顆粒物濃度的預(yù)測(cè)能力還存在不足[12]。 劉炳春等[13]采用IG-LASSO 組合預(yù)測(cè)方法對(duì)我國城市空氣質(zhì)量指數(shù)進(jìn)行了預(yù)測(cè),證明通過輸入變量?jī)?yōu)化的組合模型的預(yù)測(cè)精度更高。NIU 等[14]設(shè)計(jì)了一種新的基于模糊聚類算法的模糊時(shí)間序列模型,該模型對(duì)異常值和噪聲數(shù)據(jù)點(diǎn)具有魯棒性。 然而,單一化的神經(jīng)網(wǎng)絡(luò)模型已逐漸不能滿足政府和企業(yè)高精度的預(yù)測(cè)需求,于是研究人員不斷嘗試通過改進(jìn)輸入變量結(jié)構(gòu)來提高模型預(yù)測(cè)性能[15]。 LI 等[16]構(gòu)建了基于數(shù)據(jù)預(yù)處理和分析的混合EMMD-GRNN 模型,提高了輸入變量的數(shù)據(jù)維度,實(shí)現(xiàn)了快速并準(zhǔn)確預(yù)測(cè)未來一天的PM2.5濃度。 輸入變量選擇方面,朱素玲等[17]設(shè)計(jì)了一個(gè)非負(fù)性且高效的化學(xué)解決方案,修改了嵌套空氣質(zhì)量預(yù)測(cè)系統(tǒng)的后序,僅考慮6項(xiàng)大氣常規(guī)污染物之間的影響關(guān)系進(jìn)行數(shù)值預(yù)測(cè)。 以上研究為大氣污染控制提供了重要的技術(shù)支持,促進(jìn)了空氣質(zhì)量預(yù)測(cè)方法的發(fā)展。 目前,對(duì)污染物濃度的預(yù)測(cè)研究大多使用日均濃度數(shù)據(jù)進(jìn)行試驗(yàn)[18],因此,本文選擇京津冀城市群6 項(xiàng)大氣常規(guī)污染物日均濃度數(shù)據(jù),組成NO2濃度預(yù)測(cè)數(shù)據(jù)庫進(jìn)行預(yù)測(cè)。
相對(duì)于空氣質(zhì)量指數(shù)的動(dòng)態(tài)變化,長(zhǎng)短期記憶(LSTM)神經(jīng)網(wǎng)絡(luò)可以有效解決空氣質(zhì)量指數(shù)時(shí)空變化帶來的不利影響。 LSTM 是一種通過學(xué)習(xí)長(zhǎng)跨度時(shí)間序列來解析數(shù)據(jù)特性的深度學(xué)習(xí)方法,可以自動(dòng)確定最優(yōu)時(shí)間滯后,以實(shí)現(xiàn)精準(zhǔn)預(yù)測(cè)[19]。 小波分解(WD)能夠有效、準(zhǔn)確地表達(dá)空氣污染物的濃度信號(hào)信息,從而提高深度學(xué)習(xí)模型對(duì)試驗(yàn)數(shù)據(jù)的學(xué)習(xí)能力。 因此,本文使用通過WD 得到的其他5 項(xiàng)大氣常規(guī)污染物(不包含NO2)日均濃度時(shí)序數(shù)據(jù),作為訓(xùn)練模型的輸入指標(biāo),繼而基于LSTM 構(gòu)建預(yù)測(cè)模型,對(duì)京津冀城市群NO2濃度進(jìn)行預(yù)測(cè)。 本文主要完成以下研究?jī)?nèi)容:①通過使用WD 對(duì)數(shù)據(jù)進(jìn)行升維處理,優(yōu)化輸入變量,提升LSTM 模型的預(yù)測(cè)精度;②開發(fā)針對(duì)京津冀城市群NO2日均濃度的WD 和LSTM 組合神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)模型(W-LSTM);③將傳統(tǒng)神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)模型與W-LSTM 預(yù)測(cè)模型進(jìn)行性能比對(duì),驗(yàn)證組合預(yù)測(cè)模型的預(yù)測(cè)精度和穩(wěn)定性;④基于W-LSTM 的2019—2020 年京津冀城市群NO2濃度預(yù)測(cè)與時(shí)空變化分析。
空氣污染物濃度預(yù)測(cè)不僅需要當(dāng)日數(shù)據(jù),還需要?dú)v史數(shù)據(jù)用來進(jìn)行經(jīng)驗(yàn)學(xué)習(xí)。 由于神經(jīng)網(wǎng)絡(luò)模型的隱藏層存在自反饋機(jī)制,因此,其在處理長(zhǎng)期依賴問題方面具有優(yōu)勢(shì)。 LSTM 作為當(dāng)前流行的遞歸神經(jīng)網(wǎng)絡(luò)算法,促進(jìn)了時(shí)間序列長(zhǎng)期趨勢(shì)特征和短期動(dòng)態(tài)特征的學(xué)習(xí)能力[20]。 不同于傳統(tǒng)的循環(huán)神經(jīng)網(wǎng)絡(luò)模型,LSTM 擁有獨(dú)特的“記憶單元”,通過該結(jié)構(gòu)構(gòu)建的LSTM 網(wǎng)絡(luò)的隱藏層能夠存儲(chǔ)任意時(shí)間長(zhǎng)度的信息,獲得更為精確的時(shí)間序列模型。 LSTM 網(wǎng)絡(luò)的記憶單元結(jié)構(gòu)如圖1所示。 該模塊的主體由輸入門、遺忘門和輸出門,以及1 個(gè)循環(huán)單元構(gòu)成。 LSTM 通過非線性函數(shù)實(shí)現(xiàn)對(duì)各“門”的開關(guān)控制,用以控制和保護(hù)記憶單元狀態(tài),最終控制通過神經(jīng)單元的信息量的增減。
圖1 LSTM 神經(jīng)網(wǎng)絡(luò)示意圖Fig.1 Schematic diagram of the interior of LSTM
假設(shè)在t 時(shí)刻,某記憶單元模塊的輸入為xt,輸出為ht,單元狀態(tài)為ct,那么該記憶單元模塊的“門結(jié)構(gòu)”可以表示為
輸入門:
遺忘門:
輸出門:
各計(jì)算模塊表示為
輸入轉(zhuǎn)換:
單元狀態(tài)更新:
隱藏層輸出:
式中:σ 為Sigmoid 函數(shù);tan h 為雙曲正切函數(shù);it、 ft、ot、c_int分別為輸入門、遺忘門、輸出門、輸入轉(zhuǎn)換對(duì)單元的輸入;Wix、Wfx、Wox、Wcx和Wim、Wfm、Wom、Wcm分別為xt和ht-1對(duì)應(yīng)的輸入門、遺忘門、輸出門、輸入轉(zhuǎn)換的權(quán)重矩陣; bi、bf、bo、bc分別為輸入門、遺忘門、輸出門、輸入轉(zhuǎn)換的偏移向量。
WD 變換通過窗口調(diào)整使數(shù)據(jù)信號(hào)經(jīng)伸縮平移后更便于局部化分析,變換后的信號(hào)包含反映變化趨勢(shì)的低頻信號(hào)和隨機(jī)波動(dòng)的高頻信號(hào)。NO2濃度時(shí)序數(shù)據(jù){y1,y2,…,yn} 的特點(diǎn)是非線性非平穩(wěn),經(jīng)過WD 變換能夠提取NO2濃度時(shí)序數(shù)據(jù)在不同時(shí)頻上的信息特征。 通過WD 變換將污染物濃度數(shù)據(jù)分解為由不同維度數(shù)據(jù)信號(hào)構(gòu)成的序列組。 與原始數(shù)據(jù)相比,這些序列組具有更穩(wěn)定的方差和較少的奇異值點(diǎn),在模型中可以更有效、準(zhǔn)確地表達(dá)原信號(hào)信息。 若WD 變換的尺度函數(shù)為φ(t),母小波函數(shù)為ψ(t), 則
式中:j 為尺度參數(shù),k 為平移參數(shù)。
由此可得
式中: cj0(k) 為近似系數(shù),dj(k) 為細(xì)節(jié)系數(shù)。
NO2濃度數(shù)據(jù)經(jīng)m 步變換得到
式中: Amt為近似信息集合, 表示原始數(shù)據(jù)的信息特征; D1t,…,Dmt為高頻信息集合, 表示細(xì)微信號(hào)波動(dòng),即原信息的噪聲部分。
使用WD 變換和LSTM 網(wǎng)絡(luò)搭建京津冀NO2濃度組合預(yù)測(cè)模型,預(yù)測(cè)試驗(yàn)分為兩個(gè)部分,如圖2 所示。 第一部分將京津冀地區(qū)13 個(gè)城市的6 項(xiàng)大氣常規(guī)污染物日均濃度原始數(shù)據(jù)通過WD變換獲得重組試驗(yàn)數(shù)據(jù)集合,截取80%的原始數(shù)據(jù)(2014 年1 月—2018 年5 月)作為訓(xùn)練數(shù)據(jù)集合,另外20%(2018 年6 月—2019 年6 月)作為測(cè)試數(shù)據(jù)集合。 本階段獲得兩組輸入集合,即NO2日均濃度數(shù)據(jù)通過WD 變換得到的低頻信息集合{a3},以及其他5 項(xiàng)大氣常規(guī)污染物數(shù)據(jù)通過WD 變換得到的多維信息集合{a3,d1,d2,d3}。
第二部分使用LSTM 網(wǎng)絡(luò)搭建多層次深度預(yù)測(cè)模型,學(xué)習(xí)和記憶訓(xùn)練數(shù)據(jù)的數(shù)據(jù)特征及潛在指標(biāo)之間的關(guān)聯(lián)關(guān)系,繼而使用測(cè)試數(shù)據(jù)集對(duì)模型進(jìn)行預(yù)測(cè)性能測(cè)試,通過不斷調(diào)整參數(shù)獲得最優(yōu)預(yù)測(cè)模型。 具體試驗(yàn)過程如下:
第一步,由京津冀城市群6 項(xiàng)大氣常規(guī)污染物日均濃度數(shù)據(jù)形成時(shí)序數(shù)據(jù)集{AP1,AP2,…,APn},通過WD 變換將{AP1,AP2,…,APn}經(jīng)m 層分解可得到高維輸入信息集{X′1,X′2,…,X′t}。
其中,X′i= (Ami-1,Dli-1,…,Dmi-1),i= 1,2,…,t。同理可得到t+1 時(shí)刻的分解結(jié)果,即:X′t+1=(Amt,D1t,…,Dmt)。
第四步,使用以上訓(xùn)練得到的預(yù)測(cè)模型及第一步得到的t + 1 期輸入向量X′t+1, 可測(cè)得t + 1期NO2濃度的預(yù)測(cè)值f(X′t+1)。
通過重復(fù)步驟一至步驟四,得到預(yù)測(cè)值
f(X′1),…,f(X′t+1)。
圖2 W-LSTM 模型預(yù)測(cè)過程示意圖Fig.2 Frame of the W-LSTM forecasting model
為評(píng)價(jià)模型的預(yù)測(cè)性能,選取平均絕對(duì)誤差(MAE)、均方根誤差(RMSE)、平均絕對(duì)百分誤差(MAPE)作為模型誤差評(píng)價(jià)指標(biāo)[21],計(jì)算公式如公式(11)至公式(13)所示:
式中:n 為試驗(yàn)樣本數(shù)量,yi為實(shí)際觀測(cè)值,為預(yù)測(cè)值。
以京津冀城市群為研究對(duì)象,使用京津冀13個(gè)城市大氣污染物日均濃度歷史數(shù)據(jù)進(jìn)行預(yù)測(cè)試驗(yàn)。 為方便檢驗(yàn)預(yù)測(cè)模型的預(yù)測(cè)效果,選取13 個(gè)城市在2014 年1 月—2019 年6 月的主要大氣污染物(PM10、PM2.5、SO2、NO2、O3、CO)濃度日均值數(shù)據(jù)(共計(jì)26 091 組),作為本次試驗(yàn)的原始數(shù)據(jù),對(duì)模型預(yù)測(cè)結(jié)果進(jìn)行回算驗(yàn)證,其中PM10、PM2.5、SO2、CO 和O3作為模型的輸入變量。
本研究構(gòu)建的W-LSTM 組合模型實(shí)質(zhì)上是運(yùn)用WD 變換對(duì)原始數(shù)據(jù)進(jìn)行維度拓展,其預(yù)測(cè)性能與LSTM 模型的比較如表1 所示。 從整體性能來看,W-LSTM 模型對(duì)京津冀城市群13 個(gè)城市NO2濃度的預(yù)測(cè)結(jié)果更佳,平均MAPE 約為9%,說明W-LSTM 模型對(duì)京津冀城市群的整體預(yù)測(cè)結(jié)果更加接近真實(shí)值。 從各城市的預(yù)測(cè)結(jié)果來看,LSTM 模型的MAPE 均在10%左右,除天津和石家莊以外,該模型的預(yù)測(cè)穩(wěn)定性較強(qiáng)。 WLSTM 模型對(duì)單一城市預(yù)測(cè)評(píng)價(jià)指標(biāo)的MAPE 最優(yōu)低至5.34%,但同時(shí)也存在張家口、承德MAPE 較高的情況,尤其是承德的MAPE 高達(dá)14. 47%。 出現(xiàn)該現(xiàn)象的原因是京津冀城市群整體呈狹長(zhǎng)分布,南北各地區(qū)污染物濃度水平及分布規(guī)律存在明顯差別。 由于模型對(duì)學(xué)習(xí)訓(xùn)練數(shù)據(jù)特征的敏感度較低,在充分學(xué)習(xí)唐山這一類較高污染水平城市的數(shù)據(jù)特征之后,再使用承德和張家口等較低污染水平城市的數(shù)據(jù)進(jìn)行學(xué)習(xí),會(huì)使預(yù)測(cè)性能下降。 可以認(rèn)為,W-LSTM模型對(duì)不同地區(qū)污染數(shù)據(jù)的泛化能力比LSTM模型弱。 然而,W-LSTM 模型對(duì)京津冀城市群13 個(gè)城市NO2日均濃度預(yù)測(cè)結(jié)果的MAE 明顯優(yōu)于LSTM 模型,平均MAE 為2. 645 8,且各地之間的偏差較小。 模型性能的另一評(píng)價(jià)指標(biāo)RMSE 在兩個(gè)預(yù)測(cè)模型中的表現(xiàn)均較為良好,W-LSTM 模型以0. 462 1 的差值優(yōu)于LSTM 模型,說明基于LSTM 搭建的W-LSTM 組合模型適用于京津冀城市群NO2濃度的預(yù)測(cè)。
表1 LSTM 模型與W-LSTM 模型NO2 濃度預(yù)測(cè)性能比較Table 1 Comparison of NO2 concentration prediction performance between LSTM model and W-LSTM model
LSTM 模型在預(yù)測(cè)石家莊市NO2日均濃度時(shí)表現(xiàn)較為優(yōu)秀,MAPE 為5.61%,而W-LSTM 模型在預(yù)測(cè)唐山市NO2日均濃度時(shí)表現(xiàn)最為優(yōu)秀,MAPE 為5.34%。 與LSTM 模型相比,W-LSTM模型提高了部分城市的NO2日均濃度預(yù)測(cè)精度,最為明顯的是在唐山市,其MAPE 由10.88%下降為5.34%。 另外,在預(yù)測(cè)北京、廊坊、衡水、秦皇島NO2日均濃度時(shí),W-LSTM 也有更好的表現(xiàn),其MAPE 分別下降了4.00%、1.62%、2.61%、3.03%。 兩種模型同時(shí)存在最優(yōu)預(yù)測(cè)狀態(tài),而W-LSTM 模型在平均預(yù)測(cè)性能方面表現(xiàn)更加卓越。 W-LSTM 模型預(yù)測(cè)結(jié)果與真實(shí)觀測(cè)結(jié)果的對(duì)比如圖3 所示。 通過將表1 中不同模型的MAE進(jìn)行對(duì)比可知,加入WD 變換的組合預(yù)測(cè)模型可以有效降低MAE,部分城市的RMSE 也有非常明顯的降低。 也就是說,W-LSTM 模型能更加有效地預(yù)測(cè)NO2濃度的變化趨勢(shì),對(duì)于空氣污染物控制工作具有更為有效的指導(dǎo)作用。
圖4 為W-LSTM 模型NO2濃度預(yù)測(cè)結(jié)果。輸入變量通過WD 變換轉(zhuǎn)而生成高維輸入變量,能夠有效增加數(shù)據(jù)表示的信息量,預(yù)測(cè)結(jié)果符合預(yù)測(cè)目標(biāo)歷史數(shù)值變化規(guī)律,對(duì)提高預(yù)測(cè)模型的預(yù)測(cè)精度和穩(wěn)健性貢獻(xiàn)較大。 京津冀地區(qū)西部環(huán)山、東部沿海,氣象條件在不同城市有一定的差別,并且氣象因素對(duì)于污染物累積和擴(kuò)散的影響比較明顯。 在京津冀城市群整體氣象數(shù)據(jù)可獲取的情況下,若在組合預(yù)測(cè)模型輸入數(shù)據(jù)中補(bǔ)充氣象信息,可以更加準(zhǔn)確地對(duì)環(huán)境狀態(tài)進(jìn)行表達(dá),有助于在很大程度上提高模型的泛化能力。
為更清晰地展現(xiàn)京津冀地區(qū)各地級(jí)市NO2污染指數(shù)的空間分布狀態(tài),在繪制不同年際的京津冀城市群NO2污染綜合指數(shù)地圖時(shí),使用統(tǒng)一的圖例可有效對(duì)比NO2污染指數(shù)的時(shí)空變化,同時(shí)也能夠避免極端值對(duì)等級(jí)劃分造成過大影響。鑒于此,以每10%分位點(diǎn)為劃分界限,對(duì)平均NO2污染指數(shù)進(jìn)行等級(jí)劃分,研究通過統(tǒng)一劃分標(biāo)準(zhǔn)下的各地區(qū)不同時(shí)間、跨度較大的污染指數(shù)進(jìn)行預(yù)測(cè)結(jié)果表達(dá),最終得到便于對(duì)比分析的動(dòng)態(tài)演變圖[22]。 NO2污染指數(shù)詮釋內(nèi)容見表2。
通過迭代預(yù)測(cè)獲得2019 年7 月—2020 年12月共計(jì)18 個(gè)月的NO2日均濃度數(shù)據(jù),繪制年平均NO2污染指數(shù)地圖,同時(shí)加入2018 年和2019年整年數(shù)據(jù)用來對(duì)比觀測(cè),探究京津冀城市群NO2污染的時(shí)空演變規(guī)律,結(jié)果如圖5 所示。 從整體趨勢(shì)來看,京津冀城市群NO2污染水平從2018 年開始逐年明顯降低,僅唐山市的污染治理效果不明顯。
圖3 W-LSTM 模型NO2 濃度預(yù)測(cè)偏差觀測(cè)圖Fig.3 Deviation observation diagram of NO2 concentration prediction in W-LSTM
通過整理京津冀城市群2015 年以來有關(guān)空氣污染的部分治理舉措可知,2018—2019 年年均NO2污染綜合指數(shù)下降明顯,可能是我國在空氣污染預(yù)警、監(jiān)管和減排等多方面控制力度不斷加強(qiáng)的結(jié)果。 北京市和河北省產(chǎn)業(yè)結(jié)構(gòu)轉(zhuǎn)變速度相對(duì)較緩慢,而天津市第二產(chǎn)業(yè)比重降幅較大,在一定程度上造成了進(jìn)行京津冀城市群NO2濃度預(yù)測(cè)分析與比對(duì)時(shí),天津市NO2污染指數(shù)顯著降低的情況。 近年來,唐山不斷承接北京和天津等地的傳統(tǒng)工業(yè)企業(yè)外溢,導(dǎo)致唐山市NO2污染指數(shù)常年居于顯著水平,因此,建議將唐山作為開展京津冀城市群北部地區(qū)空氣污染治理的重點(diǎn)城市。
圖4 W-LSTM 模型NO2 濃度預(yù)測(cè)結(jié)果Fig.4 Results of NO2 concentration prediction in W-LSTM
表2 NO2 污染指數(shù)詮釋Table 2 Interpretation of nitrogen dioxide pollution index
圖5 京津冀城市群NO2 預(yù)測(cè)趨勢(shì)Fig.5 Trend of NO2 prediction results in Beijing-Tianjin-Hebei urban agglomeration
綜上所述,使用W-LSTM 模型得到的2019 年7 月—2020 年12 月京津冀城市群NO2濃度預(yù)測(cè)結(jié)果,基本符合當(dāng)下京津冀城市群的NO2污染分布趨勢(shì)。 京津冀城市群NO2污染高值區(qū)的分布較為集中,以唐山、天津、石家莊、保定和邢臺(tái)為主的工業(yè)集中城市仍是該地區(qū)未來開展NO2污染治理的重點(diǎn)區(qū)域,應(yīng)進(jìn)一步加強(qiáng)區(qū)域協(xié)作與屬地管理,確保區(qū)域環(huán)境空氣質(zhì)量得到切實(shí)改善。
1)利用LSTM 網(wǎng)絡(luò)構(gòu)建的W-LSTM 預(yù)測(cè)模型對(duì)長(zhǎng)期跟蹤時(shí)序數(shù)據(jù)具備良好的預(yù)測(cè)性能,基本可以掌握NO2濃度數(shù)據(jù)的周期性變化規(guī)律,對(duì)于特殊時(shí)間節(jié)點(diǎn)的把控也有突出表現(xiàn),例如季節(jié)更替、政策實(shí)施等。
2)NO2濃度時(shí)序數(shù)據(jù)通過WD 變換后,在一定程度上加深了對(duì)數(shù)據(jù)規(guī)律的解釋程度,WLSTM 組合模型的預(yù)測(cè)平均MAPE 明顯降低,說明增加輸入數(shù)據(jù)維度有助于提升LSTM 模型的預(yù)測(cè)精度。
3)由NO2空間分布特征分析結(jié)果可知,其分布特征差異較大,北部地區(qū)明顯低于南部地區(qū),從北部草原到南部沿海呈現(xiàn)出明顯的增高趨勢(shì),并且較高濃度水平的NO2污染分布區(qū)域較為集中,主要以保定、石家莊、邢臺(tái)一帶為中心。
4)本文提出的結(jié)合WD 和LSTM 網(wǎng)絡(luò)搭建的組合預(yù)測(cè)模型,對(duì)京津冀城市群整體NO2濃度的預(yù)測(cè)效果良好,平均MAPE 可達(dá)到9.21%,并且基于其他5 項(xiàng)大氣污染物數(shù)據(jù)的預(yù)測(cè)結(jié)果基本符合京津冀地區(qū)NO2分布規(guī)律,說明該模型可在NO2污染防治工作中發(fā)揮一定作用。