孫達(dá)云 王騰飛 郭偉震 葛于兵
(1.淮安市氣象局,江蘇 淮安 223001;2.淮安市淮安區(qū)氣象局,江蘇 淮安 223200)
臭氧主要分布在平流層。平流層的臭氧能夠吸收太陽輻射中的紫外線,保護(hù)地球上的生物。對流層的臭氧約占總量的1/10,也稱近地面臭氧。對流層的臭氧含量雖然少,但其對生物的生存產(chǎn)生一定程度的負(fù)面影響。近地面臭氧濃度較高時(shí),植物的發(fā)育會(huì)受到影響,植物發(fā)病的概率增加,產(chǎn)量隨之下降[1]。臭氧還會(huì)影響人類的呼吸系統(tǒng),損害人類的呼吸道和肺器官[2]。對流層臭氧的來源主要是氮氧化物(NOX)和揮發(fā)性有機(jī)物(VOCs),通過一系列光化學(xué)反應(yīng)生成。
Sohn 等[3]使用BP 網(wǎng)絡(luò)來預(yù)報(bào)韓國首爾市的臭氧濃度,將氣象要素和環(huán)境要素作為輸入、未來6 個(gè)時(shí)次的臭氧濃度作為輸出。蘇筱倩等[4]利用支持向量機(jī)回歸方法(SVR),利用高臭氧濃度期間的氣象資料、臭氧前體物和臭氧濃度,完成南京工業(yè)區(qū)小時(shí)臭氧濃度的預(yù)報(bào)。
近地面臭氧濃度升高會(huì)帶來光化學(xué)污染等一系列問題,而解決這些問題的一個(gè)前提是提高臭氧預(yù)報(bào)模型的精度。好的臭氧預(yù)報(bào)模型有助于提高臭氧預(yù)報(bào)的精度。當(dāng)向公眾發(fā)布臭氧超標(biāo)預(yù)警時(shí),預(yù)警的時(shí)效性和準(zhǔn)確性越高,預(yù)警所產(chǎn)生的社會(huì)效益越高,尤其是對空氣污染特別敏感的人群。同時(shí),臭氧預(yù)報(bào)精度的提高,也有助于政府部門提前采取針對空氣污染的管控策略。
本文通過深度學(xué)習(xí)算法,利用其對非線性關(guān)系的學(xué)習(xí)能力,結(jié)合各類氣象要素和環(huán)境要素?cái)?shù)據(jù),實(shí)現(xiàn)對近地面臭氧的預(yù)報(bào),能較好地預(yù)報(bào)淮安地區(qū)近地面臭氧濃度,可以作為空氣質(zhì)量預(yù)報(bào)的一種補(bǔ)充。
本文的環(huán)境數(shù)據(jù)采用2016—2020 年淮安地區(qū)的小時(shí)O3,NO2,CO,PM2.5,PM10濃度數(shù)據(jù),數(shù)據(jù)來源于中國環(huán)境監(jiān)測中心。氣象數(shù)據(jù)采用2016—2020 年淮安國家基準(zhǔn)氣候站的小時(shí)數(shù)據(jù),包括溫度、相對濕度、風(fēng)速、降水、氣壓、輻照度和曝輻量。
氣象和環(huán)境數(shù)據(jù)按照同一時(shí)間進(jìn)行組合。由于數(shù)據(jù)存在缺失值和異常值,為了保證模型訓(xùn)練的數(shù)據(jù)質(zhì)量,對某一時(shí)刻存在缺失值或異常值的數(shù)據(jù)予以剔除。將保留下來的數(shù)據(jù),根據(jù)深度學(xué)習(xí)模型要求,產(chǎn)生時(shí)間序列數(shù)據(jù)。
門控循環(huán)單元(GRU)是循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)的變體之一。GRU 由重置門(Reset Gate)和更新門(Update Gate)構(gòu)成。相比于長短期記憶網(wǎng)絡(luò)(LSTM),GRU 的構(gòu)成更為簡單,因此GRU 的訓(xùn)練時(shí)間更短、效率更高。Seq2seq 模型是一種深度學(xué)習(xí)算法,由谷歌公司于2014 年開發(fā),主要用于語言翻譯、自動(dòng)摘要等。Seq2Seq 模型由編碼器和解碼器組成。編碼器和解碼器通常由RNN 組成,常見的是LSTM 和GRU[5]。Seq2Seq 模型的輸入和輸出均為序列,并且允許輸入和輸出的時(shí)間序列長度不同。編碼器、解碼器都有輸入端、輸出端和狀態(tài)端。編碼器接收輸入序列,并將其產(chǎn)生的狀態(tài)傳遞給解碼器。解碼器的輸入端接收待解碼序列,并結(jié)合狀態(tài)在輸出端輸出解碼序列。
利用“注意力機(jī)制”下的Seq2Seq 模型進(jìn)行臭氧濃度預(yù)報(bào)時(shí),考慮用過去24 h 的實(shí)況值來預(yù)報(bào)未來4 h 的小時(shí)臭氧濃度。小時(shí)臭氧濃度模型的編碼器端輸入的是預(yù)測時(shí)間之前24 h 的氣象和環(huán)境要素?cái)?shù)據(jù),解碼器端輸入的是預(yù)報(bào)前一時(shí)刻的臭氧濃度值,輸出的是預(yù)報(bào)時(shí)刻的臭氧濃度值。氣象要素?cái)?shù)據(jù)包括溫度、相對濕度、風(fēng)速、降水、氣壓、輻照度和曝輻量,環(huán)境要素?cái)?shù)據(jù)包括O3,NO2,CO,PM2.5和PM10。
訓(xùn)練集的數(shù)據(jù)是2016—2019 年的數(shù)據(jù),測試集的數(shù)據(jù)是2020 年的數(shù)據(jù)。預(yù)報(bào)結(jié)果評估主要是測試集的實(shí)況值與預(yù)報(bào)值之間的差異。評價(jià)指標(biāo)包括皮爾遜相關(guān)系數(shù)(PCC)、平均絕對誤差(MAE)和均方根誤差(RMSE)。
一般來說,太陽輻射越強(qiáng),氣溫越高,同時(shí)太陽輻射強(qiáng)度與臭氧的光化學(xué)反應(yīng)速率是正相關(guān),所以氣溫與近地面臭氧含量也具有相關(guān)性。通過2016—2020 年氣溫與臭氧數(shù)據(jù)的統(tǒng)計(jì)分析,得出兩者之間的相關(guān)系數(shù)為0.58,達(dá)到0.001 顯著性水平。
相對濕度與空氣中的水汽含量有關(guān),相對濕度越高,空氣中的水汽含量越高。有研究表明,相對濕度較高時(shí),水汽中的O,OH 等自由基能夠?qū)3分解成氧分子,使得臭氧濃度下降[6]。同時(shí),相對濕度較高時(shí),降水的可能性增大,降水的濕清除功能造成臭氧濃度下降[7]。兩者相關(guān)系數(shù)為-0.49,達(dá)到0.001 顯著性水平。
地面氣壓與臭氧濃度的擴(kuò)散相關(guān)。一般來說,地面是高壓控制時(shí),天氣晴朗少云,城市的氣流一般是從城市中心向城市外圍運(yùn)動(dòng),從而將城市中的污染物帶走,使得臭氧濃度下降。而當(dāng)?shù)孛媸堑蛪嚎刂茣r(shí),氣流一般是從城市外圍向城市中心運(yùn)動(dòng),從而導(dǎo)致臭氧在城市中心集聚,臭氧濃度上升。兩者相關(guān)系數(shù)是-0.41,達(dá)到0.001 顯著性水平。
降水能夠?qū)η绑w物和臭氧起到凈化作用,同時(shí)降水時(shí)太陽輻射弱,不利于光化學(xué)反應(yīng),導(dǎo)致臭氧濃度低[8]。兩者相關(guān)系數(shù)為-0.015,達(dá)到0.01 顯著性水平。
風(fēng)速的大小影響著污染的水平和垂直方向的輸送。有研究表明,風(fēng)速較小時(shí),向下的輸送導(dǎo)致近地面臭氧濃度上升,而當(dāng)風(fēng)速增大時(shí),水平擴(kuò)散會(huì)導(dǎo)致近地面臭氧濃度降低。風(fēng)速達(dá)到一定值時(shí),向下輸送和水平擴(kuò)散使得二者的作用相互抵消。隨著風(fēng)速進(jìn)一步增大,臭氧濃度呈下降趨勢[9]。兩者相關(guān)系數(shù)為0.24,達(dá)到0.001 顯著性水平。
NO2是臭氧生成的前體物,主要來源包括化石燃料燃燒和生物排放。兩者的相關(guān)系數(shù)為-0.47,達(dá)到0.001 顯著性水平。
CO 主要來自汽車尾氣排放及工業(yè)生產(chǎn)排放。CO 有助于臭氧的生成。兩者的相關(guān)系數(shù)為-0.22,達(dá)到0.001 顯著性水平。
臭氧的生消與顆粒物是相關(guān)的。首先,顆粒物影響大氣光學(xué)厚度,從而影響太陽輻射,進(jìn)而影響臭氧的光化學(xué)反應(yīng)。顆粒物濃度較大時(shí),大氣光學(xué)厚度增加,NO2光解下降,OH 和HO2自由基減少,臭氧濃度下降[10]。同時(shí),顆粒物為化學(xué)反應(yīng)提供了場所[11]。PM2.5與臭氧濃度的相關(guān)系數(shù)為-0.25,達(dá)到0.001 顯著性水平。PM10與臭氧濃度的相關(guān)系數(shù)為-0.14,達(dá)到0.001 顯著性水平。
臭氧污染與人們的生產(chǎn)生活有著密切關(guān)系,因此臭氧濃度的及時(shí)準(zhǔn)確預(yù)報(bào)有著重要意義。
為了驗(yàn)證預(yù)報(bào)模型的可行性,可以通過預(yù)報(bào)模型的輸出結(jié)果與真實(shí)監(jiān)測結(jié)果的接近程度來衡量,而接近程度可以通過各項(xiàng)指標(biāo)來量化體現(xiàn)。下面將預(yù)報(bào)模型輸出的近地面臭氧濃度與真實(shí)監(jiān)測臭氧濃度的結(jié)果進(jìn)行對比分析。
測試集的輸出值與真實(shí)值的各項(xiàng)指標(biāo)如下:RMSE 介于8.36~23.66 μg/m3之間,MAE 介于6.11~18.03 μg/m3之間,PCC 介于0.96~0.64 之間。對于1~4 h 的預(yù)測,1 h 的預(yù)測值效果最好,RMSE 和MAE最小,PCC 最大,表明預(yù)測值與觀測值具有較強(qiáng)的線性相關(guān)性。隨著預(yù)測時(shí)間的增加,RMSE 和MAE 逐漸增大,PCC 逐漸減小,預(yù)測值與觀測值的差值越來越大,這是因?yàn)楫?dāng)前小時(shí)的預(yù)測值依賴于前一小時(shí)的預(yù)測值,前一小時(shí)的偏差會(huì)在當(dāng)前小時(shí)被放大。對于4 h 的預(yù)測,盡管RMSE 和MAE 分別為23.66 μg/m3和18.03 μg/m3,但PCC 仍大于0.6。小時(shí)臭氧濃度實(shí)況值—預(yù)報(bào)值分布見圖1,從圖1 來看,臭氧濃度預(yù)報(bào)模型可以有效地預(yù)測近地面臭氧濃度。
圖1 小時(shí)臭氧濃度實(shí)況值—預(yù)報(bào)值分布
根據(jù)2016—2020 年的氣象和環(huán)境要素分析可以得出,臭氧濃度與氣象要素和環(huán)境要素的關(guān)系是多樣的,臭氧與氣溫、風(fēng)速整體上呈正相關(guān),與相對濕度、氣壓、降水量、NO2、CO、PM2.5、PM10整體上呈負(fù)相關(guān)?!白⒁饬C(jī)制”下的Seq2Seq 模型在預(yù)報(bào)4 個(gè)小時(shí)的臭氧濃度上效果較好,相關(guān)系數(shù)大于0.6。整體而言,模型可以在小時(shí)臭氧濃度的預(yù)報(bào)上發(fā)揮一定的作用。未來還需要在模型結(jié)構(gòu)、超參數(shù)等方面進(jìn)一步的優(yōu)化,以取得更好的預(yù)報(bào)效果。