摘 要:近年來(lái),臭氧(O3)污染日益嚴(yán)重,因此分析了黃石市地面O3濃度的變化特征及其與環(huán)境要素之間的關(guān)系,并應(yīng)用機(jī)器學(xué)習(xí)方法構(gòu)建了一套適用于本地區(qū)的O3濃度高精度預(yù)測(cè)模型。結(jié)果表明:(1)黃石市O3污染以輕度污染為主,3—10月均出現(xiàn)臭氧污染日,其中5、6、9月出現(xiàn)O3中度污染日,9月O3污染日數(shù)和O3濃度水平均最高。(2)從O3污染日環(huán)境要素進(jìn)行分析,黃石市多年O3-8 h濃度平均值為93.5 μg·m-3,當(dāng)發(fā)生O3污染時(shí),SO2、PM10、PM2.5、CO的平均質(zhì)量濃度,以及日平均氣溫、日最高氣溫、日照時(shí)數(shù)均會(huì)明顯上升。相反,NO2的平均質(zhì)量濃度和氣壓、相對(duì)濕度均有顯著下降。(3)高溫、充足的陽(yáng)光和較高的相對(duì)濕度是黃石市O3濃度變化的關(guān)鍵驅(qū)動(dòng)因素。PM2.5和NO2也會(huì)對(duì)O3-8 h濃度產(chǎn)生影響,但相較于氣象因素,這兩者的重要性明顯較低。(4)梯度提升樹(shù)回歸模型在預(yù)測(cè)黃石市O3濃度方面表現(xiàn)出最佳的性能,但對(duì)于極高和極低的O3濃度,預(yù)測(cè)值與觀測(cè)值存在一定的偏差,需要進(jìn)一步探索和優(yōu)化模型,以提高其對(duì)極高值或極低值的預(yù)測(cè)準(zhǔn)確性。
關(guān)鍵詞:臭氧(O3);污染特征;氣象因素;機(jī)器學(xué)習(xí);預(yù)測(cè)模型
中圖分類(lèi)號(hào):X515 文獻(xiàn)標(biāo)志碼:B 文章編號(hào):2095–3305(2024)12–0-03
臭氧(O3)是典型的二次污染物,主要通過(guò)碳?xì)浠衔锖偷趸铮∟O)之間的光化學(xué)反應(yīng)生成。在有利的氣象條件下,如太陽(yáng)輻射強(qiáng)、天空晴朗、溫度高、相對(duì)濕度低等,O3容易形成和累積。特定的天氣類(lèi)型,如高壓后部、地面倒槽和鋒前暖區(qū),同樣易造成O3污染。此外,O3還可通過(guò)垂直空氣輸送從平流層進(jìn)入對(duì)流層,同時(shí)也可以隨盛行風(fēng)進(jìn)行遠(yuǎn)距離水平輸送[1]。
與CO和NO2等典型的一次污染物相比,O3在城市間的相關(guān)性更強(qiáng)。因此,準(zhǔn)確預(yù)測(cè)O3濃度變化不僅對(duì)保護(hù)公共健康、維護(hù)生態(tài)平衡至關(guān)重要,還能為有效管理環(huán)境和制定污染防控策略提供支持。
近年來(lái),隨機(jī)森林(Random Forest,RF)、卷積神經(jīng)網(wǎng)絡(luò)(Convolutional Neural Network,CNN)、人工神
經(jīng)網(wǎng)絡(luò)(Artificial Neural Network,ANN)等機(jī)器學(xué)習(xí)方法被應(yīng)用于預(yù)測(cè)大氣污染物(O3、PM2.5、NOx、NH3等)濃度以及分析大氣污染的成因。這種方法主要通過(guò)建立O3濃度與氣象因子、污染源和其他相關(guān)變量之間的關(guān)系模型來(lái)進(jìn)行預(yù)測(cè)[2]。與傳統(tǒng)方法相比,機(jī)器學(xué)習(xí)方法能夠自動(dòng)識(shí)別數(shù)據(jù)中的復(fù)雜非線性關(guān)系,無(wú)需詳細(xì)的物理化學(xué)過(guò)程知識(shí),因此在大氣污染預(yù)測(cè)領(lǐng)域具有廣闊的應(yīng)用前景。
黃石市位于湖北省東南部,地勢(shì)西南高、東北低,屬典型的亞熱帶大陸性季風(fēng)氣候,四季分明,雨量充沛。黃石市近幾年環(huán)境狀況公報(bào)顯示,O3作為首要污染物的比例顯著上升?;诖耍ㄟ^(guò)應(yīng)用機(jī)器學(xué)習(xí)方法,結(jié)合了2017—2021年黃石市地面O3濃度和相關(guān)氣象因素的數(shù)據(jù),分析了黃石市O3的污染特征及其與主要?dú)庀笠蛩刂g的關(guān)系,并對(duì)比了線性回歸、 K近鄰算法(KNN)、隨機(jī)森林和梯度提升樹(shù)等機(jī)器學(xué)習(xí)方法在O3濃度預(yù)測(cè)中的表現(xiàn),以選擇最優(yōu)的預(yù)測(cè)模型,為黃石市及其他類(lèi)似城市提供一種有效的O3污染預(yù)測(cè)和管理工具。
1 數(shù)據(jù)來(lái)源與分析方法
1.1 數(shù)據(jù)來(lái)源
大氣污染物監(jiān)測(cè)數(shù)據(jù)來(lái)自黃石市5個(gè)國(guó)控站點(diǎn)(沈家營(yíng)、陳家灣、新下陸、鐵山、團(tuán)城山),選取2017—2021年逐日SO2、NO2、CO、PM10、PM2.5、O3-8 h質(zhì)量濃度資料和逐時(shí)O3質(zhì)量濃度資料。氣象數(shù)據(jù)為黃石市國(guó)家基本氣象觀測(cè)站同期溫度、相對(duì)濕度、2 min平均風(fēng)速、氣壓和日照時(shí)數(shù)等日均值。
1.2 分析方法
根據(jù)《環(huán)境空氣質(zhì)量標(biāo)準(zhǔn)》(GB 3095—2012),當(dāng)O3日最大8 h平均質(zhì)量濃度超過(guò)160 μg·m-3時(shí),即為O3污染。根據(jù)《環(huán)境空氣質(zhì)量指數(shù)(AQI)技術(shù)規(guī)定(試行)》(HJ 633—2012),當(dāng)污染日首要污染物為O3時(shí),定義為O3污染日。
采用Pearson相關(guān)系數(shù)和Spearman相關(guān)系數(shù),分析氣象因素和其他大氣污染物與O3-8 h濃度之間的相關(guān)性。選用線性回歸、K最鄰近(KNN)回歸、隨機(jī)森林和梯度提升樹(shù)回歸4種機(jī)器學(xué)習(xí)方法預(yù)測(cè)O3濃度,使用均方根誤差(RMSE)和決定系數(shù)(R2)作為評(píng)價(jià)指標(biāo),評(píng)估不同模型的預(yù)測(cè)性能,選擇表現(xiàn)最優(yōu)的模型作為黃石市O3濃度預(yù)測(cè)的最終模型,并對(duì)最優(yōu)模型進(jìn)行檢驗(yàn)。RMSE和R2的計(jì)算公式如下[3]:
RMSE=(1)
R2=1-∑(yi-y*)2/∑(yi-y)2(2)
式(1)、(2)中,n為樣本數(shù)量,yi為實(shí)際觀測(cè)值,y*為預(yù)測(cè)值,∑為求和,y為實(shí)況平均值。
2 結(jié)果與分析
2.1 O3污染特征
2.1.1 黃石市O3月變化特征
黃石市的O3污染以輕度污染為主,3—10月均出現(xiàn)臭氧污染日,其中5、6、9月出現(xiàn)O3中度污染日,9月O3污染日數(shù)累計(jì)高達(dá)37 d(圖1)。此外,5—9月是O3質(zhì)量濃度較高的月份,9月的O3濃度最高,其次是8月,這兩個(gè)月的O3-8 h平均質(zhì)量濃度分別達(dá)到130.6、123.1 μg·m-3。根據(jù)黃石市天氣氣候特征可知,5—9月為汛期,常受副熱帶高壓控制,若無(wú)熱帶天氣系統(tǒng)影響,則天氣晴朗、云量較少、日照充足、氣溫較高;6月中下旬至7月下旬為江淮梅雨季,降雨天氣較多,由于降水過(guò)程有助于清除大氣中的污染物,因此7月的O3濃度相對(duì)較低[4]。
2.1.2 黃石市O3污染日環(huán)境要素分析
從2017—2021年黃石市O3污染處于不同程度時(shí)各環(huán)境要素的平均統(tǒng)計(jì)特征值(表1)可知,可以看出黃石市多年O3-8 h濃度平均值為93.5 μg·m-3,當(dāng)發(fā)生O3污染時(shí),SO2、PM10、PM2.5、CO、AQL的平均質(zhì)量濃度均呈上升趨勢(shì),而NO2的平均質(zhì)量濃度略有下降,這可能是由于O3的生成會(huì)消耗一部分的NO2。此外,當(dāng)發(fā)生O3污染時(shí),PM10、PM2.5的質(zhì)量濃度仍維持在較低水平。從氣象條件來(lái)看,黃石市多年日平均氣壓為
1 011.7 hPa,多年日平均氣溫和最高氣溫分別為18.3、23.0 ℃,多年平均相對(duì)濕度為76.8%,多年平均風(fēng)速為
1.5 m/s,多年平均日照時(shí)數(shù)為4.6 h。與無(wú)污染日相比,臭氧污染日氣壓和相對(duì)濕度均有顯著下降,日平均氣溫、日最高氣溫及日照時(shí)數(shù)則明顯上升。這表明在氣溫較高、日照充足的天氣條件下,黃石市易出現(xiàn)O3污染日。
2.2 環(huán)境要素對(duì)O3質(zhì)量濃度的影響
O3污染程度受特定環(huán)境條件的影響和調(diào)控,以O(shè)3濃度值為因變量,以相對(duì)應(yīng)的逐日環(huán)境要素為自變量,通過(guò)綜合運(yùn)用Pearson和Spearman相關(guān)性分析,探討環(huán)境要素與O3濃度之間的相關(guān)性。在分析前,所有數(shù)據(jù)均經(jīng)過(guò)標(biāo)準(zhǔn)化處理,以排除量綱對(duì)結(jié)果的影響。
日平均氣溫、日最高氣溫、日照時(shí)數(shù)、SO2與O3-8 h
濃度呈正相關(guān)關(guān)系,氣壓、相對(duì)濕度、NO2、PM2.5、CO與O3-8 h濃度呈負(fù)相關(guān)關(guān)系,上述各環(huán)境要素均滿足99%的置信區(qū)間的顯著相關(guān),這表明以上環(huán)境要素對(duì)O3形成和變化有一定影響(表2)。2 min平均風(fēng)速、PM10與O3-8 h濃度之間的相關(guān)性不顯著,表明在此研究區(qū)域內(nèi),風(fēng)速和PM10濃度變化對(duì)O3濃度的直接影響較小。
2.3 基于機(jī)器學(xué)習(xí)構(gòu)建O3濃度預(yù)測(cè)模型
2.3.1 模型比較
為深入了解不同環(huán)境要素與黃石市O3濃度之間的定量關(guān)系,采用機(jī)器學(xué)習(xí)方法分析了2017—2021年黃石市的1 754個(gè)數(shù)據(jù)樣本,基于上述通過(guò)顯著性檢驗(yàn)的環(huán)境因子(氣壓、日平均氣溫、日最高氣溫、相對(duì)濕度、日照時(shí)數(shù)、NO2、PM2.5、SO2、CO)構(gòu)建O3濃度預(yù)測(cè)模型,通過(guò)綜合比較這些模型的均方根誤差(RMSE)與決定系數(shù)R2,從而選出預(yù)測(cè)性能最優(yōu)的模型。
不同O3濃度預(yù)測(cè)模型的性能(表3)結(jié)果表明,隨機(jī)森林和梯度提升樹(shù)回歸兩種模型在預(yù)測(cè)O3濃度方面均具有顯著的優(yōu)勢(shì)。兩個(gè)模型的決定系數(shù)R2均為0.82,這一性能表現(xiàn)明顯優(yōu)于其他兩種模型,但梯度提升樹(shù)回歸模型的均方根誤差(RMSE)更小,在處理此研究中的復(fù)雜非線性環(huán)境數(shù)據(jù)時(shí)具有更高的準(zhǔn)確性,因此選擇梯度提升樹(shù)回歸模型作為最優(yōu)模型。
2.3.2 模型檢驗(yàn)
為檢驗(yàn)梯度提升樹(shù)回歸模型的預(yù)測(cè)效果,以2022年黃石市O3-8 h實(shí)況數(shù)據(jù)和氣象觀測(cè)數(shù)據(jù)作為檢驗(yàn)數(shù)據(jù),將O3-8 h預(yù)測(cè)值與實(shí)況值(圖2)進(jìn)行比較,發(fā)現(xiàn)梯度提升樹(shù)回歸模型能夠較好地預(yù)測(cè)O3濃度變化趨勢(shì),O3-8 h的預(yù)測(cè)值與實(shí)況值的均方根誤差(RMSE)為26.25,具有較高的預(yù)測(cè)精度。但對(duì)于一些極高值或極低值,模型預(yù)測(cè)的準(zhǔn)確性有所下降,這可能是受某些特殊的氣象條件或其他未考慮的環(huán)境因素的影響,在未來(lái)的研究中需要進(jìn)一步探索和優(yōu)化模型,以提高其對(duì)極高值或極低值的預(yù)測(cè)準(zhǔn)確性。
2.3.3 環(huán)境要素的正態(tài)化重要性分析
基于梯度提升樹(shù)回歸模型,進(jìn)一步探討了各環(huán)境要素對(duì)模型預(yù)測(cè)能力的貢獻(xiàn)度。通過(guò)正態(tài)化重要性分析,評(píng)估了各環(huán)境要素對(duì)O3-8 h濃度預(yù)測(cè)準(zhǔn)確性的影響。日最高氣溫在所有考慮的環(huán)境要素中對(duì)O3-8 h濃度預(yù)測(cè)的影響最大,其正態(tài)化重要性達(dá)到48.5%,與相關(guān)性分析的結(jié)果較為一致,表明較高的氣溫是O3濃度上升的必要條件,該條件會(huì)使O3前體物的反應(yīng)速率加快,從而使O3濃度升高(圖3)。日照時(shí)數(shù)次之,占比22.6%,表明光化學(xué)反應(yīng)在O3生成過(guò)程中具有關(guān)鍵作用。相對(duì)濕度的正態(tài)化重要性占比為15.6%,高濕度條件下會(huì)導(dǎo)致O3消耗增加、生成減少。日平均氣溫對(duì)O3-8 h濃度也有一定的影響,氣壓的重要性百分比相對(duì)較低,表明其對(duì)O3-8 h濃度的直接影響較為有限。大氣污染物對(duì)O3-8 h濃度產(chǎn)生的影響較低,其中PM2.5和NO2的重要性占比均高于CO,SO2對(duì)O3-8 h濃度影響的重要性程度較低。
3 結(jié)論
(1)黃石市O3污染以輕度污染為主,3—10月均出現(xiàn)臭氧污染日,其中5、6、9月出現(xiàn)O3中度污染日,9月O3污染日數(shù)和O3濃度水平均最高。
(2)從O3污染日環(huán)境要素進(jìn)行分析,黃石市多年O3-8 h濃度平均值為93.5 μg·m-3,當(dāng)發(fā)生O3污染時(shí),SO2、PM10、PM2.5、CO的平均質(zhì)量濃度,以及日平均氣溫、日最高氣溫及日照時(shí)數(shù)均會(huì)明顯上升。相反,NO2的平均質(zhì)量濃度和氣壓、相對(duì)濕度均有顯著下降。
(3)高溫、充足的陽(yáng)光和較高的相對(duì)濕度是黃石市O3濃度變化的關(guān)鍵驅(qū)動(dòng)因素。PM2.5和NO2也會(huì)對(duì)O3-8 h
濃度產(chǎn)生影響,但相比于氣象因素這兩者的重要性明顯較低。
(4)梯度提升樹(shù)回歸模型在預(yù)測(cè)黃石市O3濃度方面表現(xiàn)出最佳的性能,但對(duì)于極高和極低的O3濃度,預(yù)測(cè)值與觀測(cè)值存在一定的偏差,需要進(jìn)一步探索和優(yōu)化模型,以提高其預(yù)測(cè)極高值或極低值的準(zhǔn)確性。
參考文獻(xiàn)
[1] 鄭彬,陳月娟,施春華.平流層臭氧緯向分布季節(jié)變化和行星波的關(guān)系[J].高原氣象,2006(3):366-374.
[2] 馬偉.基于機(jī)器學(xué)習(xí)的臭氧預(yù)報(bào)及生成敏感性研究[D].廣州:華南理工大學(xué),2022.
[3] 何琰,林惠娟,曹舒婭,等.城市臭氧污染特征與高影響氣象因子:以蘇州為例[J].環(huán)境科學(xué),2023,44(1):85-93.
[4] 宋鴿,羅嘉,涂姍姍.近47年黃石市降水變化特征分析[J].安徽農(nóng)業(yè)科學(xué),2022,50(7):207-210.
收稿日期:2024-09-13
基金項(xiàng)目:黃石市氣象局2022年度自立科研課題“基于機(jī)器學(xué)習(xí)的黃石市臭氧污染特征及預(yù)報(bào)研究”(202201)。
作者簡(jiǎn)介:張東(1997—),女,河南南陽(yáng)人,助理工程師,研究方向?yàn)榄h(huán)境氣象。