能源工業(yè)和交通運(yùn)輸業(yè)作為中國(guó)經(jīng)濟(jì)發(fā)展的支柱產(chǎn)業(yè),在生產(chǎn)作業(yè)過程中會(huì)產(chǎn)生大量污染物。這些污染物對(duì)于環(huán)境的危害尤為突出,其中首要污染物為顆粒物( PM2.5 和 PM10 )。因此,對(duì)大氣中的顆粒物濃度進(jìn)行監(jiān)測(cè)是很有必要的。國(guó)內(nèi)外現(xiàn)有空氣污染統(tǒng)計(jì)模型有三類:基于傳統(tǒng)統(tǒng)計(jì)方法的統(tǒng)計(jì)模型[1-2]學(xué)習(xí)數(shù)據(jù)模式的機(jī)器學(xué)習(xí)模型[3-4]以及利用多層神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)復(fù)雜特征的深度學(xué)習(xí)模型[5-6]。針對(duì)這一問題,現(xiàn)有的深度學(xué)習(xí)模型在預(yù)測(cè)顆粒物濃度時(shí),具有穩(wěn)定性差、準(zhǔn)確性低的情況[7],基于本文提出的CNN-BiLSTM-Attention模型,綜合考慮空間、時(shí)間和氣象因素的影響,為我國(guó)揭示空氣污染物濃度變化規(guī)律,提前預(yù)測(cè)診斷污染狀況,為我國(guó)環(huán)保部門應(yīng)對(duì)大氣污染提供量化參考。
1 研究方法
1.1 卷積神經(jīng)網(wǎng)絡(luò)(CNN)
假設(shè)預(yù)測(cè)模型輸入為 ,其包括過去的氣象數(shù)據(jù)、大氣污染物濃度,計(jì)算公式:
1.2 BiLSTM模型
考慮到預(yù)測(cè)受到前后時(shí)刻輸人的綜合影響,采用了雙向長(zhǎng)短期記憶網(wǎng)絡(luò)(BiLSTM)[8],門控定義的數(shù)學(xué)表達(dá)式可以用如下公式表示:
g(x)=σ(Wx+b)
式中, X 為輸入矩陣, Y 為輸出的特征矩陣, c 是卷積核數(shù)量, W 表示卷積核的權(quán)重矩陣, b1 表示偏置 ,f 代表激活函數(shù)的作用。
1.3 CNN-BiLSTM-Attention模型
本研究考慮了遼寧省各市監(jiān)測(cè)站站點(diǎn)的空氣質(zhì)量和氣象時(shí)序數(shù)據(jù)中的信息記憶、存儲(chǔ)與傳遞,以及氣象因素與 PM2.5 和 PM10 濃度的相關(guān)性,設(shè)計(jì)了CNN-BiLSTM-Attention模型。利用了CNN優(yōu)秀的空間特征提取能力,之后引入了BiLSTM,更好地分析過去不同時(shí)間點(diǎn)的特征狀態(tài)對(duì)顆粒物濃度的影響程度[8]。最后加入注意力機(jī)制,給定查詢向量Q ,鍵向量集合 ,值向量集合
,
,鍵向量的維度 d?K ,該部分計(jì)算過程可以用如下方式表示:
式中:Attention,表示注意力權(quán)重向量; T 表示輸入序列維度。
2 實(shí)驗(yàn)結(jié)果與分析
2.1 相關(guān)性分析
為研究 PM2.5 和 PM10 與氣象因子之間存在的相關(guān)性,考慮空氣溫度、露點(diǎn)溫度、氣壓、降水量、風(fēng)速、風(fēng)力等級(jí)等因素??傮w而言,顆粒物與氣象因子之間的相關(guān)性較弱,相關(guān)系數(shù)通常低于0.5,見圖1。
2.2 模型評(píng)估
本文分析了LSTM模型,CNN模型與CNN-BiLSTM-Attention模型預(yù)測(cè)結(jié)果與真實(shí)值之間的差距,見圖2。
研究使用的評(píng)價(jià)指標(biāo)為平均絕對(duì)百分比誤差(MAPE)均方根誤差(RMSE)和擬合優(yōu)度 (R2) 。CNN-BiLSTM-Attention模型在 PM2.5 和 PM10 濃度預(yù)測(cè)中表現(xiàn)最好,且對(duì)直徑越小的顆粒物預(yù)測(cè)效果越好,詳見表1、表2。
3結(jié)論
基于LSTM模型進(jìn)行優(yōu)化得到CNN-BiLSTM-Attention模型對(duì)遼寧省大氣顆粒物濃度進(jìn)行了預(yù)測(cè),得出以下結(jié)論:
(1)CNN-BiLSTM-Attention模型提取了空間特征與雙向時(shí)序信息,與LSTM模型,CNN模型進(jìn)行對(duì)比,該模型評(píng)估效果更好,預(yù)測(cè)精度更高。
(2)利用皮爾遜相關(guān)性分析法分析了顆粒物濃度與氣象因子之間的相關(guān)性,但由于部分氣象相關(guān)數(shù)據(jù)過于不完整、不均衡等,這將對(duì)模型的預(yù)測(cè)帶來不確定性,因此尋找更好的數(shù)據(jù)處理方法,是以后預(yù)測(cè)研究的重點(diǎn)。
參考文獻(xiàn):
[1]魏書禾.基于三次指數(shù)平滑法對(duì)太原市空氣質(zhì)量的預(yù)測(cè)[J].科教導(dǎo)刊(下旬),2019(27):167-169.
[2]高曉輝.灰色指數(shù)平滑模型及其在空氣質(zhì)量預(yù)測(cè)中的應(yīng)用[D].邯鄲:河北工程大學(xué),2019
[3]任才溶,謝剛.基于隨機(jī)森林和氣象參數(shù)的 PM2.5 濃度等級(jí)預(yù)測(cè)[J].計(jì)算機(jī)工程與應(yīng)用,2019,55(2):213-220.
[4]孔宇,王海起,張浩然,等.基于集成學(xué)習(xí)算法的 PM2.5 濃度值預(yù)測(cè)[J].環(huán)境保護(hù)科學(xué),2021,47(4):17-23.
[5]趙文芳,林潤(rùn)生,唐偉,等.基于深度學(xué)習(xí)的 PM2,5 短期預(yù)測(cè)模型[J].南京師大學(xué)報(bào)(自然科學(xué)版),2019,42(3):32-41.
[6]趙文怡,夏麗莎,高廣闊,等.基于加權(quán)KNN-BO神經(jīng)網(wǎng)絡(luò)的 PM2,5 濃度預(yù)測(cè)模型研究[J].環(huán)境工程技術(shù)學(xué)報(bào),2019,9(1):14-18.
[7]劉杰,楊鵬,呂文生,等.基于氣象因素的 PM2,5 質(zhì)量濃度預(yù)測(cè)模型[J].山東大學(xué)學(xué)報(bào)(工學(xué)版),2015,45(6):76-83.
[8]于伸庭,劉萍.基于長(zhǎng)短期記憶網(wǎng)絡(luò)-卷積神經(jīng)網(wǎng)絡(luò)(LSTM-CNN)的北京市 PM2.5 濃度預(yù)測(cè)[J].環(huán)境工程,2020,38(6) :176-180.