凌德森,王曉凱
(山西大學(xué) 物理電子工程學(xué)院,太原 030006)
經(jīng)過(guò)藍(lán)天保衛(wèi)戰(zhàn)的努力,我國(guó)城市的細(xì)顆粒物(PM2.5)已經(jīng)下降了許多,但在北方的很多城市到了秋冬季節(jié)后,霧霾現(xiàn)象依然很?chē)?yán)重,嚴(yán)重影響了人們的日常生活,而霧霾的主要成分為細(xì)顆粒物(PM2.5),因此對(duì)PM2.5值的預(yù)測(cè)對(duì)空氣污染防治、守護(hù)藍(lán)天保衛(wèi)成果具有重要意義。
目前,國(guó)內(nèi)外的學(xué)者在PM2.5預(yù)測(cè)方面已有了大量的研究[1],主要的方法有數(shù)據(jù)驅(qū)動(dòng)方法[2],如Rui Zhao等[3]利用多元線性回歸(MLR,multiple linear regression)模型來(lái)實(shí)現(xiàn)PM2.5的短期預(yù)測(cè),Liu Wei等[4]利用粒子群算法優(yōu)化支持向量機(jī)(SVM,support vector machine)對(duì)PM2.5等級(jí)進(jìn)行預(yù)測(cè),之后隨著人工神經(jīng)的發(fā)展,深度學(xué)習(xí)作為機(jī)器學(xué)習(xí)的一個(gè)分支,是經(jīng)典機(jī)器學(xué)習(xí)的一個(gè)進(jìn)步。與經(jīng)典機(jī)器學(xué)習(xí)不同,經(jīng)典機(jī)器學(xué)習(xí)仍然需要人工輔助來(lái)提取特征,深度學(xué)習(xí)具有自動(dòng)學(xué)習(xí)原始數(shù)據(jù)特征的優(yōu)點(diǎn)。如賈佳美等[5]利用BP神經(jīng)網(wǎng)絡(luò)對(duì)PM2.5日均濃度進(jìn)行預(yù)測(cè);Jeya[6]等利用雙向LSTM模型預(yù)測(cè)PM2.5污染物濃度,并采用均方根誤差、平均絕對(duì)誤差以及平均絕對(duì)百分比誤差進(jìn)行誤差評(píng)估分析,最終結(jié)果表明此模型相較于對(duì)比模型精度得到了較大的提升。另外,混合預(yù)測(cè)模型也是最近幾年重點(diǎn)研究對(duì)象,如Bai等[7]利用改進(jìn)的極限學(xué)習(xí)機(jī)結(jié)合離群點(diǎn)檢測(cè)和校正算法、數(shù)據(jù)分解策略和多目標(biāo)優(yōu)化算法,形成了PM2.5濃度的混合模型,蔣洪訊等[8]提出了一種基于小波分解(WD,wavelet decomposition)的長(zhǎng)短期記憶網(wǎng)絡(luò)(LSTM,long short-term memory network)用來(lái)預(yù)測(cè)PM2.5的濃度,結(jié)果表明數(shù)據(jù)經(jīng)過(guò)分解處理后,能夠降低數(shù)據(jù)噪聲的影響,提高模型的預(yù)測(cè)性能。為了提高模型的預(yù)測(cè)精度,學(xué)者還利用模型對(duì)數(shù)據(jù)的隱藏特征進(jìn)行提取,如Jin等[9]利用經(jīng)驗(yàn)?zāi)B(tài)分解(EMD,empirical mode decomposition)將PM2.5數(shù)據(jù)進(jìn)行分解,并將分解后的數(shù)據(jù)根據(jù)頻率分量進(jìn)行分組,最后利用CNN-GRU模型進(jìn)行預(yù)測(cè),實(shí)驗(yàn)結(jié)果表明利用卷積神經(jīng)網(wǎng)絡(luò)(CNN,convolution neural network)網(wǎng)絡(luò)進(jìn)行特征提取之后會(huì)進(jìn)一步提高模型的預(yù)測(cè)精度,衛(wèi)曉旭等[10]提出一種多元預(yù)測(cè)模型,先利用CNN網(wǎng)絡(luò)對(duì)多因素?cái)?shù)據(jù)進(jìn)行空間特征提取,再使用雙向長(zhǎng)短期記憶(BiLSTM,bidirectional long short-term memory network)網(wǎng)絡(luò)對(duì)多因素?cái)?shù)據(jù)中包含的時(shí)間特征進(jìn)行挖掘并預(yù)測(cè),進(jìn)一步提高了模型對(duì)污染物濃度預(yù)測(cè)的精度。但是該模型先對(duì)數(shù)據(jù)的空間特征進(jìn)行提取,再對(duì)時(shí)間特征進(jìn)行挖掘,這可能會(huì)導(dǎo)致在空間特征提取后數(shù)據(jù)中某些時(shí)間特征被忽略的問(wèn)題。
目前,雖然很多的模型也都考慮了多因素之間的相互影響[11-13],但多數(shù)的研究中只是偏向于對(duì)數(shù)據(jù)的時(shí)間特征信息或空間特征信息的挖掘,并沒(méi)有同時(shí)對(duì)時(shí)間特征和空間特征進(jìn)行提取,如前文介紹的CNN網(wǎng)絡(luò),雖然相較于單一模型有了很大的提升,但模型對(duì)數(shù)據(jù)特征的提取不夠完善,不能很好的挖掘數(shù)據(jù)的隱藏信息,也是阻礙預(yù)測(cè)精度提升的原因。因此本文提出了一種時(shí)空特征提取的PM2.5濃度預(yù)測(cè)模型方法,為了能夠更容易獲取預(yù)測(cè)數(shù)據(jù)的內(nèi)部特征,先利用STL算法對(duì)預(yù)測(cè)序列進(jìn)行分解,再將分解后的序列混合著其他污染物數(shù)據(jù)和大氣因素?cái)?shù)據(jù)傳入ConvLSTM網(wǎng)絡(luò)進(jìn)行時(shí)間特征和空間特征進(jìn)行同時(shí)提取,之后傳入到利用貝葉斯優(yōu)化后的GRU網(wǎng)絡(luò)進(jìn)行預(yù)測(cè)。結(jié)果表明,本文提出的模型具有更高的精度。
ConvLSTM是雙重組合的深度學(xué)習(xí)方法,它是 LSTM 架構(gòu)的混合變體,使用卷積算子而不是矩陣乘法來(lái)進(jìn)行狀態(tài)輸入和狀態(tài)到狀態(tài)轉(zhuǎn)換[14]。這使算法能夠處理時(shí)空數(shù)據(jù)并使用本地鄰居的輸入和先前的狀態(tài)來(lái)確定網(wǎng)格中特定單元格的即將到來(lái)的狀態(tài)[15]。其運(yùn)行機(jī)制如下:
it=σ(Wxi*Xt+Whi*Ht-1+Wci°Ct-1+bi)
(1)
ft=σ(Wxf*Xt+Whf*Ht-1+Wcf°Ct-1+bf)
(2)
Ct=ft°Ct-1+it°tanh(Wxc*Xt+Whc*Ht-1+bc)
(3)
ot=σ(Wxo*Xt+Who*Ht-1+Wco°Ct+bo)
(4)
Ht=ot°tanh(Ct)
(5)
式(1)~(5)中:*和o分別表示卷積和Hadamard乘積,i,f和o分別表示輸入門(mén)、遺忘門(mén)和輸出門(mén),H表示時(shí)間序列的隱藏狀態(tài),C表示每個(gè)細(xì)胞的輸出,σ為激活函數(shù),W表示連接狀態(tài)之間的權(quán)重。
STL分解算法是一種常見(jiàn)的時(shí)間序列分解算法,它通過(guò)局部加權(quán)回歸(Loess)[16]將時(shí)間序列分解為趨勢(shì)項(xiàng)、季節(jié)項(xiàng)和隨機(jī)波動(dòng)的殘差項(xiàng),如式(6)表示。
xt=Tt+St+Rt,t=1,2,…,N
(6)
其中:xt、Tt、St和Rt分別表示在t時(shí)刻的時(shí)間序列觀測(cè)值、趨勢(shì)項(xiàng)、季節(jié)項(xiàng)和殘差項(xiàng)。另外STL可分為內(nèi)循環(huán)和外循環(huán),其中內(nèi)循環(huán)主要用來(lái)進(jìn)行趨勢(shì)擬合和周期分量的計(jì)算,內(nèi)循環(huán)的主要步驟如下。
步驟4:將步驟2得到的時(shí)間序列進(jìn)行趨勢(shì)項(xiàng)去除,為:
(7)
步驟7:判斷步驟6得到的時(shí)間序列是否收斂,若不收斂重新執(zhí)行步驟1到步驟6,直到時(shí)間序列收斂,若收斂則內(nèi)循環(huán)結(jié)束。
外循環(huán)通過(guò)引入穩(wěn)健權(quán)重來(lái)處理內(nèi)循環(huán)中出現(xiàn)的異常殘差值,可以減少迭代過(guò)程中異常值的影響,從而提高了算法的魯棒性[17]。
貝葉斯優(yōu)化是由Pelikan等[18]學(xué)者在1998年提出的,它在已知有限樣本條件下,通過(guò)構(gòu)造黑箱函數(shù)輸出的后驗(yàn)概率來(lái)尋找函數(shù)的最優(yōu)值,其主要目標(biāo)是在超參數(shù)空間內(nèi)尋找到泛化性能最優(yōu)的多維超參數(shù)x*,公式如下:
(8)
式中,f(x)是超參數(shù)向量x到模型泛化性能的映射。由于用黑箱函數(shù)評(píng)估模型代價(jià)高昂且復(fù)雜,為了克服此缺點(diǎn),常常利用高斯過(guò)程模型作為代理模型來(lái)評(píng)估模型,改進(jìn)后的模型可以考慮之前的參數(shù)信息,不斷地更新先驗(yàn)知識(shí)[19]。在超參數(shù)優(yōu)化的問(wèn)題中,貝葉斯優(yōu)化是當(dāng)前為數(shù)不多的,具有較好的收斂性理論保證的超參數(shù)估計(jì)方法[20]。
GRU網(wǎng)絡(luò)是Chung等[21]在2014年提出的一種新的RNN變體循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)的一種變體,是在LSTM網(wǎng)絡(luò)上的進(jìn)一步的改進(jìn),它能夠在降低了細(xì)胞結(jié)構(gòu)復(fù)雜度的同時(shí),保證和LSTM的模型精度相當(dāng)?shù)耐瑫r(shí),提高網(wǎng)絡(luò)的運(yùn)行效率,使得網(wǎng)絡(luò)在訓(xùn)練中能夠更快的收斂[22]。其前向傳公式如下:
rt=σ(Wr·[ht-1,xt])
(9)
zt=σ(Wz·[ht-1,xt])
(10)
(11)
(12)
為了使模型具備時(shí)空特征提取的能力,本文采用ConvLSTM模型進(jìn)行時(shí)空特征提取,將提取后的特征再利用GRU網(wǎng)絡(luò)進(jìn)行預(yù)測(cè)。此外,在加入多種特征因素后,直接使用空氣污染物原始數(shù)據(jù)進(jìn)行預(yù)測(cè),會(huì)降低模型的預(yù)測(cè)精度,因此采用STL分解算法先將待預(yù)測(cè)的空氣污染物序列進(jìn)行分解,再進(jìn)行預(yù)測(cè)。模型結(jié)構(gòu)如圖1,具體步驟如下。
圖1 STL-ConvLSTM-GRU模型的整體結(jié)構(gòu)
步驟1:為了解決各種數(shù)據(jù)輸入量綱不一致的問(wèn)題,這里將要預(yù)測(cè)的污染物濃度序列、相關(guān)的污染物濃度序列,以及氣象因素?cái)?shù)據(jù)進(jìn)行歸一化處理,原始數(shù)據(jù)主要是空氣污染物濃度數(shù)據(jù)。又因原始數(shù)據(jù)的分布改變可能會(huì)造成空氣污染物濃度分布信息的丟失,為了保證歸一化處理后的數(shù)據(jù)不改變?cè)紨?shù)據(jù)的分布情況,因此本文利用Max-Min方法對(duì)數(shù)據(jù)作歸一化處理。
(13)
式中,yi為歸一化后的數(shù)據(jù),xi為原始數(shù)據(jù),xmax,xmin分別為原始數(shù)據(jù)中的最大值、最小值。
步驟2:將歸一化后的待預(yù)測(cè)的PM2.5污染物濃度序列,采用STL算法進(jìn)行分解得到季節(jié)性序列、趨勢(shì)序列和殘差序列,能夠有效降低序列中噪聲的影響,并更有利于提高后續(xù)對(duì)數(shù)據(jù)特征的提取。
步驟3:將步驟2得到的3種子序列分別加入歸一化后的其他污染物濃度序列及氣象因素,并分別利用ConvLSTM模型進(jìn)行時(shí)空特征提取,時(shí)空特征的提取能夠更加突出對(duì)預(yù)測(cè)效果影響更大的因素的影響,提高模型預(yù)測(cè)的準(zhǔn)確率。
步驟4:利用步驟3提取得到的特征值作為GRU網(wǎng)絡(luò)的輸入值,預(yù)測(cè)結(jié)構(gòu)的誤差值作為目標(biāo)函數(shù),使用貝葉斯算法對(duì)GRU網(wǎng)絡(luò)進(jìn)行超參數(shù)優(yōu)化。
步驟5:利用步驟4優(yōu)化好的GRU預(yù)測(cè)模型對(duì)步驟3處理后的子序列分別進(jìn)行預(yù)測(cè),為了降低模型過(guò)擬合的問(wèn)題,在GRU層后增加Dropout層,Dropout正則化方法能夠有效較低模型過(guò)擬合的問(wèn)題。步驟6:將子序列預(yù)測(cè)結(jié)果通過(guò)Dense層進(jìn)行輸出,將最后的子序列預(yù)測(cè)結(jié)果疊加,并進(jìn)行反歸一化操作得到最終的預(yù)測(cè)結(jié)果。
本文選擇以某市2017年1月1日至2017年7月31日每小時(shí)采樣一次的歷史實(shí)時(shí)空氣污染物濃度數(shù)據(jù)為研究樣例,數(shù)據(jù)集收集于中國(guó)環(huán)境檢測(cè)總站的全國(guó)城市空氣質(zhì)量實(shí)時(shí)發(fā)布平臺(tái)(https://air.cnemc.cn)和真氣網(wǎng)(https://www.aqistudy.cn/)發(fā)布的數(shù)據(jù)[23],其中包括PM10、PM2.5、SO2、NO2、O3和CO 6項(xiàng)主要污染物濃度以及溫度、濕度、風(fēng)級(jí)、風(fēng)向4種氣象數(shù)據(jù)。
由于空氣污染物濃度和氣象數(shù)據(jù)收集過(guò)程十分不易,因此造成收集到的數(shù)據(jù)部分缺失,對(duì)于缺失的數(shù)據(jù)分別按照污染物和氣象數(shù)據(jù)來(lái)進(jìn)行補(bǔ)缺,對(duì)于空氣污染物的缺失值采用相鄰數(shù)據(jù)取均值的方法,即將空缺處的污染物數(shù)據(jù)利用其上一時(shí)刻和下一時(shí)刻的值進(jìn)行平均運(yùn)算得出,氣象數(shù)據(jù)則直接使用0值來(lái)補(bǔ)全。補(bǔ)全后的各污染物濃度數(shù)據(jù)如圖2所示。
從圖2中可以直觀的看出六種空氣污染物濃度之間的波動(dòng)具有一定的相關(guān)性,其中PM2.5、PM10、SO2、NO2、CO五種空氣污染物濃度的變化表現(xiàn)出一種同增同減的正相關(guān)性,而O3與其它5種空氣污染物濃度之間表現(xiàn)出一種一減一增的負(fù)相關(guān)性。為了更加深入的研究六種空氣污染物之間存在的相關(guān)性,本文利用皮爾遜(Pearson)相關(guān)系數(shù)進(jìn)行相關(guān)性研究。
Pearson相關(guān)系數(shù)是英國(guó)數(shù)學(xué)家卡爾·皮爾遜在弗朗西斯·高爾頓的研究基礎(chǔ)之上演變?yōu)閬?lái)。Pearson相關(guān)系數(shù)可以用來(lái)表示兩個(gè)變量之間的相關(guān)性,反應(yīng)兩個(gè)變量之間變化趨勢(shì)的方向以及程度[24]。若有兩個(gè)長(zhǎng)度為n的序列{x1,x2,…,xi,…xn} 和{y1,y2,…,yi,…yn} ,則Pearson相關(guān)系數(shù)r的計(jì)算公式為:
(14)
圖3 六種空氣污染物濃度之間的相關(guān)系數(shù)
從空氣污染物濃度的Pearson相關(guān)系數(shù)圖(圖3)中可以看出,PM2.5、PM10、SO2、NO2、CO、O3六種空氣污染物濃度之間相互存在著一定的相關(guān)性,其中PM10、PM2.5、SO2、NO2、CO之間相互呈現(xiàn)不同程度的正相關(guān)性,O3和其他5種空氣污染物之間呈現(xiàn)不同程度的負(fù)相關(guān)性。
為了保證所有實(shí)驗(yàn)?zāi)P偷墓叫?,本次所有?shí)驗(yàn)均在Windows11系統(tǒng)下,利用Python3.6、Matlab R2019b以及tensorflow2.0平臺(tái)搭建和運(yùn)行實(shí)驗(yàn)?zāi)P汀?/p>
圖4 經(jīng)STL分解后的PM2.5濃度
為了能夠更加準(zhǔn)確地獲取時(shí)間序列的內(nèi)部特征,將待預(yù)測(cè)的PM2.5濃度時(shí)間序列進(jìn)行STL分解,經(jīng)過(guò)多次實(shí)驗(yàn)后,將STL分解周期設(shè)置為230小時(shí),得到PM2.5的季節(jié)分量、反映PM2.5變化趨勢(shì)的趨勢(shì)項(xiàng)、以及反映PM2.5隨機(jī)波動(dòng)的殘余項(xiàng)。從圖4中可以看出雖然PM2.5數(shù)據(jù)的波動(dòng)比較混亂,但是仍然具有一定的周期性規(guī)律,從分解后的趨勢(shì)項(xiàng)來(lái)看從1月到7月的這段時(shí)間內(nèi)隨著氣溫的逐漸升高,PM2.5濃度逐漸下降并慢慢趨于平穩(wěn),這種現(xiàn)象表明霧霾等PM2.5污染現(xiàn)象的出現(xiàn)可能和冬季取暖消耗的資源較多有一定的聯(lián)系。
在模型構(gòu)建過(guò)程中需要設(shè)置模型的參數(shù),參數(shù)的選擇也是模型構(gòu)建的重點(diǎn),合適的參數(shù)關(guān)系到模型的預(yù)測(cè)誤差和泛化能力[25]。在實(shí)際應(yīng)用的過(guò)程中ConvLSTM網(wǎng)絡(luò)卷積核的熟練關(guān)系到模型對(duì)特征提取的完整程度,而GRU網(wǎng)絡(luò)中神經(jīng)元的數(shù)量、學(xué)習(xí)率的大小、正則化率的大小、迭代次數(shù)都影響著模型的最終預(yù)測(cè)結(jié)果,因此設(shè)置合適的超參數(shù)是十分重要的。
以往在超參數(shù)選擇中無(wú)論是根據(jù)自己的經(jīng)驗(yàn)來(lái)不斷地嘗試,還是利用網(wǎng)格搜索法來(lái)進(jìn)行多種嘗試,都不僅耗時(shí)耗力,還會(huì)因?yàn)閭€(gè)人經(jīng)驗(yàn)的積累程度影響到最終的結(jié)果。根據(jù)1.3節(jié)的分析可知,貝葉斯優(yōu)化算法能夠較大范圍的搜索超參數(shù)的范圍,減少模型陷入局部最優(yōu)的情況。因此本文采用貝葉斯尋優(yōu)算法來(lái)降低人力的消耗,減少嘗試法以及網(wǎng)格搜索法帶來(lái)的個(gè)人經(jīng)驗(yàn)的影響。貝葉斯尋優(yōu)步驟如下:
1)設(shè)定這5個(gè)參數(shù)的選擇范圍,以及每次搜索參數(shù)的步長(zhǎng);
2)設(shè)置初始化尋優(yōu)參數(shù),利用控制變量的方法,先固定一個(gè)超參數(shù)的大小,依次對(duì)其它超參數(shù)進(jìn)行遍歷,建立不同的預(yù)測(cè)模型;
3)每次建立的模型都會(huì)計(jì)算一次模型運(yùn)行的誤差值,對(duì)比每一次誤差值的大小,選擇出這一組最優(yōu)的超參數(shù)。
4)調(diào)整之前固定參數(shù)的大小,再次對(duì)其它超參數(shù)進(jìn)行遍歷,根據(jù)3)的描述再次選擇出一組最優(yōu)的超參數(shù);
5)當(dāng)所有的選擇參數(shù)都進(jìn)行遍歷尋優(yōu)之后,對(duì)比每一組最優(yōu)超參數(shù)下的誤差值,選擇出計(jì)算誤差最小的一組作為模型的最優(yōu)超參數(shù)。
因?yàn)榻?jīng)過(guò)STL分解后的PM2.5數(shù)據(jù)有三項(xiàng),所有將同一模型根傳入數(shù)據(jù)的不同,分別進(jìn)行超參數(shù)優(yōu)化。貝葉斯尋優(yōu)的最終結(jié)果如表1所示。
表1 貝葉斯尋優(yōu)結(jié)果
為了能夠更好的衡量模型的預(yù)測(cè)效果,本文采用了3個(gè)評(píng)價(jià)指標(biāo):平均絕對(duì)誤差(MAE,mean absolute error)、均方根誤差(RMSE,root mean squared error)和平均絕對(duì)百分比誤差(MAPE,mean absolute percentage error)來(lái)分析預(yù)測(cè)結(jié)果與真實(shí)值之間偏差。一般來(lái)說(shuō)RMSE、MAE和MAPE值越小則預(yù)測(cè)結(jié)果與真實(shí)值之間的偏差越小,模型預(yù)測(cè)效果越好;
(15)
(16)
(17)
將討論的PM2.5數(shù)據(jù)經(jīng)STL算法分解成季節(jié)項(xiàng)、趨勢(shì)項(xiàng)和殘余項(xiàng)3個(gè)子序列,如3.1節(jié)分析,并將3個(gè)子序列分別與其他5種污染物數(shù)據(jù)以及溫度、濕度、風(fēng)級(jí)、風(fēng)向4種氣象數(shù)據(jù)的前4 882條數(shù)據(jù)作為訓(xùn)練集、后206條數(shù)據(jù)作為測(cè)試集,預(yù)測(cè)步長(zhǎng)選擇8小時(shí),即使用前的8個(gè)小時(shí)的數(shù)據(jù)預(yù)測(cè)預(yù)測(cè)后1個(gè)小時(shí)的值。模型預(yù)測(cè)結(jié)果如圖5所示。
圖5 模型預(yù)測(cè)結(jié)果
從圖5可以看出,STL-ConvLSTM-GRU模型的PM2.5濃度預(yù)測(cè)結(jié)果與實(shí)際PM2.5濃度的整體趨勢(shì)較為貼合,符合PM2.5濃度的變化波動(dòng)趨勢(shì)。雖然在某些PM2.5濃度變化波動(dòng)復(fù)雜的時(shí)間內(nèi),該模型的預(yù)測(cè)結(jié)果和實(shí)際PM2.5濃度有一些誤差,但從PM2.5濃度的變化趨勢(shì)上看,預(yù)測(cè)結(jié)果與實(shí)際值也是相符合的,表明該模型能夠較為準(zhǔn)確的預(yù)測(cè)PM2.5濃度值,并且在PM2.5濃度變化復(fù)雜的情況下也能很好的預(yù)測(cè)PM2.5的波動(dòng)趨勢(shì)。
為了驗(yàn)證本文提出模型的優(yōu)劣性,除了本文主要的研究模型外,還搭建了ConvLSTM-GRU模型、常見(jiàn)的CNN-GRU模型以及GRU模型作為實(shí)驗(yàn)對(duì)比模型。
從GRU網(wǎng)絡(luò)的預(yù)測(cè)結(jié)果圖(圖6)可以看出,在相同模型參數(shù)的情況下,GRU網(wǎng)絡(luò)對(duì)PM2.5濃度的預(yù)測(cè)結(jié)果與實(shí)際值的偏離度較大,甚至在一些PM2.5濃度波動(dòng)較為復(fù)雜的情形下,基本失去了預(yù)測(cè)PM2.5濃度趨勢(shì)的可能性。
將GRU網(wǎng)絡(luò)的預(yù)測(cè)結(jié)果與ConvLSTM-GRU模型和CNN-GRU模型的PM2.5濃度預(yù)測(cè)結(jié)果(圖7、8)進(jìn)行對(duì)比可以發(fā)現(xiàn),雖然ConvLSTM-GRU模型和CNN-GRU模型的預(yù)測(cè)結(jié)果離真實(shí)值都有著一定的差距,但是通過(guò)比較這3種模型預(yù)測(cè)結(jié)果與實(shí)際值的擬合程度,可以得出在這3種模型中僅僅使用單一GRU模型進(jìn)行預(yù)測(cè)的效果最差,與實(shí)際走勢(shì)的偏離度最高,預(yù)測(cè)值與實(shí)際值的偏差最大,而另外兩種模型雖然也與真實(shí)值有所差距,但預(yù)測(cè)結(jié)果與實(shí)際值的偏離度卻有著明顯的改善,因此可以得出在對(duì)PM2.5濃度預(yù)測(cè)前對(duì)多因素?cái)?shù)據(jù)進(jìn)行特征提取,能夠有效的提高模型對(duì)PM2.5濃度的預(yù)測(cè)準(zhǔn)確率。
圖6 GRU網(wǎng)絡(luò)的預(yù)測(cè)結(jié)果
通過(guò)對(duì)比ConvLSTM-GRU模型和CNN-GRU模型的PM2.5濃度預(yù)測(cè)結(jié)果,發(fā)現(xiàn)采用ConvLSTM進(jìn)行時(shí)空特征提取之后,對(duì)于PM2.5濃度波動(dòng)比較頻繁的部分以及濃度趨勢(shì)變化較尖銳的時(shí)刻,預(yù)測(cè)結(jié)果更加貼近真實(shí)PM2.5濃度的走勢(shì),再通過(guò)觀察表2中各評(píng)價(jià)指標(biāo)值,可以得出ConvLSTM-GRU模型RMSE、MAE以及MAPE的值要小于使用CNN進(jìn)行特征提取的CNN-GRU模型,因此可以得出ConvLSTM-GRU模型的預(yù)測(cè)效果要優(yōu)于CNN-GRU模型,也即是使用ConvLSTM進(jìn)行時(shí)間和空間的特征提取后,比僅僅利用CNN網(wǎng)絡(luò)進(jìn)行空間特征提取更加有效的提高了模型的預(yù)測(cè)精度。
圖7 CNN-GRU模型的預(yù)測(cè)結(jié)果
圖8 ConvLSTM-GRU模型的預(yù)測(cè)結(jié)果
通過(guò)對(duì)比STL-ConvLSTM-GRU模型和ConvLSTM-GRU模型的預(yù)測(cè)結(jié)果和結(jié)果評(píng)估表可以看出,STL-ConvLSTM-GRU模型的預(yù)測(cè)結(jié)果要更加優(yōu)于ConvLSTM-GRU模型的預(yù)測(cè)結(jié)果,這表明使用STL分解算法對(duì)PM2.5數(shù)據(jù)進(jìn)行分解,能夠更有效的突出數(shù)據(jù)中隱藏的特征信息、降低噪聲對(duì)PM2.5濃度預(yù)測(cè)模型的影響,并進(jìn)一步提高模型的預(yù)測(cè)準(zhǔn)確度。
通過(guò)對(duì)比4種模型的RMSE、MAE和MAPE三種評(píng)價(jià)指標(biāo),STL-ConvLSTM-GRU模型相較于其它3種模型,RMSE分別降低了5.5%、12.54%、16.54%;MAE分別降低8.2%、18.05%、28.82%,MAPE也有著不同程度的降低。從以上的分析可以得出,STL-ConvLSTM-GRU模型的預(yù)測(cè)結(jié)果相較于其它3種模型效果更優(yōu),整體結(jié)果更加貼近真實(shí)的PM2.5濃度的變化趨勢(shì)。
表2 4種預(yù)測(cè)模型性能對(duì)比
1)相較于單一的GRU模型,經(jīng)過(guò)ConvLSTM進(jìn)行時(shí)空特征提取后的GRU模型預(yù)測(cè)效果更好,因此采用ConvLSTM對(duì)PM2.5數(shù)據(jù)進(jìn)行時(shí)空特征提取具有可行性。ConvLSTM-GRU模型比GRU模型的RMSE、MAE、MAPE分別降低了11.67%、22.95%、8.38%。
2)通過(guò)對(duì)比ConvLSTM-GRU模型和CNN-GRU模型的預(yù)測(cè)結(jié)果,可以得出采用ConvLSTM對(duì)數(shù)據(jù)進(jìn)行時(shí)間和空間的特征提取能夠更多的挖掘出PM2.5濃度數(shù)據(jù)中的隱藏信息,提高模型的預(yù)測(cè)技能高度。
3)由于多變量預(yù)測(cè)的復(fù)雜性較高,為了更好的提取內(nèi)部特征信息,利用STL算法先將待預(yù)測(cè)的PM2.5數(shù)據(jù)分解,再和其它影響因素一起利用ConvLSTM進(jìn)行時(shí)空特征提取,相較于ConvLSTM-GRU模型,STL-ConvLSTM-GRU模型更進(jìn)一步提高了預(yù)測(cè)精度,證明了本文所研究的模型優(yōu)越性。
4)本文只是將影響因素一并傳入到預(yù)測(cè)模型中,并沒(méi)有考慮影響因素與待預(yù)測(cè)序列之間相關(guān)度大小的影響,因此后面將對(duì)數(shù)據(jù)之間相關(guān)度大小的影響進(jìn)行實(shí)驗(yàn)。