羅 瑞, 劉金培, 陳華友, 陶志富
(1. 安徽大學 商學院,合肥 230601; 2. 安徽大學 數(shù)學科學學院,合肥 230601)
PM2.5指大氣中空氣動力學當量直徑小于等于2.5 μm的顆粒物,它長時間懸浮于空氣中,會侵蝕人體免疫力,引發(fā)心血管和呼吸道等疾病[1]。PM2.5的濃度值是連續(xù)變化的,每日最低值和最高值差異大,具有一定的時間跨度和區(qū)間關聯(lián)度。因此,PM2.5的日均值時間序列無法有效反映其濃度值的真實變化,而以PM2.5日最高和最低濃度值分別作為上下限的區(qū)間型數(shù)據(jù)則包含了更多的真實信息,不但可以有效反映其日變化趨勢和范圍,并且具有更高的穩(wěn)定性和更強的泛化能力[2]。因此,PM2.5區(qū)間時間序列預測具有更重要的理論和現(xiàn)實意義。
PM2.5濃度值預測方法主要分為3類:數(shù)值模擬法[3]、統(tǒng)計預測法[4-6]和深度學習方法[7-10]。數(shù)值模擬法在氣象學原理的基礎上,通過數(shù)學方程模擬PM2.5的擴散、轉化以及消散的過程[2]。此類模型中的參數(shù)存在一定的不確定性,導致其預測結果也會存在一定的偏差。統(tǒng)計預測法則是通過回歸或機器學習等建立PM2.5與影響因素之間的關系[4],實現(xiàn)對PM2.5的預測,主要包括多元線性回歸(MLR)[5]、支持向量機(SVM)[6]、人工神經(jīng)網(wǎng)絡(ANN)[4]等預測方法。統(tǒng)計類方法雖然能夠?qū)M2.5的變化規(guī)律以及相關影響因素之間的潛在關系進行擬合,但需要從大量的樣本數(shù)據(jù)中提取時間序列特征,對于波動程度較大的時間序列,存在擬合效果不穩(wěn)定的缺點。
深度學習方法通過學習時間序列數(shù)據(jù)的內(nèi)在規(guī)律和表現(xiàn)層次,能更好地擬合時間序列,提高預測精度[7-10],主要包括循環(huán)神經(jīng)網(wǎng)絡(RNN)、卷積神經(jīng)網(wǎng)絡(CNN)和長短期記憶模型(LSTM)等方法。其中,CNN的優(yōu)勢在于可以學習和有效提取數(shù)據(jù)的空間特征;RNN則存在梯度消失的問題,不適用于長期時間序列的預測;LSTM是對RNN的改進,它解決了RNN存在的問題,能夠有效提取數(shù)據(jù)的時間尺度特征。因此,與RNN和CNN相比,LSTM更適用于時間序列的預測[7]。Ong等[8]提出基于RNN的深度學習預測框架,對城市的PM2.5濃度值進行預測。Wu等[9]提出了基于LSTM的PM2.5預測方法,對武漢市PM2.5濃度值進行預測。曲悅等[10]分別利用BP神經(jīng)網(wǎng)絡、CNN與LSTM對PM2.5等空氣污染物進行預測。上述基于深度學習的預測模型均能較好提取單一尺度的數(shù)據(jù)特征,相對于數(shù)值模擬法和統(tǒng)計預測法具有更好的預測效果。但是,對于多尺度的復雜時間序列,存在有效信息提取不完全問題。最新研究表明,針對非線性、非平穩(wěn)性、波動性強的時間序列,先對其進行多尺度分解,使得各子序列具有更好的波動規(guī)律性,再對分解后的各層序列分別進行預測分析,可有效提高預測精度[11-12]。為了簡化復雜數(shù)據(jù),使各子序列平穩(wěn)化和規(guī)律化,從而有效減少預測誤差,本文將深度學習與多尺度分解相結合,先選取區(qū)間分解方法將PM2.5區(qū)間序列分解為不同波動頻率的子序列,進而采用深度學習方法對高頻波動的子序列進行預測。
綜上所述,現(xiàn)有研究存在以下3個方面的問題:已有研究主要關注PM2.5的日均點值時間序列預測,而針對PM2.5區(qū)間預測的研究較少;如何結合深度學習模型,建立復雜區(qū)間時間序列的多尺度分解預測新方法,仍然需要進一步探討;已有區(qū)間時間序列預測方法大多僅關注提高原始序列的預測性能,而沒有充分利用預測誤差序列中隱含的有效信息。
針對以上問題,提出一種新的基于LSTM-HFTS-EC的PM2.5區(qū)間多尺度組合預測新方法。首先,提出區(qū)間時間序列經(jīng)驗模態(tài)分解(IEMD)方法,將PM2.5區(qū)間時間序列依次分解為區(qū)間趨勢序列、低頻波動序列和高頻波動序列;然后,分別利用Holt-Winters模型、混合模糊時間序列模型(HFTS)和LSTM模型對區(qū)間趨勢序列、低頻波動序列和高頻波動序列進行預測,并將預測結果集成為PM2.5的區(qū)間預測值;為了進一步提高區(qū)間預測的精確度,再利用LSTM模型對PM2.5區(qū)間預測值進行誤差修正,即得到PM2.5的最終區(qū)間預測結果。最后,將本文的預測方法進行實證預測分析,通過對比來檢驗本文所提出的組合預測方法的準確性和適用性。
PM2.5濃度值的日度區(qū)間數(shù)如圖1所示,區(qū)間下界為每日PM2.5的最低濃度值,區(qū)間上界為每日PM2.5能達到的最高濃度值,區(qū)間半徑則代表了PM2.5濃度值的日變化范圍。
圖1 PM2.5濃度值日度區(qū)間數(shù)
以合肥市為例,合肥市2018-07-08至2018-07-16共9 d的PM2.5濃度的區(qū)間序列如圖2所示,可見PM2.5濃度值處于連續(xù)變化中,日度區(qū)間序列的上下界差異大,具有較大的變化范圍和較強的波動性??梢?,傳統(tǒng)的PM2.5日均值時間序列預測的代表性弱,無法充分反映其波動規(guī)律。
圖2 合肥市PM2.5日度區(qū)間序列
在經(jīng)驗模態(tài)分解的基礎上,提出IEMD方法。具體步驟如下:
步驟2 分別計算中心和半徑時序上下包絡線的均值mc(t)和mr(t),其中mc(t)=(ecmax(t)+ecmin(t))/2,mr(t)=(ermax(t)+ermin(t))/2。再分別計算中心和半徑時序與其平均值之間的差值,記為dc(t)和dr(t),這里dc(t)=c(t)-mc(t),dr(t)=r(t)-mr(t)。
步驟3 分別判斷序列dc(t)和dr(t)是否滿足本征模態(tài)函數(shù)(IMF)的條件[13]。若滿足,則記為1個IMF,記fcm(t)=dc(t),frn(t)=dr(t),m=1,2,…,M,n=1,2,…,N。將剩余項rc(t)=c(t)-fcm(t)和rr(t)=r(t)-frn(t)分別作為新的c(t)和r(t)。若不滿足,則記c(t)=dc(t),r(t)=dr(t)重復步驟1~步驟2的過程。
步驟4 重復步驟1~步驟3,直到無法再從c(t)和r(t)中分解出新的IMF為止。此時,則c(t)和r(t)分別分解為多個IMF和一個趨勢項,即
本文提出的IEMD分解方法能夠?qū)^(qū)間時間序列分解為區(qū)間趨勢序列、低頻波動序列和高頻波動序列,它不僅能夠充分提取區(qū)間時間序列中所包含的不同尺度的特征信息,而且避免了序列的過度分解,可以進一步簡化預測過程的復雜性。
2.2.1 LSTM
LSTM為RNN的一種改進,成功解決了RNN存在的梯度爆炸和梯度消失問題[14]。通過設置門限控制信息的取舍,解決了長期依賴問題,實現(xiàn)了神經(jīng)網(wǎng)絡的遺忘和記憶功能。LSTM有3個門限,分別為遺忘門(Forget Gate)、輸入門(Input Gate)和輸出門(Output Gate)。LSTM的算法結構如圖3所示。
圖3 長短期記憶神經(jīng)網(wǎng)絡的算法結構圖
在圖3中,方框內(nèi)上方的水平線即為單元狀態(tài),控制信息傳遞給下一時刻。LSTM的前饋計算過程分為3步。
第一步?jīng)Q定歷史信息是否可以通過單元狀態(tài),即遺忘掉不重要的歷史信息,這一步由遺忘門來控制,上一時刻的輸出信息ht-1和當前時刻的輸入信息xt經(jīng)過sigmoid激活函數(shù)σ得到函數(shù)值ft∈[0,1],決定歷史信息Ct-1通過單元狀態(tài)的程度。
ft=σ(Wf·[ht-1,xt]+bf)
it=σ(Wi·[ht-1,xt]+bi)
(1)
(2)
(3)
第三步?jīng)Q定單元狀態(tài)中有多少信息需要在當前時刻輸出,這一步由輸出門決定。根據(jù)式(4)得到輸出門的值ot,由式(5)計算LSTM當前時刻的輸出值ht。其中,W、b分別表示各“門限”的權重矩陣和偏置向量。
ot=σ(Wo·[ht-1,xt]+bo)
(4)
ht=ot*tanh(Ct)
(5)
2.2.2 HFTS預測
HFTS預測模型是傳統(tǒng)模糊時間序列(FTS)預測[16]的改進。模糊集、模糊時間序列和模糊關系的定義如下:
定義2[17]令U為給定論域,將論域劃分為n個子區(qū)間,則U={u1,u2,…,un},定義A為論域U上的模糊集,并記A=fA(u1)/u1+fA(u2)/u2+…+fA(un)/un。其中,fA(·)是定義在模糊集A上的隸屬函數(shù),fA(·):U→[0,1];fA(ui)表示ui在模糊集A上的隸屬度,i=1,2,…,n。
定義3[17]令R中一子集Y(t),(t=1,2,…)為給定論域,fi(t)為定義在其上的模糊集(i=1,2,…),且F(t)={f1(t),f2(t),…},則稱F(t)為定義在Y(t)上的模糊時間序列。
定義4[17]假設F(t)由F(t-1)所引起,即F(t-1)→F(t),此關系可表示為F(t)=F(t-1)°R(t,t-1),則稱F(t)為一階模糊,R(t,t-1)為F(t-1)與F(t)之間的模糊關系。其中,符號“°”表示合成運算。
HFTS預測方法的算法步驟如下:
步驟1 利用模糊C均值聚類(FCM)[20]將論域U劃分為n個區(qū)間,并且確定訓練數(shù)據(jù)屬于各區(qū)間的隸屬度。
步驟2 結合訓練數(shù)據(jù)屬于各模糊集的隸屬度,將時間序列轉化為FTS。
步驟3 利用BP神經(jīng)網(wǎng)絡定義模糊關系,將前m期數(shù)據(jù)屬于各模糊集的隸屬度作為BP神經(jīng)網(wǎng)絡的輸入值,將后一期數(shù)據(jù)的實際值作為BP神經(jīng)網(wǎng)絡的輸出值。
步驟4 確定BP神經(jīng)網(wǎng)絡隱含層的神經(jīng)元個數(shù)、激活函數(shù)以及相關參數(shù),構建網(wǎng)絡結構。
步驟5 利用訓練集數(shù)據(jù)對網(wǎng)絡進行訓練。
步驟6 利用訓練好的網(wǎng)絡進行預測。
HFTS能有效地解決FTS存在的3個問題:在模糊化階段,HFTS利用系統(tǒng)的FCM方法將數(shù)據(jù)集模糊化,以此得到各數(shù)據(jù)更加客觀的隸屬度,從而解決了FTS中隸屬度存在極大主觀性的問題;同時,在建立模糊關系階段,HFTS通過BP神經(jīng)網(wǎng)絡消除了模糊關系的結構性選擇問題,并且避免了復雜的模糊關系矩陣計算[18];另外,HFTS通過將時間序列的實際值作為目標值,利用BP神經(jīng)網(wǎng)絡進行預測,避免了去模糊化階段中可能出現(xiàn)的預測誤差,從而提高了預測性能。
2.2.3 Holt-Winters模型
Holt-Winters模型適用于對含有趨勢變動、季節(jié)變動和周期變動的時間序列進行預測。本文應用的乘法Holt-Winters預測模型[19],如下:
(6)
針對PM2.5區(qū)間時間序列數(shù)據(jù)非線性、非平穩(wěn)性和波動幅度較大等特點,提出一種新的基于LSTM-HFTS-EC的PM2.5區(qū)間多尺度組合預測方法,結構框架如圖4所示,具體步驟如下:
圖4 組合預測模型結構框架
步驟5 模型檢驗。利用區(qū)間平均相對誤差(IARV)、區(qū)間平均絕對誤差(IMAE)、區(qū)間平均絕對百分比誤差(IMAPE)和區(qū)間均方根誤差(IRMSE)4種預測誤差評價指標對本模型以及其他預測模型進行對比分析,以此檢驗本文提出模型的預測效果。
選取合肥市2018-07-01至2020-12-30共計914 d的PM2.5數(shù)據(jù)進行預測實證分析,數(shù)據(jù)來源于安徽省生態(tài)環(huán)境廳(http://sthjt.ah.gov.cn)。對收集的PM2.5實時數(shù)據(jù)進行預處理,將日實時數(shù)據(jù)的最高值和最低值分別作為區(qū)間的上下限,得到PM2.5區(qū)間時間序列。其中,選取前822個區(qū)間數(shù)據(jù)作為訓練集,后92個區(qū)間數(shù)據(jù)作為測試集。
根據(jù)提出的組合預測模型流程,利用IEMD方法將合肥市PM2.5原始區(qū)間時間序列依次分解為區(qū)間趨勢序列、低頻波動序列和高頻波動序列,結果如圖5所示。其中,IEMD是一種自適應分解方法,勿需提前設置分解函數(shù)和分解層數(shù),該方法可以自行分解成對應的層數(shù)。圖5(a)為分解得到的區(qū)間趨勢序列,它體現(xiàn)了合肥市PM2.5濃度值的整體趨勢,可見受新冠疫情等因素影響,合肥市PM2.5濃度值在一段時期內(nèi)處于下降趨勢,而隨著工業(yè)生產(chǎn)的全面復工以及出行的常態(tài)化,其濃度值也逐漸上升。圖5(b)為低頻波動序列,反映了合肥市PM2.5濃度值的短期變化規(guī)律,從圖5中可以看出其濃度值具有明顯的季節(jié)性和周期性,說明冬季合肥市PM2.5濃度值會達到最高峰,空氣污染比較嚴重,在夏季合肥市PM2.5濃度值會處于最低水平,空氣質(zhì)量相對較好。圖5(c)表示高頻波動序列,它體現(xiàn)了在眾多因素影響下合肥市PM2.5濃度值的具體波動細節(jié),可以發(fā)現(xiàn)合肥市PM2.5濃度值的波動幅度較大。
圖5 PM2.5原始區(qū)間數(shù)據(jù)分解圖
在上一階段的基礎上,首先采用Holt-Winters對區(qū)間趨勢序列進行預測,平滑系數(shù)分別設置為α=0.3、β=0.3和γ=0.4。然后基于HFTS對低頻波動序列進行預測,其中,F(xiàn)CM的類別數(shù)n=5,BP神經(jīng)網(wǎng)絡的輸入值m=5,隱含層的神經(jīng)元個數(shù)設置為16,激活函數(shù)為tansig,迭代次數(shù)為1 000。最后選取LSTM對高頻波動序列進行單步預測,其中,本文設置1個輸入層、1個隱含層和1個輸出層,隱含層的神經(jīng)元個數(shù)為128,激活函數(shù)設置為tanh,時間步長設置為1,批處理大小取值為50,迭代次數(shù)設置為500。同時,將各單項預測方法的預測結果進行相加集成,得到合肥市PM2.5組合預測值如圖6所示??梢钥闯?,雖然組合預測值整體可以反映PM2.5實際值的變化趨勢,但是PM2.5區(qū)間濃度值上限和下限的預測結果與實際值之間在波動細節(jié)上仍存在一定的差異。
說明高頻波動序列中隱含的一部分復雜數(shù)據(jù)特征沒有被有效利用,因此,預測結果仍然有改進的空間。
基于組合預測的結果,進一步采用誤差修正的方法,從預測誤差中間接提取隱含的有效信息,進一步提高預測精度。首先,計算得到原始數(shù)據(jù)與PM2.5組合預測結果之間的差值作為誤差序列。然后,采用LSTM對誤差序列進行預測,在相關參數(shù)設置不改變的情況下,將前一期數(shù)據(jù)作為輸入值,后一期數(shù)據(jù)作為輸出值,得到誤差序列的預測結果。最后,利用誤差預測值對組合預測的結果進行修正,將兩者相加集成,得到PM2.5區(qū)間濃度值最終預測結果,如圖6所示。由此可見,進行誤差修正后的預測結果更加接近于實際值,預測效果得到了較大地提升。說明誤差修正能夠從預測誤差序列中進一步提取有效信息,提高模型的預測精度。
圖6 預測結果對比圖
為了驗證所提出模型的有效性,進行了以下3個方面的對比,并用散點圖表示。各數(shù)據(jù)點越趨于對角線表明預測結果越接近實際值,反之,效果越差。對比分析結果如下:
(1) 不同分解方法的對比。在本文方法的基礎上,對分解方法進行變換,采用變分模態(tài)分解(VMD)、集成經(jīng)驗模態(tài)分解(EEMD)、奇異譜分解(SSA)對PM2.5原始區(qū)間數(shù)據(jù)進行分解處理,并將其記為VMD-CF-ECM、EEMD-CF-ECM和SSA-CF-ECM。對比結果如圖7所示(?、☆、▽、×分別代表IEMD-CF-ECM、VMD-CF-ECM、EEMD-CF-ECM、SSA-CF-ECM),本文模型(IEMD-CF-ECM)的預測效果明顯優(yōu)于這3種模型,由此可見IEMD非常適用于分析波動幅度不規(guī)律、非線性和非平穩(wěn)性的區(qū)間時間序列,它能根據(jù)數(shù)據(jù)固有的波動尺度特征來進行時間序列分解,具有客觀性和自適應性。
(a) 下限預測效果對比
(b) 上限預測效果對比圖7 本模型與采用不同的分解方法比較圖
(2) 不同單項預測方法的對比。在本模型基礎上,對分解后的不同頻率序列分別采用同一單項方法進行預測,如LSTM、HFTS和Holt-Winters,并依次將其設定為IEMD-LSTM-ECM、IEMD-HFTS-ECM和IEMD-HW-ECM。由圖8可知(?、□、+、▽分別代表IEMD-CF-ECM、IEMD-LSTM-ECM、IEMD-HFTS-ECM、IEMD-HW-ECM),采用單項預測方法的預測精度低于本文提出的組合預測方法,這說明利用IEMD將PM2.5區(qū)間序列分解為不同尺度的子序列,然后根據(jù)不同時序的數(shù)據(jù)特征,選擇最合適的模型,利用組合預測方法對其進行預測,能夠極大程度地提高預測性能,從而達到最優(yōu)預測效果。
(a) 下限預測效果對比
(b) 上限預測效果對比圖8 本模型與采用單一預測方法比較圖
(3) 與已有預測模型的橫向?qū)Ρ?。將本文模型與其他PM2.5預測模型進行對比,如LSTM模型[10]、ANN模型[21]和Holt-Winters模型[21]。對比結果如圖9所示(?、○、☆、×分別代表IEMD-CF-ECM、LSTM、ANN、HW),可見對比模型的預測效果遠低于本文提出模型,由此可見,本模型具有更高的預測精度。
(a) 下限預測效果對比
(b) 上限預測效果對比圖9 本模型與其他預測方法比較圖
另外,本文模型與其他比較模型的預測誤差評價指標如表1所示。可以看出,本模型預測誤差的各評價指標都低于其他比較模型,進一步反映了本文提出模型的預測精度要高于其他比較模型,具有較好的預測效果和較強的適應性。
表1 10種預測方法預測誤差評價指標對比
綜上所述,本研究具有以下3方面的優(yōu)勢:第一,本文提出的區(qū)間時間序列組合預測模型可以對PM2.5濃度值變化趨勢和范圍進行更好預測,克服了傳統(tǒng)點值時間序列預測波動信息損失的缺點;第二,本文將深度模型LSTM與區(qū)間多尺度分解等方法相結合,提出了一種區(qū)間時間序列組合預測框架,能夠從大量復雜的時間序列數(shù)據(jù)中提取關鍵性的數(shù)據(jù)特征,克服了傳統(tǒng)預測模型存在的滯后性問題;第三,本文通過提取組合預測預測誤差提供的有效信息,進行誤差修正,使預測精度得到了進一步地提升。
PM2.5濃度值是一個連續(xù)變化、隨機性強、波動頻率不規(guī)律的時間序列,傳統(tǒng)的日均值分解預測模型很難準確地獲取高頻序列中的隨機性特征,也無法完全體現(xiàn)PM2.5的區(qū)間變化規(guī)律。因此,本文提出了一種新的基于LSTM-HFTS-EC的PM2.5區(qū)間多尺度組合預測模型方法,首先利用IEMD將PM2.5區(qū)間時間序列進行分解,再基于Holt-Winters模型、HFTS和LSTM模型分別對分解出的區(qū)間趨勢序列、低頻波動序列和高頻波動序列進行預測,并將預測結果集成為PM2.5的區(qū)間預測值。進而利用LSTM模型對PM2.5區(qū)間預測值進行誤差修正,得到PM2.5的最終區(qū)間預測結果。最后通過實證預測分析,說明本文的方法適用于具有較大波動的PM2.5區(qū)間預測,與已有方法相比具有更高的精確度和良好的適用性。此外,本文的研究也為預測其他具有連續(xù)變化和波動范圍大特征的實際問題提供了一種新的思路。