文 琴, 何文孝
(內(nèi)江師范學院 人工智能學院,四川 內(nèi)江 641100)
隨著經(jīng)濟的快速發(fā)展以及人民生活質(zhì)量的不斷提高,社會對AQI的關(guān)注度越來越高,空氣質(zhì)量下降不僅對人類的健康和自然環(huán)境產(chǎn)生巨大的影響,而且在一定程度上會阻礙社會的經(jīng)濟發(fā)展,同時加劇對地球的危害.全面地了解和掌握某個城市的AQI及其未來短期內(nèi)AQI的變化趨勢,可為人們的健康出行提供指導,為公眾了解空氣質(zhì)量提供途徑,為提高人民的環(huán)保意識做出貢獻,為政府有效快速地做出污染控制措施提供輔助材料.為此,建立科學有效的AQI預測模型尤為重要,并且AQI預測研究已經(jīng)成為近年來一個重要的研究領(lǐng)域.
近年來國內(nèi)外許多學者對AQI的預測展開了研究,目前的AQI預測研究中,大多數(shù)學者在做預測的時候并未考慮氣象因素對AQI的影響,比如:陳岑等[1]提出使用一種基于IG(信息增益)和長短期記憶網(wǎng)絡(luò)(long-short term memory,LSTM)的AQI混合預測方法對某市的AQI進行預測;俆喬王等[2]建立思維進化算法(MEA)與支持向量機(SVM)結(jié)合的模型MEA-SVM,并將該模型用于AQI(AQI)的預測等;這些預測都未考慮氣象因素對AQI的影響.但在污染源一定的情況下,氣象因素是AQI的主要影響因子,因為氣象因素如:風場、降雨量、氣溫等會對污染物進行擴散和稀釋進而引起AQI的變化,為此,袁燕等[3]考慮到了氣象因素,并將氣象因素作為算法設(shè)計的基礎(chǔ),提出一種基于社區(qū)劃分的AQI預測的算法,并且在AQI預測中提高了預測的準確率:萬永權(quán)等[4]融合了氣象參數(shù)和污染物濃度對空氣質(zhì)量進行建模預測;尹曉梅等[5]探究了氣象因素對大氣污染物的影響進而對空氣質(zhì)量的影響;綜上所述氣象因素會對AQI產(chǎn)生一定的影響,因此本文在融入氣象因子的基礎(chǔ)上再考慮AQI的預測,但是目前在考慮氣象因素時,大多學者要么使用歷史氣象數(shù)據(jù)作為數(shù)據(jù)集,忽略了氣象預報數(shù)據(jù),要么使用單一的氣象預報數(shù)據(jù)作為數(shù)據(jù)集,對AQI進行預測,這在一定程度上會對最終的預測數(shù)據(jù)產(chǎn)生影響,本人在前期的AQI預測研究[6]中,提出將氣象因子集預報應(yīng)用于AQI預測中,實驗結(jié)果表明將氣象因子進行集成預報能提高氣象因子的預報準確率進而提高AQI的預測精度,為此,在本研究中,對于氣象因子仍然采用類似方式即對氣象因子進行多模式集成預報以提高預測準確率.
由于城市AQI預測是一個多變量、非線性問題,而神經(jīng)網(wǎng)絡(luò)對于這種復雜的非線性關(guān)系問題具有很好的處理能力,因此近年來被廣泛地應(yīng)用于空氣質(zhì)量預測研究中.吳慧靜等[7]利用遺傳算法改進的神經(jīng)網(wǎng)絡(luò)對許昌市AQI進行預測,為空氣質(zhì)量的監(jiān)測、預警與調(diào)控提供了科學依據(jù);方曉萍等[8]利用長短期記憶(LSTM)神經(jīng)網(wǎng)絡(luò)對長江經(jīng)濟帶AQI進行預測研究;高嵩等[9]使用機器學習算法對未來AQI進行預測,即使用隨機森林模型和卷積神經(jīng)網(wǎng)絡(luò)對成都市AQI進行預測;程蓉等[10]通過對每棵由兩個隱藏層和一個輸出層構(gòu)成的三層神經(jīng)網(wǎng)絡(luò)回歸樹對歷史空氣質(zhì)量數(shù)據(jù)進行訓練,求平均進行估計,能滿足局部空氣質(zhì)量預測要求.這一系列的研究表明將人工神經(jīng)網(wǎng)絡(luò)相關(guān)的預測模型用于空氣質(zhì)量預測是可行的,且相比于一般的統(tǒng)計模型有利于提高空氣質(zhì)量預測的精度.因此,本文提出一種結(jié)合氣象因子多模式集成預報的基于條件生成對抗網(wǎng)絡(luò)的AQI預測模型.
AQI的變化主要與污染物的排放和氣象因素有關(guān).由于污染物的遷移傳輸需要一定的時間,前一日污染物對當日污染物有較大影響,因此前日污染物可以在一定程度上描述污染源的特征,所以將前一日污染物數(shù)據(jù)作為影響AQI變化的污染物因子[6].其中污染物因子的篩選參考環(huán)境空氣質(zhì)量標準(GB3095-2012),由該標準知二氧化氮(NO2)、細顆粒物(PM 10)、二氧化硫(SO2)、臭氧(O3)、可吸入顆粒物(PM 2.5)、一氧化碳(CO)等六項污染物是引起AQI變化的主要污染物因子,因此將該六個污染物作為本文AQI預測模型的污染物因子.
此外,當城市的污染源相對穩(wěn)定時,氣象因素則是影響AQI的首要條件[11].因此,在對城市AQI進行預測時,氣象因子的篩選就變得很重要.其次,由于AQI與氣象影響因素之間是非線性關(guān)系,而信息熵能夠解決非線性問題,是量化信息之間相關(guān)度的一種有效方法.因此,采用信息熵計算方法來選擇影響AQI的主要氣象因子,即采用互信息(mutual infonIlation,MI)分析某氣象因子與AQI的相關(guān)性.
1948年Claude E.Shannon在熱力學Boltzmann熵思想的基礎(chǔ)上,系統(tǒng)全面地提出信息的度量方法,從新的角度定義了熵的基本概念.Claude E. Shannon利用概率統(tǒng)計方法,將熵作為對某一個隨機事件不確定性的數(shù)學度量方法,用以計算事件包含的信息量大小.互信息的理論來源于信息論中熵的概念,互信息是用于表示變量之間相關(guān)性的一種方法,互信息的大小代表變量間共有信息的多少,變量間的耦合越強,則它們之間的互信息就越大,互信息對各個變量的分布類型沒有特別的要求,互信息既能描述線性相關(guān)關(guān)系,又能描述非線性相關(guān)關(guān)系,在特征變量選擇中得到了非常廣泛的研究和應(yīng)用[12-15].互信息I(M,N)是統(tǒng)計兩個隨機變量M和N之間依存度的信息度量,互信息的數(shù)值越大,則這兩個隨機變量之間的依存程度就越大,那么它們之間的相關(guān)性也就越大[16].互信息的計算公式如下:
I(M,N)=H(M)+H(N)-H(M,N)
=H(M)-H(M|N)
=H(N)-H(N|M),
(1)
公式中H(M)描述的是隨機變量M的熵值;H(N)描述的是隨機變量N的熵值;H(M,N)為隨機變量M、N之間的聯(lián)合熵;H(N|M)表示在隨機變量M已知的條件下,隨機變量N的條件熵;H(M|N)則表示在隨機變量N已知的條件下,隨機變量M的條件熵.公式中p(mi)為概率密度函數(shù),p(mi,ni)為聯(lián)合概率密度函數(shù),p(mi|ni)為給定N時M的條件概率函數(shù).
(2)
(3)
(4)
以AQI與氣象因素之間的互信息大小來度量氣象因素對AQI作用程度的大小,可以消除多元氣象因素之間關(guān)聯(lián)耦合所導致的冗余信息,能夠科學地表示它們對AQI的影響.其互信息的值越大,則表示該氣象因素對AQI的作用程度就越強[17].采用2018年11月到2021年11月的內(nèi)江市氣象要素歷史預報數(shù)據(jù)與同期內(nèi)江市AQI實測歷史數(shù)據(jù)作為訓練數(shù)據(jù),然后利用互信息熵對內(nèi)江市AQI和氣象因素進行數(shù)據(jù)分析,從而得到各氣象因素與內(nèi)江市AQI的互信息熵值.篩選標準:若通過訓練后得到互信息熵值的數(shù)值小于0.01,則視該氣象因子為弱相關(guān),否則,將其篩選為內(nèi)江市AQI的氣象因子.通過實驗以及篩選標準得出能見度、相對濕度、氣溫、氣壓、降水量、風速、風向?qū)?nèi)江市AQI得影響較大(見表1),因此將這7個氣象因子作為內(nèi)江市AQI預測模型的氣象因子.綜上所述,最終篩選出AQI預測模型的輸入因子為NO2、PM10、SO2、O3、PM2.5、CO、能見度、相對濕度、氣溫、氣壓、降水量、風速、風向等13個輸入因子.
表1 氣象影響因素的互信息熵結(jié)果
在城市污染源相對穩(wěn)定的條件下,氣象因素是影響AQI發(fā)生變化的主要因素.因此,為了進一步提高最終預測結(jié)果的準確性,篩選出了氣象因素之后,還需要對篩選出的氣象因素進行集成預報[6].在目前考慮氣象因素的AQI預測研究中,大多學者要么使用歷史氣象數(shù)據(jù)作為氣象數(shù)據(jù)的預報數(shù)據(jù)集,忽略了氣象預報數(shù)據(jù);要么使用單一的氣象預報數(shù)據(jù)作為數(shù)據(jù)集,這在一定程度上會對最終的預測數(shù)據(jù)產(chǎn)生影響.在對AQI預測時,是將前一日的污染物和當日的氣象預報因子作為模型輸入.由于大氣是一個高度非線性的系統(tǒng),所以各個數(shù)值預報的結(jié)果對初始條件的微小誤差都相當敏感,多模式集成技術(shù)在此基礎(chǔ)上將各中心模式預報結(jié)果進行集成分析以減小單個數(shù)值預報模式的系統(tǒng)性偏差.多模式集成預報在一定程度上為未來氣象預報的精確度和可信度提供了強有力的依據(jù).多模式集成預報方法,能改進季節(jié)氣候預測技巧、提高中短期預報準確性、并且方便實用[18],在國際上得到廣泛研究與應(yīng)用[19-20].
表2 氣象因素各預報方式的擬合優(yōu)度
本研究利用長短期記憶(LSTM)神經(jīng)網(wǎng)絡(luò)對ecmwf_thin數(shù)值預報、japan_thin數(shù)值預報、t639_thin數(shù)值預報和germany數(shù)值預報這4種模式預報進行后處理預報試驗,以提高最終預報準確性,本文將預報前各數(shù)值預報模式的歷史預報數(shù)據(jù)作為訓練數(shù)據(jù),通過LSTM神經(jīng)網(wǎng)絡(luò)建立多模式集成預報模型.
長短期記憶(LSTM)神經(jīng)網(wǎng)絡(luò)解決了循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)無法記憶較長時間之前的歷史數(shù)據(jù)情況,即隨著時間的推移RNN無法對信息之間的關(guān)聯(lián)進行較有效的學習等問題,所以LSTM神經(jīng)網(wǎng)絡(luò)具有對信息的長期記憶能力和學習能力.在氣象因素預報中,LSTM神經(jīng)網(wǎng)絡(luò)可以通過對過去時刻預報的歷史數(shù)據(jù)進行分析學習后,較好地獲取到時間序列中所隱藏的深層次關(guān)系,同時又不會產(chǎn)生梯度衰減等現(xiàn)象,該神經(jīng)網(wǎng)絡(luò)可以為未來氣象要素預報預測打下良好的基礎(chǔ)[21].
為此,本研究中將ecmwf_thin數(shù)值預報、japan_thin數(shù)值預報、t639_thin數(shù)值預報和germany數(shù)值預報的歷史預報數(shù)據(jù)和實測數(shù)據(jù)作為LSTM神經(jīng)網(wǎng)絡(luò)模型的訓練數(shù)據(jù)建立多模式集成預報模型.通過對2018年11月到2021年10月21日的4種數(shù)值預報模式進行訓練得到各集成預報成員的權(quán)重值,然后用2021年10月22日到11月30日的這4種數(shù)值預報數(shù)據(jù)作為多模式集成預報模型的測試集進行測試.圖1為4種數(shù)值預報中每種數(shù)值預報模式和多模式集成預報模式結(jié)果的對比分析.
采用擬合優(yōu)度作為實驗結(jié)果評價指標,擬合優(yōu)度的公式如下,
(5)
TSS=∑(Yi-Y)2,
(6)
(7)
圖1 多模式集成預報與數(shù)值預報結(jié)果對比
由于城市AQI預測是一個多變量、非線性問題,而神經(jīng)網(wǎng)絡(luò)對于這類復雜的非線性關(guān)系問題具有很好的處理能力,因此近年來被廣泛地應(yīng)用于空氣質(zhì)量預測研究中并都取得了不錯得到反響.其中生成式對抗網(wǎng)絡(luò)(generative adversarial networks,GAN)由生成網(wǎng)絡(luò)和對抗網(wǎng)絡(luò)組成,并且是利用這兩個網(wǎng)絡(luò)對抗學習來互相權(quán)衡的深度學習模型,其避免了很多難以處理的概率分布問題,因此在圖像領(lǐng)域[22-23]、數(shù)據(jù)集增強[24-25]、自然語言處理等多個領(lǐng)域均有顯著的成績.此外,生成式對抗網(wǎng)絡(luò)還能挖掘出復雜的非線性問題中所隱含的深層次關(guān)系,可提高其預測能力.黃文琦等[26]采用GAN全局和局部生成相結(jié)合的方法對變電站工作人員行為進行預測,通過挖掘時間序列信息動態(tài)提高了預測能力.王靜等[27]利用生成對抗網(wǎng)絡(luò)對2002—2019年的滬深300指數(shù)進行預測,實驗結(jié)果表明將生成對抗網(wǎng)絡(luò)用于金融時間序列預測能提高預測精度,同時驗證了預測方法的有效性.為了進一步鞏固GAN的穩(wěn)定性以及擴展其應(yīng)用領(lǐng)域,許多學者在此基礎(chǔ)上提出了條件生成對抗網(wǎng)絡(luò)來解決原始網(wǎng)絡(luò)存在的部分問題.
GAN由生成網(wǎng)絡(luò)和對抗網(wǎng)絡(luò)組成,生成網(wǎng)絡(luò)通過對數(shù)據(jù)的真實樣本進行學習,從而產(chǎn)生新的樣本來“欺騙”對抗網(wǎng)絡(luò),對抗網(wǎng)絡(luò)則通過判斷輸入的樣本是真實樣本還是生成網(wǎng)絡(luò)生成的樣本,兩個網(wǎng)絡(luò)通過對抗學習來互相權(quán)衡進而優(yōu)化自身的參數(shù).條件生成對抗網(wǎng)絡(luò)(conditional generative adversarial nets, CGAN)分別在生成網(wǎng)絡(luò)和判別網(wǎng)絡(luò)中額外增加了條件信息c,該條件信息可以是類別信息也可以是其他任何的輔助信息,它可指導數(shù)據(jù)的生成過程,將GAN從無監(jiān)督模型變成了有監(jiān)督模型,其在非線性時間序列中也得到了應(yīng)用.林珊等[28]提出利用條件生成對抗網(wǎng)絡(luò)的博弈訓練,將負荷影響因素作為條件生成預測負荷數(shù)據(jù),進行短期負荷預測,實驗結(jié)果驗證了所提模型可提高短期負荷的預測精度.為此,本研究提出采用基于條件生成網(wǎng)絡(luò)建立城市AQI預測模型.CGAN的整體結(jié)構(gòu)如圖2所示.
圖2 CGAN結(jié)構(gòu)
在本研究的預測模型中,圖2中z代表隨機噪聲.c代表CGAN中額外增加的條件信息,即c代表歷史AQI數(shù)據(jù)以及AQI的其他影響因子,其他影響因子在本研究中即為污染物因子和氣象因子.x代表真實樣本即同一時間段的實測AQI數(shù)據(jù),G(z|c)代表生成模型產(chǎn)生的預測樣本即預測的AQI數(shù)據(jù).L(G|D)代表反饋即網(wǎng)絡(luò)模型的損失函數(shù).將隨機噪聲z和條件信息c作為輸入因子輸入到生成模型,然后生成模型產(chǎn)生預測樣本G(z|c).真實樣本x與預測樣本G(z|c)分別和條件信息c一起作為輸入因子到判別模型里進行判別,然后將判別結(jié)果分別反饋給生成模型和判別模型.生成模型和判別模型根據(jù)反饋結(jié)果來優(yōu)化更新各自的參數(shù),從而提高自身的生成能力和判別能力[28].
在城市AQI預測中,使用歷史實測AQI數(shù)據(jù)、同期歷史實測污染物數(shù)據(jù)、基于多模式集成的氣象因子數(shù)據(jù)建立數(shù)據(jù)集.其中,歷史實測AQI數(shù)據(jù)作為真實樣本,同期歷史實測污染物數(shù)據(jù)、基于多模式集成的氣象因子數(shù)據(jù)作為條件信息.然后將符合高斯分布的隨機噪聲z和條件信息c作為生成網(wǎng)絡(luò)的輸入因子,生成網(wǎng)絡(luò)盡可能產(chǎn)生接近真實AQI數(shù)據(jù)的預測AQI數(shù)據(jù),接著預測AQI數(shù)據(jù)和真實AQI數(shù)據(jù)分別與條件信息進行拼接輸入到判別網(wǎng)絡(luò),判別網(wǎng)絡(luò)判斷生成網(wǎng)絡(luò)產(chǎn)出的預測AQI數(shù)據(jù)為真實AQI數(shù)據(jù)的概率,同時還判斷預測的AQI數(shù)據(jù)是否滿足條件信息c.圖3為基于CGAN神經(jīng)網(wǎng)絡(luò)的預測模型.
圖3 基于CGAN的AQI預測模型
CGAN的損失函數(shù)如公式(8),其中Ex,c(.)代表x分布和c分布的期望值,G(.)表示生成模型輸出的數(shù)據(jù),D(.)表示判別模式輸出的數(shù)據(jù).生成器根據(jù)添加的條件信息c和噪聲z生成一個偽樣本.判別器接收偽樣本、真實樣本和條件信息c,判斷接收樣本的真假并輸出判別結(jié)果.整個訓練過程歸結(jié)為生成器和判別器之間的動態(tài)的極大極小博弈過程.
lCGAN(G,D)=Ex,c[logD(x,c)]+
Ex,z{log {1-D[x,G(x,z)]}}.
(8)
為了保證預測數(shù)據(jù)更加接近于真實數(shù)據(jù),在損失函數(shù)中加入L1損失函數(shù),其中L1損失函數(shù)的公式如公式(9)所示:
lL1(G)=Ex,c,z[‖c-G(x,z)‖1].
(9)
為此,算法的損失函數(shù)最終定義為:
(10)
公式(10)中:‖.‖表示計算絕對偏差.
本研究中將收集到的四川省內(nèi)江市2018年11月到2021年10月21日的氣象因子的歷史數(shù)值預報數(shù)據(jù)、污染物的歷史實測數(shù)據(jù)和同期內(nèi)江市AQI的歷史實測數(shù)據(jù)作為CGAN預測模型和其他預測模型的輸入訓練預測模型.然后用2021年10月22日到11月5日的數(shù)據(jù)作為測試集進行測試.選擇1.3章節(jié)中的擬合優(yōu)度作為CGAN預測模型的實驗結(jié)果評價指標.實驗結(jié)果如圖4所示.圖4(a)為BP神經(jīng)網(wǎng)絡(luò)模型的預測值與真實值之間的對比圖,圖4(b)為統(tǒng)計分析模型預測值與真實值之間對比圖,圖4(c)為CGAN神經(jīng)網(wǎng)絡(luò)預測值與真實值之間對比圖,圖正上方R2是計算的預測值與真實值之間的擬合優(yōu)度,從圖中可以看出使用CGAN神經(jīng)網(wǎng)絡(luò)模型預測的AQI值與真實值之間的擬合優(yōu)度為0.933 02,比其他兩種預測模型的擬合優(yōu)度高,由此可見該預測模型的準確率相比于其他兩種模型的準確率有一定的提高.
圖4 不同模型預測值對比
本研究中將ecmwf_thin數(shù)值預報、japan_thin數(shù)值預報、t639_thin數(shù)值預報和germany數(shù)值預報的氣象因子歷史預報數(shù)據(jù)和氣象因子實測數(shù)據(jù)作為LSTM神經(jīng)網(wǎng)絡(luò)模型的訓練數(shù)據(jù)建立氣象因子的多模式集成預報模型.通過對2018年11月到2021年10月21日的4種氣象因子數(shù)值預報模式進行訓練得到各集成預報成員的權(quán)重值,然后用2021年10月22日到11月5日的這4種數(shù)值預報數(shù)據(jù)作為多模式集成預報模型的測試集進行測試,得到氣象因子的多模式集成預報結(jié)果,最后將氣象的多模式集成預報結(jié)果、污染物因子、AQI歷史實測數(shù)據(jù)作為CGAN預測模型的輸入因子對AQI進行預測.實驗結(jié)果如圖5所示,結(jié)合多模式集成預報的CGAN模型的預測值與真實值之間的擬合優(yōu)度為0.940 17,比沒有結(jié)合多模式集成預報的CGAN模型預測值的擬合優(yōu)度0.933 02,提高了0.007 15,可以看出將氣象因子的多模式集成預報結(jié)果作為氣象因子的輸入在一定程度上可提高AQI的預測精度.
圖5 結(jié)合多模式集成預報的CGAN模型的預測值對比
為了提高短期城市AQI預測準確率,提出了一種結(jié)合氣象因子多模式集成預報的基于條件生成對抗網(wǎng)絡(luò)的AQI預測模型.實驗表明,利用互信息熵篩選出氣象因子后,再通過利用長短期記憶神經(jīng)網(wǎng)絡(luò)對氣象因子的4種數(shù)值預報數(shù)據(jù)進行多模式集合預報,有助于提高氣象因子的預報準確性;最后利用CGAN神經(jīng)網(wǎng)絡(luò)對AQI進行預測可提高最終AQI的預測精度.