潘欣玉,鄭 亮
(中國石油大學(xué)(華東)計算機(jī)科學(xué)與技術(shù)學(xué)院,青島 266580)
近年來,空氣質(zhì)量成為人們越來越關(guān)心的問題,大氣污染物濃度預(yù)測對于預(yù)防地區(qū)污染具有重要的意義.區(qū)域內(nèi)的污染物濃度預(yù)測,可以對區(qū)域空氣質(zhì)量的微變化及時做出響應(yīng).污染物的預(yù)警對于區(qū)域可持續(xù)發(fā)展具有十分重要的作用,可為政府決策制定、環(huán)境監(jiān)管[1-3]執(zhí)行提供技術(shù)支持,因此研究污染物預(yù)測工作具有重要意義.
現(xiàn)階段對于污染物預(yù)測的研究包含數(shù)值模擬及統(tǒng)計計算兩部分.數(shù)值模擬[4,5]方法充分研究污染物在大氣中的遷移變化,預(yù)測的精確度較高.但在預(yù)測過程中需要收集復(fù)雜的物化數(shù)據(jù),計算過程冗雜,且需應(yīng)用氣象、物化等多學(xué)科知識,預(yù)測工作較為繁瑣; 統(tǒng)計計算為污染物預(yù)測工作提供了廣泛思路,可應(yīng)用各種神經(jīng)網(wǎng)絡(luò)模型進(jìn)行污染物預(yù)測工作[6,7],通過對神經(jīng)網(wǎng)絡(luò)模型的構(gòu)建及統(tǒng)計計算可以實現(xiàn)簡易精確的預(yù)測.然而當(dāng)前神經(jīng)網(wǎng)絡(luò)預(yù)測模型多為前饋型神經(jīng)網(wǎng)絡(luò),其輸出結(jié)果僅與當(dāng)前輸入有關(guān),無法研究污染物數(shù)據(jù)前后依賴關(guān)系,因而需構(gòu)建一種可以對前后依賴序列數(shù)據(jù)進(jìn)行預(yù)測的模型.且由于多種污染物具有相同排放源,所以多個污染物間往往存在潛在關(guān)聯(lián)關(guān)系,使得一種污染物濃度的變化可反映出其他污染物濃度變化情況,以往預(yù)測方法中,無論數(shù)值模擬還是統(tǒng)計計算均未考慮應(yīng)用污染物間關(guān)聯(lián)關(guān)系進(jìn)行預(yù)測工作.
針對上述兩個問題,本文充分考慮LSTM神經(jīng)網(wǎng)絡(luò)在處理時間序列數(shù)據(jù)前后依賴關(guān)系的優(yōu)勢,應(yīng)用待預(yù)測污染物及其敏感參數(shù)之間的關(guān)聯(lián)關(guān)系,實現(xiàn)區(qū)域污染物的濃度預(yù)測工作.本文將關(guān)聯(lián)規(guī)則算法[8,9]與多元回歸分析[10,11]結(jié)合應(yīng)用,發(fā)現(xiàn)待預(yù)測污染物的敏感參數(shù),在此基礎(chǔ)上構(gòu)建LSTM模型,將待預(yù)測污染物及其敏感參數(shù),全部作為LSTM預(yù)測模型的輸入變量,從而更加準(zhǔn)確的實現(xiàn)對各種重點污染物濃度的預(yù)測.
當(dāng)前污染物濃度分析預(yù)測方法主要有機(jī)理類與非機(jī)理類兩個方向.機(jī)理類方法中數(shù)值模擬[1,2]涉及復(fù)雜物化流程,需要建立完整的污染物擴(kuò)散過程相關(guān)物化模型[12],將污染物的排放、擴(kuò)散、遷移、轉(zhuǎn)化過程使用復(fù)雜的偏微分方程來解析,通過展示模式得到空氣污染物濃度的空間分布及變化趨勢.
非機(jī)理類方法對污染物排放的復(fù)雜機(jī)理過程不做過多要求,主要是基于歷史數(shù)據(jù)應(yīng)用統(tǒng)計學(xué)方法構(gòu)建神經(jīng)網(wǎng)絡(luò)預(yù)測模型[3,4].孫寶磊等[13,14]建立BP預(yù)測模型對污染物的日均濃度進(jìn)行預(yù)測,通過對模擬輸出值和期望輸出值誤差的迭代計算調(diào)整,使BP神經(jīng)網(wǎng)絡(luò)預(yù)測輸出不斷逼近期望輸出,直至誤差滿足要求.方彥[15]構(gòu)建RBF神經(jīng)網(wǎng)絡(luò)模型,基于歷史數(shù)據(jù)作為訓(xùn)練樣本構(gòu)建模型并以同期數(shù)據(jù)作為測試樣本,并選取2018年同期數(shù)據(jù)作為測試樣本對區(qū)域污染物進(jìn)行預(yù)測.郭曉君等[16,17]基于GM(1,1)模型、Verhulst模型和SCGM(1,1)模型建立組合灰色預(yù)測模型,運(yùn)用預(yù)測有效度方法確定組合預(yù)測模型的權(quán)重系數(shù),利用模型預(yù)測污染物排放量,通過灰色系統(tǒng)GM(1,1)殘差修正模型對大氣污染物濃度進(jìn)行預(yù)測.支持向量機(jī)在大氣污染物濃度預(yù)測方面也有應(yīng)用[18-21],在對各類影響因子進(jìn)行分析的基礎(chǔ)上進(jìn)行建模預(yù)測,利用PCA方法對輸入因子降維形成支持向量機(jī)的訓(xùn)練樣本集,建立大氣污染預(yù)模型.Haewon等通過構(gòu)建聚類回歸模型[22-24]進(jìn)行污染物濃度預(yù)測,根據(jù)氣象要素與污染物濃度數(shù)據(jù)資料,分析天氣變化規(guī)律,挖掘若干種天氣類型,并分析各種天氣類型的典型參數(shù),將這些參數(shù)與相應(yīng)的環(huán)境質(zhì)量實測數(shù)據(jù)通過回歸分析[25-27]建立定量關(guān)系,根據(jù)定量關(guān)系進(jìn)行污染物濃度預(yù)測.杜續(xù)等[28]針對神經(jīng)網(wǎng)絡(luò)算法在當(dāng)前污染物濃度預(yù)測領(lǐng)域存在的易過擬合、網(wǎng)絡(luò)結(jié)構(gòu)復(fù)雜、學(xué)習(xí)效率低等問題,引入隨機(jī)森林回歸算法,分析氣象條件、大氣污染物濃度和季節(jié)所包含的多項特征因素,通過調(diào)整參數(shù)的最優(yōu)組合,設(shè)計出一種新的污染物濃度預(yù)測模型—RFRP模型.馬天成等[29]采用一種改進(jìn)型PSO優(yōu)化的模糊神經(jīng)網(wǎng)絡(luò),將粒子群算法與模糊神經(jīng)網(wǎng)絡(luò)進(jìn)行融合,發(fā)揮PSO算法全局尋優(yōu)的特點,預(yù)測污染物濃度的變化規(guī)律.
在污染物預(yù)測領(lǐng)域,機(jī)理類方法預(yù)測過程較為復(fù)雜,需要綜合污染物遷移過程中各種物化因素,因此機(jī)理類方法通用性較低.在以往非機(jī)理類模型中,前饋型神經(jīng)網(wǎng)絡(luò)未考慮時間序列依賴關(guān)系.以上兩種方法均未考慮污染物間關(guān)聯(lián)關(guān)系的影響,準(zhǔn)確性有待提高.因此,本文充分考慮污染物間的具有關(guān)聯(lián)關(guān)系的特點,以此為基礎(chǔ)建立基于敏感參數(shù)發(fā)現(xiàn)的LSTM預(yù)測模型[30-33]的污染物預(yù)測模型,應(yīng)用待預(yù)測污染物及其敏感參數(shù)的關(guān)聯(lián)關(guān)系來提高模型的預(yù)測精確度.
在現(xiàn)實情況中,由于污染源并非排放單一類型的污染物,多種污染物具有相同排放源,污染物間往往存在潛在關(guān)系,一種污染物的變化可能反映另一種污染物變化,所以在污染物濃度預(yù)測工作中可應(yīng)用污染物間的關(guān)系進(jìn)行預(yù)測,即需考慮待預(yù)測污染物敏感參數(shù)這一影響因素.基于上述問題,本文將污染物預(yù)測工作分為兩階段進(jìn)行.
(1)基于關(guān)聯(lián)規(guī)則與多元回歸分析的敏感參數(shù)發(fā)現(xiàn)方法.在該方法中,首先應(yīng)用關(guān)聯(lián)規(guī)則算法對污染物數(shù)據(jù)集進(jìn)行關(guān)聯(lián)關(guān)系發(fā)現(xiàn),初步挖掘出各污染物的敏感參數(shù).再應(yīng)用多元回歸分析實現(xiàn)各污染物間相關(guān)性分析,將各污染物的相關(guān)性分析結(jié)果與關(guān)聯(lián)性分析結(jié)果取交集,保留二者共同部分,保證敏感參數(shù)發(fā)現(xiàn)的完備性與準(zhǔn)確性,并通過對比試驗驗證了敏感參數(shù)的有效性.最終實現(xiàn)各污染物敏感參數(shù)的發(fā)現(xiàn),為后續(xù)污染物預(yù)測工作的開展奠定基礎(chǔ).
(2)基于敏感參數(shù)發(fā)現(xiàn)的污染物預(yù)測方法.由于污染物數(shù)據(jù)存在時間序列上的前后依賴關(guān)系,將待預(yù)測污染物及其敏感參數(shù)作為預(yù)測模型特征變量,實現(xiàn)污染物濃度預(yù)測工作.在該部分工作中,通過對現(xiàn)有的LSTM預(yù)測模型的改進(jìn)完成污染物濃度預(yù)測工作.
本文采用關(guān)聯(lián)規(guī)則算法進(jìn)行污染物間關(guān)聯(lián)性關(guān)系發(fā)現(xiàn).針對污染物參數(shù)數(shù)據(jù),首先對污染物參數(shù)值分區(qū)間處理,依據(jù)污染物數(shù)值最小值及最大值對參數(shù)數(shù)據(jù)三等分.例如SO2用S表示,分為S1、S2、S3.S1表示SO2濃度很小,S2表示SO2濃度中等,S3表示SO2濃度大.O3用O表示,NO2用N表示,CO用C表示,PM2.5用P表示,PM10用M表示.其中,參數(shù)程度詞的等級越高代表的值越大.
(1)首先基于式(1)計算每個參數(shù)程度詞集的支持度.
(2)不斷迭代使用上一次得到的(k-1)項頻繁項集,計算頻繁項集中參數(shù)程度詞的支持度,保留滿足支持度閾值ST的參數(shù)程度集,產(chǎn)生新的候選k項頻繁項集Lk,直到?jīng)]有新的頻繁項集產(chǎn)生.
(3)獲取k項頻繁項集Lk的關(guān)聯(lián)規(guī)則Ls→Lk?s,其中,Ls表示由s個參數(shù)程度詞組成的程度詞集,Lk?s表示去掉Lk中s個參數(shù)程度詞剩余的程度詞組成的程度詞集.
(4)計算每個候選關(guān)聯(lián)規(guī)則的置信度,置信度的計算公式如式(2).
(5)設(shè)置一個置信度閾值CT,當(dāng)一個項集內(nèi)所有子集之間的置信度都滿足置信度閾值CT時,則認(rèn)為該項集內(nèi)的所有程度詞之間具有較強(qiáng)的關(guān)聯(lián)性,并留下這樣的項集,保留到關(guān)聯(lián)規(guī)則集中.
針對污染物指標(biāo)數(shù)據(jù),應(yīng)用回歸分析中的相關(guān)系數(shù)法獲取各個污染物指標(biāo)之間的相關(guān)系數(shù),發(fā)現(xiàn)各個污染物指標(biāo)之間的相關(guān)性程度,綜合污染物間關(guān)聯(lián)規(guī)則進(jìn)一步發(fā)現(xiàn)污染物間關(guān)系.
回歸分析使用相關(guān)系數(shù)來度量污染物指標(biāo)之間線性相關(guān)關(guān)系.其定義如式(3)所示.
求得兩污染物指標(biāo)相關(guān)系數(shù)后,應(yīng)用T檢驗判斷自變量X中影響因子對因變量Y的影響顯著性程度,T統(tǒng)計量計算公式如下:
根據(jù)t檢驗表,查得顯著水平α的臨界值tα.若t>tα,則拒絕原假設(shè),說明兩指標(biāo)間具有較強(qiáng)相關(guān)性; 否則,說明兩指標(biāo)間相關(guān)性不強(qiáng).
本文在進(jìn)行污染物預(yù)測研究時充分考慮污染物敏感參數(shù)及時間序列關(guān)系,通過對LSTM預(yù)測模型進(jìn)行改進(jìn),實現(xiàn)污染物預(yù)測工作.本文預(yù)測工作的改進(jìn)主要有以下兩點:
(1)模型預(yù)測參數(shù)及輸入特征的選擇.在模型構(gòu)建之前引入?yún)?shù)choose_target來進(jìn)行待預(yù)測污染物的選擇,choose_target取值為0-5,分別代表SO2、NO2、PM10、PM2.5、O3、CO六種污染物,選擇不同參數(shù)值即對不同污染物預(yù)測,例如choose_target=3則代表此時的待預(yù)測污染物為PM2.5.設(shè)置參數(shù)needed_target來進(jìn)行待預(yù)測污染物輸入特征的選擇,needed_target取值同樣為0-5.例如needed_target=[0,1,2]則代表此時預(yù)測模型輸入特征為SO2、NO2、PM10.
(2)本模型在預(yù)測過程中采用了滾動預(yù)測的方式.采用“早停止”策略判斷模型收斂性,首先將污染物輸入特征數(shù)據(jù)輸入到模型進(jìn)行濃度預(yù)測,得出未來一天的污染濃度數(shù)據(jù)并記錄; 然后將實際輸出結(jié)果加入下一條樣本的污染物濃度特征中,與其他敏感參數(shù)特征共同作為訓(xùn)練樣本再次預(yù)測未來一天的污染濃度數(shù)據(jù),依次類推,得到預(yù)測結(jié)果.
基于LSTM重點污染物預(yù)測模型框架如圖1所示.
圖1 基于LSTM主要污染物預(yù)測模型框架
本文使用Keras深度框架構(gòu)建LSTM模型.預(yù)測模型的構(gòu)建流程包括以下4個步驟.
(1)構(gòu)建模型
本預(yù)測模型包含一個LSTM神經(jīng)網(wǎng)絡(luò)層和一個全連接層,兩層之間順序連接.首先設(shè)置LSTM神經(jīng)網(wǎng)絡(luò)層:一種污染物具有n個敏感參數(shù),則訓(xùn)練集特征數(shù)為n+1,因此模型的輸入層特征維度設(shè)置為n+1,并設(shè)置時間步長及循環(huán)神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)內(nèi)部Sigmoid層和tanh層的神經(jīng)元數(shù)量,最后設(shè)置預(yù)測模型輸出層,用于輸出污染物預(yù)測結(jié)果.
(2)模型參數(shù)設(shè)置
本模型采用均方誤差作為模型的損失函數(shù),采用Adam優(yōu)化算法作為模型優(yōu)化器,在模型訓(xùn)練過程中設(shè)置每次迭代訓(xùn)練的樣本數(shù)據(jù)量、訓(xùn)練輪數(shù)、模型學(xué)習(xí)率.
(3)模型預(yù)測過程
模型采用滾動預(yù)測的方式,首先將污染物輸入特征數(shù)據(jù)輸入到模型進(jìn)行濃度預(yù)測,得出未來一天的污染濃度數(shù)據(jù)并記錄; 然后將實際輸出結(jié)果加入下一條樣本的污染物濃度特征中,與其他敏感參數(shù)特征共同作為訓(xùn)練樣本再次預(yù)測未來一天的污染濃度數(shù)據(jù),依次類推,得到預(yù)測結(jié)果.
(4)模型評價
用式(5)計算各污染物指標(biāo)預(yù)測數(shù)據(jù)與真實數(shù)據(jù)間均方根誤差RMS E.
其中,xi為第i個數(shù)據(jù)點污染物指標(biāo)濃度的實測值,為第i個數(shù)據(jù)點污染物指標(biāo)濃度的預(yù)測值,n為數(shù)據(jù)長度.
(1)對原始環(huán)保監(jiān)測數(shù)據(jù)進(jìn)行數(shù)據(jù)清洗、去除無用數(shù)據(jù)、數(shù)據(jù)標(biāo)準(zhǔn)化等操作得到預(yù)處理后的數(shù)據(jù)集.
(2)掃描預(yù)處理后環(huán)保監(jiān)測數(shù)據(jù)集,得到滿足支持度閾值ST的k項頻繁項集,基于k項頻繁項集組合得到候選關(guān)聯(lián)規(guī)則集,將所有滿足置信度閾值CT的污染物間關(guān)聯(lián)規(guī)則加入關(guān)聯(lián)規(guī)則集.
(3)再次掃描環(huán)保監(jiān)測數(shù)據(jù)集,得到污染物兩兩之間的相關(guān)系數(shù),保留相關(guān)系數(shù)大于0.5的污染物關(guān)系,將各污染物的相關(guān)性分析結(jié)果與關(guān)聯(lián)性分析結(jié)果取交集,保留二者共同部分,實現(xiàn)污染物的敏感參數(shù)發(fā)現(xiàn)工作.
(4)綜合(2)(3)所發(fā)現(xiàn)的各污染物的敏感參數(shù),以與待預(yù)測污染物及其敏感參數(shù)作為預(yù)測模型輸入變量,實現(xiàn)對污染物的濃度預(yù)測.
本實驗使用區(qū)域內(nèi)8個環(huán)保監(jiān)測點所得的環(huán)保監(jiān)測數(shù)據(jù),實驗數(shù)據(jù)共有209 340條數(shù)據(jù).
本實驗數(shù)據(jù)預(yù)處理操作包含數(shù)據(jù)清洗及數(shù)據(jù)標(biāo)準(zhǔn)化.首先對數(shù)據(jù)進(jìn)行數(shù)據(jù)清洗,去除異常數(shù)據(jù)點及空白數(shù)據(jù)、重復(fù)數(shù)據(jù).其次,進(jìn)行數(shù)據(jù)標(biāo)準(zhǔn)化操作,針對清洗后數(shù)據(jù)采用式(6)進(jìn)行標(biāo)準(zhǔn)化操作.
其中,x為數(shù)據(jù)清洗后的環(huán)保監(jiān)測數(shù)據(jù),μ為所有樣本數(shù)據(jù)的均值,σ為所有樣本數(shù)據(jù)的標(biāo)準(zhǔn)差.
3.3.1 污染物間關(guān)聯(lián)分析
設(shè)置支持度5%,置信度60%,通過污染物指標(biāo)間關(guān)聯(lián)規(guī)則挖掘,得到污染物指標(biāo)間的關(guān)聯(lián)規(guī)則集,可初步挖掘出污染物間的關(guān)聯(lián)關(guān)系,結(jié)果如表1所示.
3.3.2 污染物間相關(guān)性分析
為進(jìn)一步發(fā)現(xiàn)污染物指標(biāo)間的相關(guān)性,對污染物指標(biāo)進(jìn)行相關(guān)性分析,結(jié)果如表2所示.
當(dāng)相關(guān)系數(shù)大于0.5則兩種指標(biāo)相關(guān)性較強(qiáng),綜合表1與表2結(jié)果,污染物間關(guān)系發(fā)現(xiàn)結(jié)果如表3所示.
表1 重點污染物關(guān)聯(lián)規(guī)則結(jié)果表
表2 重點污染物相關(guān)系數(shù)表
表3 重點污染物關(guān)系表
3.4.1 基于敏感參數(shù)發(fā)現(xiàn)的LSTM污染物預(yù)測
針對關(guān)聯(lián)規(guī)則算法與多元回歸分析挖掘的污染物關(guān)系,預(yù)測模型構(gòu)建時,對SO2的預(yù)測輸入變量設(shè)置為SO2; 對NO2的預(yù)測輸入變量為NO2、CO、O3; 對CO的預(yù)測輸入變量為CO、NO2、PM10、PM2.5; 對O3的預(yù)測輸入變量為O3、NO2; 對PM10的預(yù)測輸入變量為PM10、CO、PM2.5; 對PM2.5的預(yù)測輸入變量為PM2.5、CO、PM10.將數(shù)據(jù)預(yù)處理后的數(shù)據(jù)集中的后600條數(shù)據(jù)作為測試集數(shù)據(jù),其余作為訓(xùn)練集數(shù)據(jù),并將訓(xùn)練集中10%的數(shù)據(jù)作為驗證集數(shù)據(jù).采用前24個時刻的污染物濃度數(shù)據(jù)對下一時刻污染物濃度數(shù)據(jù)進(jìn)行預(yù)測,時間步長設(shè)置為24,每次迭代訓(xùn)練的樣本數(shù)據(jù)量設(shè)置為96,將學(xué)習(xí)率設(shè)置為0.0001,訓(xùn)練輪數(shù)次數(shù)設(shè)置為50,隱藏層神經(jīng)元數(shù)量設(shè)置為256.
如果模型兩次迭代之間損失值變化已經(jīng)很小,那么說明模型收斂,可以結(jié)束訓(xùn)練.因此,為驗證本文模型的收斂性,引入“早停止”策略.當(dāng)驗證集與訓(xùn)練集上模型損失已不再變化時,無論是否達(dá)到所設(shè)置的迭代次數(shù),均停止模型訓(xùn)練.
本文模型構(gòu)建之初迭代次數(shù)設(shè)置為50次,但是由圖2所知,當(dāng)模型迭代次數(shù)為16次時,模型已達(dá)收斂,所以此時停止模型訓(xùn)練,以減少模型損耗提高訓(xùn)練性能.
圖2 模型收斂性判別圖
為檢驗和說明本文提出模型的預(yù)測性能,將本文污染物預(yù)測模型與未經(jīng)敏感參數(shù)發(fā)現(xiàn)的LSTM模型進(jìn)行對比預(yù)測.對比結(jié)果如圖3-圖12所示.
圖3 本文SO2預(yù)測結(jié)果擬合圖
圖4 未經(jīng)敏感參數(shù)發(fā)現(xiàn)SO2預(yù)測結(jié)果擬合圖
圖5 本文NO2預(yù)測結(jié)果擬合圖
圖3-圖12中,Forecast-model1為經(jīng)敏感參數(shù)發(fā)現(xiàn)的LSTM預(yù)測模型結(jié)果; Forecast-model2為未經(jīng)敏感參數(shù)發(fā)現(xiàn)的預(yù)測模型結(jié)果; Real_data為污染物真實值.可以看出,本文模型預(yù)測效果優(yōu)于未經(jīng)敏感參數(shù)發(fā)現(xiàn)的對比模型,能夠較好地跟蹤各種污染物濃度變化趨勢,并響應(yīng)其波動變化,實現(xiàn)相對精確的預(yù)測.
圖6 未經(jīng)敏感參數(shù)發(fā)現(xiàn)NO2預(yù)測結(jié)果擬合圖
圖7 本文CO預(yù)測結(jié)果擬合圖
圖8 未經(jīng)敏感參數(shù)發(fā)現(xiàn)CO預(yù)測結(jié)果擬合圖
圖9 本文O3預(yù)測結(jié)果擬合圖
圖10 未經(jīng)敏感參數(shù)發(fā)現(xiàn)O3預(yù)測結(jié)果擬合圖
圖11 本文PM10預(yù)測結(jié)果擬合圖
圖12 未經(jīng)敏感參數(shù)發(fā)現(xiàn)PM10預(yù)測結(jié)果擬合圖
3.4.2 污染物預(yù)測對比評估結(jié)果
根據(jù)SO2、NO2、CO、O3、PM10、PM2.5六種污染物預(yù)測值與真實值情況,兩種污染物預(yù)測模型誤差對比情況如表4所示.
表4 模型均方根誤差評估表
由圖3-圖14及表4所知,經(jīng)污染物敏感參數(shù)發(fā)現(xiàn)的預(yù)測模型擬合效果與預(yù)測誤差均優(yōu)于對比模型.由此,證實了本文預(yù)測模型預(yù)測效果優(yōu)于未經(jīng)敏感參數(shù)發(fā)現(xiàn)的LSTM模型.
圖13 本文PM2.5預(yù)測結(jié)果擬合圖
圖14 未經(jīng)敏感參數(shù)發(fā)現(xiàn)PM2.5預(yù)測結(jié)果擬合圖
本文提出了一種基于敏感參數(shù)發(fā)現(xiàn)的區(qū)域重點污染物濃度預(yù)測方法.該方法主要包含3個模塊,即數(shù)據(jù)預(yù)處理模塊、重點污染物敏感參數(shù)發(fā)現(xiàn)模塊、污染物預(yù)測模塊.其中,在數(shù)據(jù)預(yù)處理模塊主要是針對將原始數(shù)據(jù)進(jìn)行數(shù)據(jù)清洗、數(shù)據(jù)標(biāo)準(zhǔn)化操作.在重點污染物敏感參數(shù)發(fā)現(xiàn)模塊對環(huán)保監(jiān)測數(shù)據(jù)應(yīng)用關(guān)聯(lián)規(guī)則算法、多元回歸分析挖掘出各污染物的強(qiáng)相關(guān)污染物,為預(yù)測模型構(gòu)建時輸入變量的設(shè)置提供依據(jù).在污染物預(yù)測模塊構(gòu)建LSTM污染物預(yù)測模型,基于挖掘所得各污染物間的敏感參數(shù)設(shè)置輸入變量,使用均方根誤差評估模型性能,證實本文模型較之以往未經(jīng)污染物間關(guān)系發(fā)現(xiàn)的LSTM模型精確度較高.可有效實現(xiàn)環(huán)境污染預(yù)測完成由“滯后”到“超前”的轉(zhuǎn)變.本文雖已實現(xiàn)重點污染物的預(yù)測,但是重點污染物的追蹤工作同樣是環(huán)保監(jiān)測的重點工作,因此,下一步將研究重點污染物的溯源追蹤工作,即依據(jù)污染物歷史數(shù)據(jù)及各行業(yè)企業(yè)排污數(shù)據(jù)查清重點污染物的排放源頭,從而與污染物預(yù)測共同為環(huán)保監(jiān)測工作提供技術(shù)支撐.