李付蘭
(寧夏環(huán)境科學(xué)研究院(有限責任公司)寧夏銀川 750011)
近年來,銀川市大氣污染呈現(xiàn)復(fù)合型污染特征,顆粒物(PM10)、臭氧(O3)污染問題凸顯,增加了空氣污染防治的難度。銀川市于2017 年建立了空氣質(zhì)量多模式預(yù)報系統(tǒng),包括1 個統(tǒng)計模式和4 個數(shù)值模式,數(shù)值模式系統(tǒng)包括CMAQ、NAQPMS、WRF-Chem 和CAMx 模式[1]。由于WRF 模擬的氣象場具有不確定性,排放清單的分配也無法達到非常精細且與實際排放情況完全相符,數(shù)值模式系統(tǒng)對一些具有復(fù)雜化學(xué)反應(yīng)機制的污染物生成機理不太清晰,導(dǎo)致預(yù)報結(jié)果準確性不夠,尤其是對O3濃度的預(yù)報數(shù)值偏差更大。目前,常用的大氣污染物預(yù)測方法主要包括灰色GM(1,1)預(yù)測、多元回歸預(yù)測、支持向量機SVM、長短期記憶網(wǎng)絡(luò)(LongShort-TermMemory,LSTM)預(yù)測、RNN 預(yù)測等模型[2],對其優(yōu)缺點進行分析,如表1 所示。
表1 不同大氣污染物預(yù)測方法的比較
針對上述問題,本文基于氣象臺空氣質(zhì)量預(yù)報數(shù)據(jù)及實測數(shù)據(jù),采用Takagi-Sugeno 模糊模型為支撐,構(gòu)建基于Fuzzy-BLS 的大氣污染物濃度預(yù)測模型,對《環(huán)境空氣質(zhì)量標準》(GB 3095—2012)明確的6 種常規(guī)大氣污染物日平均濃度進行預(yù)測,并對預(yù)測精度進行評估。
引入模糊推理系統(tǒng),通過If-Then 規(guī)則對氣象數(shù)據(jù)和污染物數(shù)據(jù)中所蘊含的專家經(jīng)驗進行提取、表述,以達到更好的預(yù)測效果。這里針對缺少物理信息模型的情況,采用自適應(yīng)神經(jīng)模糊推理系統(tǒng)(ANFIS),但該模型在特征維數(shù)以及輸出結(jié)果等方面存在一定的局限性,為了保留模糊推理系統(tǒng)的優(yōu)勢,又使得模型便于本題目求解,引入基于寬度學(xué)習(xí)的Takagi-Sugeno模糊模型,稱為Fuzzy-BLS[3]。Fuzzy-BLS 模型原理如圖1 所示。
圖1 Fuzzy-BLS 模型原理圖
模型主要包含數(shù)據(jù)輸入層,映射節(jié)點、增強節(jié)點層,輸出結(jié)果層3 層。數(shù)據(jù)輸入后,通過Takagi-Sugeno 模糊子系統(tǒng)進行初步計算,得到映射節(jié)點,同時將模糊子系統(tǒng)結(jié)果輸入到增強層中,構(gòu)建增強節(jié)點,將映射節(jié)點和增強節(jié)點通過嶺回歸求解偽逆的方式確定每個節(jié)點的權(quán)重,最終輸出結(jié)果。具體流程如下。
在Takagi-Sugeno 模糊模型中,通常使用If-Then 規(guī)則,即式(1)。
用數(shù)學(xué)公式表示為式(2)。
其中參數(shù)可見式(5)~(7)。
得到增強節(jié)點輸出,同時將Zi再進行處理,得到映射節(jié)點輸出,即式(10)。
通過嶺回歸算法求解偽逆得到W,見式(14)和式(15)。
通過求解上述模型,即可得到大氣污染物SO2、NO2、PM10、PM2.5、CO 的單日濃度值和O3的最大8 h 滑動平均濃度。
對PM2.5、NO2、SO2、CO、PM10一次污染物進行預(yù)測,輸入數(shù)據(jù)主要是各污染物的預(yù)報濃度和實測濃度,經(jīng)過模型訓(xùn)練與迭代,獲得優(yōu)化后的一次污染物濃度預(yù)測值。模型結(jié)構(gòu)如圖2所示。
圖2 基于Fuzzy-BLS 的一次污染物濃度預(yù)測模型
由于O3屬于二次污染物,要考慮各種氣象條件以及NOx的影響,故輸入數(shù)據(jù)主要是O3的預(yù)報濃度、氣象因子、NO2的預(yù)報數(shù)據(jù)。以實測的O3濃度,經(jīng)過模型訓(xùn)練與迭代,獲得優(yōu)化后的O3濃度預(yù)測值。對于氣象因子選擇,本文通過PCA 降維法和相關(guān)性分析法進行氣象因子的篩選,最終篩選出溫度、濕度、風(fēng)速、太陽輻射及雨量等因子。模型結(jié)構(gòu)如圖3 所示。
圖3 基于Fuzzy-BLS 的二次污染物濃度預(yù)測模型
為了有效評價模型的性能,本文使用2 種模型評價方法,分別是MSE 和R2。MSE 可以估計訓(xùn)練出的預(yù)測值與實際的濃度值之差的平方的期望值,MSE 的值越小,說明污染物濃度預(yù)測的精確度越高。R2是指回歸平方和與總離差平方和的一個比值,體現(xiàn)的是總離差平方和中能夠由回歸平方和來解釋的比例,數(shù)值越大,模型就越準確,回歸成效就越明顯[4]。其計算如式(16)和式(17)。
選取銀川市2020 年1 月1 日—12 月31 日空氣質(zhì)量預(yù)報數(shù)據(jù)和實測數(shù)據(jù),利用建立的Fuzzy-BLS 模型,預(yù)測6 種大氣污染物的日平均濃度。同時將每種污染物的氣象臺預(yù)報濃度和模型預(yù)測濃度與實測濃度分別相減,計算二者的絕對誤差[5-6],如圖4 所示。
圖4 6 種大氣污染物預(yù)測濃度絕對誤差圖
利用6 種大氣污染物的氣象臺預(yù)報濃度和Fuzzy-BLS 模型預(yù)測濃度,計算2 種預(yù)測方法的精度,計算結(jié)果如表2 所示。
表2 2 種預(yù)測模型的精度對比表
由圖4、表2 分析可知:①本文建立的基于Fuzzy-BLS 的大氣污染物濃度預(yù)測模型預(yù)測效果較好,精度最高的是PM10和SO2,分別為0.988 和0.980,最低的是O3,預(yù)測精度是0.932,達到了較高精度;②PM10和O3的MSE 數(shù)值較大,是因為這2 種污染物的原始數(shù)值比較大,但精度數(shù)值都在可接受的范圍內(nèi);③對比氣象臺預(yù)報模型與本模型的預(yù)測濃度絕對誤差曲線,能夠顯著看出本模型預(yù)測精度更好,預(yù)測誤差更小。經(jīng)計算,對于一次污染物(PM10、SO2、NO2、PM2.5、CO),MSE指標平均下降了71.7%,R2指標提高了10.4%;對于二次污染物臭氧,MSE 指標下降了78.0%,R2指標提高了26.9%。
本文建立的基于Fuzzy-BLS 的大氣污染物濃度預(yù)測模型擅長處理具有時序性和非線性的數(shù)據(jù),對氣象及污染物數(shù)據(jù)具有較強的適用性,對多種污染物濃度預(yù)測精度較高,是一種可行的預(yù)測手段,在解決實際環(huán)境問題的過程中能夠輔助決策。同時,在建立模型過程中,考慮到了多種氣象因素對大氣污染物濃度的影響,使建立的污染物濃度預(yù)測模型很大程度上能反應(yīng)實際的大氣情況,對于環(huán)境空氣質(zhì)量監(jiān)測及環(huán)境保護具有較大的參考價值,實用性和可推廣性較強。