李 悅,談進忠,陳 鵬,趙信一
(烏魯木齊氣象衛(wèi)星地面站,新疆 烏魯木齊830011)
霧是大量微小水滴浮游空中,常呈乳白色,使水平能見度小于1.0 km[1],霧是一種自然現(xiàn)象,空氣中水汽氤氳,霧雖然以灰塵作為它的凝結(jié)核,但總體是無毒無害;霾是大量極細微的干塵粒等均勻地浮游在空中,使水平能見度<10.0 km的空氣普遍渾濁現(xiàn)象。霾使遠處光亮的物體微帶黃、紅色,使灰暗的物體微帶藍色[2]。霾的核心物質(zhì)是懸浮在空氣中的煙塵和灰塵等物質(zhì),是由空氣中的微小塵粒、硫酸鹽、硝酸鹽粒子、有機碳氫化合物等可吸入顆粒物組成。霧霾是霧與霾的混合物[3-4],霧霾能直接進入并且能夠粘附在人的呼吸道和肺葉中,直接危害人體健康[5-7]。大量研究表明,霧霾天氣的形成機理主要是:空氣中的沙塵、粉塵、工業(yè)排放、汽車尾氣等和二次氣溶膠粒子,空氣中的水汽也起著重要作用,直接影響著二次粒子的增大與散射率的變化[8]。張小曳等[9]研究發(fā)現(xiàn),PM10質(zhì)量濃度中有超過50%為二次氣溶膠,而且二次氣溶膠的形成和PM10的濃度變化受天氣條件影響很大。近年烏魯木齊市及周邊人口的快速增長,汽車保有量的逐年攀升,米東工業(yè)區(qū)的飛速發(fā)展,車輛、工業(yè)排放源量的增加,PM2.5成為近年污染的主要問題[10-11]。烏魯木齊冬季大氣層結(jié)穩(wěn)定,逆溫層厚、持續(xù)時間長,頻次高,冬季出現(xiàn)逆溫頻率在86%以上[12-13],風(fēng)速較小,氣象條件導(dǎo)致大氣污染物不易擴散[14]。在冬季大氣層結(jié)極為穩(wěn)定的前提下,隨著空氣中PM2.5的濃度逐步加大,霧霾天氣也在逐漸加重[15]。在不考慮擴散條件的前提下,選擇污染物排放濃度因子研究烏魯木齊污染物排放對大氣污染的貢獻,進一步認識控制排放的重要性,預(yù)測未來大氣污染強度,對有效防治重污染實施積極措施意義重大。孟兆佳[16]、付倩嬈[17]等研究了利用多元回歸方法建立霧霾預(yù)測模型取得了較好的效果,其中付倩嬈通過多元線性回歸建立了PM2.5含量預(yù)測模型,并將氣象要素作為霧霾的判斷標(biāo)準,利用多元線性回歸對北京未來1 d、3 d及一周的PM2.5的含量進行較為精確的預(yù)測。本文試圖通過對烏魯木齊市大氣環(huán)境監(jiān)測站點數(shù)據(jù)進行多元線性回歸分析,利用MATLAB建立動態(tài)預(yù)測模型,選擇逐日PM2.5、PM10、SO2、NO2、CO的量值作為影響烏魯木齊霧霾天氣的主要因子,研究霧霾天氣預(yù)測方法,輸出次日的污染指數(shù)分級,發(fā)現(xiàn)有較好的擬合度和預(yù)測準確率,能夠?qū)F霾天氣提前預(yù)警,對提出防范措施具有較重要的參考價值。
烏魯木齊三面環(huán)山,東北低、西南高,呈簸箕形,冬季盛行東北風(fēng),特殊的地形地貌以及氣象因素使得烏魯木齊冬季風(fēng)速為全年最小,冬季平均風(fēng)速僅2.3 m/s,1月平均風(fēng)速不足2 m/s,冬季大氣層結(jié)極為穩(wěn)定,逆溫出現(xiàn)頻率高達87%~92%[18-19],逆溫頻次高,強度強,混合層高度低,持續(xù)時間長,近地面風(fēng)速小而主導(dǎo)風(fēng)向不穩(wěn)定,污染物擴散能力差,利于積累[13、18],這樣的氣象條件極其不利于污染物的擴散,在強逆溫天氣持續(xù)穩(wěn)定的天氣條件下,污染物將不斷積累,空氣質(zhì)量也將急劇惡化[18]。
本文選用的環(huán)境數(shù)據(jù)包括AQI(Air Quality Index,簡稱 AQI)實時數(shù)據(jù)、PM2.5小時值、PM10小時值、SO2小時值、NO2小時值、CO小時值、O3小時值,數(shù)據(jù)來源為新疆環(huán)境保護廳網(wǎng)站http://www.xjepb.gov.cn/和千人計劃PM2.5特別防治小組信息平臺(真氣網(wǎng))https://www.zq12369.com/,使用 java語言開發(fā)設(shè)計相關(guān)污染物濃度數(shù)據(jù)自動采集程序,采集了該網(wǎng)站2013—2015年烏魯木齊市的所有環(huán)境監(jiān)測站點數(shù)據(jù)。
圖1 AQI與污染物濃度因子相關(guān)分析
木尼拉·阿不都木太力甫[20]研究發(fā)現(xiàn),2013—2016年烏魯木齊市大氣中PM2.5和PM10呈上升趨勢,為首要污染物;NO2和SO2呈下降趨勢,但變化趨勢均不顯著。污染負荷系數(shù)排序為PM2.5>PM10>NO2>SO2。SO2負荷系數(shù)最小并且有明顯下降趨勢,說明“煤改氣”能源結(jié)構(gòu)的調(diào)整對SO2濃度的降低起到了積極作用。在同樣的擴散條件下,污染物因子的排放濃度和積累過程是重污染天氣形成的主要原因。利用烏魯木齊環(huán)境監(jiān)測站2013年11月15日—2014年3月30日及2014年11月15日—2015年3月30日,2個冬季逐日AQI日平均值和日最大值分別與對應(yīng)日的 PM2.5、PM10、CO、NO2、SO2日平均值和日最大值做相關(guān)分析(圖1),PM2.5和PM10的日平均和日最大值與AQI相關(guān)最為密切,R2分別為0.846 5、0.595 9 和 0.779、0.829,其次是 CO,SO2、NO日平均值和日最大值與AQI也存在較為明顯相關(guān)性關(guān)系,R2分別為 0.4259、0.1939、0.1958 和 0.275、0.201 1、0.108 9,均通過了α=0.01的顯著性水平檢驗,這也說明影響烏魯木齊污染指數(shù)的最主要是因子是 PM2.5、PM10和 CO。
用烏魯木齊環(huán)境監(jiān)測站2013年11月15日—2014年3月30日及2014年11月15日—2015年3月30日PM2.5和PM10的日平均值分別與對應(yīng)日CO、NO2、SO2的日平均值做相關(guān)分析(圖 2),可以看出 PM2.5和 PM10與 CO、NO2、SO2相關(guān)十分密切,R2分別為 0.624、0.471 1、0.2571 1 和 0.588、0.471、0.281 1,均通過了α=0.01的顯著性水平檢驗,說明在穩(wěn)定不利于擴散的天氣條件下,各種污染物同步積累增加,同時,空氣中的細顆粒、工業(yè)廢氣、汽車尾氣等與水汽結(jié)合形成二次粒子,使得PM2.5粒子增多加重霧霾天氣。
為了分析污染排放因子對未來24 h空氣質(zhì)量的影響,分別用前1 d的污染因子PM2.5、PM10、CO、NO2、SO2濃度和AQI值與當(dāng)天的AQI值分析其相關(guān)關(guān)系(圖3),可見前1 d的污染排放因子和AQI與當(dāng)天的AQI存在顯著的相關(guān)關(guān)系,R2分別為0.503、0.433、0.332、0.359、0.203 和 0.531。在擴散條件沒有發(fā)生大的變化前,也就是在沒有強天氣破壞穩(wěn)定的大氣層結(jié)前,污染物在大氣中積累將加重次日的大氣污染。因此,可以用污染排放濃度因子估測未來24 h的AQI值范圍。
霧霾天氣的形成是由多種氣候和環(huán)境因子綜合作用形成的,例如大氣穩(wěn)定度、混合層厚度、溫度、濕度、風(fēng)向、風(fēng)速,以及污染物 PM2.5、PM10、CO、NO2、SO2等排放量,由于烏魯木齊冬季大氣層結(jié)極為穩(wěn)定,逆溫頻次高,強度強,混合層高度低,持續(xù)時間長,近地層風(fēng)速小,近地面主導(dǎo)風(fēng)向不穩(wěn)定,使得污染源排放的污染物在近地層堆積混合[13]形成大量的二次氣溶膠粒子,造成較嚴重的霧霾天氣。大氣環(huán)流、局地氣象條件不易人為控制,而污染源排放是人為可控的[8-9,21-22],為了分析各種不同大氣污染物排放量對烏魯木齊大氣污染、霧霾天氣的影響,對烏魯木齊市2013—2015 年冬季逐日 PM2.5、PM10、CO、NO2、SO2濃度數(shù)據(jù)與次日污染指數(shù)AQI進行回歸分析,建立對應(yīng)的預(yù)測模型,并利用預(yù)測模型對2013、2014年的污染指數(shù)進行擬合度測試,對2015年的數(shù)據(jù)進行試報測試,發(fā)現(xiàn)多元線性回歸模型在霧霾天氣預(yù)測中具有較好的擬合效果和預(yù)測效果。
Y 為因變量,X1,X2,...XK為自變量,當(dāng)自變量與因變量之間成線性關(guān)系時,多元線性回歸模型可表示為[23]:
圖 2 PM2.5、PM10與 CO、SO2、NO2濃度相關(guān)分析
圖3 前一天污染物濃度因子和AQI與當(dāng)天AQI相關(guān)分析
其中,a0為常數(shù)項,b1、b2...bk為回歸系數(shù)。
在式(1)中XK代表影響霧霾天氣形成的污染物濃度因子,y代表污染指數(shù)(AQI),選擇烏魯木齊市環(huán)境監(jiān)測站點2013年11月15日—2014年3月31日、2014年11月15日—12月30日逐日的AQI指數(shù)和前一日(T-1 日)PM2.5、PM10、CO、NO2、SO2濃度數(shù)據(jù)進行統(tǒng)計分析計算建模,使得預(yù)測數(shù)據(jù)與實際數(shù)據(jù)誤差盡量小。
利用多元回歸分析方法和MATLAB編程工具編寫霧霾統(tǒng)計預(yù)測系統(tǒng)軟件,系統(tǒng)自動獲取大氣污染物濃度數(shù)據(jù),輸出次日污染指數(shù)。傳統(tǒng)多元回歸分析預(yù)測方法依賴大樣本數(shù),采用固定的回歸預(yù)測模型,而本系統(tǒng)采用起報日之前60 d的數(shù)據(jù)作為樣本,進行多元線性回歸分析,不斷改進更新模型,既保證了預(yù)測的精度,又無需大量的樣本數(shù)據(jù),還可以及時調(diào)整預(yù)測因子,建立了霧霾天氣預(yù)測模型訓(xùn)練流程(圖 4)。
圖4 霧霾天氣預(yù)測模型訓(xùn)練流程圖
霧霾天氣預(yù)測模型訓(xùn)練過程主要包括以下步驟:
(1)歷史氣象環(huán)境數(shù)據(jù)采集;
(2)對采集到的數(shù)據(jù)進行歸一化處理,消除不同數(shù)據(jù)度量標(biāo)準的差別;
(3)將第2步形成的數(shù)據(jù)分成訓(xùn)練集和測試集兩部分;
(4)利用多元線性回歸算法進行訓(xùn)練,模型計算利用MATLAB;
(5)模型測試,并根據(jù)測試結(jié)果對模型進行參數(shù)優(yōu)化。
分別選取烏魯木齊市2013年11、12月和2014年 1、2、3、11、12 月霧霾天氣 PM2.5、PM10、SO2、NO2、CO日平均數(shù)據(jù)作為訓(xùn)練正例樣本,再選取同時期等數(shù)量的晴好天氣作為反例樣本,正例樣本和反例樣本共同組成了訓(xùn)練集,再選取2015年1、2、3月霧霾天氣和晴好天氣作為測試樣本,訓(xùn)練集準備好后,需對訓(xùn)練集進行數(shù)據(jù)歸一化處理,利用(2)式對數(shù)據(jù)進行處理。
經(jīng)過歸一化處理后的數(shù)據(jù)全部在 [0.2,0.9]之間。數(shù)據(jù)要形成MATLAB能夠處理的數(shù)據(jù)格式,每行數(shù)據(jù)的格式為:第一個數(shù)據(jù)為1或-1,代表霧霾天氣和非霧霾天氣,后面為6個經(jīng)歸一化處理后的PM10、PM2.5、SO2、NO2、CO 指標(biāo)數(shù)據(jù)。
利用MATLAB對模型進行計算,將處理好的X,Y數(shù)據(jù)矩陣導(dǎo)入 MATLAB,導(dǎo)入完成后在MATLAB 的 命 令 窗 口 輸 入 [b,bint,r,rint,stats]=regress(Y,X,alpha),此時,MATLAB 將對數(shù)據(jù)進行計算,其中,b代表回歸系數(shù),bint代表回歸系數(shù)區(qū)間估計,r表示殘差,rint表示置信區(qū)間,stats表示用于檢驗回歸模型的統(tǒng)計量,alpha表示顯著性水平。
模型計算完成后,代入2015年數(shù)據(jù)進行測試,2015年1—3月烏魯木齊霧霾天氣共發(fā)生17次,選取這17 d前一天數(shù)據(jù)進行測試,同時再隨機選取2015年1—3月中任意17 d的晴好天氣作為測試數(shù)據(jù),經(jīng)測試,模型準確度達到85%左右,圖5為霧霾天氣測試結(jié)果,圖6為非霧霾天氣測試結(jié)果。
通過以上預(yù)測試驗對比,測試結(jié)果與實際值取得了較好的擬合效果,實驗證明用多元線性回歸算法對霧霾天氣進行預(yù)測是一種有效的霧霾預(yù)測輔助手段。
圖5 霧霾天氣實際值與預(yù)測值對比結(jié)果
圖6 非霧霾天氣實際值與預(yù)測值對比結(jié)果
(1)烏魯木齊市大氣污染指數(shù)與前一天的PM10、PM2.5、SO2、NO2、CO 濃度有密切的相關(guān)關(guān)系,在大氣層結(jié)穩(wěn)定的冬季,細顆粒排放是霧霾天氣的決定因素,在沒有強天氣系統(tǒng)破壞逆溫層時,由于地形和水平風(fēng)速小的原因,前幾天污染物積累,前一天的污染排放直接影響當(dāng)天和第二天的大氣環(huán)境,當(dāng)相對濕度在80%左右時,形成霧霾天氣,本項工作建立的多元線性回歸模型和預(yù)測系統(tǒng)軟件在霧霾天氣預(yù)測中有較好的預(yù)測水平,能夠在冬季霧霾天氣預(yù)測業(yè)務(wù)中應(yīng)用。
(2)通過對模型的試驗測試發(fā)現(xiàn),當(dāng)不同影響因子之間呈線性關(guān)系時,多元線性回歸算法計算的預(yù)測值具有較高準確度,在呈非線性關(guān)系時計算出的預(yù)測值精確度則較低,因此,后期還需研究非線性關(guān)系數(shù)據(jù)的計算模型,與多元線性回歸算法進行對比,選擇出具有更高擬合度預(yù)報準確度的預(yù)測算法。