董麗沙,范金圓,呂金鳳,孔 亮,張步英,楊曉靜,李洋洋
(1 河北科技師范學院數學與信息科技學院,河北 秦皇島,066004;2 中冶沈勘秦皇島工程設計研究院總院有限公司)
2012年初發(fā)布的《環(huán)境空氣質量指數AQI技術規(guī)定(試行)》(HJ 633—2012),依照數值范圍的大小將空氣質量指數(AQI)劃分為0~50優(yōu)、51~100良、101~150輕度污染、151~200中度污染、201~300重度污染、300以上嚴重污染等6個等級,依次用綠、黃、橙、紅、紫、褐紅等6種顏色來表示[1]。AQI的高低反映空氣污染的程度,AQI數值越大,說明空氣污染狀況越嚴重,對人體的健康危害越大[2]。被列為評價大氣環(huán)境質量標準的污染物包括PM2.5,PM10,SO2,NO2,CO,O3,各個城市都設立了多個監(jiān)測站點,實時監(jiān)測污染物濃度。
Boznar等[3]于1993年開始了將神經網絡模型用于空氣污染的預測。Kolehmainen等[4]在研究大氣中NO2濃度時,通過多個預測模型的對比,找到MLP模型中使用原始時間序列進行空氣中NO2的濃度預測結果最好。Giuseppe等[5]分析了BP神經網絡存在的預測不足之處,并對其進行改進,得到了誤差代價函數,通過對比得到利用其代價函數得到的預測結果較之前更優(yōu)。雖然我國的環(huán)境監(jiān)測與保護工作起步晚于工業(yè)發(fā)達國家,但是我國政府的環(huán)保意識提高迅速,環(huán)保措施發(fā)展迅速[6]。周兆媛等[7]利用主成分回歸分析對北京、石家莊、天津地區(qū)的空氣污染指數與氣象要素的關系進行了論證,得到氣溫、氣壓、降雨量和相對濕度與空氣質量密切相關。王娟等[8]分析了高密市空氣污染物濃度的變化特征及成因,利用了適合于短期預測模型的GM(1,1)模型對高密市空氣質量進行了預測。袁章帥等[9]建立了北京市空氣質量預測ARMA(1,2)模型,通過實際數據進行預測,驗證了模型的精確性,同時為有關部門提出大氣污染治理的合理、科學的建議。文獻[10~17]通過對各地空氣質量變化趨勢的評價分析,提出了一系列的原因分析與針對性的防治對策。
本次研究以AQI及PM2.5,PM10,SO2,NO2,CO,O3等6項污染物在空氣中的質量濃度為因子,通過從網站獲取的2015~2019年各指標數據,對秦皇島市空氣質量的時間分布特征和變化趨勢進行分析,并根據分布特征特點試建立當地空氣質量的預測模型。
從天氣后報網站(http://www.tianqihoubao.com)獲取了河北省秦皇島市的AQI和空氣中PM2.5,PM10,SO2,NO2,CO,O3等6項污染物的質量濃度在2015~2019年的日均值。將所得數據進行整理和統(tǒng)計,用于本次研究。
對獲取到的秦皇島市AQI數據,PM2.5,PM10,SO2,NO2,CO,O3在空氣中的質量濃度日均值數據進行整理和計算,得到各個指標在2015~2019年每年的月均變化趨勢。統(tǒng)計結果表明:秦皇島市AQI及6項污染物質量濃度均呈現冬季較高,夏季較低的變化趨勢,變化曲線整體呈U型(圖1~圖6)。這是由于在我國,包括河北省在內的北方地區(qū)居民住宅、學校及各種公共場所、企事業(yè)單位辦公場所等冬季必需供暖,采暖形式以燃煤為主,因燃煤量暴增而產生的大量煙塵和SO2,NO2,CO等污染物排放到大氣中,導致空氣中的污染物濃度上升,再加上我國北方冬季的氣象條件不利于污染物擴散,進一步造成污染物濃度居高不下的局面。不同的是,O3質量濃度變化曲線在每年中的月均值呈倒U型,即夏季較高、冬季較低的現象,這主要歸因于夏季溫度高、光照強的氣候特點促使能生成O3的相關化學反應不斷發(fā)生。
圖1 2015~2019年秦皇島市AQI的月均值變化特征
圖2 2015年秦皇島市空氣中6項污染物的月均值 圖3 2016年秦皇島市空氣中6項污染物的月均值
圖4 2017年秦皇島市空氣中6項污染物的月均值 圖5 2018年秦皇島市空氣中6項污染物的月均值
圖6 2019年秦皇島市空氣中6項污染物的月均值
對秦皇島市2015~2019年的AQI數據及PM2.5,PM10,SO2,NO2,CO,O3在空氣中的質量濃度的日均值數據作整理和統(tǒng)計,計算各指標2015~2019年每年的年均值,分別得到AQI數據及6項污染物質量濃度的年均值分布特征和變化趨勢。統(tǒng)計結果表明,2015~2019年秦皇島市AQI及空氣中PM2.5,PM10,SO2,CO的質量濃度均呈顯著的下降趨勢,O3質量濃度有明顯上升趨勢,而NO2質量濃度沒有太大變化(圖7,圖8)。其原因在于近年來空氣污染的不斷加劇,引起了政府和城市居民的高度關注,通過采取有效措施,加大空氣污染的治理力度,使大氣環(huán)境得到了明顯的改善。
圖7 2015~2019年秦皇島市AQI的年均值變化趨勢 圖8 2015~2019年秦皇島市空氣中6項污染物的年均值
本次研究分別采用基于AQI時間序列和氣象因子的2種預測方案:在利用AQI序列歷史數據規(guī)律預測未來發(fā)展趨勢的方案中,選取乘積季節(jié)模型;基于7個氣象因子(后知氣象網獲取的平均溫度、濕度、風速、氣壓、能見度、總降雨量、平均總云量)的AQI預測方案中,選取的是適用范圍較廣的BP神經網絡模型。利用上述方法分別對秦皇島市2015~2018年空氣質量進行擬合、建模,并預測2019年全年12個月份的AQI指數。通過對比不同模型的預測準確率,分析2種預測方案的優(yōu)劣性,并選出秦皇島市空氣質量較優(yōu)的預測模型。其中,準確率={1-|(預測值-實際值)/實際值|}×100%。
空氣污染的復雜成因加大了對空氣質量預測的難度。從前面關于秦皇島市空氣質量分布特征的分析中可以看出,秦皇島市過去5年空氣質量指數波動規(guī)律可大致劃分為趨勢、季節(jié)和其他3大類,且各類特征的作用是交錯難分的。因此,本次研究采用多影響因素之間呈乘積關系的乘積季節(jié)模型對2015~2018年秦皇島市的AQI的月均值序列進行建模,并預測2019年全年12個月份的AQI。在R軟件中得到的結果如下:
首先,對AQI實測值序列作1階差分提取序列中的趨勢信息,周期12的步長差分提取序列的季節(jié)信息,得到AQI的1階12步差分結果(圖9),并對AQI的1階12步差分后序列進行平穩(wěn)性檢驗。結果顯示,AQI的1階12步差分后序列圍繞均值在有界范圍內作隨機波動,基本可以視為平穩(wěn)序列(圖9)。AQI 的1階12步差分后序列自相關圖顯示出典型的平穩(wěn)序列自相關圖特征(圖10),自相關系數快速衰減至2倍標準差范圍內,此后始終在零軸附近作小值波動。依據對時序圖和自相關圖的分析與檢驗可以判斷,AQI的1階12步差分后的序列為平穩(wěn)序列。
圖9 秦皇島市AQI的1階12步差分后序列時序情況
第2步,對AQI的1階12步差分后的序列進行純隨機性檢驗,以考察該序列是否有研究價值。檢驗結果顯示,延遲12期的P值為0.012 78,小于顯著性水平0.05。因此,可以拒絕純隨機序列的原假設,認為序列各項之間有密切的相關關系,即過去的數據對未來發(fā)展有一定影響,后續(xù)對序列的建模和未來發(fā)展的預測有意義。
經上述分析可以得出,AQI的1階12步差分后序列為平穩(wěn)非白噪聲序列。
第3步,依據上述AQI的1階12步差分后序列的自相關結果和偏自相關結果對ARIMA季節(jié)乘積模型定階。
AQI的1階12步差分后序列自相關結果與偏自相關結果(圖10,圖11)反映出其自相關系數和偏自相關系數從顯著非零到衰減至零值附近做小值波動的過程緩慢且連續(xù),所以二者均呈現拖尾性。
圖10 秦皇島市AQI的1階12步差分后序列自相關情況 圖11 秦皇島市AQI的1階12步差分后序列偏自相關情況
綜合上述差分和自相關分析結果,最終確定對秦皇島市2015~2018年AQI的月均值序列擬合ARIMA(1,1,1)×(1,1,0)12乘積季節(jié)模型。
對上述擬合模型進行參數估計,得到擬合模型口徑為:
模型顯著性檢驗的結果顯示,各階延遲下LB統(tǒng)計量的P值都大于0.05,說明該擬合模型的殘差序列為白噪聲序列,擬合模型顯著有效。利用此模型對秦皇島市2019年全年12個月份的AQI進行預測,結果見圖12。其中,黑色曲線表示2015 ~2018年秦皇島市AQI實測值序列,陰影內曲線表示2019年全年12個月份的AQI預測值。
圖12 乘積季節(jié)模型對秦皇島市AQI的預測結果
由預測結果計算可得,乘積季節(jié)模型對秦皇島市2019年全年12個月份AQI預測的準確率在75.72%~99.82%之間,均值為92.09%(表1)。
表1 乘積季節(jié)模型對秦皇島市AQI的預測值和準確率
本次研究利用從天氣后報網上獲取并整理的AQI月均值數據,以及從后知氣象網獲取的平均溫度、濕度、風速、氣壓、能見度、總降雨量、平均總云量等7個氣象因子的月均值數據,采用BP神經網絡模型對2015~2018年秦皇島市的AQI與7個氣象參數進行擬合建模(圖13),并預測2019年全年12個月份的AQI。對比2019年AQI的預測值和已獲取到的實測值,計算預測的準確率,對BP神經網絡的預測效果進行評價。
圖13 BP神經網絡擬合秦皇島市AQI的效果
建立空氣質量的BP神經網絡預測模型,選用3層的網絡結構,輸入層節(jié)點為7,包含平均溫度、濕度、風速、氣壓、能見度、總降水量、平均總云量,隱含層層數為1,隱藏節(jié)點為4,輸出層節(jié)點為1,即AQI。在MATLAB中用2015~2018年的空氣質量和氣象因子數據進行訓練和檢驗,訓練精度為0.000 001,最大訓練次數為10 000。最后用經過訓練和檢驗得到的BP神經網絡模型,對秦皇島市2019年全年12個月份的AQI進行預測,第1次運行結果見圖14。
圖14 BP神經網絡預測秦皇島市AQI的效果
在MATLAB中將這一程序運行多次會得到不同的預測結果,因為每次訓練隨機生成的初始權值和閾值不同。連續(xù)運行5次所得的5組AQI預測值和準確率計算結果分別見表2和表3。
表2 BP神經網絡預測秦皇島市AQI的前5次預測值
表3 BP神經網絡預測秦皇島市AQI的前5次預測準確率 %
在以上5次的運行結果中,只有第5次8月份的準確率為48.39%,這反映了BP神經網絡算法收斂速度慢的缺點。其他預測準確率都在60%以上,其中預測準確率最高為99.91%,進一步計算得到前5次預測結果的總的平均準確率為89.81%。
綜合以上分析可得,在本次研究所選用的2種模型中,基于AQI序列的乘積季節(jié)模型預測的準確率更高。