黃 蕓,姜 國(guó),徐治欠
(湖北師范大學(xué)數(shù)學(xué)與統(tǒng)計(jì)學(xué)院,湖北 黃石 435002)
ARIMA模型在黃石市PM 2.5濃度預(yù)測(cè)中的應(yīng)用
黃 蕓,姜 國(guó),徐治欠
(湖北師范大學(xué)數(shù)學(xué)與統(tǒng)計(jì)學(xué)院,湖北 黃石 435002)
PM2.5的精確預(yù)測(cè)對(duì)空氣質(zhì)量評(píng)估和大氣污染防治工作起著關(guān)鍵性作用 .由于PM2.5濃度受多種因素影響,不同時(shí)間段內(nèi)變化模式存在較大差異,將序列分時(shí)段可以提高預(yù)測(cè)精確度。根據(jù)2015年黃石市市區(qū)PM2.5日均濃度變化特征,建立了分時(shí)段ARIMA模型,進(jìn)而對(duì)黃石市PM2.5濃度進(jìn)行深入分析及可靠預(yù)測(cè)。
PM2.5;ARIMA模型;時(shí)間序列
目前,PM 2.5污染已經(jīng)成為社會(huì)的熱議話題。PM 2.5是指大氣中的細(xì)顆粒物通過(guò)對(duì)太陽(yáng)光的吸收,反射或散射降低大氣能見度,使太陽(yáng)輻射強(qiáng)度降低,是霧霾制造者之一。這種微小顆粒被吸入肺部后,對(duì)身體健康危害極大。PM 2.5的準(zhǔn)確預(yù)測(cè)有利于人們采取必要的防護(hù)措施。因此建立有效的PM 2.5濃度預(yù)測(cè)模型具有重要的現(xiàn)實(shí)意義。許多專家對(duì)PM 2.5污染進(jìn)行了相關(guān)研究,并且提出了其存在的問(wèn)題以及改進(jìn)的方法。孫柏峰[1]根據(jù)吉林省某市 2001~2010[3~5]年的空氣質(zhì)量監(jiān)測(cè)情況,結(jié)合數(shù)學(xué)模型對(duì)該市的空氣質(zhì)量進(jìn)行了評(píng)價(jià)與預(yù)測(cè) ;邵銀念[2]等運(yùn)用模糊數(shù)學(xué)方法,通過(guò)計(jì)算污染因子權(quán)重值和隸屬度對(duì)烏魯木齊市 2007年度大氣環(huán)境質(zhì)量就進(jìn)行了綜合評(píng)價(jià);國(guó)外對(duì)大氣污染的統(tǒng)計(jì)預(yù)測(cè)做了廣泛研究,主要運(yùn)用多元統(tǒng)計(jì)分析理論、灰色預(yù)測(cè)模型、神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)模型等。其中,用法最廣的是神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)模型[7],它在非線性模型上有較好的擬合效果,但存在難已確定網(wǎng)絡(luò)結(jié)構(gòu)等問(wèn)題,影響預(yù)測(cè)模型的泛化能力。
本文根據(jù)相關(guān)部門提供的實(shí)時(shí)數(shù)據(jù),運(yùn)用時(shí)間序列方法,建立了 ARIMA模型[6]。對(duì)黃石市市區(qū) 2015年 PM 2.5日均濃度進(jìn)行短期預(yù)測(cè),探討了黃石市空氣質(zhì)量發(fā)展趨勢(shì)。
1.1 ARIMA模型的結(jié)構(gòu)
建立 ARIMA模型,是研究時(shí)間序列的重要方法,它是由自回歸模型 ( AR模型 )和滑動(dòng)平均模型 ( MA模型 )構(gòu)成,簡(jiǎn)記為 ARIMA (p,d,q)模型:
1.2 ARIMA模型的建模過(guò)程
非平穩(wěn)時(shí)間序列可以利用差分轉(zhuǎn)化為平穩(wěn)時(shí)間序列來(lái)進(jìn)行ARMA(p,q)的擬合。根據(jù)時(shí)序圖和自相關(guān)圖判斷序列是否具有平穩(wěn)性。若數(shù)據(jù)是非平穩(wěn)的,則可以通過(guò)差分對(duì)數(shù)據(jù)進(jìn)行處理后再重復(fù)以上步驟使序列平穩(wěn)。在對(duì)序列進(jìn)行白噪聲檢驗(yàn)時(shí),若為非白噪聲序列,則要對(duì)平穩(wěn)的非白噪聲序列進(jìn)行ARMA(p,q)擬合。
數(shù)據(jù)平穩(wěn)性處理后,應(yīng)用SAS的PROC ARIMA功能分析序列的自相關(guān)系數(shù)(ACF)和偏自相關(guān)系數(shù)(PACF)變化趨勢(shì),估計(jì)自相關(guān)階數(shù)(p)和滑動(dòng)階數(shù)(q)的值。用最小二乘估計(jì)檢驗(yàn)每個(gè)參數(shù)是否顯著不為零,如果有不顯著的參數(shù)要剔除其對(duì)應(yīng)的自變量進(jìn)行新的擬合。
檢驗(yàn)擬合后的模型是否提取了足夠充分的信息,也就是殘差的白噪聲檢驗(yàn)。是白噪聲,則擬合有效;反之,需重新擬合模型。模型的有效性檢驗(yàn)是LB統(tǒng)計(jì)量對(duì)殘差進(jìn)行2檢驗(yàn) 。在SAS程序中的調(diào)用 FORECAST程序,可以對(duì)未來(lái)的情況進(jìn)行預(yù)測(cè)和進(jìn)行趨勢(shì)分析。
收集到黃石市2015年城區(qū) PM 2.5日均濃度的相關(guān)數(shù)據(jù) (來(lái)自黃石市有關(guān)部門實(shí)時(shí)數(shù)據(jù) ),選取時(shí)間段為 2015年 1月 1日~12月 31日,除因停電以及設(shè)備故障等偶然性因素所缺失的 1個(gè)數(shù)據(jù)外,共有 364個(gè)有效數(shù)據(jù)。
2.1 繪制序列時(shí)序圖
根據(jù)空氣質(zhì)量數(shù)據(jù)繪制時(shí)序圖如下:
圖1 全年P(guān)M 2.5日均濃度時(shí)序圖
由圖1可以看出全年P(guān)M 2.5日均濃度序列為非平穩(wěn)序列,不同時(shí)間段污染物均值呈現(xiàn)的差異較大,因此選擇分時(shí)間段模型進(jìn)行預(yù)測(cè)。對(duì)不同時(shí)間段時(shí)間序列進(jìn)行平穩(wěn)化處理,以 1~3月份為例,對(duì)這段時(shí)間的PM 2.5日均濃度序列作一階差分后繪制時(shí)序圖(圖2)。分時(shí)間段后的 PM 2.5日均濃度序列波動(dòng)平穩(wěn),初步判斷變化后的序列為平穩(wěn)序列 。
圖2 1~3月份PM 2.5日均濃度差分時(shí)序圖
2.2 模型定階
觀察差分后序列的自相關(guān)圖和偏自相關(guān)圖的性質(zhì),進(jìn)一步確定平穩(wěn)性判斷以及擬合模型階數(shù)。
圖1 程序運(yùn)行1差分后1~3月份PM 2.5日均濃度序列自相關(guān)圖
圖2 程序運(yùn)行2差分后1~3月份PM 2.5日均濃度序列偏自相關(guān)圖
自相關(guān)圖(程序運(yùn)行 1)顯示, 2階之后自相關(guān)系數(shù)都在零值附近波動(dòng)??梢哉J(rèn)為自相關(guān)系數(shù)具有短期相關(guān)性,差分后的序列類似平穩(wěn)。2階自相關(guān)系數(shù)顯著大于 2倍標(biāo)準(zhǔn)差范圍。觀察偏自相關(guān)圖(程序運(yùn)行 2)得到的結(jié)論和上述基本一致。
2.3 參數(shù)估計(jì)
圖3 程序運(yùn)行 3參數(shù)估計(jì)
運(yùn)用最小二乘法,確定擬合模型(程序 3)。1~3月份選用ARIMA(2,1,1)模型,其估計(jì)結(jié)果為: (1-0.65085B+0.31979B2)△PM2.5= (1-0.74408B)εt.
同理可得其他不同時(shí)段序列的估計(jì)結(jié)果: 4~6月份選用ARIMA(1,1,2)模型,估計(jì)結(jié)果為:(1-0.57605B)△PM2.5= 0.000118+ (1-0.67346B-0.32654B2)εt;7~9月選用ARIMA(1,1,1)模型,估計(jì)結(jié)果為:(1-0.61804B)△PM2.5= (1-0.96232B)εt;10~12月份選用ARIMA(1,1,1)模型,估計(jì)值為:(1-0.53976B)△PM2.5 = (1- 0.90985B)εt. 式中:B為延遲算子;εt(t=0,1,2,…) 為白噪聲序列 。
2.4 假設(shè)檢驗(yàn)
圖4 程序運(yùn)行4模型的參數(shù)檢驗(yàn)
以1~3月為例,由殘差白噪聲檢驗(yàn)結(jié)果得到檢驗(yàn)統(tǒng)計(jì)量的P值都顯著大于 0.05(程序運(yùn)行 4),則可認(rèn)為殘差序列為白噪聲序列,系數(shù)顯著性檢驗(yàn)顯示兩系數(shù)均顯著。這就證明 ARIMA(2,1,1)模型對(duì)該序列建模成功。
2.5 模型預(yù)測(cè)
表1 兩種模型各季度最后一天的PM 2.5日均濃度預(yù)測(cè)表
由表1可以看出:分時(shí)短PM 2.5日均濃度序列模型預(yù)測(cè)的相對(duì)誤差小于全年P(guān)M 2.5日均濃度序列模型的相對(duì)誤差,且相對(duì)誤差不超過(guò)12%,預(yù)測(cè)效果較好;分時(shí)段PM 2.5日均濃度序列模型 3~6月以及 6~9月PM 2.5濃度值較低,屬于污染相對(duì)較輕的輕度污染;而 1~3月及10~12月濃度值較大,屬于污染較重的中度污染與重度污染。
本文利用黃石市實(shí)時(shí)數(shù)據(jù),對(duì)黃石市2015年大氣PM 2.5日均濃度數(shù)據(jù)進(jìn)行相關(guān)分析,根據(jù)不同時(shí)間段污染濃度的分布特征,建立了分時(shí)間段ARIMA (p,d,q)預(yù)測(cè)模型;并預(yù)測(cè)了不同季度最后一天的污染濃度值,通過(guò)將其與全年時(shí)間序列模型的結(jié)構(gòu)進(jìn)行比較驗(yàn)證。結(jié)果顯示分時(shí)間短預(yù)測(cè)結(jié)果與實(shí)值相對(duì)誤差更小,分時(shí)間段預(yù)測(cè)的結(jié)果相對(duì)更好。
ARIMA模型是一種較好擬合PM 2.5日均濃度序列的方法,該模型便于數(shù)據(jù)處理,變化靈活,方便推廣到其他城市的大氣污染數(shù)據(jù)觀測(cè)中。但由于PM 2.5濃度受排放源和氣象條件影響及模型自身的限制因素,只能進(jìn)行短期預(yù)測(cè)。在未來(lái),可以結(jié)合空間預(yù)測(cè)模型與非線性動(dòng)力學(xué)為大氣污染預(yù)測(cè)提供評(píng)價(jià)、預(yù)警和治理方法。
[1]孫柏峰 .吉林省某市空氣質(zhì)量評(píng)價(jià)及預(yù)測(cè)[D].長(zhǎng)春:吉林大學(xué) ,2013.
[2]廖銀念 ,蘇玉紅 ,艾尼瓦爾 買買提 .城市空氣質(zhì)量的模糊綜合評(píng)價(jià)——以烏魯木齊市為例 [J].北方環(huán)境,2011,11:143~144.
[3]Reilly P. Time series modeling of global mean temperature for managerial decision-making[J]. Journal of Environment Management, 2005, 76(1):61~70.
[4]Huber P J.Robust Statitics[M]. New York: Wiley, 1981.
[5]Han Jiawei, Kamber M. Data mining: concepts and techniques[M].Morgan Kaufmann Publishers,2000: 7~9.
[6]王 燕 .應(yīng)用時(shí)間序列分析 (第三版 )[M].北京:中國(guó)人民大學(xué)出版社, 2005.
[7]Grivas G A. Chaloulakou. Artificial neural network models for prediction of PM 2.5 hourly concentrations, in the Greater Area of Athens[J]. Atmospheric Environment, 2006.40(7): 1216~1229.
ARIMA model of Huangshi’s PM 2.5 and its application
HUANG Yun,JIANG Guo,XU Zhi-qian
(College of Mathematics and Statistics,Hubei Normal University,Huangshi 435002,China)
The accurate prediction of PM 2.5 plays a key role in atmospheric pollutant and management. Since there are exist many factors that effect PM 2.5 and the models are various in different time interval, the segmented time series can improve the prediction of PM 2.5.According to the characteristics of time series of concentration variation of PM 2.5 , this article build a new segmented ARIMAmodel. Moreover, we give a deeply analysis and reliably forecast of PM 2.5 in Huangshi.
PM 2.5; ARIMA model; time series
2016—10—11
湖北省科技廳自然科學(xué)基金項(xiàng)目( 2016CFB526),湖北省大學(xué)生創(chuàng)新創(chuàng)業(yè)項(xiàng)目( 201410513022)
黃蕓(1990— ),女,湖北黃石人,碩士研究生,主要研究方向?yàn)殡S機(jī)過(guò)程及其交叉領(lǐng)域.
O163
A
2096-3149(2017)02- 0038-05
10.3969/j.issn.2096-3149.2017.02.009