梁 煒,李雅箐,黃喜壽,李宏姣
(1.廣西壯族自治區(qū)環(huán)境信息中心,廣西南寧 530028;2.廣西壯族自治區(qū)環(huán)境保護(hù)科學(xué)研究院,廣西南寧 530022)
城市中近地面的臭氧是由人類活動(dòng)排放的NOx、CO 和VOCs 等前體物在特定大氣環(huán)境條件下發(fā)生復(fù)雜的化學(xué)反應(yīng)生成的二次污染物[1]。近年來隨著城市機(jī)動(dòng)車保有量的激增,南寧近地面空氣中O3污染問題日益嚴(yán)重,已成為南寧市大氣污染防治重點(diǎn)工作之一。如何準(zhǔn)確預(yù)報(bào)近地面臭氧濃度成為當(dāng)前一個(gè)熱門研究課題。
目前大氣污染物濃度預(yù)測主要分為數(shù)值預(yù)測[2-3]和統(tǒng)計(jì)預(yù)測[4-8]兩種方法。由于氣象條件的復(fù)雜性,以大氣動(dòng)力學(xué)理論為基礎(chǔ)的數(shù)值模式污染物濃度預(yù)測方法需要消耗大量的計(jì)算時(shí)間。而基于統(tǒng)計(jì)模型的預(yù)測方法通常采用真實(shí)監(jiān)測值,利用統(tǒng)計(jì)方法,建立預(yù)測模型,具有計(jì)算速度快的特點(diǎn)。時(shí)間序列模型作為統(tǒng)計(jì)預(yù)測法之一,已被廣泛用于大氣污染物濃度預(yù)測[9],但主要還是集中在PM10、NOx等污染物的預(yù)測[10-13]上,用于O3濃度預(yù)測仍比較少。
本文通過構(gòu)建ARMA-GARCH模型,對(duì)南寧市城區(qū)O3濃度進(jìn)行預(yù)測,并對(duì)預(yù)測模型進(jìn)行誤差評(píng)價(jià),期望為大氣污染防治和預(yù)警預(yù)報(bào)提供支持。
本研究以南寧市2017年1月1日-2017年12月31日日均O3濃度監(jiān)測值為樣本,數(shù)據(jù)來源于廣西壯族自治區(qū)環(huán)境保護(hù)廳、廣西壯族自治區(qū)環(huán)境監(jiān)測中心站按照《環(huán)境空氣質(zhì)量指數(shù)(AQI)技術(shù)規(guī)定(試行)》的有關(guān)要求,實(shí)時(shí)發(fā)布的南寧市市區(qū)環(huán)境空氣自動(dòng)監(jiān)測站點(diǎn),數(shù)據(jù)真實(shí)可靠。本研究使用EViews軟件對(duì)樣本擬合模型,預(yù)測2018年1月1日至2018年1月31日O3日均濃度,并對(duì)預(yù)測結(jié)果進(jìn)行誤差分析和模型評(píng)價(jià)。
1.2.1 ARMA模型
時(shí)間序列是變量按時(shí)間間隔的順序形成的隨機(jī)變量序列,時(shí)間序列分析通常不需要建立在專業(yè)理論所體現(xiàn)的相互關(guān)系基礎(chǔ)之上,而是“讓數(shù)據(jù)自己說話”。本研究選用移動(dòng)平均自回歸模型即ARMA模型。ARMA模型是描述平穩(wěn)時(shí)間序列最常用的分析模型,由統(tǒng)計(jì)學(xué)家Box G.E.P.和Jenkins G.M.于20世紀(jì)70年代創(chuàng)立,用此模型對(duì)時(shí)間序列進(jìn)行預(yù)測分析稱為博克斯-詹金斯(B-J)方法。其基本思想是構(gòu)成時(shí)序的單個(gè)序列值雖然具有不確定性,但整個(gè)序列的變化具有一定的規(guī)律性,可以運(yùn)用時(shí)間序列的過去值、當(dāng)期值及滯后擾動(dòng)項(xiàng)的加權(quán)和建立模型來“解釋”時(shí)間序列的變化規(guī)律[14]。
ARMA(p,q)模型的一般形式為
xt=C+α1xt-1+…+αpxt-p-θ1μt-1-…-θqμt-q+μt,
其中參數(shù)C為常數(shù),α是自回歸模型系數(shù),θ是移動(dòng)平均模型系數(shù),μt是滿足獨(dú)立同分布的隨機(jī)誤差項(xiàng)(擾動(dòng)項(xiàng))。當(dāng) C=0,該模型成為中心化ARMA(p,q)模型;當(dāng)q=0時(shí),上式變?yōu)閜階自回歸模型,記為AR(p);當(dāng)p=0時(shí),上式稱為q階移動(dòng)平均模型,記為MA(q)。
ARMA模型建立過程如圖1所示,主要由以下5個(gè)部分構(gòu)成:
(1)數(shù)據(jù)預(yù)處理。通過時(shí)序圖初步判斷數(shù)據(jù)是否具有周期性、趨勢(shì)性、隨機(jī)性等特點(diǎn)。若存在相應(yīng)特點(diǎn),則對(duì)原始數(shù)據(jù)進(jìn)行差分、對(duì)數(shù)變換等處理。
(2)平穩(wěn)性檢驗(yàn)。時(shí)間序列可以分為平穩(wěn)序列和非平穩(wěn)序列兩大類。時(shí)間序列數(shù)據(jù)的平穩(wěn)有以下要求:均值、方差不隨時(shí)間變化;自相關(guān)系數(shù)只與時(shí)間間隔有關(guān),而與所處時(shí)間無關(guān)。如果用傳統(tǒng)方法對(duì)彼此不相關(guān)聯(lián)的非平穩(wěn)變量進(jìn)行回歸,t檢驗(yàn)值和F檢驗(yàn)值往往傾向于顯著,從而得出“變量相依”的“偽回歸結(jié)果”,因此,在利用回歸分析方法討論變量有意義的關(guān)系之前,必須對(duì)變量時(shí)間序列的平穩(wěn)性與非平穩(wěn)性進(jìn)行判斷[15]。
圖1 ARMA模型建模流程圖
(3)模型識(shí)別。通過樣本自相關(guān)函數(shù)分析(ACF)或樣本偏自相關(guān)函數(shù)分析(PACF)對(duì)模型滯后階數(shù)進(jìn)行初步判定,之后再通過最小信息準(zhǔn)則判斷赤池信息量準(zhǔn)則(Akaike Information Criterion,AIC)值、施瓦茨信息準(zhǔn)則(Schwarz Information Criterion,SIC)值和漢南-奎因準(zhǔn)則(Hannan-quinn Criterion,HQ)值,選出最優(yōu)階數(shù)。
(4)模型檢驗(yàn)。通過白噪聲檢驗(yàn)、殘差自相關(guān)性檢驗(yàn)、異方差檢驗(yàn)、系數(shù)顯著性檢驗(yàn),驗(yàn)證模型的有效性。
(5)模型應(yīng)用。對(duì)未來一段時(shí)間的O3濃度進(jìn)行預(yù)測。
1.2.2 GARCH模型
yt=xtπ+εt。
GARCH模型的建立步驟:
(1)檢驗(yàn)ARCH效應(yīng)。在建立ARMA模型后,使用拉格朗日乘數(shù)法(LM法)或殘差平方自相關(guān)函數(shù)分析圖檢驗(yàn)其是否存在ARCH效應(yīng),若存在ARCH效應(yīng)則進(jìn)入下一步。
(2)識(shí)別滯后階數(shù),選取最優(yōu)模型。通過對(duì)比各模型系數(shù)的顯著性與AIC、SIC、HQ值確定滯后階數(shù)后,選取最合適的模型進(jìn)行建模。
(3)復(fù)驗(yàn)ARCH效應(yīng)。建立模型后仍然使用LM法或殘差平方自相關(guān)函數(shù)分析圖檢驗(yàn)其是否仍存在ARCH效應(yīng),若仍存在ARCH效應(yīng),則返回上一步調(diào)整模型階數(shù)。
2.1.1 數(shù)據(jù)預(yù)處理
使用Eviews軟件對(duì)南寧市2017年1月1日至2017年12月31日日均O3濃度監(jiān)測值樣本數(shù)據(jù)進(jìn)行模型參數(shù)估計(jì),并根據(jù)監(jiān)測值樣本數(shù)據(jù)構(gòu)建時(shí)序圖,從圖2可初步判斷O3序列非線性近似平穩(wěn),因此無法確定其有周期性、趨勢(shì)性。為確定該序列的平穩(wěn)性,對(duì)其進(jìn)行平穩(wěn)性檢驗(yàn)并使用Augmented Dickey-Fuller (ADF)單位根檢驗(yàn)方法判斷。
圖2 2017年O3日均濃度時(shí)序圖
Fig.2 Sequence diagram of average daily concentration of O3in 2017
檢驗(yàn)結(jié)果表明(表1和表2),ADF的t統(tǒng)計(jì)量(-8.244 276)小于1%顯著水平下的臨界值(-3.983 471),可認(rèn)為O3樣本序列在1%的顯著水平下屬于不含單位根的平穩(wěn)過程,趨勢(shì)項(xiàng)(TREND)系數(shù)的P值大于0.05,可認(rèn)為趨勢(shì)項(xiàng)系數(shù)顯著為零。常數(shù)項(xiàng)C系數(shù)P值小于0.05,表示常數(shù)項(xiàng)顯著不為零。即該O3樣本序列為帶有常數(shù)項(xiàng)、不含趨勢(shì)項(xiàng)、滯后階數(shù)為0的平穩(wěn)序列。
2.1.2 模型識(shí)別
證明O3序列平穩(wěn)之后,通過自相關(guān)函數(shù)分析初步為ARMA模型定階(表3)。
表1 O3平穩(wěn)性檢驗(yàn)與ADF單位根檢驗(yàn)結(jié)果
Table 1 Results of O3stationarity test and ADF unit root test
t統(tǒng)計(jì)量tstatisticP值Prob.1%顯著水平下檢驗(yàn)關(guān)鍵值Test critical values at 1% level5%顯著水平下檢驗(yàn)關(guān)鍵值Test critical values at 5% level10%顯著水平下檢驗(yàn)關(guān)鍵值Test critical values at 10% level-8.244 2760-3.983 471-3.422 218-3.133 955
表2 ADF檢驗(yàn)方程
Table 2 Augmented Dickey-Fuller test equation
變量Variable系數(shù)Coefficient標(biāo)準(zhǔn)差Standard errort統(tǒng)計(jì)值tstatisticP值Prob.O3(-1)-0.316 0020.038 330-8.244 2760.000 0常數(shù)項(xiàng)C0.014 5930.002 2356.530 0660.000 0趨勢(shì)項(xiàng)(TREND)0.000 000 4250.000 006 590.064 4340.948 7
表3 O3自相關(guān)函數(shù)分析
Table 3 Analysis diagram of O3autocorrelation function
觀察表3發(fā)現(xiàn)自相關(guān)函數(shù)分析圖拖尾,偏自相關(guān)圖一階截尾,因此初步判斷模型形式為ARMA(1,0)。為確定模型形式與階數(shù),同時(shí)采用AIC、SIC和HQ方法,使用最小信息準(zhǔn)則判斷最佳階數(shù)。從表4可見,模型ARMA(1,0)在SIC和HQ中信息最小,在AIC中僅此與ARMA(1,1)為次佳,綜合判斷,模型ARMA(1,0)為最佳階數(shù)。
2.1.3 ARMA模型檢驗(yàn)
(1)自相關(guān)檢驗(yàn)
本研究采用殘差序列相關(guān)LM法檢驗(yàn)ARMA模型,選取滯后一至五階進(jìn)行殘差相關(guān)檢驗(yàn)。檢驗(yàn)結(jié)果表明ARMA(1,0)模型異方差懷特檢驗(yàn)量對(duì)應(yīng)的P值均大于0.05,即殘差不存在序列相關(guān),無遺漏變量,滯后階數(shù)選取合理。
表4 AIC、SIC和HQ方法信息表
Table 4 Information sheets of AIC,SIC and HQ method
模型Model AIC SIC HQARMA(1,0)-5.813 072-5.791 659-5.804 561ARMA(1,1)-5.813 082-5.780 962-5.800 316ARMA(0,1)-5.647 139-5.625 769-5.638 646ARMA(2,0)-5.812 695-5.780 510-5.799 902ARMA(2,1)-5.808 003-5.765 089-5.790 945ARMA(2,2)-5.808 007-5.765 094-5.790 949ARMA(0,2)-5.751 998-5.719 944-5.739 259ARMA(1,2)-5.807 812-5.764 986-5.790 790
注:粗體為最大值
Note:Bold are the maximum
(2)殘差白噪聲檢驗(yàn)與正態(tài)檢驗(yàn)
通過觀察該樣本殘差序列的ACF、PACF,判斷該殘差序列是否為白噪聲序列。
表5顯示,各期Q統(tǒng)計(jì)量對(duì)應(yīng)P值均高于0.05,說明殘差序列是白噪聲序列。結(jié)合自相關(guān)檢驗(yàn)與白噪聲檢驗(yàn),判定ARMA(1,0)模型已經(jīng)將原序列中的信息提取完全,該模型擬合顯著。
表5 樣本殘差序列的ACF、PACF
Table 5 ACF and PACF diagrams of sample residual error sequence
2.2.1 GARCH模型的建立
對(duì)已建立的ARMA(1,0)模型使用LM法檢驗(yàn)判定模型是否具有ARCH效應(yīng),結(jié)果顯示,F(xiàn)統(tǒng)計(jì)值為4.637 139,異方差懷特檢驗(yàn)量(Obs*R-squared)為4.603 694,F(xiàn)統(tǒng)計(jì)量的概率(Prob.F(1,391))為0.031 9,卡方檢驗(yàn)的概率(Prob.Chi-Square(1))0.031 9。該結(jié)果表明模型存在1階ARCH效應(yīng),因此需要建立GARCH模型去除ARCH效應(yīng)。GARCH模型使用最小信息準(zhǔn)則對(duì)比如表6。由表6可知GARCH模型滯后階數(shù)(3,2)最小,選擇GARCH(3,2)模型,模型AIC=-5.864 8、SC=-5.768 4、HQ=-5.826 5。
表6 GARCH模型信息表
Table 6 Information sheet of GARCH model
GARCHAICSCHQ(1,1)-5.826 0-5.761 8-5.800 5(1,2)-5.823 8-5.748 8-5.794 0(1,3)-5.848 7-5.763 1-5.814 7(2,1)-5.820 3-5.745 3-5.790 5(2,2)-5.817 2-5.731 5-5.783 1(2,3)-5.819 4-5.723 1-5.781 1(3,1)-5.817 2-5.731 5-5.783 1(3,2)-5.864 8-5.768 4-5.826 5(3,3)-5.843 3-5.736 3-5.800 8
注:粗體為最大值。
Note: Bold are the maximum.
2.2.2 GARCH模型的檢驗(yàn)
使用LM法檢驗(yàn)GARCH(3,2)模型殘差是否仍具有ARCH效應(yīng),結(jié)果顯示,其F統(tǒng)計(jì)值為0.059 821(P=0.806 9),異方差懷特檢驗(yàn)量為0.060 143(P=0.806 3)。GARCH族模型異方差懷特檢驗(yàn)量均大于顯著水平0.05,殘差序列不存在ARCH效應(yīng),因此此次研究建立的GARCH模型均滿足序列平穩(wěn)且沒有ARCH效應(yīng)的統(tǒng)計(jì)要求。
結(jié)合前文基于南寧市2017年1月1日-2017年12月31日O3日均濃度監(jiān)測值樣本數(shù)據(jù)建立的ARMA(1,1)模型-GARCH(3,2)模型,對(duì)南寧市2018年1月1日至2018年1月31日O3日均濃度進(jìn)行預(yù)測,結(jié)合實(shí)測值進(jìn)行誤差分析(圖3)。
結(jié)果表明,模型預(yù)測值與實(shí)測值的擬合趨勢(shì)基本一致,相對(duì)誤差率平均34.39%;在31 d預(yù)測濃度值中,有9 d與實(shí)測值相對(duì)誤差率在5%以內(nèi),有14 d與實(shí)測值相對(duì)誤差率在10%以內(nèi),有9 d與實(shí)測值相對(duì)誤差率在10%-20%,但也有8 d預(yù)測值與實(shí)測值誤差較大。從圖3可以看出,在實(shí)測值擬合曲線峰、谷值等前后位置容易出現(xiàn)較大誤差。2018年1月1日與1月2日的預(yù)測值相對(duì)誤差率均不超過4%,說明由于時(shí)間序列模型體現(xiàn)的是時(shí)間序列的自相關(guān)性和自身的動(dòng)態(tài)記憶性,更適宜反映樣本時(shí)間序列的短期變化。
圖3 模型擬合效果圖
Fig.3 Chart of model fitting effect
本文通過構(gòu)建ARMA-GARCH模型,對(duì)南寧市城區(qū)2018年1月31 d的O3日均濃度進(jìn)行預(yù)測,預(yù)測值擬合曲線基本能與實(shí)測值保持一致。在31 d預(yù)測濃度值中,23 d預(yù)測相對(duì)誤差率在20%,較為準(zhǔn)確,其中2018年1月1日與1月2日相對(duì)誤差率均小于4%。這表明采用時(shí)間序列ARMA-GARCH模型短期預(yù)測O3濃度是比較有效的,能為O3濃度的預(yù)測預(yù)報(bào)提供一定的參考價(jià)值。
盡管時(shí)間序列ARMA-GARCH模型描述的是樣本在時(shí)間序列上的自相關(guān)性,可較為準(zhǔn)確地反映短期內(nèi)的時(shí)間序列變化關(guān)系,而非長期的變化關(guān)系。但正因如此,時(shí)間序列ARMA-GARCH模型更適宜應(yīng)用在短期大氣污染物濃度預(yù)測方面,充分發(fā)揮其速度快、準(zhǔn)確性較高的特點(diǎn),為大氣污染防治提供決策參考。