亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于ARIMA模型的大同市空氣質(zhì)量預(yù)測(cè)研究

        2019-01-02 09:01:18張葉娥,高云
        軟件 2019年12期

        摘 ?要: 時(shí)序模型作為一種預(yù)測(cè)方法,在貨運(yùn)量預(yù)測(cè)、機(jī)場(chǎng)客流量預(yù)測(cè)、疾病發(fā)病率預(yù)測(cè)、空氣質(zhì)量預(yù)測(cè)等許多重要的領(lǐng)域具有廣泛的應(yīng)用。本文利用大同市2016年1月到2019年8月共44個(gè)月的空氣質(zhì)量綜合指數(shù)數(shù)據(jù)樣本,使用牛頓插值進(jìn)行了缺失值插補(bǔ),根據(jù)給定的數(shù)據(jù)序列進(jìn)行了時(shí)序圖、自相關(guān)圖和偏自相關(guān)圖的構(gòu)建。然后,進(jìn)行單位根檢驗(yàn),判斷出序列為平穩(wěn)非白噪聲序列。本文使用相對(duì)最優(yōu)模型識(shí)別方法確立模型的p、q值,最終建立ARIMA(2,0,1)模型,對(duì)2019年9-12月的空氣質(zhì)量綜合指數(shù)進(jìn)行預(yù)測(cè)。通過(guò)對(duì)模型的分析,判斷預(yù)測(cè)值比較準(zhǔn)確。

        關(guān)鍵詞: ARIMA;時(shí)序分析;非白噪聲序列;平穩(wěn)序列

        中圖分類號(hào): TP391 ? ?文獻(xiàn)標(biāo)識(shí)碼: A ? ?DOI:10.3969/j.issn.1003-6970.2019.12.020

        本文著錄格式:張葉娥,高云. 基于ARIMA模型的大同市空氣質(zhì)量預(yù)測(cè)研究[J]. 軟件,2019,40(12):8589

        Research on Air Quality Prediction in DaTong Based on ARIMA Model

        ZHANG Ye-e, GAO Yun

        (School of Computer and Network Engineering, Shanxi Datong University, Datong,Shanxi 037009, China)

        【Abstract】: As a forecasting method, time series model has been widely used in many important fields,such as cargo volume prediction, airport passenger flow prediction, disease incidence prediction, and air quality prediction. In this paper, 44 months of air quality composite index data samples from January 2016 to August 2019 in datong city were used to carry out missing value interpolation with Newton interpolation, and time sequence, autocorrelation and partial autocorrelation were constructed according to the given data sequence. Then, the unit root test is carried out and the sequence is determined to be a stationary non-white noise sequence. In this paper,The relative optimal model identification method was used to establish the p and q values of the model, and finally the ARIMA(2,0,1) model was established to predict the air quality index from September to December 2019. Through the analysis of the model, the prediction value is more accurate.

        【Key words】: ARIMA; Time series analysis; Non-White noise sequence; Stationary series

        0 ?引言

        城市的空氣質(zhì)量問(wèn)題與居民的健康、生活、交通等問(wèn)題息息相關(guān),因此城市空氣質(zhì)量成為城市居民關(guān)注的焦點(diǎn)問(wèn)題。隨著大同市經(jīng)濟(jì)的高速發(fā)展,城市人口、交通工具、石化能源消費(fèi)劇增,由此帶來(lái)的污染問(wèn)題對(duì)城市環(huán)境的影響倍受關(guān)注。完善大同市城市空氣質(zhì)量檢測(cè)體系,對(duì)城市空氣質(zhì)量檢測(cè)歷史數(shù)據(jù)的變化進(jìn)行分析,預(yù)測(cè)未來(lái)的空氣質(zhì)量,對(duì)即將可能出現(xiàn)的空氣質(zhì)量問(wèn)題進(jìn)行預(yù)防和治理,對(duì)城市環(huán)境建設(shè)具有非常重要的意義。

        1 ?預(yù)測(cè)方法

        目前,常用的預(yù)測(cè)方法有BP神經(jīng)網(wǎng)絡(luò)和時(shí)間序列分析法,邱晨等人研究了基于BP神經(jīng)網(wǎng)絡(luò)的空氣質(zhì)量模型分類預(yù)測(cè),建立了三層神經(jīng)網(wǎng)絡(luò)數(shù)學(xué)模型,對(duì)空氣質(zhì)量等級(jí)進(jìn)行分類預(yù)測(cè),預(yù)測(cè)準(zhǔn)確率達(dá)到90%[1]?;贐P神經(jīng)網(wǎng)絡(luò)的預(yù)測(cè)模型雖然收斂效果好,精度高,但易于陷入局部最優(yōu)、過(guò)擬合。孟慶云等人應(yīng)用時(shí)間序列分析法對(duì)天津市空氣質(zhì)量各項(xiàng)指標(biāo)進(jìn)行了預(yù)測(cè)分析,預(yù)測(cè)結(jié)果較理想[2]。

        由于大同市的空氣質(zhì)量具有周期性和季節(jié)性,空氣質(zhì)量的預(yù)測(cè)問(wèn)題包含了時(shí)間的分量,所以采用時(shí)間序列分析法易于進(jìn)行預(yù)測(cè)。但由于數(shù)據(jù)具有缺失值,本文進(jìn)行了數(shù)據(jù)插補(bǔ)。對(duì)大同市空氣質(zhì)量時(shí)序數(shù)據(jù),首先需要時(shí)序分析的預(yù)處理,然后在此基礎(chǔ)上建立時(shí)序分析模型,進(jìn)行空氣質(zhì)量預(yù)測(cè)。

        1.1 ?時(shí)序分析

        時(shí)序分析方法是以概率統(tǒng)計(jì)學(xué)為基礎(chǔ),利用時(shí)序監(jiān)測(cè)數(shù)據(jù),建立相應(yīng)的數(shù)學(xué)模型,描述時(shí)序狀態(tài),以便預(yù)測(cè)未來(lái)的方法。本文應(yīng)用時(shí)間序列進(jìn)行分析,使用一個(gè)給定的已被觀測(cè)了的時(shí)間序列,即大同市2016年1月到2019年8月共44個(gè)月的空氣質(zhì)量綜合指數(shù)數(shù)據(jù)樣本,來(lái)預(yù)測(cè)該序列的未來(lái)值。

        1.2 ?時(shí)序分析的預(yù)處理

        獲得大同市2016年1月到2019年8月共44個(gè)月的空氣質(zhì)量綜合指數(shù)數(shù)據(jù)樣本后,首先要進(jìn)行時(shí)序分析的預(yù)處理,檢查序列的平穩(wěn)性和純隨機(jī)性。

        1.2.1 ?平穩(wěn)性檢驗(yàn)

        (1)時(shí)序圖檢驗(yàn)

        檢驗(yàn)大同市2016年1月到2019年8月共44個(gè)月的空氣質(zhì)量綜合指數(shù)數(shù)據(jù)樣本的時(shí)序圖,判斷該序列值是否始終在一個(gè)常數(shù)附近波動(dòng),并且波動(dòng)的范圍有界,確定數(shù)據(jù)序列是否為平穩(wěn)序列。如果不是,那么數(shù)據(jù)序列為非平穩(wěn)序列,需要通過(guò)差分運(yùn)算,使得序列成為平穩(wěn)序列。

        (2)自相關(guān)圖、偏自相關(guān)圖檢驗(yàn)

        利用自相關(guān)圖對(duì)大同市2019年8月共44個(gè)月的空氣質(zhì)量綜合指數(shù)數(shù)據(jù)樣本進(jìn)行平穩(wěn)性檢驗(yàn),自相關(guān)系數(shù)如果隨著延遲期數(shù)的增加,以較快的速度趨向于零,并在零附近隨機(jī)波動(dòng),則序列為平穩(wěn)序列,否則為非平穩(wěn)序列。利用偏自相關(guān)圖對(duì)數(shù)據(jù)樣本進(jìn)行平穩(wěn)性檢驗(yàn),看偏自相關(guān)系數(shù)是否隨著延遲期數(shù)的增加超出置信度的上下限,如果沒(méi)超出則為平穩(wěn)序列,否則,序列為非平穩(wěn)序列。

        (3)單位根檢驗(yàn)

        檢驗(yàn)大同市2019年8月共44個(gè)月的空氣質(zhì)量綜合指數(shù)序列中是否存在單位根,不存在單位根的序列為平穩(wěn)序列,否則為非平穩(wěn)序列。

        1.2.2 ?純隨機(jī)性檢驗(yàn)

        純隨機(jī)檢驗(yàn)也稱白噪聲檢驗(yàn),通過(guò)大同市2019年8月共44個(gè)月的空氣質(zhì)量綜合指數(shù)數(shù)據(jù)樣本各延遲期數(shù)的自相關(guān)系數(shù),計(jì)算得到檢驗(yàn)統(tǒng)計(jì)量,判斷是否為白噪聲序列,若是,則停止對(duì)該序列的分析。

        1.3 ?ARIMA模型

        ARIMA模型,又稱自回歸移動(dòng)平均模型,是20世紀(jì)70年代初由博克思(Box)和詹金斯(Jenkins)提出的時(shí)間序列預(yù)測(cè)方法。其中ARIMA (p,d,q)模型是由差分運(yùn)算與ARIMA (p,q)模型組合而成,其中,p是自回歸模型的階數(shù),d是差分的階數(shù),q是移動(dòng)平均的階數(shù)[5]。

        實(shí)際應(yīng)用中的絕大部分序列都是非平穩(wěn)的,將非平穩(wěn)序列采用差分運(yùn)算轉(zhuǎn)換成差分平穩(wěn)序列,這樣就可以使用ARIMA模型進(jìn)行建模分析。

        差分平穩(wěn)時(shí)間序列建模步驟如圖1所示。

        圖1 ?差分平穩(wěn)時(shí)間序列建模步驟圖

        Fig.1 ?Differential stationary time series

        modeling step diagram

        2 ?使用ARIMA模型實(shí)現(xiàn)大同市空氣質(zhì)量的預(yù)測(cè)分析

        本文在Python中實(shí)現(xiàn)ARIMA模型建模過(guò)程,使用了StatsModels庫(kù),對(duì)于通常的數(shù)據(jù)探索任務(wù)來(lái)說(shuō),Numpy和Pandas的結(jié)合是夠用的,但是對(duì)于較為深入的統(tǒng)計(jì)模型時(shí),就會(huì)使用StatsModels。

        本文選用的數(shù)據(jù)為2016年1月至2019年8月的大同市共44個(gè)月的空氣質(zhì)量綜合指數(shù),通過(guò)對(duì)這44個(gè)月的空氣質(zhì)量綜合指標(biāo)建立模型,預(yù)測(cè)2019年9月到12月的空氣質(zhì)量綜合指數(shù)。本文選用的數(shù)據(jù)視為無(wú)異常值數(shù)據(jù),但是有缺失值。

        其基本步驟是:(1)以已有數(shù)據(jù)為基礎(chǔ),進(jìn)行數(shù)據(jù)插補(bǔ)補(bǔ)足缺失值。(2)以原有數(shù)據(jù)和補(bǔ)足的缺失值數(shù)據(jù)為依據(jù),區(qū)別不規(guī)則變動(dòng)、循環(huán)變動(dòng)、季節(jié)變動(dòng)等不同時(shí)間的動(dòng)勢(shì),特別是連續(xù)的長(zhǎng)期動(dòng)勢(shì)。(3)運(yùn)用ARIMA求出時(shí)間序列以及將來(lái)時(shí)態(tài)的各項(xiàng)預(yù)測(cè)值。

        2.1 ?缺失值補(bǔ)足

        本文獲取的數(shù)據(jù)中,存在著4個(gè)月數(shù)據(jù)缺失,原始數(shù)據(jù)如圖2所示。

        圖2 ?大同市空氣質(zhì)量月報(bào)數(shù)據(jù)圖

        Fig.2 ?Datong city air quality monthly data map

        處理缺失值可以采用數(shù)據(jù)插補(bǔ)的方法,在眾多插補(bǔ)方法中,牛頓插值法使用較為普遍,所以本文采用了牛頓插值法來(lái)進(jìn)行缺失值補(bǔ)足。

        2.1.1 ?牛頓插值法

        對(duì)于平面上已知的n個(gè)點(diǎn)(無(wú)兩點(diǎn)在一條直線上)可以找到n-1次多項(xiàng)式y(tǒng)=a0+a1x+a2x2+…+ an-1xn-1,使此多項(xiàng)式曲線過(guò)這n個(gè)點(diǎn)[6]。

        (1)求已知的n個(gè)點(diǎn)對(duì)(x1,y1),(x2,y2)…(xn,yn)的所有階差商公式

        (2)聯(lián)立以上商差公式建立如下插值多項(xiàng)式

        其中,

        .

        P(x)為牛頓插值逼近函數(shù),R(x)為誤差函數(shù)。

        2.1.2 ?使用牛頓插值法進(jìn)行插補(bǔ)

        Python中使用的Scipy庫(kù)是建立在Numpy的基礎(chǔ)之上,基于Python生態(tài)的一款開源數(shù)值計(jì)算,是用于科學(xué)與工程應(yīng)用的開源軟件。本文應(yīng)用牛頓插值法對(duì)缺失值進(jìn)行插補(bǔ),使用缺失值前后各5個(gè)未缺失的數(shù)據(jù)參與建模,在插值之前會(huì)對(duì)數(shù)據(jù)進(jìn)行異常值檢測(cè),異常值大于50也定義為空缺值(本文不存在異常值),進(jìn)行補(bǔ)數(shù)。

        缺失值插補(bǔ)后的數(shù)據(jù)如圖3所示。

        圖3 ?缺失值插補(bǔ)后的數(shù)據(jù)圖

        Fig.3 ?Data diagram after missing value interpolation

        分析插補(bǔ)值可知,缺失的月份分別為6、9和12月,6月大同市天氣比較舒適,不需要使用空調(diào),不影響空氣質(zhì)量;12月大同市已經(jīng)進(jìn)入了供暖期,供暖對(duì)空氣造成一定程度污染,這兩個(gè)月的插補(bǔ)值比較準(zhǔn)確。9月空氣質(zhì)量應(yīng)該與6月比較接近,這里的插補(bǔ)值略微偏大,一定程度上會(huì)對(duì)預(yù)測(cè)結(jié)果造成影響,但是綜合幾個(gè)月來(lái)看,影響在可接受范圍內(nèi)。

        2.2 ?ARIMA模型的建立

        使用ARIMA建模,步驟如下:

        (1)檢驗(yàn)序列的平穩(wěn)性

        2016年1月至2019年8月的大同市共44個(gè)月的空氣質(zhì)量綜合指數(shù)的數(shù)據(jù)序列時(shí)序圖如圖4所示。

        檢驗(yàn)數(shù)據(jù)序列的平穩(wěn)性,對(duì)應(yīng)的自相關(guān)圖和偏自相關(guān)圖,如圖5、圖6所示。

        圖4 ?數(shù)據(jù)序列的時(shí)序圖

        Fig.4 ?Time series of data series

        圖5 ?數(shù)據(jù)序列的自相關(guān)圖

        Fig.5 ?Autocorrelation diagram of data series

        圖6 ?數(shù)據(jù)序列的偏自相關(guān)圖

        Fig.6 ?Partial autocorrelation diagram of data series

        數(shù)據(jù)序列的ADF(單位根)檢驗(yàn)結(jié)果為: (–4.360335390121504, 0.0003486671586324529, 6, 37, {'1%': –3.6209175221605827, '5%': –2.9435394610388332, '10%': –2.6104002410518627}, 82.97142692734585)

        表1 ?數(shù)據(jù)序列的單位根檢驗(yàn)

        Tab.1 ?Unit root test for data series

        adf cValue p值

        1% 5% 10%

        –4.36 –3.6209 –2.9436 –2.6104 0.0003

        結(jié)果顯示,數(shù)據(jù)序列的時(shí)序圖在其均值附近進(jìn)行比較平穩(wěn)的波動(dòng)、自相關(guān)圖具有很強(qiáng)的短期相關(guān)性、單位根檢驗(yàn)p值遠(yuǎn)小于0.05,adf值小于三個(gè)水平值,所以數(shù)據(jù)序列是平穩(wěn)序列,不需要再進(jìn)行差分運(yùn)算。

        (2)數(shù)據(jù)序列的白噪聲檢驗(yàn)

        數(shù)據(jù)序列的白噪聲檢驗(yàn)結(jié)果為:(array ([17.38442578]), array([3.05317522e-05]))。

        表2 ?數(shù)據(jù)序列的白噪聲檢驗(yàn)

        Tab.2 ?White noise test of data series

        stat p值

        17.3844 3.05317522e-05

        輸出的p值遠(yuǎn)遠(yuǎn)小于0.05,所以數(shù)據(jù)序列是平穩(wěn)非白噪聲序列。

        (3)對(duì)數(shù)據(jù)的平穩(wěn)非白噪聲序列擬合ARMA ? 模型。

        對(duì)模型的擬合可以通過(guò)人為識(shí)別的方法,此時(shí)序列的自相關(guān)圖和偏自相關(guān)圖均顯示出拖尾性,所以可以考慮使用ARMA(2,1)模型擬合該序列。

        但是人為識(shí)別的方法會(huì)帶有很大的主觀性并受到歷史經(jīng)驗(yàn)的限制,所以實(shí)際應(yīng)用中通常會(huì)采用相對(duì)最優(yōu)模型識(shí)別的方法來(lái)擬合模型,即計(jì)算ARMA(p,q)。本文采用了44條數(shù)據(jù)量,計(jì)算時(shí)p和q的值即一般階數(shù)不超過(guò)44/10。計(jì)算當(dāng)p和q均小于等于4時(shí)的所有組合的BIC信息量,這里取其中BIC信息量達(dá)到最小的模型階數(shù)。計(jì)算出當(dāng)p和q均小于等于4時(shí)的BIC矩陣如圖7所示。

        圖7 ?BIC矩陣圖

        Fig.7 ?BIC matrix diagram

        p值為2、q值為1時(shí)最小BIC值為122.637017,p、q定階完成,原始序列不需要差分運(yùn)算,序列建立模型為ARIMA(2,0,1)。

        2.3 ?ARIMA模型分析

        (1)模型檢驗(yàn)

        殘差為白噪聲序列。

        (2)參數(shù)檢驗(yàn)和參數(shù)估計(jì)

        使用了ARMA模型進(jìn)行建模,BIC、AIC和HQIC值見表3所示。

        表3 ?BIC、AIC和HQIC值

        Tab.3 ?BIC, AIC and HQIC values

        BIC AIC HQIC

        122.6370 113.7161 117.024

        模型參數(shù)見表4所示。

        表4 ?模型參數(shù)表

        Tab.4 ?Model parameter table

        Coef Std.Err t

        const 5.1266 0.0338 151.5411

        ar.L1.空氣綜合指數(shù) 1.4780 0.0980 15.0815

        ar.L2.空氣綜合指數(shù) –0.7389 0.0969 –7.6242

        ma.L1.空氣綜合指數(shù) –1.0000 0.0695 –14.3854

        (3)ARIMA模型預(yù)測(cè)

        應(yīng)用ARIMA(2,0,1)對(duì)給空氣質(zhì)量數(shù)據(jù)做為期4個(gè)月的預(yù)測(cè),結(jié)果如表5所示。

        表5 ?2019年9-12月空氣質(zhì)量數(shù)據(jù)預(yù)測(cè)表

        Tab.5 ?Forecast Table of Air Quality Data for

        September-December 2019

        2019-9 2019-10 2019-11 2019-12

        4.50285477 5.48054205 6.11064921 6.31951199

        3 ?結(jié)論

        本文采用了ARIMA(2,0,1)模型,利用歷史44個(gè)月的大同市空氣質(zhì)量指標(biāo)數(shù)據(jù)進(jìn)行了4個(gè)月的數(shù)據(jù)預(yù)測(cè),從預(yù)測(cè)結(jié)果來(lái)看,所得空氣質(zhì)量指標(biāo)數(shù)據(jù)與往年同期相比,符合相關(guān)規(guī)律,與2019年1-8月相比,符合本年天氣變化規(guī)律。即預(yù)測(cè)數(shù)據(jù)符合短期相關(guān)性。但時(shí)間預(yù)測(cè)的典型特點(diǎn)是利用模型向前預(yù)測(cè)的時(shí)期越長(zhǎng),預(yù)測(cè)的誤差將會(huì)越大。

        參考文獻(xiàn)

        [1]邱晨, 羅璟, 趙朝文, 等. 基于BP神經(jīng)網(wǎng)絡(luò)的空氣質(zhì)量模型分類預(yù)測(cè)研究[J]. 軟件, 2019, 40(2): 129-132.

        [2]孟慶云, 張若晴, 袁朱紅, 等. 基于ARIMA模型的天津市空氣質(zhì)量各項(xiàng)指標(biāo)的預(yù)測(cè)分析[J]. 農(nóng)業(yè)災(zāi)害研究, 2018, 8(5): 44-45.

        [3]Mehdi Khashei, Zahra Hajirahimi. A comparative study of series arima/mlp hybrid models for stock price forecasting[J]. Communications in Statistics - Simulation and Computation, 2019, 48(9).

        [4]敖建松, 尚文利, 趙劍明, 等. 基于ARIMA預(yù)測(cè)修正的工控系統(tǒng)態(tài)勢(shì)理解算法[J/OL]. 計(jì)算機(jī)應(yīng)用研究: 1-5 [2019-09-25]. https://doi.org/10.19734/j.issn.1001-3695.2019.05. 0148.

        [5]李苑輝, 劉夏, 歐志鵬. 基于ARIMA 模型的三亞機(jī)場(chǎng)客流量預(yù)測(cè)[J]. 軟件, 2018, 39(7): 42-47.

        [6]高萌. 抵御黑洞攻擊的牛頓插值備份路由協(xié)議研究[D]. 中國(guó)礦業(yè)大學(xué), 2017.

        [7]趙朝文, 羅璟, 邱晨. 基于ARIMA模型與Winter模型的水運(yùn)貨運(yùn)量預(yù)測(cè)比較[J]. 軟件, 2019, 40(1): 172-178.

        [8]張良均, 王璐等. Python數(shù)據(jù)分析與挖掘?qū)崙?zhàn)[M]. 北京: 機(jī)械工業(yè)出版社, 2016.

        人妻少妇精品视频专区vr| 亚州精品无码久久aV字幕| 国产精品久久久久孕妇| 加勒比东京热综合久久| 日韩有码在线免费视频| 91超精品碰国产在线观看| 亚洲av无码久久精品色欲| 狠狠色综合网站久久久久久久 | 国产精品白浆一区二区免费看| 日韩精品有码中文字幕在线| 成人大片在线观看视频| 麻豆亚洲一区| 天天鲁在视频在线观看| 99久久综合狠狠综合久久| 免费无码AⅤ片在线观看| 日韩亚洲一区二区三区在线| 国产午夜视频在线观看免费| 国产精品v片在线观看不卡| 亚洲人成网7777777国产| 国产美女精品AⅤ在线老女人| 日本顶级片一区二区三区| 蜜桃av噜噜一区二区三区策驰| √新版天堂资源在线资源| 日韩av无码成人无码免费| 国产边摸边吃奶叫床视频| 亚洲精品国产第一区二区尤物| 超碰观看| 国产色视频在线观看了| 女人被狂躁的高潮免费视频| 伊人久久久精品区aaa片| 国产AⅤ无码久久丝袜美腿| 日本午夜一区二区视频| 亚洲av高清一区二区在线观看 | 国产精品亚洲精品一区二区| 免费大片黄国产在线观看| 老师翘臀高潮流白浆| 国产自在自线午夜精品视频在 | 亚洲AⅤ乱码一区二区三区| 亚洲一区二区懂色av| 久久99精品久久久久久噜噜| 国产内射999视频一区|