曹昱東,王 浩
(北京師范大學(xué)珠海分校,廣東珠海,519085)
隨著經(jīng)濟(jì)的不斷發(fā)展,城市生活垃圾產(chǎn)生量也越來(lái)越多,這些生活垃圾嚴(yán)重阻礙了城市的發(fā)展,帶來(lái)了一系列經(jīng)濟(jì)、社會(huì)、環(huán)境問題。全國(guó)大部分城市都面臨著垃圾快速增長(zhǎng)而處理垃圾的設(shè)施多年不變的局面。幾乎2/3的城市已經(jīng)被垃圾所包圍,而且這種情況日益嚴(yán)峻。城市生活垃圾問題也受到政府的強(qiáng)烈關(guān)注,準(zhǔn)確的預(yù)測(cè)未來(lái)城市生活垃圾產(chǎn)生量是解決城市生活垃圾問題的第一步,也是關(guān)鍵一步。
ARIMA模型的全稱是求和自回歸移動(dòng)平均模型,ARIMA(p,d,q)模型。使用 ARIMA 模型去做預(yù)測(cè),通俗的講,就是將需要預(yù)測(cè)的對(duì)象隨時(shí)間變化的數(shù)據(jù)作為一個(gè)隨機(jī)序列,然后分析出這個(gè)序列的特點(diǎn)與性質(zhì),從而通過時(shí)間序列過去的數(shù)值來(lái)推測(cè)未來(lái)的走勢(shì)。ARIMA(p,d,q)模型具有以下三條性質(zhì):
在獲取一個(gè)觀察值序列之后,首先是判斷它的平穩(wěn)性,通過平穩(wěn)性檢驗(yàn),可以把序列分為平穩(wěn)序列和非平穩(wěn)序列兩種,要用ARIMA模型進(jìn)行數(shù)據(jù)分析,所分析的序列必須是平穩(wěn)序列,而非平穩(wěn)的序列則不能直接通過ARIMA模型計(jì)算,需要將非平穩(wěn)序列轉(zhuǎn)化為平穩(wěn)序列。這里轉(zhuǎn)化的過程就是一種有效提取序列中蘊(yùn)含的確定性信息的過程。對(duì)序列進(jìn)行差分運(yùn)算則是一種常用的轉(zhuǎn)化過程。差分運(yùn)算的實(shí)質(zhì)是使用自回歸的方式提取確定性信息。由于差分運(yùn)算的這種強(qiáng)大提取信息的能力,許多非平穩(wěn)序列差分之后會(huì)顯示出平穩(wěn)序列的性質(zhì),對(duì)差分后平穩(wěn)序列可以使用ARIMA模型進(jìn)行擬合,從而去分析序列的特點(diǎn)。
而具體進(jìn)行ARIMA模型分析的時(shí)候,通過計(jì)算ACF,PACF可以有效的確定出ARIMA(p,d,q)中各參數(shù)p,d,q的具體數(shù)值,從而最終擬合序列并進(jìn)行預(yù)測(cè)。具體的ARIMA建模流程圖如圖1.
根據(jù)上海市綠化和市容管理局提供的數(shù)據(jù),做出1978年到2011年上海市生活垃圾產(chǎn)生量表1。
1978到2011年上海市生活垃圾產(chǎn)生量表(單位:萬(wàn)噸)
在SAS軟件中,繪制出該序列的時(shí)序圖圖2
圖2:上海市生活垃圾產(chǎn)生量時(shí)序圖
由圖2可看出,隨著經(jīng)濟(jì)的發(fā)展與人口的增加,自1978年來(lái),上海市垃圾產(chǎn)生量大體上呈遞增趨勢(shì),除了2000年到2002年有一個(gè)短暫的回落。垃圾產(chǎn)生量從開始的100萬(wàn)增長(zhǎng)到700萬(wàn),增長(zhǎng)的幅度比較塊,平均每年增長(zhǎng)幅度超過20%。整個(gè)圖像具有顯著的趨勢(shì),站在時(shí)間序列的角度來(lái)說,該序列是典型的非平穩(wěn)序列。
因?yàn)闀r(shí)序圖明顯非平穩(wěn),所以對(duì)數(shù)據(jù)進(jìn)行一階差分處理,一階差分后自相關(guān)圖和白噪聲檢驗(yàn)圖見圖3.
圖3:一階差分自相關(guān)、白噪聲檢驗(yàn)圖
由圖3可以看出,原序列進(jìn)過差分運(yùn)算后,已經(jīng)向平穩(wěn)序列方向發(fā)展,但是p=0.0341 還是大于標(biāo)準(zhǔn)值0.005,所以我們對(duì)該序列繼續(xù)做差分運(yùn)算。
進(jìn)過二階差分,序列在均值附近比較穩(wěn)定的波動(dòng),白噪聲檢驗(yàn)如圖3。
圖3:二階差分后的白噪聲檢驗(yàn)圖
圖3 顯示,差分后序列在均值附近比較穩(wěn)定的波動(dòng),p值<0.005,可以認(rèn)為序列平穩(wěn)。所以對(duì)二階差分后的數(shù)列進(jìn)行分析。
由偏自相關(guān)系數(shù)圖4可得在延遲期數(shù)大于等于4后,偏自相關(guān)系數(shù)就基本保持在兩倍標(biāo)準(zhǔn)差之內(nèi)。對(duì)序列進(jìn)行相對(duì)最優(yōu)定階,得到最小信息量結(jié)果為圖5.
圖4:二階差分后偏自相關(guān)圖
圖5:相對(duì)最優(yōu)定價(jià)圖
圖5 顯示,在自相關(guān)系數(shù)小于等于5,移動(dòng)平均延遲系數(shù)小于等于5的所有ARMA(p,q)模型中,BIC信息量相對(duì)最小的是 ARMA(2,1)模型,也就是 ARIMA(2,2,1)模型。
對(duì)2階差分后的序列進(jìn)行殘差自相關(guān)分析,殘差自相關(guān)檢驗(yàn)結(jié)果如圖6:
圖6:殘差白噪聲檢驗(yàn)圖
由于p顯然大于0.05,所以殘差序列為白噪聲序列,擬合模型顯著成立,模型檢驗(yàn)通過。
所以擬合模型為: 1 + 0.72298B + 0.65197,具體預(yù)測(cè)數(shù)值表2
表2:上海市生活垃圾產(chǎn)生量7期預(yù)測(cè)(單位:萬(wàn)噸)
最終得到上海市垃圾產(chǎn)生量走勢(shì)預(yù)測(cè)圖7:
圖7:上海市生活垃圾產(chǎn)生量走勢(shì)預(yù)測(cè)圖
運(yùn)用ARIMA模型對(duì)序列進(jìn)行預(yù)測(cè)時(shí),預(yù)測(cè)的準(zhǔn)確度隨著時(shí)間的推移呈發(fā)散的趨勢(shì),所以ARIMA模型只適合短期預(yù)測(cè)。而且由于ARIMA模型基本使用純數(shù)學(xué)方法來(lái)提取序列中的有效因素,不能從機(jī)理上來(lái)解釋生活垃圾產(chǎn)生量快速增加的原因,從而不利于對(duì)垃圾產(chǎn)生做出具體分析,從源頭上解決垃圾產(chǎn)生問題。
但是ARIMA模型在預(yù)測(cè)分析中,理論比較成熟,而且垃圾產(chǎn)生量常常是自相關(guān)非平穩(wěn)的,所以運(yùn)用ARIMA模型比較合理,且得出的結(jié)論可信度較高。
垃圾治理問題關(guān)系到城市發(fā)展的方方面面,是重要的城市建設(shè)問題之一。本文通過分析過去幾十年的數(shù)據(jù),運(yùn)用ARIMA(2,2,1)模型對(duì)上海市未來(lái)7年的生活垃圾產(chǎn)生量做了具體的預(yù)測(cè),具有一定的應(yīng)用價(jià)值。
[1]徐禮來(lái),崔勝輝,閆禎,等.城市生活垃圾產(chǎn)生預(yù)測(cè)的核心問題探討[J].環(huán)境科學(xué)與技術(shù),2013,36(002):184-190.
[2]芮少權(quán),匡安樂.高速公路月度交通量 ARIMA 預(yù)測(cè)模型[J].長(zhǎng)安大學(xué)學(xué)報(bào):自然科學(xué)版,2010,30(4):82-85.
[3]王燕.應(yīng)用時(shí)間序列分析[M].中國(guó)人民大學(xué)出版社,2008.
[4]上海統(tǒng)計(jì)年鑒:2012[M].中國(guó)統(tǒng)計(jì)出版社, 2012.
[5]趙鑫,郭嘉,吳建川.ARIMA 模型和 GM (1,1)與 ARMA(p, q)組合模型在滑坡短期預(yù)報(bào)中的對(duì)比分析[J].安全與環(huán)境工程,2012,19(3):24-28.