劉學(xué)剛,張騰飛,韓 印 LIU Xuegang,ZHANG Tengfei,HAN Yin
(上海理工大學(xué) 管理學(xué)院,上海 200093)
隨著城市化進(jìn)程不斷推進(jìn)、智能交通系統(tǒng)的迅猛發(fā)展,汽車保有量日益增加,道路交通擁擠已經(jīng)成為制約城市發(fā)展的重要因素,僅僅依靠增加道路面積,不能有效解決交通堵塞問題,所以越來越多的學(xué)者開始研究智能交通系統(tǒng)用以提高道路通行能力,緩解城市的交通壓力。同時,短時交通流預(yù)測是實現(xiàn)智能交通系統(tǒng)中交通誘導(dǎo)與控制的首要問題之一,該預(yù)測能夠?qū)崿F(xiàn)城市道路路網(wǎng)最大化合理利用,極大程度降低交通事故的發(fā)生概率,提高社會經(jīng)濟(jì)效益,因此,可靠的短時交通流預(yù)測很有必要。同時克服短時交通流預(yù)測隨機(jī)性、周期性與不確定性是當(dāng)下的難點(diǎn)與重點(diǎn)。自20世紀(jì)70年代以來,交通學(xué)者就開始將其他領(lǐng)域應(yīng)用較為成熟的預(yù)測模型直接使用在短時交通流預(yù)測領(lǐng)域,如自回歸模型(MA)、自回歸移動平均模型(ARMA)等。這些模型未能有限反映出交通流的不確定性,無法克服其他外在干擾因素對交通流量的影響。由于時間跨度的縮短,使得預(yù)測的交通流受非線性干擾因素的影響較大,造成預(yù)測結(jié)果與預(yù)測精度不甚理想。隨著研究的深入,為了適應(yīng)交通流不確定性與非線性的特點(diǎn),一種基于ARIMA模型(差分自回歸移動平均模型)的短時交通流預(yù)測使用廣泛。
國內(nèi)外基于ARIMA模型的研究眾多。1993年Kim與Hobeika將ARIMA模型應(yīng)用到高速公路交通流量預(yù)測中[1-2];姚亞夫、曹鋒[3]采用ARIMA方法進(jìn)行交通流量趨勢預(yù)測,并按照AIC準(zhǔn)則進(jìn)行模型定階,最終通過實測數(shù)據(jù)進(jìn)行驗證,結(jié)果表明,ARIMA模型能夠獲得較好的中短期預(yù)測精度。2008年張利、施化吉等基于ARIMA模型結(jié)構(gòu)的時間序列分析方法,用最小二乘法進(jìn)行參數(shù)估計,同時對多個統(tǒng)計量進(jìn)行誤差分析,結(jié)果表明:該算法在應(yīng)用于時變性強(qiáng)的短時交通流量預(yù)測時,相對于Astom算法具有更好地預(yù)測性能[4]。2017年張艷艷、劉曉佳[5]等根據(jù)已有事故資料,對事故過去發(fā)展變化的規(guī)律進(jìn)行分析,參照現(xiàn)有水上交通條件,采用時間序列分析法中的ARIMA模型進(jìn)行分析預(yù)測,對水上交通事故未來發(fā)展趨勢的科學(xué)推測。2019年謝紅利、趙樹鵬、王浩宇[6]通過ARIMA模型對重慶市軌道交通進(jìn)站客流量進(jìn)行預(yù)測,同時得出其所建立的預(yù)測方法可以適用于城市軌道交通的客流預(yù)測。孫旻根據(jù)崇遵高速公路車流量的時間序列,進(jìn)行了ARIMA建模的實證分析,實驗中發(fā)現(xiàn)崇遵高速公路的出口流量序列為非平穩(wěn)序列,具有一定的趨勢和周期性,故利用ARIMA模型對該非平穩(wěn)時間序列進(jìn)行建模預(yù)測,預(yù)測效果較為合理[7]。
縱觀以往的研究可以看出,盡管ARIMA模型具有波動性及不確定性,但其對于預(yù)測短時交通流仍然具有重要意義。本文首先考慮道路交通流時間序列的非平穩(wěn)性特征,通過差分使數(shù)據(jù)變得平穩(wěn),并構(gòu)建ARIMA( 6,1,)6模型,對上海市楊浦區(qū)大連路的短時交通流進(jìn)行預(yù)測,結(jié)果表明ARIMA模型可以很好地擬合短時交通量數(shù)據(jù),ARIMA模型在短時交通量預(yù)測中有很大應(yīng)用價值。
ARIMA(差分自回歸移動平均模型)是一種時間序列數(shù)據(jù)預(yù)測的統(tǒng)計方法,其描述的是某一時間序列變量自身的統(tǒng)計規(guī)律性,根據(jù)歷史時間序列的相關(guān)關(guān)系,揭示系統(tǒng)的動態(tài)結(jié)構(gòu)特性及其發(fā)展規(guī)律。
ARIMA(差分自回歸移動平均模型)可以分為以下幾類:AR(自回歸模型)、MA(移動平均模型)、ARMA(自回歸移動平均模型)、ARIMA(差分自回歸移動平均模型)。預(yù)測思路是將預(yù)測主體隨時間變化形成的序列看作是一個隨機(jī)時間序列,通過若干次差分化使非平穩(wěn)數(shù)據(jù)轉(zhuǎn)化為平穩(wěn)序列,用一定的數(shù)學(xué)模型近似描述這個隨機(jī)序列[8]。這個模型一旦被識別,就可以用時間序列的現(xiàn)在或過去的數(shù)據(jù)來預(yù)測未來數(shù)據(jù)值。ARIMA模型在預(yù)測過程中僅考慮了時間序列的歷史數(shù)據(jù),通過發(fā)掘自身規(guī)律建立模型,提取有效信息對數(shù)據(jù)進(jìn)行預(yù)測,在數(shù)據(jù)預(yù)測方面有很大的應(yīng)用價值。
ARIMA(p,q,)d模型表達(dá)式為:
其中:yt是時間序列數(shù)據(jù);p是自回歸項的系數(shù);d是差分的階數(shù);q是移動平均項的系數(shù);ε是均值為0、方差為σ2的白噪聲序列;B是滯后算子,定義為Bkyt=yt-k,?1……?p和θ1……θq是系數(shù)。
如果數(shù)據(jù)是平穩(wěn)的時間序列數(shù)據(jù),那么d=0,方程(1)就可以簡化為ARMA模型,表達(dá)式如下:
其中:yt是時間序列數(shù)據(jù);C0是常數(shù);p是自回歸項的系數(shù);q是移動平均項的系數(shù),?1……?p和θ1……θq;ε是均值為0、方差為σ2的白噪聲序列。
(1)獲取時間序列數(shù)據(jù),根據(jù)其函數(shù)圖像以ADF單位根檢驗其方差,對序列的平穩(wěn)性進(jìn)行識別。對非平穩(wěn)序列進(jìn)行平穩(wěn)化處理。直到處理后的數(shù)據(jù)的偏相關(guān)函數(shù)值以及自相關(guān)函數(shù)值無顯著差別地趨于零后終止此項操作。
(2)根據(jù)時間序列識別規(guī)則,建立相應(yīng)模型。若平穩(wěn)序列的偏相關(guān)函數(shù)及自相關(guān)函數(shù)均是拖尾,則可使用ARIMA模型;然后對參數(shù)進(jìn)行定階與估計,判斷其是否具有統(tǒng)計的意義。
(3)對建立的ARIMA模型參數(shù)和殘差序列進(jìn)行檢驗,同時判斷殘差序列是否為白噪聲,即檢驗?zāi)P蛿M合是否合理。(4)通過Eviews軟件對交通量數(shù)據(jù)建立ARIMA模型并對交通量進(jìn)行靜態(tài)預(yù)測,并對模型結(jié)果進(jìn)行評價分析。
本數(shù)據(jù)選取上海市大連路2015年11月9日至12日的短時交通量數(shù)據(jù),數(shù)據(jù)為電磁感應(yīng)線圈獲得,統(tǒng)計時間間隔為3分鐘,共采取1 920個數(shù)據(jù),見圖1。為此將1 900個數(shù)據(jù)作為訓(xùn)練數(shù)據(jù),留下20個數(shù)據(jù)進(jìn)行預(yù)測對比分析。
從圖1看出短時交通量數(shù)據(jù)Q的波動性較大,存在一定的規(guī)律性,由此大致判斷該時間序列數(shù)據(jù)為非平穩(wěn)數(shù)據(jù),為此進(jìn)行單位根ADF檢驗結(jié)果為非平穩(wěn)時間序列。對于非平穩(wěn)時間序列數(shù)據(jù)則需要進(jìn)行差分,一階差分后得到DQ,對差分后的數(shù)據(jù)進(jìn)行單位根檢驗,檢驗結(jié)構(gòu)顯示t統(tǒng)計量小于1%置信水平下的值,即拒絕原假設(shè)存在單位根,所以一階差分后的序列是平穩(wěn)時間序列。檢驗結(jié)果如表1。
因為一階差分后的短時交通量數(shù)據(jù)為平穩(wěn)時間序列數(shù)據(jù),即可以進(jìn)行ARIMA(p,1,q)模型預(yù)測。而(p,q)的值則首先通過序列的自相關(guān)和偏自相關(guān)系數(shù)確定。
由圖2的自相關(guān)系數(shù)和偏自相關(guān)系數(shù)初步判斷(p,q)的值均不大于5,由此建立不同(p,q)階數(shù)的組合進(jìn)行測試,根據(jù)AIC以及SC準(zhǔn)則選取最優(yōu)組合模型得ARIMA( 5,1,4),采用最小二乘法對模型的系數(shù)進(jìn)行估計,如表2所示。
圖1 短時交通量數(shù)據(jù)
表1 一階差分后時間序列ADF檢驗結(jié)果
圖2 一階差分序列的相關(guān)圖
表 2 ARIMA( 5,1, 4)模型
模型的表達(dá)式為:
將表達(dá)式轉(zhuǎn)換后為:
對 ARIMA( 5,1, )4模型的殘差進(jìn)行白噪聲Q檢驗,檢驗結(jié)果如圖3所示,殘差的白噪聲檢驗均通過顯著性測試,得殘差序列為白噪聲序列,即時間序列中的信息被充分提取,模型擬合較好。
圖3 殘差的相關(guān)性檢驗
通過Eviews軟件對交通量數(shù)據(jù)建立ARIMA( 5,1,)4模型并對交通量DQ進(jìn)行靜態(tài)預(yù)測,向前20步預(yù)測得到序列的預(yù)測值,
具體預(yù)測結(jié)果見圖4,模型的評價指標(biāo)則采用MAPE、RMSE和MAE表示,見表3。
MAE、MAPE、RMSE的表達(dá)式:
其中:xi為交通量的實際值,x*為交通量的預(yù)測值,n為預(yù)測的步數(shù)。
通過圖4看出短時交通量的擬合曲線與實際值基本走勢一致,而殘差也變現(xiàn)為平穩(wěn)數(shù)據(jù),表明模型的擬合效果較好,ARIMA模型可以進(jìn)行交通量的預(yù)測。通過表3得RMSE為7.02,MAPE為26.55,MAE為5.26表明模型可以擬合短時交通量數(shù)據(jù),但MAPE相對較大,一是因為本研究收集的數(shù)據(jù)統(tǒng)計時間間隔為3分鐘,而短時交通量數(shù)據(jù)本身就具有很大的不確定性以及波動性導(dǎo)致,二是因為ARIMA模型再進(jìn)行預(yù)測時只考慮時間序列本身的歷史數(shù)據(jù),沒考慮外在的不確定性因素,導(dǎo)致模型在預(yù)測時不能較好地擬合不確定性和波動性大的數(shù)據(jù)。
影響短時交通量數(shù)據(jù)變化的因素有很多,本文沒有考慮外因素的影響,僅分析交通量時間序列本身的歷史數(shù)據(jù),建立ARIMA( 5,1, )4模型進(jìn)行短時交通量預(yù)測,采用最小二乘法對模型進(jìn)行參數(shù)估計并采用靜態(tài)預(yù)測法對數(shù)據(jù)進(jìn)行20步預(yù)測,結(jié)果顯示模型的擬合效果較好,ARIMA模型再進(jìn)行短時交通量預(yù)測時有很高的實用價值,本研究也有一些不足之處需要改進(jìn),一是ARIMA模型本身只考慮自身的歷史數(shù)據(jù)進(jìn)行預(yù)測,但由于數(shù)據(jù)不足也導(dǎo)致了模型的預(yù)測精度不是很高,二是短時交通量數(shù)據(jù)本身不確定性較大,ARIMA模型不能很好地捕捉之間的規(guī)律。所以下一步的研究就是通過對ARIMA模型改進(jìn)使之可以更好地預(yù)測短時交通量數(shù)據(jù)。
圖4 交通量的擬合曲線
表3 模型的評價