盛選義 彭良玉
(天津大學(xué) 理學(xué)院,天津 300072)
分位數(shù)回歸在時間序列中的應(yīng)用
盛選義 彭良玉
(天津大學(xué) 理學(xué)院,天津 300072)
文章利用分位數(shù)回歸和時間序列相結(jié)合的方法對澳大利亞月度紅酒銷售量數(shù)據(jù)進(jìn)行建模和預(yù)測,得出的模型能很好地描述出月份對于紅酒銷量變化范圍的影響.當(dāng)自變量時間對因變量紅酒銷量的分布產(chǎn)生不同的影響時,相對于最小二乘回歸系數(shù)得到單一結(jié)果來說,利用分位數(shù)回歸得到的時間序列模型能更好地利用數(shù)據(jù)里的信息,得到比較全面的預(yù)測結(jié)果.
季節(jié)差分;分位數(shù)回歸;自回歸移動平均模型;區(qū)間估計;模型診斷
為了彌補(bǔ)均值回歸在回歸分析中的缺陷,1978年,Koenker和Bassett[1]首次提出了分位數(shù)回歸的概念,隨后分位數(shù)回歸逐步發(fā)展,理論方面越來越完善,詳盡的理論在文獻(xiàn)[2]中都有介紹.Barnes和 W.Hughes[3]利用分位數(shù)回歸對跨部門公債市場的回報率進(jìn)行了分析;Deaton對于分位數(shù)回歸在需求分析方面做了介紹,并分析了巴基斯坦的Engel曲線[4];Ma和Pohlman運用了分位數(shù)回歸來評估共同基金超級市場的日銷售情況,2009年Firpo,F(xiàn)ortin和Lemieux[5]研究了無條件的分位數(shù)回歸.
分位數(shù)回歸在時間序列中的研究也在逐步發(fā)展.1983年Bloomfield和Steiger[6]研究了用中位數(shù)回歸法估計時間序列的自回歸模型參數(shù),1991年 Weiss[7],1989年 Knight[8],1995年 Koul和 Saleh[9],1994年Koul和 Mukherjee[10],1997年 Hassan和 Koenker[11]以及1999年 Hallin和Jureckova[12]都研究過線性分位數(shù)自回歸模型.2005年Koenker和Xiao[13]又研究了線性分位數(shù)自回歸模型的系數(shù),把系數(shù)拓展成與同一變量相關(guān)的單調(diào)函數(shù).2010年Marcus,Matthew和Carlos研究了時間序列橫截面數(shù)據(jù)的分位數(shù)回歸.分位數(shù)回歸法在時間序列中各種模型的研究還有很多,其應(yīng)用在國際上是非常廣泛的,但是在國內(nèi)近幾年才開始對分位數(shù)回歸進(jìn)行研究,分位數(shù)回歸的應(yīng)用也有一定的局限性.本文針對澳大利亞月度紅酒銷售量數(shù)據(jù),用分位數(shù)回歸和時間序列相結(jié)合的方法對數(shù)據(jù)進(jìn)行建模和預(yù)測從而能得到相對滿意的結(jié)果.
對平穩(wěn)的時間序列建模,最常用的模型是自回歸移動模型ARMA模型:
在實際應(yīng)用中,模型的識別比較重要,一個比較簡單直觀的模型識別方法是可以利用時間序列模型ACF,PACF的性質(zhì)判別模型,具體見表1.
其他識別方法如Akaike給出的信息準(zhǔn)則法,Gray,Kelley和McIntire引入的R-和S-陣列方法和Beguin,Gourieroux和Monfort提出的隅角法,各有其優(yōu)缺點,這里就不贅述了.
對時間序列模型中參數(shù)φ1,φ2,…,φp,θ1,θ2,…,θq的估計稱為參數(shù)估計.參數(shù)估計的方法有很多種,主要有矩方法、極大似然方法、最小二乘方法和分位數(shù)回歸法.
表1 時間序列模型的性質(zhì)
1.2.1 分位數(shù)回歸法
對于 ARMA(p,q)序列:
1.2.2 模型的檢驗和優(yōu)化
模型的診斷檢驗有兩類問題:1)模型的顯著性檢驗:模型的顯著檢驗主要就是看它提取的信息是否充分.所以模型的顯著性檢驗就是基于殘差序列分析的.如果殘差序列是白噪聲序列,則選取的模型通過顯著性檢驗,如果不是,則說明此模型還不夠有效,需選擇其他模型.2)參數(shù)的顯著性檢驗:就是檢驗?zāi)P椭械拿恳粋€參數(shù)是否顯著為0,目的是為了使模型更精確更精簡.如果某個參數(shù)不顯著,則將此變量刪除,從而得到一個精簡的擬合模型.
碲雖然在蒸餾段能夠有效脫除,但其混雜于鉛鉍合金中,在后續(xù)的鉛、鉍電解回收上造成嚴(yán)重的干擾,同時因碲價值較高,鉛、鉍、碲的復(fù)雜合金難以得到有效分離,降低了浮選尾礦綜合回收的價值。
有時我們得到的通過模型顯著性的模型不止一個,其他模型選擇的方法就被提出,常用的是信息準(zhǔn)則法,其中有AIC準(zhǔn)則,SBC準(zhǔn)則等,這些準(zhǔn)則的提出可以有效地彌補(bǔ)我們依據(jù)自相關(guān)圖和偏自相關(guān)圖定階的主觀性,以幫助我們尋找最優(yōu)的擬合模型.
分位數(shù)回歸采用使加權(quán)殘差絕對值之和達(dá)到最小的方法估計參數(shù),其優(yōu)點主要體現(xiàn)在以下幾個方面:
1)分位數(shù)回歸對時間序列模型的隨機(jī)誤差項無要求,與最小二乘法相比適應(yīng)性強(qiáng),能使得分位數(shù)回歸具有很強(qiáng)的適應(yīng)性.
2)分位數(shù)回歸的參數(shù)估計值不受異常點的影響,使得建立的時間序列模型具有較強(qiáng)的穩(wěn)健性.
3)分位數(shù)回歸對不同的分位點,都能估計出相應(yīng)的參數(shù)值,這使得數(shù)據(jù)中的大部分的信息都能被提取出來.
本文采用的數(shù)據(jù)來自1980年到1990年澳大利亞紅酒月度銷量(單位:L),依據(jù)原有數(shù)據(jù)建立起未來數(shù)月的銷售量預(yù)測的預(yù)測模型,能夠?qū)σ院蟮匿N量進(jìn)行預(yù)測,以便于生產(chǎn)商和銷售商制定出合適的生產(chǎn)和銷售方案,以達(dá)到資源的合理配置和利用.這里所有的計算都是通過R軟件計算的.
根據(jù)已有的數(shù)據(jù),畫出紅酒月度銷量的時間序列圖見圖1-a,可以看出該原始數(shù)據(jù)序列不是平穩(wěn)的數(shù)據(jù)序列,存在一個明顯遞增的趨勢,因此在建模前我們先要對數(shù)據(jù)預(yù)處理以使其穩(wěn)定.
從紅酒月度銷量的時間序列圖中還可以看出序列呈現(xiàn)一個季節(jié)效應(yīng),因此先對原數(shù)據(jù)標(biāo)準(zhǔn)化后,再用周期差分進(jìn)行處理,處理后結(jié)果如圖1-a,通過檢驗我們發(fā)現(xiàn)經(jīng)過周期為12個月度的一階差分以后的平穩(wěn)性檢驗的p值為0.038 483,拒絕原假設(shè),則認(rèn)為經(jīng)過此處理后序列是平穩(wěn)的.
模型的識別,采用簡單直觀的方法即利用時間序列ACF,PACF性質(zhì)的判別模型類型.對差分處理后的平穩(wěn)數(shù)列,它們的樣本自相關(guān)系數(shù)和偏自相關(guān)系數(shù)圖,分別見圖1-c,圖1-d.
然后根據(jù)得到自相關(guān)系數(shù)和偏自相關(guān)系數(shù)表現(xiàn)出來的性質(zhì),選擇適當(dāng)階數(shù)的模型擬合序列.觀測我們所得到的樣本自相關(guān)系數(shù)和偏自相關(guān)系數(shù)圖的特征,可以認(rèn)為ACF一階截尾,PACF一階拖尾;也可以認(rèn)為ACF拖尾,PACF一階截尾;或者ACF,PACF都一階截尾,所以我們只能采取別的模型識別方法,采用信息準(zhǔn)則法,對應(yīng)的模型為 MA(1),AR(1),ARMA(1,1)分別計算各模型的 AIC值分別為AIC=136.87,AIC=135.45,AIC=137.45.選取AIC值最小的時間序列類型AR(1)即為我們的模型.y t=β0+β1y t-1+εt.
圖1 紅酒月銷售量相關(guān)信息圖
下面用分位數(shù)回歸法對模型的系數(shù)β0,β1進(jìn)行估計.這里選擇五個不同的分位點τ=0.1,0.3,0.5,0.7,0.9估計模型系數(shù).估計結(jié)果如表2.
表2 模型參數(shù)
模型的擬合圖如圖2,圖中由下到上的散點依次是τ=0.1,0.5,0.9所對應(yīng)的擬合值.
下面對模型的殘差進(jìn)行檢驗,如果殘差是白噪聲序列,則說明這個模型是合適的,用Ljung-Box檢驗法檢驗殘差是否為白噪聲序列,結(jié)果如表3.表中的p值都比較大,不能拒絕原假設(shè),說明這些殘差序列都是白噪聲,因此這個模型是顯著有效的.
表3 殘差檢驗數(shù)
接著我們對模型的參數(shù)進(jìn)行顯著性檢驗,對通過模型殘差檢驗的5個模型的參數(shù)檢驗,檢驗結(jié)果如下表4所示.
表4 模型參數(shù)顯著性檢驗
取檢驗水平α=0.05,得到檢驗的拒絕域為|t|≥t1-α/2(T-m),而t0.975(119)=1.980 1,則各分位點模型的參數(shù)都顯著不為0,因此上述各分位點的模型都可作為我們的擬合模型.
圖2 分位點τ=0.1,0.5,0.9的擬合圖
利用分位數(shù)回歸的方法,對于同一個模型,可以得到很多組系數(shù)的估計值,這里對模型AR(1)取了5個不同的分位點τ=0.1,0.3,0.5,0.7,0.9.從表4中可以看出,高分位數(shù)點0.7,0.9對應(yīng)的擬合值普遍比較高,相對低的分位點0.1,0.3所對應(yīng)的擬合值比較低.比如,對于經(jīng)濟(jì)情況較好的年份,我們可以采取高分位點的估計值進(jìn)行預(yù)測,相反,我們就可以采取低分位點的估計值進(jìn)行預(yù)測,對于經(jīng)濟(jì)情況一般的年份我們可以采取0.5分位點的估計值作為預(yù)測值.
表5 銷量預(yù)測表
時間序列分析從大量按時間順序排列的數(shù)據(jù)出發(fā),建立一個能很好地描述數(shù)據(jù)的模型.時間序列在商業(yè)、經(jīng)濟(jì)、金融等各個領(lǐng)域的應(yīng)用越來越廣泛,常見的時間序列模型參數(shù)估計方法也有很多種,本文將分位數(shù)回歸方法應(yīng)用在時間序列模型的參數(shù)估計中,由于分位數(shù)回歸有著很多其他方法不具備的優(yōu)點,如對模型的誤差項不做具體要求,對異常值不敏感,能夠比較完整地提取擬合數(shù)據(jù)集中的信息,這使得用分位數(shù)回歸求出的時間序列模型能夠做出比較準(zhǔn)確且全面的預(yù)測.
本文得到的模型為AR(1):y t=β0+β1y t-1+εt可知,反映的是前一個月紅酒銷量對當(dāng)月紅酒銷量的影響.參數(shù)β1估計值呈現(xiàn)遞增趨勢,隨著分位點的增加,前一個月的銷量所起的作用越來越大.商家可以根據(jù)當(dāng)年經(jīng)濟(jì)狀況的好壞和葡萄的產(chǎn)量選擇合適的分位點預(yù)測值對未來幾個月的銷量進(jìn)行預(yù)測,從而制定出合適的生產(chǎn)和銷售方案.由此可見,用分位數(shù)回歸法對澳大利亞月度紅酒銷量進(jìn)行建模和分析,可以更加詳細(xì)地提取出潛藏在數(shù)據(jù)里面的信息.它不僅能夠比較準(zhǔn)確地計算出模型的整體趨勢,而且還可以針對不同情況,得到不同分位點下的估計值,為預(yù)測未來的銷售量和做出正確的戰(zhàn)略決策提供充分的理論依據(jù),這是其他方法所不能比擬的.
[1]Koenker R,Bassett G.Regreesion quantiles[J].Econometrica,1978,46(1):33-50
[2]Roger,Koenker.Quantile regreesion[M].New York:Cambridge University Press,2005
[3]Barnes M,Hughes W.A quantile regression analysis of the cross section of stock market returns[M].Boston:Papers,F(xiàn)ederal Reserve Bank of Boston,2002
[4]Deaton A.The analysis of household surveys:a microeconometric approach to development policy[D].Baltimore:Johns Hopkins University Press,1997
[5]Firpo S,F(xiàn)ortin N M,Lemieux T.Unconditional quantile regression[J].Econnometrica,2009,77,953-973
[6]Bloomfield P,Steiger W S.Least Absolute Deviations Theory[J].Boston:Birkhauser,1983
[7]Weiss A A.Esimating nonlinear dynamic modes using least absolute error estimation[J].Econnometric Theory,1991,7:46-68
[8]Knight K.Limit theory for autoregressive-parameter estimate in an infinite-variance random walk[J].Canadian Journal of statistics,1989,17:261-278
[9]Koul H,Saleh A.Autoregression quantiles and related reank score processes[J].Annals of Statistics,1995,23:670-689
[10]Koul H,Mukherjee K.Regression quantiles and related processes under long range dependent errors[J].Journal of Multivariate Analysis,1994,51:318-337
[11]Hassan M,Koenker R.Robust rank tests of the unit root hypothesis[J].Econometric,1997,65:133-161
[12]Hallin M,Jureckova J.Optimal tests for autoregressive models based on autoregression rand scores[J].Annals of statistics,1999,27:1 385-1 414
[13]Koenker R,Zhao Q.Conditional quantile estimation and interence for ARCH models[J].Econometric Theory,1996(12):793-813
[14]王黎明,王 連,楊 楠.應(yīng)用時間序列分析[M].上海:復(fù)旦大學(xué)出版社,2009
The Application of Quantile Regression in Time Series
Sheng Xuanyi Peng Liangyu
(Shcool of Science,Tianjin University,Tianjin 300072,China)
Taking advantage of the application of quantile regression in time series,we predict the future red wine sales of Australia.Models getted can give a good discription of affection of month to sales.Comparing to single result from the Least-square method,quantile regression can make full use of the data and give more comprehensive results.
season difference;quantile regression;ARMA;interval estimation;model diagnosis
王映苗】
1672-2027(2011)03-0025-05
O213.9
A
2011-03-21
盛選義(1986-),男,山東菏澤人,天津大學(xué)理學(xué)院在讀碩士研究生,主要從事分位數(shù)回歸,數(shù)據(jù)挖掘研究.