葉曉卿 范國良
(安徽工程大學(xué)數(shù)理學(xué)院,安徽 蕪湖 241000)
預(yù)測(cè)已有漫長(zhǎng)的歷史。我國古代人民用沙漏來預(yù)測(cè)時(shí)間,看見螞蟻上樹預(yù)示天即將下雨等,都是自覺和不自覺運(yùn)用預(yù)測(cè)技術(shù)的一種體現(xiàn)。但在19世紀(jì)以前,人類對(duì)于這樣一類問題,往往根據(jù)個(gè)人的經(jīng)驗(yàn)、閱歷、學(xué)識(shí)和智慧,通過類比、分析和綜合的方法做出直觀判斷,即現(xiàn)在我們所說的定性預(yù)測(cè)。這些方法至今仍在采用,并繼續(xù)向理性化、系統(tǒng)化的方向發(fā)展,在一些缺乏定量信息和極端復(fù)雜的場(chǎng)合,仍有不可取代的作用。但該方法主觀性較濃,同時(shí)也容易出錯(cuò)。時(shí)間序列預(yù)測(cè)是通過對(duì)預(yù)測(cè)目標(biāo)自身時(shí)間序列的處理來研究其變化趨勢(shì)的,即通過時(shí)間序列的歷史數(shù)據(jù)揭示現(xiàn)象隨時(shí)間變化的規(guī)律,并將這種規(guī)律延伸到未來若干年,從而對(duì)該數(shù)據(jù)的未來做出預(yù)測(cè)。時(shí)間序列作為20世紀(jì)近代統(tǒng)計(jì)學(xué)的一個(gè)分支,現(xiàn)在已成為數(shù)學(xué)界、工程界和經(jīng)濟(jì)學(xué)界應(yīng)用最多、最廣的課題之一。
目前,對(duì)時(shí)間序列分析的方法主要有以下三種:一是由Box和Jenkins提出的Box-Jenkins遞推預(yù)報(bào)方法;二是由Brock well和Davis以Hilbert空間的基本理論和方法為基礎(chǔ)提出的射影預(yù)報(bào)方法;三是最優(yōu)濾波理論。本文采用的ARIMA模型即是Box和Jenkins提出的Box-Jenkins法中的一種預(yù)測(cè)模型。關(guān)于時(shí)間預(yù)測(cè)的軟件主要有SPSS和Excel。其中SPSS是社會(huì)經(jīng)濟(jì)統(tǒng)計(jì)軟件包,在主成分分析上有著獨(dú)特的優(yōu)勢(shì),但也能用來做經(jīng)濟(jì)學(xué)的時(shí)間序列分析。本文主要采用SPSS19.0做分析。
ARIMA(Auto Regressive Integrated Moving Average)即自回歸求和滑動(dòng)平均,其前身是ARMA模型,是由美國統(tǒng)計(jì)學(xué)家Box和英國統(tǒng)計(jì)學(xué)家Jenkins在20世紀(jì)70年代提出的時(shí)間序列模型,即自回歸滑動(dòng)平均模型,用此模型所作的時(shí)間序列預(yù)測(cè)方法也稱Box-Jenkins(BJ)法,ARIMA是Box-Jenkins方法中重要的預(yù)測(cè)模型,適于處理非平穩(wěn)時(shí)間序列。ARIMA是多個(gè)模型的混合,即自回歸,求和,和移動(dòng)平均。ARIMA模型分為非季節(jié)性ARIMA模型和季節(jié)性ARIMA模型,即模型和模型,兩者的區(qū)別在于后者在進(jìn)行預(yù)測(cè)時(shí)考慮了季節(jié)周期的因素,更加適用于有季節(jié)性或周期性變動(dòng)的數(shù)據(jù)。模型有三個(gè)參數(shù)(非季節(jié)性),p是自回歸階數(shù),d是差分項(xiàng)階數(shù),q是移動(dòng)平均的階數(shù)。
指數(shù)平滑法是在單一時(shí)間序列統(tǒng)計(jì)模型的基礎(chǔ)上進(jìn)行預(yù)測(cè)的方法。指數(shù)平滑法分為一次指數(shù)平滑法和多次指數(shù)平滑法。指數(shù)平滑預(yù)測(cè)模型要用到平滑系數(shù)α,α值既代表模型對(duì)時(shí)間序列數(shù)據(jù)變化的反應(yīng)速度,又決定了預(yù)測(cè)模型修勻誤差的能力。α值越大,則新數(shù)據(jù)占的比重就越大,最近一期的觀察值影響越大,預(yù)測(cè)就越依賴于近期信息。選擇的關(guān)鍵在于,使預(yù)測(cè)值與實(shí)際值之間的誤差最小,一般α值取在0到1之間。
下面我們通過spss19.0軟件來處理。
在spss19.0中輸入原始數(shù)據(jù)并定義日期,也就是確定個(gè)案的起始日期。日期定義后,繪制原始序列的序列圖,從序列圖可以粗略觀察平穩(wěn)性。結(jié)果如下圖所示。
圖1
可以明顯看出是不平穩(wěn)的。
平穩(wěn)化處理。在SPSS中對(duì)原始序列進(jìn)行差分處理來使序列平穩(wěn)化,從一階差分開始,每次差分都繪制序列圖和自相關(guān)圖,直到平穩(wěn)為止。則需預(yù)測(cè)→自相關(guān),進(jìn)行一階差分后如下圖:
圖2
可以看出已經(jīng)是平穩(wěn)序列,作一階差分后的自相關(guān)圖和偏自相關(guān)圖如下圖所示:
圖3
序列平穩(wěn)后,開始模型的建立。由于我們確定了運(yùn)用一次平滑后的曲線來分析,即進(jìn)行一次差分,因此就確定了d值為1。由上圖自相關(guān)圖可以看出二階之后函數(shù)明顯趨于0,呈拖尾性,因此q=2,偏自相關(guān)圖在2階之后也趨于0,呈拖尾性,則p=0。于是選定模型(2,1,2)。
參數(shù)估計(jì)與診斷。對(duì)于已經(jīng)建好的模型,觀察表模型參數(shù),這里會(huì)給出估計(jì)值,標(biāo)準(zhǔn)差,t統(tǒng)計(jì)值。參數(shù)估計(jì)通過后,觀察殘差的自相關(guān)圖和偏自相關(guān)圖,如果值都在置信區(qū)間內(nèi),可以判斷殘差序列為白噪聲序列。說明建立的模型為比較理想的模型。
利用模型預(yù)測(cè)。分析→預(yù)測(cè)→應(yīng)用模型,選取模型結(jié)果如下
表1 預(yù)測(cè)
至于指數(shù)平滑法,之前數(shù)據(jù)預(yù)處理部分與相同。分析→預(yù)測(cè)→應(yīng)用模型,選取指數(shù)平滑法,得出結(jié)論。
表2 關(guān)于兩種觀測(cè)結(jié)果的比較
由此可看出由模型預(yù)測(cè)出來的結(jié)果更加適合,更加接近事實(shí)。
任何一種預(yù)測(cè)方法都是建立在一定的假定條件之上的,而任何一種假定條件都難以包括現(xiàn)實(shí)世界中所有復(fù)雜的關(guān)系,因而必須考慮適用條件,指數(shù)平滑法、ARIMA模型均適用于短期的擬合和預(yù)測(cè)ARIMA模型計(jì)算過程比指數(shù)平滑法復(fù)雜、繁瑣,但在短期內(nèi),其精度要高于指數(shù)平滑法。
[1]徐國祥.統(tǒng)計(jì)預(yù)測(cè)與決策[M].上海:上海財(cái)經(jīng)大學(xué)出版社,2006
[2]王燕.應(yīng)用時(shí)間序列分析[M].北京:中國人民大學(xué)出版社,2005.
[3]薛薇.統(tǒng)計(jì)分析與SPSS的應(yīng)用[M].北京:中國人民大學(xué)出版社,2001.
[4]俞澤鵬.時(shí)間序列中一種模型的最優(yōu)預(yù)測(cè)的研究[J].內(nèi)江師范學(xué)院學(xué)報(bào),2009,(8):37-38.