羅智恒
[摘 要]為了給汽車業(yè)“出?!庇《葏⒖?,文章利用時間序列預測印度乘用車2020年銷量。首先,提出了利用時間序列預測銷量的研究思路。其次,利用印度乘用車2010—2018年銷量數(shù)據(jù),按研究思路預測出印度乘用車2019年銷售3492170輛,同比增長2.87%;預計2020年銷售3622561輛,同比增長3.73%。最后,用2019年1—3月的實際銷售數(shù)據(jù),與預測數(shù)據(jù)對比得出預測誤差在5.20%內,驗證了預測模型的精度。
[關鍵詞]印度乘用車銷量;預測;時間序列;2020年;ARMA
[中圖分類號]F426
1 前 言
印度作為“金磚四國”之一,聯(lián)合國人口署2017年公布其人口為13.39億[1], 世界第二;據(jù)國際貨幣基金組織消息,2018財年GDP為2.69萬億美元,排行世界第7 [2];2018年乘用車銷量為339.4萬輛, 千人汽車擁有量不足30輛[3],不但遠低于美國千人汽車擁有量800輛,也小于中國千人汽車擁有量170輛[4],汽車業(yè)擁有巨大發(fā)展空間。
但印度存在“三個短缺”:持續(xù)的國際貿易赤字、長期的政府預算赤字,以及欠發(fā)達地區(qū)的發(fā)電和配電基礎設施[5];同時2018年印度人均GDP僅為2016美元,世界排名146位(同期中國人均GDP為9633美元,世界排名76位)[2],國家社會的發(fā)展水平和發(fā)展程度偏低,使其汽車業(yè)發(fā)展存在不確定性。為此文章嘗試利用時間序列預測2020年印度乘用車銷量,給國內各大整車廠進入印度市場提供參考。
時間序列是將某一個變量或指標在不同時間上的不同數(shù)值按照時間的先后順序排列而成的數(shù)列。Box 和Jenkins在20世紀70年代首次提出利用時間序列進行預測[6],主要利用平穩(wěn)時間序列的統(tǒng)計性質不隨時間原點的推移而變化的特性。
2 研究思路
文章預測印度2020年乘用車銷量研究思路如圖1所示。
2.1 時間序列
將印度乘用車每月銷量數(shù)據(jù)按先后順序導入。
2.2 平穩(wěn)
判斷一個時間序列是否平穩(wěn),通過自相關系數(shù)及其圖形,可以初步判斷一個時間序列的平穩(wěn)性。如需定量地判斷時間序列的平穩(wěn)性,則可采用Dickey-Fuller(DF檢驗)單位根進行檢驗。如果時間序列平穩(wěn),就進行第3步平穩(wěn)時間序列的步驟;如果時間序列不平穩(wěn),就進行第7步平穩(wěn)化。
2.3 平穩(wěn)時間序列
如時間序列平穩(wěn),就可以利用AR,MA,ARMA進行預測。
2.4 模型識別
從AR,MA,ARMA中選擇合適的時間序列模型。常用的模型識別方法有:利用自相關系數(shù)、偏相關系數(shù)圖進行模型識別;計算擴展的自相關函數(shù)(EACF)并利用其估計值進行模型識別[7]。
2.5 參數(shù)估計
模型所含的未知參數(shù),通過時間序列確定其最優(yōu)估計,一般采用的估計優(yōu)化準則為矩估計、極大似然法和最小二乘法[8]。然后,進行第6步對模型進行評估。
2.6 評估
通過分析擬合模型的殘差和過度參數(shù)化的模型,可以保證擬合模型的優(yōu)度同時又不過擬合[8] 。如果模型被正確識別,參數(shù)估計足夠接近真實值,則模型殘差就應該近似白噪聲,服從獨立、同分布的零均值和相同標準的正態(tài)分布[8]。如通過評估,則可以到第12步進行預測數(shù)據(jù);如沒有通過評估,則進行第4步模型識別,調整模型。
2.7 平穩(wěn)化
平穩(wěn)化常用方法有:加法模型、乘法模型、混合模型和差分模型[9]。若一時間序列能夠通過差分的方式平穩(wěn)化,則稱其具有單位根。如一個時間序列具有單位根,則它是非平穩(wěn)的。如平穩(wěn)化成功后,則回到第3步;如平穩(wěn)化失敗,則到第8步進行非平穩(wěn)時間序列分析。
2.8 非平穩(wěn)時間序列
如果時間序列不能平穩(wěn)化,則用非平穩(wěn)時間序列進行預測。常用的非平穩(wěn)時間序列預測模型有:指數(shù)平滑法[10],但其只適合短期預測。
2.9 模型識別
指數(shù)平滑法分為一次平滑法和多次平滑法。銷量預測中主要運用多次平滑法中的二、三次指數(shù)平滑法。然后進行第10步。
2.10 參數(shù)估計
指數(shù)平滑法中,需要確定的參數(shù)為平滑系數(shù)。然后進行第11步。
2.11 評估
通過平均誤差, 平均絕對誤差和均方差來評估模型的擬合效果[10]。如通過評估,則可以進行第12步進行預測數(shù)據(jù);如沒有通過評估,則進行第9步模型識別,調整模型。
2.12 預測數(shù)據(jù)
根據(jù)模型預測將來的數(shù)據(jù)值,并進行預測精度分析:一是模型對現(xiàn)有數(shù)據(jù)的擬合程度;二是模型對將來預測數(shù)據(jù)的準確程度,通常采用后驗預報方法進行精度分析[9]。
3 具體實例
3.1 時間序列
由中國汽車工業(yè)協(xié)會、MarkLines獲得2010—2018年印度乘用車每月銷量如表1所示,印度乘用車銷量時間序列X(以下簡稱時間序列X),記 Xi為時間序列第i個月銷量。
3.2 平穩(wěn)
對時間序列是否是平穩(wěn)時間序列進行檢驗。利用自相關系數(shù)
(1)式中rp是時間序列X的p階樣本,Xt是時間序列X第t個月銷量,X-是時間序列X的均值。根據(jù)上式,利用R軟件計算各點p的自相關系數(shù),并繪制相關系數(shù)如圖2所示,從圖中可以發(fā)現(xiàn)時間序列的自相關系數(shù)超過置信區(qū)間(圖2中虛線內區(qū)間),可以判定時間序列X非平穩(wěn)。
3.3 平穩(wěn)化
3.4 模型識別
3.5 參數(shù)估計
在確定時間序列Y的模型之后,采用最小二乘法使參數(shù)et平方和達最小值(如式(4)所示)的方法:
帶入2011—2018年樣本數(shù)據(jù)進行模型的參數(shù)估計,由R軟件擬合出時間序列Y ARMA(1,1)模型估計結果如表3所示。
3.6 評估
再確定模型具體形式,利用殘差進行評估檢驗。殘差如式(6)所示:
4 結 論
利用2010—2018年印度乘用車銷量數(shù)據(jù),首先對其季節(jié)差分獲得平穩(wěn)時間序列,然后識別出模型ARMA(1,1),并進行參數(shù)估計及檢驗,最后利用此模型預測印度乘用車2019—2020年銷量。用2019年1—3月的實際銷售數(shù)據(jù),對比預測數(shù)據(jù)得出預測誤差在5.20%內。說明此方法進行的預測具有一定的精度。同時如果數(shù)據(jù)更新,可以用文章的方法繼續(xù)預測后續(xù)銷量。
參考文獻:
[1]United Nations Department of Economic and Social Affairs Population Division . World Population Prospects: The 2017 Revision[EB/OL]. (2019-07-1)[2019-04-09].https://population.un.org/wpp/Download/Standard/Population/.
[2]IMF. 2018年世界經濟展望排行榜單版[EB/OL].(2018-10-09) [2019-04-09].https://xw.qq.com/cmsid/20181022B00EVC/20181022B00EVC00.
[3]張冬梅.逆勢增長5.32%,印度2021年將成全球第三大車市[EB/OL].(2019-01-018)[2019-04-09].http://www.sohu.com/a/289976869_120044219.
[4]孫杰.千人汽車保有量170輛左右 國家發(fā)改委:消費升級趨勢依然強勁[EB/OL].(2019-1-29)[2019-04-09].https://baijiahao.baidu.com/s?id=1623968075621898571&wfr=spider&for=pc.
[5]白莉.2020年印度將成世界第三大汽車市場[J].中國汽車界,2011(10):26.
[6]GEORGE E P BOX, GWILYM M NKINSJE, GREGORY C REINSEL. 顧嵐,主譯.時間序列分析:預測與控制[M].北京:中國統(tǒng)計出版社,1997.
[7]TSAY R,TIAO G. Consistent estimates of autoregressive parameters and extended sample autocorrelation function for stationary and nonstationary ARMA models [J]. Journal of the American Statistical Association, 1984,79 (385):84-96.
[8]JONATHAN D CRYER, KUNG-SIK CHAN.時間序列分析及應用R語言[M].北京:機械工業(yè)出版社,2011.
[9]馮康.數(shù)值計算方法[M].北京:國防工程出版社,1978.
[10]張忠平.指數(shù)平滑法[M].北京:中國統(tǒng)計出版社,1996.