(平頂山學院 數學與統(tǒng)計學院,河南 平頂山 467000)
居民消費價格指數是一種能夠反映人們家庭日常生活所消費的產品及服務的重要物價變動指標。通常,CPI的增幅可以用來界定通貨膨脹的嚴重程度,臨界點一般為3%和5%。當發(fā)生通貨膨脹時,一般對應CPI的增長幅度會大于3%,當CPI出現大于5%的增長幅度時,我們會認定發(fā)生了嚴重的通貨膨脹。
當CPI的增長幅度反映出我國具有通貨膨脹的傾向時,央行將實行緊縮的貨幣政策和財政政策,這一宏觀調控從長遠看并不利于經濟的穩(wěn)定發(fā)展。因此,加大對該指數的研究和預測對于穩(wěn)定經濟、把握經濟運行的規(guī)律以及宏觀調控的方向有重要意義。
石撿情和楊世娟(2017)選取2009年1月至2017年4月的CPI時間序列數據,采用時間序列分析的方法,對數據進行處理及ADF檢驗來分析CPI序列的特征,并選擇自回歸移動平均(ARIMA)模型對我國的居民消費價格指數數據進行建模預測,得出2017年5月CPI指數為101.8%,預計通貨膨脹溫和[1]。魏靜潔(2016)通過選取1990—2014年我國CPI數據,運用單因素分析求和和多元線性回歸模型相結合的方法,既可以看出各個因素對我國居民消費價格指數的影響程度,又可以得出各個影響因素和被解釋變量之間的模型表達式[2]。楊堅和費俊?。?014)基于ARMA模型基礎,實證分析了我國國內物價水平的總體走勢和居民消費價格指數與社會經濟發(fā)展相聯(lián)系的變動規(guī)律,并根據所建立的模型進行了預測,得出ARIMA模型對居民消費價格指數的數據擬合很好[3]。
ARMA移動平均自回歸模型[4][5](Autoregressive Moving Average Model),是一類常用的隨機時間序列分析模型。ARIMA模型相對ARMA模型,多了差分操作。
具有如下結構的模型稱為求和自回歸移動平均模型,簡記為 ARIMA(p,d,q)模型:
由上式可以看出,模型的實質就是差分運算與模型的組合。
當 d=0 時,ARIMA(p,d,q)模型實際上就是 ARMA(p,q)模型。
當 p=0 時,ARIMA(0,d,q)模型可以簡記為 IMA(d,q)模型。
當 q=0 時,ARIMA(p,d,0)模型可以簡記為 ARI(p,d)模型。
ARIMA(p,d,q)模型可以對具有季節(jié)效應的序列建模。根據季節(jié)效應提取的難易程度,可以分為簡單季節(jié)模型和乘積季節(jié)模型。
表1 不同模型的ACF和PACF特征
簡單季節(jié)模型的產生是由于序列之間的季節(jié)效應和其他效應之間存在加法關系,這時,各種效應信息的提取都非常容易,通常簡單的周期步長差分即可將序列中的季節(jié)信息提取充分。簡單季節(jié)模型實際上就是通過趨勢差分、季節(jié)差分將序列轉化為平穩(wěn)序列,再對其進行擬合[6][7][8]。模型結構通常如下:
式中:D為周期步長,d為提取趨勢信息所用的差分階數;εt{}為白噪聲序列,且Θ(B)=1-θ1B-…-θqBq為 q 階移動平均系數多項式;Φ(B)=1-φ1B-…-φpBp為p階自回歸系數多項式。
通常而言,由于簡單的季節(jié)模型并不足以提取序列間的長期趨勢效應和隨機波動等交互影響關系,因此才產生了季節(jié)乘積模型。乘積模型的構造原理如下:
低階 ARIMA(p,d,q)模型用來提取序列的短期相關性。而當序列具有季節(jié)效應,季節(jié)效應本身還具有相關性時,季節(jié)相關性可以使用以周期步長為單位的ARIMA(p,d,q)模型提取。
乘積模型簡記為 ARIMA(p,d,q)×(P,D,Q)S,綜合前面的d階趨勢差分和D階以周期S為步長的季節(jié)差分運算,對原觀察值序列擬合的乘積模型完整的結構如下:
式中:
Θ(B)=1-θ1B-…-θqBq
Φ(B)=1-φ1B-…-φpBp
ΘS(B)=1-φ1BS-…-φQBQS
ΦS(B)=1-φ1BS-…-φpBPS
主成分分析是針對多個解釋變量,將關系緊密的變量剔除,建立盡可能少的新變量,使這些新變量兩兩不相關。也就是說,把原來的多個變量重新組合成幾個能充分反映總體信息的新變量,新組合的變量之間是相互獨立的,而且這些新變量在解釋因變量時盡可能保持原有的信息,從而在不丟掉重要信息的前提下消除變量間的共線性問題,便于進一步分析。基本步驟如下:
(1)原始數據標準化。由于原始數據的單位之間存在差異,為了消除各個經濟指標在量綱和數量級上的差別,首先對數據進行標準化處理。
(2)計算相關系數矩陣。根據標準化數據建立協(xié)方差矩陣R。R是反映標準化之后的數據之間相關關系密切程度的統(tǒng)計指標,值越大,說明越有必要對數據進行主成分分析。
(3)求相關矩陣R的特征根、特征向量和方差貢獻率,確定主成分個數。特征值是各主成分的方差,其大小反映了各個主成分的影響力。主成分Z1的貢獻率,累計貢獻率為。主成分個數的選取原則為特征值大于1且累計貢獻率達80%—95%。
(4)計算主成分得分,其得分是相應的因子得分乘以相應方差的算術平方根。
(5)使用主成分代替原始變量與Y建立多元線性回歸模型。
研究使用的數據為我國居民消費價格指數,樣本區(qū)間為2001年1月至2017年12月,數據來自國家統(tǒng)計局官網。
建立模型之前需要先驗證原始序列的平穩(wěn)性。利用R軟件畫出序列CPI的時序圖,并判斷其平穩(wěn)性,如圖1所示。
根據圖1,可初步認為CPI序列是平穩(wěn)的。為了避免判斷的主觀性,對序列進行單位根檢驗,進一步確定序列的平穩(wěn)性,如表1所示。
圖1 2001年1月至2017年12月中國居民消費價格指數時序圖
表2 ADF檢驗結果
上述模型,原假設為存在單位根,序列不平穩(wěn);備擇假設為不存在單位根,序列平穩(wěn)。
模型三的t-Statistic值為-11.07406,小于三個測試臨界值并且p值顯著小于0.05,因此拒絕原假設,表明我國2001—2017年居民消費價格指數序列不存在單位根,序列具有平穩(wěn)性,可繼續(xù)進行白噪聲檢驗。
表3 原始序列白噪聲檢驗
白噪聲檢驗的假設條件為:
H1:至少存在某個
延遲6階的LB統(tǒng)計量p-value=0.01939,延遲12階的LB統(tǒng)計量p-value=1.051e-09,統(tǒng)計量的p值遠遠小于0.05,即拒絕序列為純隨機序列的假定,該平穩(wěn)序列屬于非白噪聲序列,可以對其繼續(xù)研究。
圖2 2001年1月至2017年12月中國居民消費價格指數原始序列的自相關圖和偏自相關圖
從圖2可以看出,原始序列的偏自相關圖是截尾的,而自相關圖以12為周期長度呈現出一定的周期性,因此,應建立季節(jié)模型進行進一步分析。
在建立季節(jié)模型之前對原始序列進行1階12步差分來消除季節(jié)效應。
接著,利用R語言軟件對不含有季節(jié)效應和趨勢的序列進行系統(tǒng)定階,可得系統(tǒng)定階模型ARIMA(1,0,0)(2,1,0)[12],其中:p=1,P=2,D=1,d=q=Q=0。
表4 系統(tǒng)定階模型系數表
模型擬合輸出結果,可以得到乘積季節(jié)模型ARIMA(1,0,0)(2,1,0)[12]的擬合模型為:
表5 殘差白噪聲檢驗結果
由殘差白噪聲檢驗結果可以看出,延遲6階的檢驗p值為0.5565。在顯著性水平α為0.05的條件下,由于概率p值遠大于顯著性水平0.05,所以要接受原假設,可以認為乘積季節(jié)模型提取的數據信息較為充分,該模型的擬合效果較為理想。
圖3 正態(tài)檢驗Q-Q圖
圖4 殘差分布圖
由圖3、圖4可以直觀地看出殘差是隨機的,殘差基本服從正態(tài)分布,模型是有效的。
預測結果是以1995—2017年的CPI數據為樣本,利用系統(tǒng)定階模型 ARIMA(1,0,0)(2,1,0)[12]對 CPI序列在2018—2019年度的走勢進行預測,得出預測結果列。
通過R語言擬合出的系統(tǒng)定階模型ARIMA(1,0,0)(2,1,0)[12]繪制 2018—2019 年 CPI走勢的預測圖,以更加直觀地感受CPI的變動趨勢。
圖5 預測圖
圖6 預測結果對比圖
表6 預測結果對比表
根據2018年1月至2019年12月的預測值與真實值求得相對誤差:
相對誤差=(預測值-真實值)/真實值×100%
將相對誤差取絕對值之后求得平均誤差為0.33%,一般認為將平均誤差控制在5%以內,模型預測效果較好。此處平均誤差為0.33%,結合圖5和圖6我們可以非常直觀的得出結論:ARIMA(1,0,0)(2,1,0)[12]模型的預測效果比較可觀。
在影響CPI的眾多影響因素中,選取全社會固定資產投資(億元)、人民幣對美元匯率(美元=100)、社會消費品零售總額(億元)、工業(yè)生產者出廠價格指數(上年 =100)、貨幣和準貨幣(M2)供應量(億元)、進出口總額(億元)、GDP(億元)和外匯儲備等8個主要因素為自變量。
表7 符號說明
收集1995—2019年CPI及影響CPI變動的全社會固定資產投資(億元)、人民幣對美元匯率(美元=100)、社會消費品零售總額(億元)、工業(yè)生產者出廠價格指數(上年=100)、貨幣和準貨幣(M2)供應量(億元)、進出口總額(人民幣)(億元)、GDP(億元)以及外匯儲備8個指標的年度數據。其數據均來自國家統(tǒng)計局官網。
為了克服數據在整個值域中處于不同區(qū)間的差異帶來的影響,將原始數據取對數處理,得到新的變量:ln(Y),ln(X1),ln(X2),…,ln(X8)。
表8 模型系數表
變量間是否存在多重共線性,可以通過容忍度和VIF 值來判斷。ln(X3)、ln(X8)的容忍度大于 0.1,加之 ln(X1)、ln(X4)、ln(X5) 的 VIF 值為 364.587、1388.726、1123.953,因此可以確定自變量之間存在嚴重的多重共線性。此處選用主成分回歸方法來消除共線性的問題。
進行KMO檢驗和巴特利球體檢驗時,一般而言,KMO值大于0.5意味著因子分析可以進行,而在0.7以上則是令人滿意的值。KMO值為0.711,最后一行數據sig值小于0.005,符合標準,各個變量的相關性合理,可以進行因子分析。
表9 KMO和巴特利特檢驗
表10 總方差解釋
表10第一列為8個成分,第二列為對應的特征值,第三列為主成分貢獻率,第四列為累計貢獻率。通常SPSS會默認選擇將特征值大于1的成分作為主成分。從表中可以得出:成分1和成分2的特征值分別為5.809、1.692,明顯特征值大于1;從累計貢獻率來看這兩個成分可以解釋方差的93.762%,即主成分1和主成分2可以解釋原來8個自變量93.762%的信息,因此抓住主要矛盾,提取兩個主成分。
表11 成分得分系數矩陣
成分得分系數矩陣(表11)列出了各主要成分解析表達式中的標準化變量的系數向量,可以得出各主成分解析表達式分別為:
式中 Zln(X1)…Zln(X8)不同于 ln(X1)…ln(X2),而是標準化之后的變量。
用相應的因子得分乘以相應方差的算術平方根得到主成分得分 F1、F2,并且以 F1、F2為自變量,以標準化之后的ln(Y)為因變量建立回歸模型。
表12 系數表
此時變量F1、F2的VIF都顯著小于10,模型不存在多重共線性問題,可以根據更改后的模型系數表,確定各個自變量的系數,得出主成分回歸模型。
主成分回歸表達式為:Zln(Y)=-0.034F1+0.714F2
為了保持物價穩(wěn)定,減少物價大幅波動,維持我國居民消費價格指數相對穩(wěn)定,給出以下建議:
維持物價、匯率穩(wěn)定,是各國宏觀經濟調控的核心內容。匯率穩(wěn)定與物價穩(wěn)定相輔相成,國家應從供給與需求兩方面進行宏觀調控,最大限度減少匯率的波動。
既要進一步深化農業(yè)供給側結構性改革,調整農業(yè)、畜牧業(yè)、漁業(yè)、林業(yè)的產業(yè)結構和產品結構,提升生態(tài)農產品、綠色農產品和品牌農產品的比重,又要堅持保供給、保收入、保生態(tài)協(xié)調統(tǒng)一,促進農民增收。要重點加強科技研發(fā)推廣,提高綠色農業(yè)發(fā)展水平。
一方面,把積極的財政政策的重點放在基本物資的保障供給上,合理地引導地方政府處理經濟發(fā)展與通貨膨脹之間的矛盾。另一方面,努力探索貨幣政策工具的創(chuàng)新,健全貨幣的決策機制,使我國的經濟調節(jié)機制更加靈活,更加適應我國國情?!?/p>