□劉嘉誠
采購經(jīng)理指數(shù)(Purchasing Managers' Index,簡稱PMI)是通過對企業(yè)采購經(jīng)理的月度調(diào)查匯總出來的指數(shù),因其具有及時(shí)性、先導(dǎo)性、綜合性和指導(dǎo)性等特點(diǎn),使得該指數(shù)在經(jīng)濟(jì)預(yù)測和商業(yè)分析等方面都有著重要的意義。PMI 具有較強(qiáng)的實(shí)際應(yīng)用性,本文以舟山制造業(yè)月度PMI 數(shù)據(jù)為基礎(chǔ),通過建立SARIMA 模型對舟山制造業(yè)PMI 的預(yù)測能力進(jìn)行評價(jià)。
本文選取2015 年3 月至2019年4 月舟山制造業(yè)月度PMI 共50 組數(shù)據(jù),其中使用2015 年3 月至2018年10 月的44 組數(shù)據(jù)進(jìn)行建模,用2018 年11 月 至2019 年4 月 的6 組數(shù)據(jù)進(jìn)行模型檢驗(yàn)。此外,為了減少異方差的影響,對這組序列進(jìn)行自然對數(shù)轉(zhuǎn)換,其中pmi 表示舟山制造業(yè)月度PMI 序列,lpmi 表示進(jìn)行對數(shù)轉(zhuǎn)換后的序列,dlpmi 表示進(jìn)行一階逐期差分平衡后的序列,sdlpmi 表示進(jìn)行一階逐期差分和季節(jié)差分之后的序列。
SARIMA 模型的建立主要包括四個(gè)步驟:平衡性檢驗(yàn)、模型的定階與識別、模型的參數(shù)估計(jì)、模型的診斷與檢驗(yàn)。
(一)平衡性檢驗(yàn)。
在對一個(gè)時(shí)間序列進(jìn)行建模前,首先應(yīng)當(dāng)考察該序列的平穩(wěn)性。如果序列是不平穩(wěn)的,則需要對序列進(jìn)行差分,使得差分后的序列成為平穩(wěn)時(shí)間序列。本文對序列的平穩(wěn)性檢驗(yàn)采用最為常用的ADF 單位根檢驗(yàn)方法。
從圖1 單位根檢驗(yàn)結(jié)果可以看到,原始序列l(wèi)pmi 是非平穩(wěn)序列,在進(jìn)行一階逐期差分處理后的序列dlpmi 是平穩(wěn)序列,因此dlpmi是一階單整序列,可以得到d=1。進(jìn)行一階逐期差分和季節(jié)差分處理后的序列sdlpmi 是平穩(wěn)序列。同時(shí)該序列已消除了原時(shí)間序列l(wèi)pmi的季節(jié)性,因此D=1。從dlpmi 的自相關(guān)和偏相關(guān)圖分析,序列在k=12時(shí)顯著不為零,可以得出序列存在以12 個(gè)月為周期的季節(jié)波動(dòng),經(jīng)過上述檢驗(yàn)和處理,原始序列l(wèi)pmi 滿足建模要求,可以以序列sdlpmi 為基礎(chǔ)建立SARIMA 模型。
圖1 ADF 單位根檢驗(yàn)結(jié)果
(二)模型的定階與識別。
由于上文確定原始序列l(wèi)pmi的非季節(jié)差分階數(shù)d=1;季節(jié)差分階數(shù)D=1,故考慮建立SARIMA(p,d,q) (P,D,Q)12 模型進(jìn)行分析與預(yù)測,接下來確定p、q、P、Q 的取值。
圖2 sdlpmi 序列的自相關(guān)和偏相關(guān)圖
觀察分析序列sdlpmi 的相關(guān)圖和偏相關(guān)圖(如圖2),如果把自相關(guān)函數(shù)看作截尾特征(K>13 后截尾),把偏自相關(guān)函數(shù)看作是拖尾特征,應(yīng)該有一個(gè)乘積季節(jié)移動(dòng)平均模型,推出q、Q 可以等于1,考慮建立(0,1,1)(0,1,1)12。如果把自相關(guān)函數(shù)看作拖尾特征,把偏自相關(guān)函數(shù)看作截尾特征(K>13 后截尾),應(yīng)該加入一個(gè)乘積月度自回歸模型,推出p、P 可以等于1,考慮建立(1,1,0)(1,1,0)12。
通過觀察序列的自相關(guān)和偏相關(guān)圖,結(jié)合上述的判斷,對可能性最大的六個(gè)模型進(jìn)行比較測試評價(jià),分別是(1,1,1)(1,1,1)12、(1,1,0)(1,1,1)12、(1,1,0)(1,1,0)12、(1,1,1)(1,1,0)12、(1,1,1)(0,1,1)12、(0,1,1)(0,1,1)12。
接下來依次對六個(gè)模型進(jìn)行單位根檢驗(yàn),如果模型的單位根有個(gè)等于1,說明模型是不可逆的,過程是不平穩(wěn)的。通過對六個(gè)模型單位根的判斷可以得出,除(1,1,0)(1,1,1)12和(1,1,0)(1,1,0)12兩個(gè)模型之外,其他四個(gè)模型中的單位根均存在等于1 的根。
接下來對這兩個(gè)模型進(jìn)一步評價(jià)。在選擇模型時(shí),一般根據(jù)AIC 值和SC 值最小的準(zhǔn)則作出選擇。(1,1,0)(1,1,1)12模 型:AIC=-3.21267,SC=-3. 027639;(1,1,0)(1,1,0)12模型:AIC=-3.238941,SC=-3.100168。因此,選擇模型(1,1,0)(1,1,0)12較為合適,結(jié)果更理想。
(三)模型的參數(shù)估計(jì)。
建立模型(1,1,0)(1,1,0)12,用2015 年3 月至2018 年10 月的月度數(shù)據(jù)對模型進(jìn)行參數(shù)估計(jì),得到結(jié)果如下:
其中,R2=0.52,DW=2.13,Q(16)=9.68,χ20.05(15)=24.99
(四)模型的檢驗(yàn)。
圖3 殘差序列的自相關(guān)和偏相關(guān)圖
對模型估計(jì)結(jié)果進(jìn)行檢驗(yàn),包括模型特征根值的檢驗(yàn)、參數(shù)估計(jì)的t 檢驗(yàn)和殘差序列的Q 檢驗(yàn)。
首先是特征根值的檢驗(yàn),該模型的特征根值都在單位圓之外,說明模型滿足檢驗(yàn)要求。其次參數(shù)估計(jì)的t 檢驗(yàn),殘差序列的自相關(guān)系數(shù)均落入隨機(jī)區(qū)間內(nèi),且P 值均較為顯著,說明殘差序列不再有自相關(guān)成分,且模型參數(shù)具有顯著性,通過t 檢驗(yàn)。最后是殘差序列的Q 檢驗(yàn),以Q(16)為例,Q(16)=9.68<χ20.05(15)=24.99,模型的誤差項(xiàng)通過Q 檢驗(yàn)。綜上分析,可以確定最終建立的模型為(1,1,0)(1,1,0)12模型。
根據(jù)建立的模型,首先對樣本內(nèi)2017 年5 月-2018 年10 月 共18 個(gè)月的PMI 進(jìn)行靜態(tài)預(yù)測,通過實(shí)際值與預(yù)測值的比較來判斷模型的預(yù)測精度,然后繼續(xù)利用模型對樣本 外2018 年11 月-2019 年4 月 共6個(gè)月的PMI 進(jìn)行動(dòng)態(tài)預(yù)測。
從衡量指標(biāo)看,模型的擬合結(jié)果是較好的。首先分析評估靜態(tài)預(yù)測結(jié)果,均方根誤差(RMSE) 為2.1858、平均絕對誤差(MAE) 為1.8026,兩個(gè)數(shù)值均較??;平均相對百分比誤差(MAPE)為3.77%,泰勒不等系數(shù)(TIC)為0.0227,其中泰勒不等系數(shù)(TIC)越小,擬合度越好;總體而言這些衡量指標(biāo)說明該模型具有較好的擬合效果。
從實(shí)際值與預(yù)測值的誤差率來看,預(yù)測效果是不理想的。首先看靜態(tài)預(yù)測結(jié)果,如表1 所示,相對誤差平均值為3.78%,誤差率最高為9.09%,最低為0.2%。18 組靜態(tài)預(yù)測結(jié)果中,只有兩組的相對誤差在1%以下,說明預(yù)測數(shù)據(jù)的相對誤差率是較高的。再看動(dòng)態(tài)預(yù)測結(jié)果,6 組動(dòng)態(tài)預(yù)測結(jié)果中,只有1組的相對誤差率在1% 以下,如2019 年2 月的相對誤差率竟然達(dá)到13.59%。綜上,從實(shí)際預(yù)測結(jié)果看,該模型的預(yù)測誤差率較高,預(yù)測值與實(shí)際值存在較大差距,模型的預(yù)測結(jié)果是不理想的。
圖4 靜態(tài)預(yù)測結(jié)果
圖5 動(dòng)態(tài)預(yù)測結(jié)果
(一)逐步擴(kuò)充基礎(chǔ)歷史數(shù)據(jù)序列。如前文所述,盡管SARIMA方法可以為任何周期的經(jīng)濟(jì)時(shí)間序列建模,但需要足夠多的基礎(chǔ)數(shù)據(jù)(序列觀測值)作為支撐。建立SARIMA 模型,對于季度序列最好在100 個(gè)以上,對于月度序列則應(yīng)該更多。而本文基于月度序列建立的模型,其序列觀測值個(gè)數(shù)只有44 個(gè),在進(jìn)行一階逐期差分和季節(jié)差分之后,觀測值更少。另一方面,月度PMI 基本在50 上下波動(dòng),月度波動(dòng)的幅度非常非常小,有時(shí)只有0.1%或0.2%左右,這就需要模型具有非常好的擬合性和非常低的誤差率。而分析本文中所建立的模型,盡管從幾個(gè)衡量指標(biāo)看具有擬合效果和一定的預(yù)測的作用,但是就實(shí)際誤差率而言,預(yù)測效果是不理想的,是無法解釋當(dāng)前的時(shí)間序列。為此要逐步擴(kuò)充基礎(chǔ)歷史數(shù)據(jù)(序列觀測值),通過觀測值來進(jìn)一步識別合適的P、Q 等參數(shù),建立較理想的SARIMA 模型,進(jìn)一步提升數(shù)據(jù)支撐力度,增強(qiáng)模型的擬合效果。
(二)持續(xù)探索合適NBS 季調(diào)參數(shù)。除數(shù)據(jù)序列預(yù)測值不夠多這個(gè)明顯缺陷之外,月度PMI 數(shù)據(jù)匹配性協(xié)調(diào)性較差,也是導(dǎo)致模型預(yù)測效果不理想的原因。就季節(jié)調(diào)整本身而言,一方面,時(shí)間序列越長季節(jié)調(diào)整的效果越好,通常不能少于10 年,最好是一個(gè)經(jīng)濟(jì)周期的時(shí)間。舟山制度業(yè)PMI 調(diào)查從2012 年開始,月度PMI 的正式試算從2015 年開始,顯然還沒有經(jīng)歷一個(gè)完整周期,所以季節(jié)調(diào)整本身就不是很完善,存在很多缺陷。另一方面,目前月度PMI 數(shù)據(jù)都是通過NBS 數(shù)據(jù)處理軟件,經(jīng)過季節(jié)調(diào)整推算而來,NBS 季調(diào)軟件中參數(shù)的設(shè)定,包括arima 模型、工作日效應(yīng)、交易日效應(yīng)以及節(jié)假日參數(shù)的設(shè)定等等,都會(huì)導(dǎo)致最后季調(diào)結(jié)果的不同。因此建議要不斷研究NBS軟件的運(yùn)行原理,探索符合舟山實(shí)際經(jīng)濟(jì)發(fā)展?fàn)顩r的各項(xiàng)參數(shù),確保季調(diào)后的PMI 數(shù)據(jù)不失真,更有匹配性、協(xié)調(diào)性。
一方面,以舟山制造業(yè)月度PMI 數(shù)據(jù)為序列是可以建立合適的SARIMA 模型,而且建立的模型也具有一定的擬合效果和預(yù)測能力,同時(shí)也說明建立相應(yīng)的模型對PMI自身進(jìn)行短期或長期的預(yù)測具有較強(qiáng)的可行性。另一方面,受限于數(shù)據(jù)序列觀測值很少,數(shù)據(jù)匹配性協(xié)調(diào)性較低等自身的缺陷,再加上PMI 序列具有很低的波動(dòng)性等高要求,本文中模型的預(yù)測誤差率還是偏高的,預(yù)測值與實(shí)際值存在較大幅度的差距,無論是靜態(tài)預(yù)測還是動(dòng)態(tài)預(yù)測,其預(yù)測結(jié)果是不理想的,預(yù)測能力也是有限的。綜上所述,基于SARIMA 模型的舟山制造業(yè)PMI 預(yù)測能力目前來看是較低的,但是從長期來看具有較大的上升提高空間。如果能逐步擴(kuò)充基數(shù)數(shù)據(jù)序列并不斷提高數(shù)據(jù)匹配性協(xié)調(diào)性,SARIMA 模型的預(yù)測能力也會(huì)得到進(jìn)一步的提高,預(yù)測效果得到進(jìn)一步的增強(qiáng)。