林 勇,殷三杰
(西北師范大學(xué) 經(jīng)濟(jì)學(xué)院,甘肅 蘭州 730070)
加入網(wǎng)絡(luò)搜索行為能提升CPI的預(yù)測(cè)效果嗎*
林 勇,殷三杰
(西北師范大學(xué) 經(jīng)濟(jì)學(xué)院,甘肅 蘭州 730070)
傳統(tǒng)的CPI預(yù)測(cè)模型利用的數(shù)據(jù)主要來源于政府統(tǒng)計(jì)局,由于政府統(tǒng)計(jì)數(shù)據(jù)規(guī)范、噪音小等特點(diǎn),使得這樣的預(yù)測(cè)模型在CPI變化不大的時(shí)期預(yù)測(cè)效果較好,但是在CPI變化趨勢(shì)出現(xiàn)拐點(diǎn)的時(shí)期,預(yù)測(cè)效果往往較差;網(wǎng)絡(luò)搜索數(shù)據(jù)作為一種新興的數(shù)據(jù)結(jié)構(gòu)類型,被運(yùn)用到經(jīng)濟(jì)社會(huì)問題的預(yù)測(cè)當(dāng)中,其實(shí)時(shí)可得的特點(diǎn),能夠提前預(yù)測(cè)到趨勢(shì)變化的拐點(diǎn)。因此將網(wǎng)絡(luò)搜索數(shù)據(jù)加入到傳統(tǒng)的CPI 預(yù)測(cè)模型中,分析增加網(wǎng)絡(luò)搜索行為能不能提升CPI 的預(yù)測(cè)效果,尤其是在CPI出現(xiàn)拐點(diǎn)的時(shí)期。分析結(jié)果顯示,當(dāng)CPI趨勢(shì)出現(xiàn)拐點(diǎn)的時(shí)期,在傳統(tǒng)預(yù)測(cè)模型中加入網(wǎng)絡(luò)搜索數(shù)據(jù),的確可以提升模型的預(yù)測(cè)效果。
網(wǎng)絡(luò)搜索數(shù)據(jù);CPI預(yù)測(cè);趨勢(shì)拐點(diǎn);預(yù)測(cè)效果
引言
居民消費(fèi)價(jià)格指數(shù)(CPI)是根據(jù)居民生活相關(guān)的商品和服務(wù)價(jià)格統(tǒng)計(jì)出來的物價(jià)變動(dòng)指標(biāo),反映了社會(huì)通貨膨脹的水平,是經(jīng)濟(jì)運(yùn)行和社會(huì)穩(wěn)定重點(diǎn)監(jiān)測(cè)的指標(biāo)。能否準(zhǔn)確預(yù)測(cè)未來CPI的變動(dòng),是國家制定宏觀經(jīng)濟(jì)政策,進(jìn)行緊急調(diào)控的關(guān)鍵,因此,能夠?qū)嵤┍O(jiān)測(cè)和提前預(yù)測(cè)CPI具有重要的意義。
在現(xiàn)有文獻(xiàn)中,對(duì)CPI預(yù)測(cè)研究的數(shù)據(jù)類型主要有結(jié)構(gòu)化數(shù)據(jù)和非結(jié)構(gòu)化數(shù)據(jù)。前者是能夠用數(shù)據(jù)或統(tǒng)一的結(jié)構(gòu)加以表示的數(shù)據(jù),比如國家統(tǒng)計(jì)局公布的官方數(shù)據(jù);而后者其數(shù)據(jù)來源和形式都十分多樣化,無法用數(shù)字或統(tǒng)一的結(jié)構(gòu)表示,網(wǎng)絡(luò)日志、圖片、音視頻等屬于非結(jié)構(gòu)化數(shù)據(jù)。結(jié)構(gòu)化數(shù)據(jù)的優(yōu)點(diǎn)是噪音小、數(shù)據(jù)規(guī)范,但缺點(diǎn)是數(shù)據(jù)會(huì)有一定的滯后;非結(jié)構(gòu)化信息的優(yōu)點(diǎn)是信息更新快、 數(shù)據(jù)實(shí)時(shí)可得,但缺點(diǎn)是信息噪音大、數(shù)據(jù)來源和形式多樣化。以往的研究或者側(cè)重對(duì)結(jié)構(gòu)化數(shù)據(jù)的利用,或者側(cè)重對(duì)非結(jié)構(gòu)化數(shù)據(jù)的挖掘應(yīng)用,而沒有文獻(xiàn)將兩者合理地結(jié)合起來,充分利用結(jié)構(gòu)化數(shù)據(jù)和非結(jié)構(gòu)化數(shù)據(jù)的優(yōu)點(diǎn)來對(duì)CPI作出預(yù)測(cè)。本文通過使用向量自回歸模型對(duì)CPI進(jìn)行預(yù)測(cè),然后在此模型基礎(chǔ)上加入網(wǎng)絡(luò)搜索行為這樣的非結(jié)構(gòu)化數(shù)據(jù),通過比較模型自變量?jī)H包括結(jié)構(gòu)化數(shù)據(jù)或既包括結(jié)構(gòu)化數(shù)據(jù)又包括非結(jié)構(gòu)化數(shù)據(jù),來探索網(wǎng)絡(luò)搜索數(shù)據(jù)能不能幫助我們提升CPI的預(yù)測(cè)效果。
(一)CPI影響因素及預(yù)測(cè)的相關(guān)研究
在我國,國家統(tǒng)計(jì)局負(fù)責(zé)編制CPI,并于次月中旬發(fā)布,因此國家統(tǒng)計(jì)局對(duì) CPI 的發(fā)布存在兩周左右的滯后。為了能夠提前得知CPI,學(xué)者們提出了多種定量預(yù)測(cè)方法,如王宇、李旭東(2009)利用BP神經(jīng)網(wǎng)絡(luò)對(duì)我國 CPI 做了預(yù)測(cè)[1];龔玉婷、陳強(qiáng)、鄭旭(2014)基于混頻模型對(duì)CPI做了短期預(yù)測(cè)[2];吳強(qiáng)、付永利(2013)運(yùn)用ARMA-EGARCH模型探尋CPI發(fā)展變化規(guī)律,并對(duì)2013年的CPI走勢(shì)進(jìn)行預(yù)測(cè)分析[3];董梅(2011)運(yùn)用VAR模型對(duì)CPI做了預(yù)測(cè)[4];門小琳(2012)通過給季節(jié)性ARIMA模型、自回歸分布滯后模型、VEC模型確定組合權(quán)重這樣的組合預(yù)測(cè)模型來預(yù)測(cè)CPI[5]。這些方法的基本原理都是用歷史數(shù)據(jù)來擬合未來,用當(dāng)前的趨勢(shì)外推未來的情況,但歷史數(shù)據(jù)難以反映未來的不確定性,無法把握未來的突變情況,因此基于這種原理的預(yù)測(cè)對(duì)結(jié)構(gòu)性變化的預(yù)測(cè)準(zhǔn)確度不是很高,特別是不能有效預(yù)測(cè)未來趨勢(shì)變化的拐點(diǎn)。
(二)基于互聯(lián)網(wǎng)搜索數(shù)據(jù)的經(jīng)濟(jì)社會(huì)行為預(yù)測(cè)
近幾年利用互聯(lián)網(wǎng)搜索數(shù)據(jù)來預(yù)測(cè)經(jīng)濟(jì)社會(huì)問題已經(jīng)成為了一個(gè)熱門話題。張崇、呂本富、彭賡(2012)從商品市場(chǎng)的角度建立概念框架為出發(fā)點(diǎn),以均衡價(jià)格理論為理論基礎(chǔ),揭示了網(wǎng)絡(luò)搜索數(shù)據(jù)與居民消費(fèi)價(jià)格指數(shù)(CPI)之間存在一定的相關(guān)關(guān)系和先行滯后關(guān)系,并取得了良好的預(yù)測(cè)效果[6];劉穎、呂本富、彭賡(2011)從微觀的投資者行為視角建立理論框架,揭示了網(wǎng)絡(luò)搜索與股票市場(chǎng)之間存在一定的相關(guān)關(guān)系和先行滯后關(guān)系,在時(shí)差相關(guān)分析的基礎(chǔ)上,運(yùn)用經(jīng)濟(jì)含義將搜索數(shù)據(jù)合成為股民行動(dòng)指數(shù)、市場(chǎng)行情指數(shù)和宏觀形勢(shì)指數(shù)三類搜索指數(shù),并實(shí)證檢驗(yàn)搜索指數(shù)對(duì)股票市場(chǎng)具有顯著的預(yù)測(cè)能力[7];袁慶玉、彭賡等(2011)從網(wǎng)絡(luò)關(guān)鍵詞搜索數(shù)據(jù)與汽車銷量的角度建立了理論基礎(chǔ)框架,采用了綜合賦權(quán)法對(duì)關(guān)鍵詞進(jìn)行提取,并對(duì)不同價(jià)格區(qū)間的汽車銷量進(jìn)行了預(yù)測(cè),與傳統(tǒng)模型相比則取得了很好的效果[8]??梢?,搜索數(shù)據(jù)可以作為傳統(tǒng)數(shù)據(jù)的良好補(bǔ)充,對(duì)某些典型的社會(huì)、經(jīng)濟(jì)類行為存在一定的預(yù)測(cè)能力。
雖然較傳統(tǒng)領(lǐng)域研究來說,該領(lǐng)域研究取得了一定程度上的突破,但是該領(lǐng)域研究還處在摸索發(fā)展的初級(jí)階段,未形成一套完整的理論體系,所以在理論上有待改進(jìn)與完善,特別是對(duì)網(wǎng)絡(luò)搜索數(shù)據(jù)與研究對(duì)象之間的內(nèi)在機(jī)理尚未進(jìn)行深入的研究。另外,在合成綜合指數(shù)方法方面,目前研究的學(xué)者就如何選取和合成關(guān)鍵詞的標(biāo)準(zhǔn)并未達(dá)成統(tǒng)一共識(shí)。
(三)CPI與互聯(lián)網(wǎng)搜索相關(guān)關(guān)系研究
隨著互聯(lián)網(wǎng)的飛速發(fā)展,人們獲取信息的渠道已經(jīng)由傳統(tǒng)的方式轉(zhuǎn)向互聯(lián)網(wǎng)。據(jù)中國互聯(lián)網(wǎng)絡(luò)信息中心 (CNNIC) 的數(shù)據(jù)顯示,截至2016年6月我國互聯(lián)網(wǎng)搜索引擎用戶規(guī)模達(dá)5.93億,使用率為83.5%。生產(chǎn)者和消費(fèi)者通過互聯(lián)網(wǎng)獲取信息的同時(shí),互聯(lián)網(wǎng)記載了他們的查詢和瀏覽記錄,在商品市場(chǎng)上的交易價(jià)格及交易量,反映在互聯(lián)網(wǎng)上就是網(wǎng)絡(luò)搜索、瀏覽等指標(biāo)量,這兩種表現(xiàn)是對(duì)同一事物的反映,所以二者有一定的相關(guān)關(guān)系。張崇(2012)等人研究了網(wǎng)絡(luò)搜索數(shù)據(jù)與CPI的相關(guān)性,從理論分析的角度,分析了市場(chǎng)主體的行為對(duì)網(wǎng)絡(luò)搜索數(shù)據(jù)的傳導(dǎo)路徑,認(rèn)為市場(chǎng)主體的行為對(duì)價(jià)格的影響有一定的傳導(dǎo)過程,反映在價(jià)格上的變化是滯后的,但是反映在互聯(lián)網(wǎng)搜索數(shù)據(jù)的變化是及時(shí)的,所以市場(chǎng)價(jià)格和網(wǎng)絡(luò)搜索數(shù)據(jù)存在先行滯后關(guān)系,網(wǎng)絡(luò)搜索數(shù)據(jù)領(lǐng)先于市場(chǎng)價(jià)格的變化,所以利用網(wǎng)絡(luò)搜索數(shù)據(jù)對(duì)CPI具有一定的預(yù)測(cè)能力[6]。
目前,對(duì)CPI的預(yù)測(cè)的相關(guān)文獻(xiàn)大多主要利用的是結(jié)構(gòu)化數(shù)據(jù),鮮有利用非結(jié)構(gòu)化數(shù)據(jù)來預(yù)測(cè)CPI。本文擬通過將結(jié)構(gòu)化數(shù)據(jù)和非結(jié)構(gòu)化數(shù)據(jù)合理的利用,來嘗試提高CPI的預(yù)測(cè)精度,尤其是對(duì)CPI的結(jié)構(gòu)性變化做出預(yù)測(cè)。
(一)網(wǎng)絡(luò)搜索指標(biāo)的選擇與判斷
本文采用的網(wǎng)絡(luò)搜索數(shù)據(jù)來源于百度指數(shù)網(wǎng)站(http:// index.baidu.com/)。雖然百度搜索指數(shù)是經(jīng)過標(biāo)準(zhǔn)化處理的,但因?yàn)槠鋪碓礊榫W(wǎng)民的搜索行為,而搜索行為是非常復(fù)雜和不規(guī)范的,在本質(zhì)上是非結(jié)構(gòu)化的,所以百度搜索指數(shù)屬于非結(jié)構(gòu)化信息。百度指數(shù)能夠告訴用戶:某個(gè)關(guān)鍵詞在百度的搜索規(guī)模有多大,一段時(shí)間內(nèi)的漲跌態(tài)勢(shì)以及相關(guān)的新聞?shì)浾撟兓P(guān)注這些詞的網(wǎng)民是什么樣的,分布在哪里,同時(shí)還搜索了哪些相關(guān)的詞。關(guān)鍵詞搜索數(shù)據(jù)是從百度指數(shù)網(wǎng)站“趨勢(shì)研究”版塊中獲得的,考慮到“趨勢(shì)研究”數(shù)據(jù)有PC趨勢(shì)和移動(dòng)趨勢(shì),PC趨勢(shì)積累了電腦端2006年6月至今的網(wǎng)絡(luò)搜索數(shù)據(jù),移動(dòng)趨勢(shì)數(shù)據(jù)是移動(dòng)互聯(lián)網(wǎng)設(shè)備從2011年1月開始至今的網(wǎng)絡(luò)搜索數(shù)據(jù)。為了準(zhǔn)確預(yù)測(cè)CPI,我們選擇了整體趨勢(shì),也就是既包括PC趨勢(shì)數(shù)據(jù),又包括移動(dòng)趨勢(shì)數(shù)據(jù),因此時(shí)間段選取2011年1月至2016年8月共68個(gè)月的互聯(lián)網(wǎng)搜索數(shù)據(jù)。
張崇、呂本富、彭賡、劉穎(2012)等人在研究網(wǎng)絡(luò)搜索數(shù)據(jù)與CPI的相關(guān)性研究中,選取了“貨幣政策”“中行外匯牌價(jià)”“攜程網(wǎng)”共44個(gè)網(wǎng)絡(luò)搜索關(guān)鍵詞[6];孫毅、戴維、董紀(jì)昌、呂本富(2014)等人在基于主成分分析的網(wǎng)絡(luò)搜索數(shù)據(jù)合成方法研究一文中,選取了“貨幣”“通貨膨脹”“原材料”等14個(gè)網(wǎng)絡(luò)搜索關(guān)鍵詞[9];去除重復(fù)的關(guān)鍵詞后,抓取百度指數(shù)網(wǎng)站上的日搜索量,然后將日數(shù)據(jù)合并為月度數(shù)據(jù),最后計(jì)算每個(gè)關(guān)鍵詞與 CPI 的皮爾遜相關(guān)系數(shù),該系數(shù)表示候選詞搜索變化曲線與 CPI曲線的相似程度,相關(guān)系數(shù)越高,二者的相似程度越大,最終選取相關(guān)系數(shù)大于0.7的關(guān)鍵詞共10個(gè)。選取的關(guān)鍵詞如表1。
表1 網(wǎng)絡(luò)搜索關(guān)鍵詞
(二)政府統(tǒng)計(jì)指標(biāo)的選擇與判斷
長(zhǎng)期以來,學(xué)者們對(duì)于導(dǎo)致CPI上漲的因素分析,主要圍繞貨幣供給、利率匯率、外匯儲(chǔ)備、投資與消費(fèi)、食品和住房?jī)r(jià)格等。高玲、李時(shí)椿 (2008)利用統(tǒng)計(jì)數(shù)據(jù)分析了我國20年來的定期存款利率的變化,并且實(shí)證分析了2005年1月到2008年7月之間我國CPI的變化和貨幣供應(yīng)量變化之間的相關(guān)關(guān)系,得出了這段時(shí)間內(nèi)消費(fèi)價(jià)格指數(shù)的變化率和貨幣供應(yīng)量的變化率之間的關(guān)系是正相關(guān)的[10]。王眾、魏慧豐、郭希明(2006)分析了影響CPI的眾多因素, 重點(diǎn)是居民消費(fèi)率與全社會(huì)固定資產(chǎn)投資對(duì)CPI的影響, 結(jié)果表明我國居民消費(fèi)率對(duì)CPI指數(shù)的影響不大,與此相反固定資產(chǎn)投資對(duì)CPI的影響卻很明顯[11]。王軍平(2006)分析了住房?jī)r(jià)格對(duì)CPI的影響,他認(rèn)為住房?jī)r(jià)格上漲對(duì)CPI的影響是復(fù)雜且多維度的,房?jī)r(jià)上漲通過一個(gè)住房類權(quán)數(shù)這個(gè)中間紐帶將上漲的效應(yīng)傳遞至CPI中去, 結(jié)果不僅提高了CPI的整體水平,也會(huì)導(dǎo)致CPI構(gòu)成中其他商品的價(jià)格發(fā)生上漲[12]。李慶華(2006)認(rèn)為消費(fèi)價(jià)格指數(shù)對(duì)本身的沖擊和對(duì)滯后的固定資產(chǎn)投資的沖擊是敏感的[13]。董梅(2011)在居民消費(fèi)價(jià)格指數(shù)預(yù)測(cè)一文中,研究了CPI對(duì)其自身的影響,以及貨幣和準(zhǔn)貨幣的同期增長(zhǎng)率(M2)、工業(yè)生產(chǎn)者出廠價(jià)格指數(shù)(PPI)、原材料、燃料和動(dòng)力購進(jìn)價(jià)格指數(shù)對(duì)居民消費(fèi)價(jià)格指數(shù)(PPIRM)的影響,得出CPI對(duì)自身反應(yīng)較為敏感,原料、燃料和動(dòng)力購進(jìn)價(jià)格指數(shù)對(duì)CPI的影響較弱,工業(yè)產(chǎn)品出廠價(jià)格指數(shù)以及貨幣供給增長(zhǎng)率對(duì) CPI 的影響也較弱,但有3個(gè)月的時(shí)滯[4]。
本文從影響CPI的各個(gè)因素著手, 選取居民消費(fèi)價(jià)格指數(shù)、貨幣和準(zhǔn)貨幣的同期增長(zhǎng)率、原材料、燃料和動(dòng)力購進(jìn)價(jià)格指數(shù) 、工業(yè)生產(chǎn)者出廠價(jià)格指數(shù)這四個(gè)指標(biāo),采用全國2011年1月至2016年8月(共68組)的月度數(shù)據(jù)資料并利用向量自回歸模型進(jìn)行實(shí)證研究,并據(jù)此預(yù)測(cè)走勢(shì)。本文采用的樣本期是從2011年1月到2016年月共68組數(shù)據(jù),2011年1月到2015年12月共60組數(shù)據(jù)作為訓(xùn)練集,2016年1月到8月的數(shù)據(jù)作為預(yù)測(cè)集。
(一)模型的構(gòu)建
1.單位根檢驗(yàn)
利用Eviews8.0分別對(duì)上述的4個(gè)變量及其差分之后得到的新的序列逐一的進(jìn)行ADF單位根檢驗(yàn),檢驗(yàn)的結(jié)果總結(jié)在表2。
表2 時(shí)間序列變量的ADF單位根檢驗(yàn)
由表2各個(gè)變量和其差分之后的新的序列的對(duì)比中可以很明顯地看出上述四個(gè)指標(biāo)中有三個(gè)是非平穩(wěn)的一階單整序列。
2.變量的協(xié)整關(guān)系檢驗(yàn)
選用Johanson協(xié)整關(guān)系檢驗(yàn),在進(jìn)行檢驗(yàn)前,檢驗(yàn)協(xié)整關(guān)系的個(gè)數(shù)是我們比較關(guān)注的一點(diǎn)。選取兩個(gè)檢驗(yàn)統(tǒng)計(jì)量:跡檢驗(yàn)統(tǒng)計(jì)量(Tface Testing Statistic)和最大特征根檢驗(yàn)統(tǒng)計(jì)量(Maxima Eigenvalue Testing Statistic)。分析結(jié)果顯示,本文的指標(biāo)變量居民消費(fèi)價(jià)格指數(shù)、貨幣和準(zhǔn)貨幣的同期增長(zhǎng)率、原材料、燃料等的購進(jìn)價(jià)格指數(shù)以及工業(yè)生產(chǎn)者出廠價(jià)格指數(shù)之間由兩個(gè)協(xié)整關(guān)系存在,即變量間存在長(zhǎng)期均衡關(guān)系,可以建立VAR模型。
3.建立VAR模型
向量自回歸模型中存在一個(gè)很重要的問題那就是如何判斷一個(gè)模型是幾階最優(yōu)的,在確定滯后階數(shù)的過程中,為了能夠全面地反映所建立模型的動(dòng)態(tài)特征,就要使階數(shù)足夠大,但隨著滯后階數(shù)的增加,所要估計(jì)的模型的參數(shù)也會(huì)隨著增加,而模型的自由度會(huì)隨著減少。如果階數(shù)太少的話就無法全面地反映出建立的模型的特征。所以如何確定具體的滯后階數(shù)非常關(guān)鍵。確定一個(gè)模型是滯后幾階的方法有很多種,其中最主要有以下幾種: LR(似然比)檢驗(yàn)、AIC和SC信息準(zhǔn)則。
根據(jù)AIC和SC準(zhǔn)則,結(jié)果我們可以確定最優(yōu)的滯后階數(shù)為二階,即我們可建立VAR(2)模型。本文構(gòu)建的如下包含四變量的向量自回歸模型系統(tǒng)如(1):
(1)
其中A1、B1、C1是系數(shù)矩陣,在這四個(gè)變量中,我們重點(diǎn)關(guān)注CPI受自身以及其他三個(gè)變量的影響。利用Eviews8.0我們建立如下的Unrestrieted VAR模型,估計(jì)結(jié)果如表3所示。
表3 VAR模型系統(tǒng)
4.模型系統(tǒng)穩(wěn)定性的檢驗(yàn)
檢驗(yàn)所建立的模型系統(tǒng)的穩(wěn)定性,其充分必要條件就是模型所有的特征值均要落在單位圓之內(nèi)。如果檢驗(yàn)得出的結(jié)果顯示特征根模的倒數(shù)全部落于單位圓內(nèi),那么所構(gòu)建的VAR系統(tǒng)就是穩(wěn)定的;如果存在有部分特征根模的倒數(shù)在單位圓之外的情形,那么所建立的VAR系統(tǒng)不是特別穩(wěn)定的,也就是說我們估計(jì)的有些結(jié)果可能無效。另外,對(duì)所建立的VAR模型是否穩(wěn)定進(jìn)行檢驗(yàn)也是進(jìn)行脈沖響應(yīng)分析的前提,否則,就會(huì)出現(xiàn)脈沖響應(yīng)函數(shù)分析過程不穩(wěn)定的情形。
根據(jù)圖1可以明顯地看出,所有AR根的模的倒數(shù)都在單位圓之內(nèi),因此所建立的VAR(2)模型系統(tǒng)是穩(wěn)定的,所以可以進(jìn)行脈沖響應(yīng)分析。
圖1 VAR(2)模型系統(tǒng)的AR根圖
(二)模型分析與預(yù)測(cè)
1.脈沖響應(yīng)分析
脈沖響應(yīng)函數(shù)主要是描述其他變量在當(dāng)期和以前各期均保持不變的情形下施加一次沖擊的響應(yīng)過程。下面主要用來描述加入一個(gè)標(biāo)準(zhǔn)差大小的隨機(jī)新息是否會(huì)對(duì)CPI產(chǎn)生影響,如果產(chǎn)生影響,對(duì)CPI現(xiàn)在和以后產(chǎn)生的影響程度又是多少。
圖2是運(yùn)用Eviews軟件輸出的CPI的脈沖響應(yīng)情況圖。由圖形可以看出:首先,居民消費(fèi)價(jià)格指數(shù)對(duì)其本身始終保持一個(gè)正的影響,在未來一期的影響程度是非常大的,但是到未來二期影響的程度迅速減小,此后第三期影響程度雖然有一個(gè)微小的提高,但總體來看,后面幾期影響程度是不斷減小的,這說明CPI一次偶然的增加,可能會(huì)使CPI自身在未來的第一期有一個(gè)非常大的提高,此后一段時(shí)間內(nèi)雖然也會(huì)使得CPI提高,但是幅度不大。其次,M2對(duì)CPI的影響在未來一期幾乎是沒有影響的,但到了未來二期影響程度迅速變大,到了第三期又迅速減小到0.075左右,此后影響程度逐步增加,這說明M2一次偶然的增加,對(duì)CPI未來第一期幾乎沒有影響,到了第二期效果才顯現(xiàn)出來。再次, 工業(yè)生產(chǎn)者出廠價(jià)格指數(shù)對(duì)CPI的影響程度和M2是非常相似的,即PPI對(duì)CPI在未來一期幾乎沒有影響,第二期影響程度迅速變大,此后一直減小。最后原材料、燃料等的購進(jìn)價(jià)格指數(shù)對(duì)CPI的影響和M2在未來第一期也是沒有影響,此后影響程度逐漸變大,到第六期達(dá)到最大,從第六期開始影響程度又逐漸減小,到了第十期其影響程度相對(duì)來看依然較大,說明PPIRM對(duì)CPI未來影響較大,影響效果隨著時(shí)間推移越來越明顯。
圖2 CPI的脈沖響應(yīng)圖
2.方差分解分析
方差分解主要提供的是模型中每個(gè)擾動(dòng)項(xiàng)因素對(duì)VAR模型中每個(gè)內(nèi)生變量的影響的相對(duì)程度,它可以將VAR模型系統(tǒng)中的一個(gè)變量的方差具體地分解到每個(gè)擾動(dòng)項(xiàng)上。
從圖3可知,CPI的預(yù)測(cè)誤差主要來自其本身新息的影響,第二期占的比重雖然也很大,但是相對(duì)于第一期比重下降得很快,之后逐步遞減,到第十期占了22.195%,從而說明CPI的預(yù)測(cè)誤差主要來自其本身新息的影響。換言之,CPI自身的變化情況就可很好的預(yù)測(cè)其以后短期內(nèi)的變化趨勢(shì),而其他三個(gè)變量對(duì)物價(jià)水平的影響相對(duì)來說較小。對(duì)于PPIRM所占的比重,前四期比重一直很小,也就是說PPIRM對(duì)CPI的預(yù)測(cè)誤差影響不大,但是在第六期PPIRM所占的比重超過了CPI,到了第八期,M2所占的比重也超過了CPI的比重,但是卻一直小于PPIRM所占的比重。由此也能夠看出,推動(dòng)CPI增長(zhǎng)的主要因素是其自身、PPIRM,M2和PPI對(duì)CPI增長(zhǎng)的貢獻(xiàn)都非常微小。方差分析結(jié)果見表4。
圖3 各變量的方差分解圖
3.樣本外預(yù)測(cè)
由表3可得基于VAR的居民消費(fèi)價(jià)格指數(shù)預(yù)測(cè)模型公式(2)和參數(shù)如下:
CPI=0.187456*CPI(-1)+0.197764*CPI(-2)+0.168672*M2(-1)-0.107627*M2(-2)+0.233294*PPI(-1)-1.020223*PPI(-2)+0.242245*PPIRM(-1)+0.493532*PPIRM(-2)+67.22067
(2)
在上述變量中加入網(wǎng)絡(luò)搜索行為,重新建立VAR模型,通過對(duì)比加入網(wǎng)絡(luò)搜索行為的模型預(yù)測(cè)效果與沒有加入網(wǎng)絡(luò)搜索行為的模型預(yù)測(cè)效果,以此來論證加入網(wǎng)絡(luò)搜索行為能不能幫助我們提高CPI的預(yù)測(cè)效果。
(一)網(wǎng)絡(luò)搜索指數(shù)的合成
由于各個(gè)搜索詞之間存在共線性,又考慮到“維數(shù)災(zāi)難”對(duì)建模的影響,因此需要進(jìn)一步將關(guān)鍵詞合成為關(guān)鍵詞指數(shù),達(dá)到降維的目的,以消除 “維數(shù)災(zāi)難”。孫毅、戴維、董紀(jì)昌、呂本富(2014)等人運(yùn)用主成分分析的方法對(duì)網(wǎng)絡(luò)搜索數(shù)據(jù)進(jìn)行合成,取得了不錯(cuò)的效果[9]。因?yàn)橹鞒煞址治龇椒ㄊ菑恼w的角度出發(fā),在充分反映整體趨勢(shì)的前提下剔除了變量間的多元共線性影響,其次,將各個(gè)分量的載荷系數(shù)作為賦權(quán)的依據(jù)從而解決了指標(biāo)合成的權(quán)重問題。因此本文運(yùn)用主成分分析的方法合成關(guān)鍵詞指數(shù)。
首先,通過SPSS統(tǒng)計(jì)軟件,得到核心關(guān)鍵詞方差分解主成分提取表5,以及核心關(guān)鍵詞成分矩陣見表6。
表5 核心關(guān)鍵詞方差分解主成分提取表
表6 核心關(guān)鍵詞成分矩陣
然后,以每個(gè)主成分所對(duì)應(yīng)的特征值占所提取主成分總的特征值之和的比例作為權(quán)重計(jì)算主成分綜合模型,即可得到綜合主成分模型,如下述方程所示:
y綜合=0.69659y1+0.13845y2
其中,y1、y2分別是第一、二主成分。
最后,計(jì)算綜合主成分值,繪制網(wǎng)絡(luò)搜索合成指數(shù),將網(wǎng)絡(luò)搜索合成指數(shù)作為代表網(wǎng)絡(luò)搜索行為的變量INTERNET加入到變量當(dāng)中,以CPI、M2、PPI、PPIRM、INTERNET五個(gè)變量構(gòu)建新的VAR模型并且做出評(píng)價(jià)預(yù)測(cè)。
(二)模型的構(gòu)建
經(jīng)過ADF單位根檢驗(yàn)可知,變量INTERNET是一階單整序列,協(xié)整檢驗(yàn)顯示,變量間存在協(xié)整關(guān)系。根據(jù)HQ和SC準(zhǔn)則,結(jié)果我們可以確定最優(yōu)的滯后階數(shù)為二階,即我們可以建立VAR(2)模型。本文構(gòu)建如下包含五變量的向量自回歸模型系統(tǒng)如(3):
(3)
其中A2、B2、C2是系數(shù)矩陣,在這五個(gè)變量中,我們重點(diǎn)關(guān)注CPI受自身以及其他四個(gè)變量的影響。利用Eviews8.0我們建立如表7所示的Unrestrieted VAR模型。
表7 加入網(wǎng)絡(luò)搜索行為的VAR模型系統(tǒng)
檢驗(yàn)?zāi)P偷姆€(wěn)定性,由VAR(2)模型系統(tǒng)的AR根圖4可知,所構(gòu)建的VAR模型系統(tǒng)是穩(wěn)定的。
圖4 VAR(2)模型系統(tǒng)的AR根圖
(三)模型分析與預(yù)測(cè)
1.脈沖響應(yīng)分析
圖5 加入網(wǎng)絡(luò)搜索行為的CPI脈沖響應(yīng)圖
由CPI的脈沖響應(yīng)情況圖5可知,由圖形可以得出,首先,居民消費(fèi)價(jià)格指數(shù)對(duì)其自身在五期內(nèi)都是正的影響,其中第二期和第三期CPI對(duì)其自身的影響幾乎相等,但是五期滯后影響程度變?yōu)樨?fù)數(shù),且影響程度不斷變大。其次,M2對(duì)CPI的影響在第二期到第三期有一個(gè)急劇的下降,隨后逐步上升。再次,工業(yè)生產(chǎn)者出廠價(jià)格指數(shù)對(duì)CPI的作用力度在第一期到第二期是上升的,但在第二期滯后影響程度就逐漸下降,五期滯后影響程度就變得非常小了。原材料、燃料等的購進(jìn)價(jià)格指數(shù)對(duì)CPI的影響在第一期幾乎為零,從第二期開始,作用力度就逐漸變大,到第五期作用力度達(dá)到最大值,之后作用力度就逐漸變小。最后,網(wǎng)絡(luò)搜索指數(shù)對(duì)CPI的影響力度大致呈上升態(tài)勢(shì),其中第三期和第四期影響力度大致相等。
2.方差分解分析
從方差分解函數(shù)合成圖6、方差分析結(jié)果表8可知,居民消費(fèi)價(jià)格指數(shù)的預(yù)測(cè)誤差主要來自其本身新息的影響,第二期占的比重雖然也很大,但是相對(duì)于第一期比重下降得很快,之后呈現(xiàn)線性遞減的形式,到第十期占了23.159%,從而表明居民消費(fèi)價(jià)格指數(shù)的預(yù)測(cè)誤差主要來自其本身新息的影響。換言之,居民消費(fèi)價(jià)格指數(shù)自身的變化情況就可很好地預(yù)測(cè)其以后短期內(nèi)的變化趨勢(shì),而其他四個(gè)變量對(duì)物價(jià)水平的影響相對(duì)來說較小。尤其是網(wǎng)絡(luò)搜索指數(shù)對(duì)CPI的方差影響程度很低,也就是說,只利用網(wǎng)絡(luò)搜索指數(shù)來預(yù)測(cè)CPI的短期變化趨勢(shì),其效果是很差的。
圖6 各變量的方差分解圖
PeriodS.E.CPIM2PPIPPIRMINTERNET10.331873100.00000.0000000.0000000.0000000.00000020.41999667.8693015.7046615.642230.7717410.01207330.46909159.0811415.2309117.350567.6361600.70122540.52822446.7932519.4227916.9623515.699391.12222150.58307238.4179021.1306314.8642323.487872.09937560.63751132.4708623.8105112.8623427.673223.18307570.68579628.6660426.3877111.3317929.034144.58032180.72814226.1605729.1312110.2333628.397366.07749890.76473124.4381731.682719.46805926.832607.578464100.79628523.1599833.897698.95064525.055588.936102
由表7可得加入網(wǎng)絡(luò)搜索行為構(gòu)建的基于VAR的居民消費(fèi)價(jià)格指數(shù)預(yù)測(cè)模型公式(4)和參數(shù)如下:
CPI=0.136202*CPI(-1)+0.173043*CPI(-2)+0.156718*M2(-1)-0.107959*M2(-2)+0.208777*PPI(-1)-0.973814*PPI(-2)+ 0.284969*PPIRM(-1)+0.421906*PPIRM(-2)+0.010809*INTERNET(-1)+0.097398*INTERNET(-2)+ 75.90813
(4)
根據(jù)以上得出的兩個(gè)模型,即不包括網(wǎng)絡(luò)搜索行為的VAR(2)模型和包括網(wǎng)絡(luò)搜索行為的VAR(2)模型,將2016年1月到8月的政府統(tǒng)計(jì)指標(biāo)數(shù)據(jù)和網(wǎng)絡(luò)搜索行為數(shù)據(jù)代入上述模型,分別得到兩組預(yù)測(cè)值,其中預(yù)測(cè)值F1是不包括網(wǎng)絡(luò)搜索行為的模型預(yù)測(cè)結(jié)果,F(xiàn)2是包括網(wǎng)絡(luò)搜索行為的模型預(yù)測(cè)結(jié)果,根據(jù)預(yù)測(cè)值與真實(shí)值的對(duì)比分析,得到均方誤差MSE,通過顯著性檢驗(yàn),均拒絕均方誤差MSE等于0的原假設(shè),得出均方誤差MSE顯著不為零的結(jié)論。但是通過對(duì)比發(fā)現(xiàn),MSE2總和大于MSE1總和,預(yù)測(cè)值F2的效果沒有預(yù)測(cè)值F1的效果好,也就是說在模型中加入網(wǎng)絡(luò)搜索行為并沒有使預(yù)測(cè)效果得到提升。
做出CPI的變化趨勢(shì)圖,如圖7,發(fā)現(xiàn)CPI在2011年4月到2012年2月之間變化幅度較大,因此通過向模型中代入政府統(tǒng)計(jì)數(shù)據(jù)和網(wǎng)絡(luò)搜索數(shù)據(jù),以此來預(yù)測(cè)2011年4月到2012年2月之間的CPI。
圖7 CPI變化趨勢(shì)圖
預(yù)測(cè)結(jié)果如表9,通過顯著性檢驗(yàn),均拒絕均方誤差MSE等于0的原假設(shè),得出均方誤差MSE顯著不為零的結(jié)論。對(duì)比兩個(gè)模型的預(yù)測(cè)效果,發(fā)現(xiàn)MSE3總和大于MSE4總和,即預(yù)測(cè)值F3的效果沒有預(yù)測(cè)值F4的效果好,其中預(yù)測(cè)值F3是不包括網(wǎng)絡(luò)搜索行為的模型預(yù)測(cè)結(jié)果,F(xiàn)4是包括網(wǎng)絡(luò)搜索行為的模型預(yù)測(cè)結(jié)果,也就是說在模型中加入網(wǎng)絡(luò)搜索行為使預(yù)測(cè)效果得到了一定的提升。
表9 預(yù)測(cè)值及均方誤差
通過選取兩個(gè)不同的時(shí)間段,我們發(fā)現(xiàn),在CPI變化幅度較大的時(shí)期,加入網(wǎng)絡(luò)搜索行為的模型要比沒有加入網(wǎng)絡(luò)搜索行為的模型預(yù)測(cè)效果好,在CPI變化幅度較小的時(shí)期,加入網(wǎng)絡(luò)搜索行為的模型預(yù)測(cè)效果反而沒有無網(wǎng)絡(luò)搜索行為模型預(yù)測(cè)效果好,這也正好驗(yàn)證了最初的設(shè)想,即網(wǎng)絡(luò)搜索行為數(shù)據(jù)不是對(duì)政府統(tǒng)計(jì)數(shù)據(jù)的替代,而是補(bǔ)充,網(wǎng)絡(luò)搜索行為數(shù)據(jù)是及時(shí)的,因?yàn)閷⑦@一影響價(jià)格變化的即時(shí)因素代入了模型,所以該模型能夠反映出CPI的結(jié)構(gòu)性變化,提前預(yù)測(cè)CPI變化趨勢(shì)的拐點(diǎn),因此在CPI變化幅度較大,或者出現(xiàn)拐點(diǎn)的時(shí)期,加入網(wǎng)絡(luò)搜索行為的模型預(yù)測(cè)效果要好一些。
[1] 王宇,李旭東,等.基于BP神經(jīng)網(wǎng)絡(luò)的我國CPI預(yù)測(cè)與對(duì)策[J].計(jì)算機(jī)科學(xué),2009(10):256-264.
[2] 龔玉婷,陳強(qiáng),鄭旭.基于混頻模型的CPI短期預(yù)測(cè)研究[J].統(tǒng)計(jì)研究,2014(12):25-31.
[3] 吳強(qiáng),付永利.中國近年通脹原因與2013年CPI預(yù)測(cè)分析[J].經(jīng)濟(jì)問題,2013(3):51-55.
[4] 董梅.基于VAR模型的居民消費(fèi)價(jià)格指數(shù)預(yù)測(cè)[J].統(tǒng)計(jì)與決策,2011(1):29-31.
[5] 門小琳.組合預(yù)測(cè)方法在我國CPI預(yù)測(cè)中的應(yīng)用[D].南京財(cái)經(jīng)大學(xué),2012.
[6] 張崇,呂本富,彭賡,劉穎.網(wǎng)絡(luò)搜索與CPI的相關(guān)性研究[J].管理科學(xué)學(xué)報(bào),2012(7):50-59.
[7] 劉穎,呂本富,彭賡,張崇.網(wǎng)絡(luò)搜索對(duì)股票市場(chǎng)的預(yù)測(cè)能力:理論分析與實(shí)證檢驗(yàn)[J].經(jīng)濟(jì)管理,2011(1):172-180.
[8] 袁慶玉,彭賡,劉穎,呂本富.基于網(wǎng)絡(luò)關(guān)鍵詞搜索數(shù)據(jù)的汽車銷量預(yù)測(cè)研究[J].管理學(xué)家學(xué)術(shù)版,2011(01):12-24.
[9] 孫毅,戴維,董紀(jì)昌,呂本富.基于主成分分析的網(wǎng)絡(luò)搜索數(shù)據(jù)合成方法研究[J].數(shù)學(xué)的實(shí)踐與認(rèn)識(shí),2014(21):121-128.
[10] 高玲,李時(shí)椿.關(guān)于我國近年貨幣供給和CPI的實(shí)證分析[J].產(chǎn)業(yè)與信息論壇,2008(11):151-153.
[11] 王眾,魏慧豐,郭希明.居民消費(fèi)價(jià)格影響因素的協(xié)整分析[J].統(tǒng)計(jì)與決策,2006(9):61-62.
[12] 王軍平. 住房?jī)r(jià)格上漲對(duì)CPI的傳導(dǎo)效應(yīng)——兼論我國CPI編制體系的缺陷[J].經(jīng)濟(jì)學(xué)家,2006(6):78-82.
[13] 李慶華.基于VAR模型的中國消費(fèi)價(jià)格指數(shù)分析[J]. 華中師范大學(xué)學(xué)報(bào)(人文社會(huì)科學(xué)版),2006(4):56-61.
CanWebSearchBehaviorHelpUsPromotethePredictionEffectofCPI
LIN Yong, YIN San-jie
(SchoolofEconomics,NorthwestNormalUniversity,GansuLanzhou730070,China)
The traditional CPI forecast model uses the data mainly from the government bureau of statistics, because the government statistics data have low noise and are regular, which makes the forecasting model predict better in the period of little CPI change, but its effect is poor in the period of CPI turning point. However, network search data as a new type of data structure, which is applied to the forecast of economic and social problems, and its real-time available features, can predict in advance the turning point of the trend. Therefore, this paper adds the network search data to the traditional CPI forecasting model, and analyzes whether increased network search behavior can promote the prediction effect of CPI, especially for the CPI turning point period. The analysis results show that in the period of the turning point of CPI, the network search data can be added to the traditional model, and the model’s prediction effect can be promoted.
web search data; CPI prediction; trend turning point; prediction effect
10.3969/j.issn.1672- 0598.2018.01.007
2017-06-30
林勇(1959—),男, 四川省成都人;西北師范大學(xué)經(jīng)濟(jì)學(xué)院教授,碩士生導(dǎo)師,主要從事政府統(tǒng)計(jì)與數(shù)量經(jīng)濟(jì)研究。
殷三杰(1992—),男,甘肅張掖人;西北師范大學(xué)經(jīng)濟(jì)學(xué)院碩士研究生,主要從事大數(shù)據(jù)與政府統(tǒng)計(jì)研究。
F104.5
A
1672- 0598(2018)01- 0061- 12
(責(zé)任編校:朱德東)