李方一,肖夕林,劉思佳
(合肥工業(yè)大學(xué) 管理學(xué)院,安徽 合肥 230009)
基于網(wǎng)絡(luò)搜索數(shù)據(jù)的區(qū)域經(jīng)濟(jì)預(yù)警研究
李方一,肖夕林,劉思佳
(合肥工業(yè)大學(xué) 管理學(xué)院,安徽 合肥 230009)
摘要:網(wǎng)絡(luò)搜索直接反映了互聯(lián)網(wǎng)用戶的行為與心理,隨著用戶的不斷增長(zhǎng),海量的網(wǎng)絡(luò)搜索數(shù)據(jù)對(duì)社會(huì)經(jīng)濟(jì)發(fā)展趨勢(shì)的指示作用不斷被發(fā)現(xiàn)并研究。文章以安徽省為例,選取區(qū)域工業(yè)增加值等指標(biāo)為預(yù)測(cè)目標(biāo),基于經(jīng)濟(jì)波動(dòng)與大數(shù)據(jù)的相關(guān)理論,運(yùn)用K-L信息量法與時(shí)差相關(guān)性分析對(duì)大量國(guó)際國(guó)內(nèi)經(jīng)濟(jì)指標(biāo)與特定關(guān)鍵詞的百度搜索指數(shù)進(jìn)行篩選,得到區(qū)域經(jīng)濟(jì)先行指標(biāo),建立區(qū)域經(jīng)濟(jì)預(yù)警模型,并對(duì)模型進(jìn)行了擬合檢驗(yàn)和預(yù)測(cè)檢驗(yàn)。結(jié)果顯示,部分關(guān)鍵詞的網(wǎng)絡(luò)搜索數(shù)據(jù)能夠有效地用于預(yù)測(cè)區(qū)域工業(yè)增加值和社會(huì)消費(fèi)品零售額的月度變化,預(yù)警模型具有較好的準(zhǔn)確性與時(shí)效性,可為政府、企業(yè)應(yīng)對(duì)經(jīng)濟(jì)波動(dòng)提供決策參考。
關(guān)鍵詞:經(jīng)濟(jì)波動(dòng);先行指標(biāo);網(wǎng)絡(luò)搜索數(shù)據(jù);K-L信息量法;區(qū)域經(jīng)濟(jì)
[DOI]10.3969/j.issn.1007-5097.2016.08.010
隨著經(jīng)濟(jì)全球化步伐的加快,區(qū)域經(jīng)濟(jì)受世界經(jīng)濟(jì)環(huán)境的影響越來(lái)越大,經(jīng)濟(jì)波動(dòng)也越來(lái)越成為一個(gè)普遍的現(xiàn)象。短期的經(jīng)濟(jì)波動(dòng)對(duì)未來(lái)經(jīng)濟(jì)的發(fā)展有一定的促進(jìn)作用,但頻繁而劇烈的經(jīng)濟(jì)波動(dòng)會(huì)對(duì)企業(yè)造成負(fù)面影響,阻礙經(jīng)濟(jì)的健康發(fā)展。為了保證經(jīng)濟(jì)恢復(fù)正常平穩(wěn)運(yùn)行,政府會(huì)制定相應(yīng)的財(cái)政政策或貨幣政策,來(lái)平抑經(jīng)濟(jì)波動(dòng),減小經(jīng)濟(jì)波動(dòng)的影響。尋求經(jīng)濟(jì)波動(dòng)的內(nèi)在規(guī)律,對(duì)經(jīng)濟(jì)波動(dòng)進(jìn)行預(yù)警,對(duì)于提前采取應(yīng)對(duì)措施、實(shí)現(xiàn)事后經(jīng)濟(jì)迅速恢復(fù)具有重要的意義。
近年來(lái),經(jīng)濟(jì)先行指標(biāo)的篩選和驗(yàn)證已逐漸形成一個(gè)成熟的研究領(lǐng)域,在宏觀經(jīng)濟(jì)指標(biāo)預(yù)測(cè)的研究中應(yīng)用較為廣泛[1]。國(guó)外學(xué)者Banerjee等[2]利用先行指標(biāo)預(yù)測(cè)歐元區(qū)的通貨膨脹以及國(guó)內(nèi)生產(chǎn)總值增長(zhǎng)率,得出勞動(dòng)力市場(chǎng)變化、價(jià)格、出口以及政府支出這四個(gè)因素對(duì)預(yù)測(cè)歐元區(qū)甚至是美國(guó)的通貨膨脹都有所幫助。晏露蓉等[3]從基準(zhǔn)指標(biāo)選取、指標(biāo)體系構(gòu)成和先行指數(shù)編制等三個(gè)方面對(duì)國(guó)內(nèi)外經(jīng)濟(jì)運(yùn)行先行指標(biāo)體系進(jìn)行了比較分析。陳可嘉和劉思峰[4]選用了能源與原材料類、投資類、生產(chǎn)類、財(cái)政類、貨幣與信貸類、消費(fèi)類、對(duì)外經(jīng)濟(jì)類、物價(jià)類、指數(shù)類等9大類24項(xiàng)指標(biāo),應(yīng)用K-L信息量法進(jìn)行經(jīng)濟(jì)指標(biāo)時(shí)差分析,確定了經(jīng)濟(jì)周期波動(dòng)監(jiān)測(cè)預(yù)警的先行指標(biāo)、同步指標(biāo)與滯后指標(biāo)。王?;酆蛷埥ㄆ剑?]從先行地區(qū)、先導(dǎo)行業(yè)兩個(gè)全新的視角展開(kāi)分析和論證,運(yùn)用格蘭杰因果檢驗(yàn)、時(shí)差相關(guān)分析、主成分分析等方法,構(gòu)建了經(jīng)濟(jì)波動(dòng)的預(yù)測(cè)指標(biāo)。傳統(tǒng)的經(jīng)濟(jì)先行指標(biāo)往往來(lái)自于統(tǒng)計(jì)數(shù)據(jù),受到準(zhǔn)確性與時(shí)效性不足的制約,隨著信息技術(shù)與互聯(lián)網(wǎng)的發(fā)展,來(lái)自于互聯(lián)網(wǎng)的全樣本或大樣本數(shù)據(jù)受到越來(lái)越多學(xué)者的關(guān)注。
使用搜索引擎記錄的關(guān)鍵詞進(jìn)行預(yù)測(cè)具有預(yù)測(cè)精度較高、數(shù)據(jù)獲取及時(shí)、樣本統(tǒng)計(jì)意義明顯等優(yōu)勢(shì),2008年以來(lái),許多學(xué)者基于這一類型數(shù)據(jù)對(duì)相關(guān)經(jīng)濟(jì)問(wèn)題做出研究[6-8]。國(guó)外有關(guān)網(wǎng)絡(luò)搜索數(shù)據(jù)的研究方面已涉及經(jīng)濟(jì)、社會(huì)及健康等領(lǐng)域,其中的著名案例是Ginsberg等[9]發(fā)現(xiàn)Google中與流感相關(guān)的部分關(guān)鍵詞搜索量與美國(guó)疾病控制和防治中心發(fā)布的流感看診數(shù)據(jù)有很強(qiáng)的相關(guān)性,以此構(gòu)建了基于Google搜索數(shù)據(jù)的監(jiān)測(cè)模型,比傳統(tǒng)模型提前兩周測(cè)算流感爆發(fā)趨勢(shì);Francesco、Amuri等[10]利用Google搜索數(shù)據(jù)建立工作搜索指數(shù)來(lái)預(yù)測(cè)美國(guó)的失業(yè)率,發(fā)現(xiàn)通過(guò)搜索指數(shù)修正后的模型,預(yù)測(cè)效果顯著高于傳統(tǒng)模型;Choi、Varian[11]根據(jù)部分網(wǎng)絡(luò)搜索數(shù)據(jù)與典型行業(yè)當(dāng)期銷售量之間的相關(guān)關(guān)系,建立了典型行業(yè)當(dāng)期銷售量預(yù)測(cè)模型,取得良好的預(yù)測(cè)效果。國(guó)內(nèi)學(xué)者袁慶玉等[12]引入網(wǎng)絡(luò)關(guān)鍵詞搜索數(shù)據(jù),以預(yù)測(cè)汽車銷量;張崇等[13]、孫毅等[14]研究了網(wǎng)絡(luò)搜索數(shù)據(jù)與通貨膨脹、CPI的關(guān)系;彭賡等[15]通過(guò)建立基于網(wǎng)絡(luò)搜索數(shù)據(jù)的逐步回歸改進(jìn)模型,實(shí)證分析預(yù)測(cè)失業(yè)率,最后得出結(jié)論,運(yùn)用網(wǎng)絡(luò)搜索數(shù)據(jù)進(jìn)行失業(yè)率預(yù)測(cè)能顯著提高預(yù)測(cè)準(zhǔn)確性。此外,網(wǎng)絡(luò)搜索數(shù)據(jù)還應(yīng)用于房?jī)r(jià)預(yù)測(cè)[16]、旅游人數(shù)預(yù)測(cè)[17-18]、股票市場(chǎng)[19]、風(fēng)險(xiǎn)感知[20]、消費(fèi)者信心指數(shù)構(gòu)建[21]等研究領(lǐng)域。由此可見(jiàn),網(wǎng)絡(luò)搜索數(shù)據(jù)研究逐漸成為指標(biāo)預(yù)測(cè)領(lǐng)域一個(gè)新的研究方向,并逐步顯示出它的優(yōu)越性。盡管網(wǎng)絡(luò)搜索數(shù)據(jù)已經(jīng)運(yùn)用到對(duì)失業(yè)率、CPI及房?jī)r(jià)指數(shù)的預(yù)測(cè),但基于網(wǎng)絡(luò)搜索數(shù)據(jù)對(duì)區(qū)域經(jīng)濟(jì)波動(dòng)的預(yù)警研究還較為少見(jiàn),宏觀經(jīng)濟(jì)研究將是網(wǎng)絡(luò)搜索數(shù)據(jù)應(yīng)用的一個(gè)重要的新興領(lǐng)域。
根據(jù)網(wǎng)絡(luò)信息中心公布的第三十五屆中國(guó)互聯(lián)網(wǎng)發(fā)展報(bào)告,截至2014年12月,我國(guó)網(wǎng)民規(guī)模達(dá)6.49億,互聯(lián)網(wǎng)普及率為47.9%[22]。互聯(lián)網(wǎng)成為眾多網(wǎng)民獲取信息的主要方式,搜索引擎的廣泛使用,其在滿足用戶信息需求的同時(shí)也記錄了用戶的搜索行為,從而使得基于互聯(lián)網(wǎng)的搜索數(shù)據(jù)蘊(yùn)含著用戶的關(guān)注及意圖,能夠映射用戶在現(xiàn)實(shí)生活中的行為趨勢(shì)和規(guī)律。百度指數(shù)是由百度公司2006年推出的一款基于百度海量網(wǎng)民行為的數(shù)據(jù)分享平臺(tái),以關(guān)鍵詞為統(tǒng)計(jì)對(duì)象,科學(xué)分析并計(jì)算出各個(gè)關(guān)鍵詞在百度網(wǎng)頁(yè)搜索中搜索頻次的加權(quán)和,并以曲線圖的形式展現(xiàn),可以反映與該關(guān)鍵詞相對(duì)應(yīng)的某類事物的熱門(mén)程度和被關(guān)注程度。通過(guò)篩選一些與經(jīng)濟(jì)相關(guān)的關(guān)鍵詞搜索頻率,來(lái)反映公眾對(duì)經(jīng)濟(jì)走勢(shì)的判斷,從而預(yù)測(cè)經(jīng)濟(jì)的波動(dòng),具有重要的研究意義。
本文基于大量經(jīng)濟(jì)指標(biāo)與百度搜索引擎中的關(guān)鍵字指數(shù),來(lái)構(gòu)建區(qū)域經(jīng)濟(jì)預(yù)警模型,克服傳統(tǒng)預(yù)測(cè)方法信息來(lái)源受限、數(shù)據(jù)公布滯后而造成的預(yù)測(cè)滯后、解釋變量過(guò)少、預(yù)測(cè)誤差過(guò)大等問(wèn)題。研究以安徽省為例,選取了工業(yè)增加值和社會(huì)消費(fèi)品零售總額等指標(biāo)來(lái)反映區(qū)域經(jīng)濟(jì)狀況,探究區(qū)域經(jīng)濟(jì)與百度搜索指數(shù)間的時(shí)差相關(guān)關(guān)系,然后建立多元線性回歸模型,以預(yù)測(cè)區(qū)域經(jīng)濟(jì)的發(fā)展趨勢(shì),達(dá)到預(yù)警效果。研究成果能為政府與企業(yè)決策提供參考依據(jù),及時(shí)緩解經(jīng)濟(jì)不規(guī)律波動(dòng)對(duì)實(shí)體經(jīng)濟(jì)的沖擊。
(一)研究思路
研究將分為以下幾步:
(1)驗(yàn)證可行性。選取代表安徽省經(jīng)濟(jì)狀況的核心經(jīng)濟(jì)指標(biāo),驗(yàn)證其與國(guó)際國(guó)內(nèi)經(jīng)濟(jì)指標(biāo)、特定關(guān)鍵詞百度搜索指數(shù)之間可能存在的時(shí)差相關(guān)關(guān)系,篩選出相關(guān)性較強(qiáng)的若干先行指標(biāo),從統(tǒng)計(jì)關(guān)系上論證用關(guān)鍵詞搜索指數(shù)預(yù)測(cè)區(qū)域經(jīng)濟(jì)變化的可行性。
(2)變量篩選。對(duì)先行指標(biāo),根據(jù)最佳滯后階數(shù)進(jìn)行數(shù)據(jù)集的調(diào)整,生成新的解釋變量數(shù)據(jù)集,進(jìn)行解釋變量與被解釋變量間的相關(guān)性分析,剔除相關(guān)性較弱的備選指標(biāo)。根據(jù)相關(guān)性分析,列出相關(guān)性矩陣,剔除相關(guān)性非常不明顯的指標(biāo)。
(3)建模。根據(jù)調(diào)整后的數(shù)據(jù)集建立被解釋變量的預(yù)測(cè)模型,根據(jù)模型的檢驗(yàn)效果和預(yù)測(cè)結(jié)果,選取最優(yōu)模型為預(yù)警模型。
(4)機(jī)制分析。對(duì)預(yù)測(cè)結(jié)果精度較高的預(yù)警模型,結(jié)合經(jīng)濟(jì)學(xué)相關(guān)理論,探討其預(yù)警機(jī)制。
(二)時(shí)差相關(guān)分析
經(jīng)濟(jì)波動(dòng)總是呈周期性的出現(xiàn)波峰和波谷,與之相關(guān)的指標(biāo)在工業(yè)增加值或社會(huì)消費(fèi)品零售總額出現(xiàn)波峰、波谷之前、之后或同時(shí)存在自身的波峰、波谷特征,由此用于研究的這些指標(biāo)可以分為三大類:先行指標(biāo)、同步指標(biāo)、滯后指標(biāo)。而本文以預(yù)警經(jīng)濟(jì)為目的,所以公眾的指標(biāo)數(shù)據(jù)中選取先行指標(biāo)用于建模。
首先對(duì)收集的所有數(shù)據(jù)集進(jìn)行季節(jié)性調(diào)整,扣除季節(jié)性因素的影響。為了保證下一步K-L信息量的求值要求兩列數(shù)據(jù)必須每一個(gè)值都大于0,所以采用乘法模型,季節(jié)調(diào)整的公式如下:
其中,Xt為原序列;St為季節(jié)因子;Tt為長(zhǎng)期趨勢(shì)變動(dòng);It為不規(guī)則變動(dòng)。對(duì)原序列進(jìn)行季節(jié)分解,即先用建模數(shù)據(jù)計(jì)算其對(duì)應(yīng)月份的季節(jié)因子,變換序列得到Xt*=Xt/St=Tt+It。后面即對(duì)Xt*進(jìn)行建模分析。
K-L信息量法:運(yùn)用該方法分別確定與被解釋變量相關(guān)的先行指標(biāo)、同步指標(biāo)和滯后指標(biāo),篩選出先行指標(biāo),并確定先行期數(shù)。
這里主要考察離散變量。設(shè)基準(zhǔn)指標(biāo)為y=(y1,y2,…,yn),由于任意滿足Pi>0、∑Pi=1的序列p均可視為某隨機(jī)變量的概率分布序列,因此,基準(zhǔn)指標(biāo)序列記為p,即
設(shè)備擇指標(biāo)為x=(x1,x2,…,xn),序列記為q,即
K-L信息量的計(jì)算公式為:
當(dāng)備擇指標(biāo)序列x與基準(zhǔn)指標(biāo)序列y完全一致時(shí),K-L信息量等于0;指標(biāo)x與基準(zhǔn)指標(biāo)y越接近,K-L信息量絕對(duì)值越小,越接近于0。K-L信息量衡量?jī)蓚€(gè)概率分布的相似程度,即度量它們之間的距離,越小即代表兩者越接近越相似。根據(jù)大數(shù)據(jù)理論,時(shí)差相關(guān)關(guān)系可能是因果關(guān)系,也可能是同為結(jié)果的關(guān)系,但只要信息量足夠大,就可以用于預(yù)測(cè)。分別計(jì)算每個(gè)被解釋變量與備選的解釋指標(biāo)從-12階至+12階的K-L信息量值,選取信息量值最小的指標(biāo)對(duì)應(yīng)的階數(shù)為備選解釋指標(biāo)的最終時(shí)差,并進(jìn)行時(shí)差篩選與相關(guān)性檢驗(yàn),篩選每個(gè)被解釋變量對(duì)應(yīng)的解釋變量。
(三)多元回歸模型的構(gòu)建與篩選
為了表征區(qū)域經(jīng)濟(jì)變化,選取安徽省的工業(yè)增加值、社會(huì)消費(fèi)品零售總額、出口額與房地產(chǎn)銷售額為被解釋變量,分別篩選出對(duì)應(yīng)的解釋變量,建立多元回歸線性模型:
其中,REIk表示選出來(lái)的4個(gè)區(qū)域經(jīng)濟(jì)指標(biāo);ELIi表示國(guó)際國(guó)內(nèi)其他經(jīng)濟(jì)指標(biāo);BDSj表示百度關(guān)鍵詞搜索指數(shù)。
由于解釋變量較多,無(wú)法采用傳統(tǒng)的顯著性檢驗(yàn)來(lái)確定最終模型的自變量個(gè)數(shù),因此需要制定一定的篩選原則,對(duì)所有解釋變量進(jìn)行篩選,同時(shí)根據(jù)篩選結(jié)果的擬合效果、變量顯著性與多重共線性程度,篩選出最優(yōu)預(yù)測(cè)模型。篩選的原則分別是:全模型(包含所有解釋變量)、AIC準(zhǔn)則選擇出的最佳模型、BIC準(zhǔn)則選出的最佳模型、全模型去除多重共線性下的修正模型、AIC準(zhǔn)則選擇出的最佳模型去除多重共線性下的修正模型、BIC準(zhǔn)則選出的最佳模型去除多重共線性下的修正模型。
(四)數(shù)據(jù)來(lái)源
根據(jù)指標(biāo)篩選的全面性、精煉性、可靠性、敏感性、穩(wěn)定性、時(shí)效性等原則,選取備選的解釋變量,主要來(lái)源于兩個(gè)方面:一方面來(lái)自于安徽省統(tǒng)計(jì)局公布的經(jīng)濟(jì)指標(biāo),涉及投資、生產(chǎn)、消費(fèi)、金融等經(jīng)濟(jì)各個(gè)方面13個(gè)指標(biāo),上海市統(tǒng)計(jì)局公布的經(jīng)濟(jì)指標(biāo)10個(gè),國(guó)家統(tǒng)計(jì)局公布的經(jīng)濟(jì)指標(biāo)22個(gè),美國(guó)、歐洲和日本的進(jìn)出口額、失業(yè)率等9個(gè)經(jīng)濟(jì)指標(biāo);另一方面來(lái)自于百度搜索引擎提供的關(guān)鍵詞搜索指數(shù),關(guān)鍵詞的選取依據(jù)是可能與區(qū)域經(jīng)濟(jì)相關(guān)、能反映用戶需求及認(rèn)知的全國(guó)網(wǎng)絡(luò)用戶或安徽網(wǎng)絡(luò)用戶的搜索關(guān)鍵詞,共54個(gè),其中,全國(guó)范圍內(nèi)網(wǎng)絡(luò)用戶的搜索關(guān)鍵詞26個(gè),安徽省范圍內(nèi)網(wǎng)絡(luò)用戶的搜索關(guān)鍵詞28個(gè),包括創(chuàng)業(yè)、上市公司、基金、找工作、就業(yè)形勢(shì)、二手房等。
由于百度指數(shù)數(shù)據(jù)只能獲取2011年1月之后的數(shù)據(jù),而且本文的經(jīng)濟(jì)指標(biāo)都是月度的,所以本文將百度指數(shù)周數(shù)據(jù)合成為月度數(shù)據(jù),并選取了2011年1月至2014年12月的數(shù)據(jù)為研究樣本,其中2014年9 月-12月的數(shù)據(jù)用于預(yù)測(cè)效果的檢驗(yàn)。
(一)時(shí)差相關(guān)性分析結(jié)果
由于安徽省出口額和房地產(chǎn)投資開(kāi)發(fā)額篩選出的對(duì)應(yīng)備選指標(biāo)在相關(guān)性檢驗(yàn)下,大部分指標(biāo)的相關(guān)系數(shù)都很小,所以,在建立的預(yù)警模型中,解釋變量個(gè)數(shù)偏少,模型的擬合效果不佳,預(yù)測(cè)誤差較大。因此,下文只將安徽省工業(yè)增加值和社會(huì)消費(fèi)品零售總額的預(yù)測(cè)模型納入預(yù)警機(jī)制中,而安徽省出口額和房地產(chǎn)開(kāi)發(fā)投資額的預(yù)測(cè)模型有待后續(xù)進(jìn)一步研究。
通過(guò)乘法模型對(duì)所有數(shù)據(jù)指標(biāo)進(jìn)行季節(jié)性調(diào)整,扣除季節(jié)因素的影響。安徽省工業(yè)增加值和社會(huì)消費(fèi)品零售總額兩個(gè)指標(biāo)調(diào)整前后的對(duì)比如圖1所示。
圖1 經(jīng)濟(jì)指標(biāo)季節(jié)性調(diào)整前后對(duì)比
從圖1中可以看出,在每年的1、2月份會(huì)出現(xiàn)較大的季節(jié)性波幅,通過(guò)季節(jié)性調(diào)整前后對(duì)比,可以看出波幅降低,但不影響整個(gè)總體的趨勢(shì)。
表1 變量間的時(shí)差相關(guān)分析結(jié)果
運(yùn)用K-L信息量法分別對(duì)安徽省工業(yè)增加值和社會(huì)消費(fèi)品零售總額以及各解釋變量進(jìn)行分析,確定各個(gè)指標(biāo)的超前或滯后階數(shù),選取超前的各個(gè)指標(biāo),即先行指標(biāo)。然后對(duì)各個(gè)先行指標(biāo)與安徽省工業(yè)增加值和社會(huì)消費(fèi)品零售總額進(jìn)行相關(guān)性檢驗(yàn),剔除相關(guān)性較弱(|R|<0.5)的先行指標(biāo)。最后篩選的指標(biāo)見(jiàn)表1所列。
通過(guò)K-L信息量法,分別分析解釋變量與被解釋變量間不同時(shí)間段的概率分布,選取了概率分布最近似的移動(dòng)月數(shù),即-12到+12階下,每階對(duì)應(yīng)的K-L信息量值最小的為最佳滯后階數(shù),K-L信息量值越小越接近于0,表示解釋變量與被解釋變量間相關(guān)關(guān)系越密切。另外,根據(jù)選取的指標(biāo)對(duì)應(yīng)的最佳滯后階數(shù)對(duì)數(shù)據(jù)進(jìn)行月度的平移調(diào)整,得到新的數(shù)據(jù)集,并對(duì)新的數(shù)據(jù)集作了解釋變量與被解釋變量間的相關(guān)性分析,根據(jù)實(shí)驗(yàn)數(shù)據(jù)的結(jié)果顯示,調(diào)整后的大部分指標(biāo)與被解釋變量間存在比較明顯的相關(guān)性。因此,以上篩選出的先行指標(biāo),通過(guò)相關(guān)性檢驗(yàn),可以用來(lái)建立回歸模型。
(二)預(yù)警模型構(gòu)建
對(duì)篩選出的先行指標(biāo)按照其最佳滯后階數(shù)進(jìn)行變換,作為自變量,建立回歸模型,預(yù)測(cè)未來(lái)一個(gè)月的值。根據(jù)六種模型的擬合情況、預(yù)測(cè)誤差和方程顯著性等篩選出最佳模型,輸出模型參數(shù)與擬合結(jié)果,見(jiàn)表2所列。
表2 不同模型的擬合與檢驗(yàn)結(jié)果
據(jù)以上模型輸出結(jié)果,結(jié)合方程系數(shù)的顯著性,篩選出最優(yōu)的預(yù)警模型。安徽省工業(yè)增加值篩選的預(yù)警模型為BIC準(zhǔn)則選出的最佳模型,對(duì)安徽省社會(huì)零售總額模型進(jìn)行篩選,其中,多種準(zhǔn)則都篩選出同一個(gè)最佳模型。模型參數(shù)輸出結(jié)果見(jiàn)表3所列。
表3 模型的參數(shù)及顯著性檢驗(yàn)
從模型的檢驗(yàn)結(jié)果看:日本進(jìn)口額、M1、美國(guó)進(jìn)口額、關(guān)鍵詞創(chuàng)業(yè)、通貨膨脹、就業(yè)形勢(shì)、增值稅的安徽百度指數(shù)都在95%的置信水平下對(duì)工業(yè)增加值產(chǎn)生作用,尤其創(chuàng)業(yè)和增值稅在99%的置信水平下都很顯著。房地產(chǎn)業(yè)固定資產(chǎn)投資額、房地產(chǎn)開(kāi)發(fā)投資、關(guān)鍵詞理財(cái)產(chǎn)品、黃山的全國(guó)百度指數(shù)、關(guān)鍵詞手機(jī)排行榜、找工作、中國(guó)經(jīng)濟(jì)的安徽百度指數(shù)在95%的置信區(qū)間內(nèi)對(duì)安徽省社會(huì)消費(fèi)品零售總額產(chǎn)生作用。
根據(jù)以上分析及結(jié)果,安徽省工業(yè)增加值和社會(huì)消費(fèi)品零售總額預(yù)警模型如下:
(三)擬合與預(yù)測(cè)效果檢驗(yàn)
根據(jù)篩選出的最優(yōu)模型,得到擬合結(jié)果,并預(yù)測(cè)2014年9月-12月的值,擬合與預(yù)測(cè)結(jié)果如圖2所示。根據(jù)預(yù)測(cè)結(jié)果給出預(yù)警結(jié)果,并列出模型的預(yù)測(cè)誤差,結(jié)果見(jiàn)表4所列。
圖2 模型擬合與預(yù)測(cè)結(jié)果
表4 模型預(yù)測(cè)結(jié)果與誤差率(2014年9月-12月)
從模型的擬合效果看,安徽省工業(yè)增加值的波峰和波谷的擬合出現(xiàn)稍微的偏差,但大體的逆轉(zhuǎn)趨勢(shì)都能準(zhǔn)確地反映;安徽省社會(huì)消費(fèi)品零售總額的擬合效果比較理想,波峰和波谷及增長(zhǎng)率的擬合都比較準(zhǔn)確。根據(jù)兩個(gè)模型的4個(gè)月預(yù)測(cè)誤差來(lái)看,平均誤差分別是2.3%和2.4%,誤差率較低。模型能在統(tǒng)計(jì)數(shù)據(jù)公布一個(gè)月之前給出預(yù)警結(jié)果,可見(jiàn)模型具有較高的精確度與時(shí)效性。
基于預(yù)測(cè)結(jié)果可以對(duì)區(qū)域經(jīng)濟(jì)下月的波動(dòng)進(jìn)行預(yù)警:通過(guò)預(yù)測(cè)本月的增長(zhǎng)率,與上月實(shí)際增長(zhǎng)率對(duì)比,若增長(zhǎng)率延續(xù)原趨勢(shì)并處于合理區(qū)間,則經(jīng)濟(jì)是平穩(wěn)運(yùn)行;若增長(zhǎng)率較低或出現(xiàn)大幅下降,則經(jīng)濟(jì)形勢(shì)惡化或面臨下行壓力;若增長(zhǎng)率較高或大幅上漲,則經(jīng)濟(jì)形勢(shì)較好或加速上行。
(一)工業(yè)增加值預(yù)警機(jī)制
從統(tǒng)計(jì)口徑上看,工業(yè)增加值是企業(yè)日常生產(chǎn)的產(chǎn)品總價(jià)值扣除生產(chǎn)過(guò)程中消耗或轉(zhuǎn)移的物質(zhì)產(chǎn)品和勞務(wù)價(jià)值后的余額,是工業(yè)企業(yè)生產(chǎn)過(guò)程中新增加的價(jià)值??梢苑从彻I(yè)企業(yè)的投入、產(chǎn)出和經(jīng)濟(jì)效益情況,為改善工業(yè)企業(yè)生產(chǎn)經(jīng)營(yíng)提供依據(jù),也是衡量宏觀經(jīng)濟(jì)發(fā)展趨勢(shì)的一個(gè)重要指標(biāo)。由預(yù)警模型看出,安徽省工業(yè)增加值與美國(guó)和日本的進(jìn)口額存在一定的相關(guān)關(guān)系,表明安徽省的經(jīng)濟(jì)一定程度上存在對(duì)出口的依賴,因而可以根據(jù)國(guó)外市場(chǎng)需求的波動(dòng)來(lái)預(yù)測(cè)未來(lái)經(jīng)濟(jì)的走向,提前制定對(duì)經(jīng)濟(jì)波動(dòng)的應(yīng)對(duì)措施。
另外,從安徽省的百度搜索指數(shù)看,創(chuàng)業(yè)和就業(yè)形勢(shì)的搜索量與工業(yè)增加值存在一定程度的負(fù)相關(guān)關(guān)系,也就是在經(jīng)濟(jì)低迷的時(shí)候,大家都比較關(guān)注就業(yè)方面的信息,政府部門(mén)及科研方面人員對(duì)當(dāng)前的形勢(shì)更為關(guān)注,失業(yè)人數(shù)一旦增加,政府會(huì)鼓勵(lì)創(chuàng)業(yè)解決部分失業(yè)。尤其自2015年來(lái)經(jīng)濟(jì)一路下行,在經(jīng)濟(jì)仍有巨大下行壓力的情況下,李克強(qiáng)總理發(fā)出“大眾創(chuàng)業(yè)、萬(wàn)眾創(chuàng)新”的號(hào)召,因此近期該有關(guān)創(chuàng)業(yè)方面的搜索量就會(huì)上升,一定程度上與此相關(guān)的搜索量上升可能反映該段時(shí)間經(jīng)濟(jì)的不景氣。
通貨膨脹和增值稅的搜索量與工業(yè)增加值之間存在正相關(guān)的關(guān)系,反映該關(guān)鍵字搜索量的上升,工業(yè)增加值也隨之上升,由此可以看出,公眾在經(jīng)濟(jì)景氣的時(shí)候可能對(duì)這方面的指標(biāo)比較關(guān)注。例如,對(duì)通貨膨脹的認(rèn)識(shí)源于公眾平時(shí)對(duì)物價(jià)利率的反映,思考貨幣購(gòu)買(mǎi)力是否降低,為了印證這種猜測(cè),在百度中搜索相關(guān)證據(jù),一旦搜索量上升,則反映普遍的人認(rèn)為物價(jià)在上漲,通貨膨脹開(kāi)始發(fā)生。這種反映在互聯(lián)網(wǎng)上超前于統(tǒng)計(jì)上描述的經(jīng)濟(jì)現(xiàn)象發(fā)生的認(rèn)識(shí),成為新一代的數(shù)據(jù)集,為研究提供了更多的數(shù)據(jù)基礎(chǔ)。
(二)社會(huì)消費(fèi)品零售總額預(yù)警機(jī)制
社會(huì)消費(fèi)品零售總額是批發(fā)和零售業(yè)、住宿和餐飲業(yè)以及其他行業(yè)直接售給城鄉(xiāng)居民和社會(huì)集團(tuán)的消費(fèi)品零售額,是一項(xiàng)反映最終消費(fèi)的指標(biāo),與宏觀經(jīng)濟(jì)波動(dòng)的方向趨于一致。不僅是反映我國(guó)拉動(dòng)內(nèi)需政策效果、制定新政策和新計(jì)劃的重要指標(biāo),而且是各企業(yè)制定生產(chǎn)規(guī)劃、個(gè)人投資者決策參考的重要指標(biāo)。
從最優(yōu)預(yù)警模型可以看出,安徽省房地產(chǎn)投資額與社會(huì)消費(fèi)品零售總額之間呈正相關(guān)關(guān)系,而房地產(chǎn)開(kāi)發(fā)投資是指在房地產(chǎn)經(jīng)營(yíng)業(yè)務(wù)中,對(duì)于統(tǒng)籌待建、拆遷還建等目前未存在的各類建筑物及配套和服務(wù)設(shè)施的建設(shè)投入,投資完成后,是作為商品進(jìn)入銷售領(lǐng)域,以獲取預(yù)期利潤(rùn)為目的,因此,與消費(fèi)品零售額之間可能存在一個(gè)正向的相關(guān)關(guān)系。
檢驗(yàn)結(jié)果還表明,安徽省與經(jīng)濟(jì)相關(guān)關(guān)鍵字的搜索量與消費(fèi)品零售額存在相關(guān)關(guān)系,在模型預(yù)測(cè)效果不錯(cuò)的條件下,有關(guān)百度指數(shù)的解釋變量系數(shù)檢驗(yàn)非常顯著,由此可以得出結(jié)論,網(wǎng)絡(luò)搜索數(shù)據(jù)與社會(huì)消費(fèi)品零售總額存在相關(guān)關(guān)系。相關(guān)研究表明網(wǎng)絡(luò)搜索數(shù)據(jù)與景區(qū)實(shí)際游客量之間具有正相關(guān)性[18],而“黃山(全國(guó)百度指數(shù))”與社會(huì)消費(fèi)品零售總額之間的正相關(guān),可能反映社會(huì)消費(fèi)品的零售總額與旅游業(yè)形勢(shì)存在一定的相關(guān)關(guān)系。
(三)小結(jié)
綜上所述,結(jié)合模型的系數(shù)顯著性、方程顯著性、方程的擬合優(yōu)度及預(yù)測(cè)效果分析等,以及基于經(jīng)濟(jì)理論的預(yù)警機(jī)制分析,本文構(gòu)建的預(yù)警模型存在一定的合理性。因此,安徽省工業(yè)增加值與社會(huì)消費(fèi)品零售總額的預(yù)警模型,可作為指示安徽省經(jīng)濟(jì)波動(dòng)的預(yù)警模型。
根據(jù)預(yù)警模型來(lái)預(yù)測(cè)這兩大指標(biāo)未來(lái)趨勢(shì)走向,可以從生產(chǎn)和消費(fèi)兩個(gè)方面分析未來(lái)經(jīng)濟(jì)的增長(zhǎng)率,提前應(yīng)對(duì)經(jīng)濟(jì)波動(dòng),制定企業(yè)和政府的相關(guān)政策。在經(jīng)濟(jì)低迷時(shí),實(shí)行經(jīng)濟(jì)促進(jìn)政策,及時(shí)拉動(dòng)內(nèi)需、適當(dāng)增加投資;反之則需要減少經(jīng)濟(jì)刺激政策,注重產(chǎn)業(yè)結(jié)構(gòu)調(diào)整目標(biāo)的實(shí)現(xiàn)。
本文基于對(duì)大量傳統(tǒng)經(jīng)濟(jì)指標(biāo)與百度搜索指數(shù)之間的時(shí)差相關(guān)關(guān)系分析,建立區(qū)域經(jīng)濟(jì)預(yù)警模型,通過(guò)對(duì)模型擬合與預(yù)測(cè)結(jié)果的檢驗(yàn),結(jié)合預(yù)警機(jī)制研究,認(rèn)為預(yù)警模型具有較好的精確度與時(shí)效性。研究結(jié)果較精確的預(yù)測(cè)出安徽省工業(yè)增加值和社會(huì)消費(fèi)品零售總額未來(lái)一月的變化趨勢(shì);研究通過(guò)引入百度搜索指數(shù),篩選先行指標(biāo)來(lái)建立回歸模型,證實(shí)了網(wǎng)絡(luò)搜索行為與經(jīng)濟(jì)波動(dòng)存在一定的相關(guān)性,彌補(bǔ)了由于統(tǒng)計(jì)數(shù)據(jù)公布滯后性造成的數(shù)據(jù)時(shí)滯性的缺陷;基于互聯(lián)網(wǎng)的搜索數(shù)據(jù)集容易獲取,在預(yù)警模型的基礎(chǔ)上,通過(guò)觀測(cè)相關(guān)數(shù)據(jù)的變化,能夠?yàn)檎块T(mén)和企業(yè)應(yīng)對(duì)經(jīng)濟(jì)波動(dòng)提供參考。
在大數(shù)據(jù)時(shí)代,數(shù)據(jù)搜集、存儲(chǔ)和更新的成本更低,為復(fù)雜動(dòng)態(tài)模型研究提供了條件,而指標(biāo)數(shù)量越多,包含的信息越豐富[23-25]。隨著移動(dòng)互聯(lián)網(wǎng)和大數(shù)據(jù)分析技術(shù)的快速發(fā)展,基于大數(shù)據(jù)分析的預(yù)測(cè)方法將改變傳統(tǒng)的預(yù)測(cè)模型,而以百度指數(shù)為代表的網(wǎng)絡(luò)大數(shù)據(jù)將為未來(lái)的研究提供更多更有價(jià)值的數(shù)據(jù)。
本文在研究框架和方法上還存在一定的不足,相關(guān)研究還有待繼續(xù)深入和完善。首先,單從百度指數(shù)方面來(lái)考慮公眾對(duì)經(jīng)濟(jì)的判斷存在一定的局限性,百度指數(shù)反映的數(shù)據(jù)只是用戶生成內(nèi)容的一部分,并不涵蓋所有的用戶內(nèi)容生成數(shù)據(jù),譬如搜狗、360搜索引擎以及社交網(wǎng)絡(luò)等,一些代表用戶對(duì)經(jīng)濟(jì)的預(yù)期和看法的高頻數(shù)據(jù)每天在微博、新聞評(píng)論等媒體上也有生成,未來(lái)需要將這些結(jié)構(gòu)化與非結(jié)構(gòu)化的數(shù)據(jù)進(jìn)行整合。其次,盡管可選的網(wǎng)絡(luò)搜索關(guān)鍵詞數(shù)量巨大,由于多元回歸模型的自變量數(shù)量過(guò)多會(huì)影響回歸模型的效果,需要限制網(wǎng)絡(luò)搜索關(guān)鍵詞的數(shù)量,篩選的方式往往是根據(jù)經(jīng)濟(jì)學(xué)理論與相關(guān)研究的經(jīng)驗(yàn),存在信息的遺漏,未來(lái)需要引進(jìn)大數(shù)據(jù)的最新研究方法,從網(wǎng)絡(luò)大數(shù)據(jù)中提取更多關(guān)于宏觀經(jīng)濟(jì)形勢(shì)的有用信息。
參考文獻(xiàn):
[1]楊嵐.中、美、日宏觀經(jīng)濟(jì)監(jiān)測(cè)中的先行指標(biāo)、同步指標(biāo)和滯后指標(biāo)簡(jiǎn)介[J].西安金融,2004(10):29-30.
[2]Banerjee A,Marcellino M,Masten I.Leading Indicators for Euro-area Inflation and GDP Growth[J].Oxford Bulletin of Economics and Statistics,2005,67(12):785-813.
[3]晏露蓉,吳偉.建設(shè)先行指標(biāo)體系的科學(xué)方法[J].金融研究,2006(6):128-135.
[4]陳可嘉,劉思峰.基于K-L信息量法的經(jīng)濟(jì)指標(biāo)時(shí)差分析[J].江南大學(xué)學(xué)報(bào):自然科學(xué)版,2010,9(6):45-49.
[5]王?;?,張建平.短期經(jīng)濟(jì)波動(dòng)預(yù)測(cè)方法研究——基于先行地區(qū)與先導(dǎo)行業(yè)的視角[J].上海金融,2010(8):16-20.
[6]Kulkarni R,Haynes K,Stough R,et al.Forecasting housing prices with Google econometrics[R].GMU School of Public Policy,2009.
[7]Suhoy T.Query Indices and a 2008 Downturn:Israeli Data [R].Bank of Israel,2009.
[8]Konstantin K A,Podstawski M,Siliverstovs B,et al.Google searches as a means of improving the nowcasts of key Macro-economic Variables[R].Discussion Papers of Diw Berlin,2009.
[9]Ginsberg J,Mohebbi M,Patwl R,et al.Detecting influenza epidemics using search engine query data[J].Nature,2008,457(19):1012-1014.
[10]Francesco,Amuri D.Predicting Unemployment in Short Samples with Internet Job Search Query Data[R].Working Paper of the Economic and Social research Council,2009.
[11]Choi H,Varian H.Predicting the Present with Google Trends[J].Economic Record,2009,88(S1):2-9.
[12]袁慶玉,彭賡,劉穎,等.基于網(wǎng)絡(luò)關(guān)鍵詞搜索數(shù)據(jù)的汽車銷量預(yù)測(cè)研究[J].管理學(xué)家:學(xué)術(shù)版,2011(1):12-24.
[13]張崇,呂本富,彭賡,等.網(wǎng)絡(luò)搜索數(shù)據(jù)與CPI的相關(guān)性研究[J].管理科學(xué)學(xué)報(bào),2012,15(7):50-59.
[14]孫毅,呂本富,陳航,等.大數(shù)據(jù)視角的通脹預(yù)期測(cè)度與應(yīng)用研究[J].管理世界,2014(4):171-172.
[15]彭賡,蘇亞軍,李娜.失業(yè)率預(yù)測(cè)研究——基于網(wǎng)絡(luò)搜索數(shù)據(jù)及改進(jìn)的逐步回歸模型[J].現(xiàn)代管理科學(xué),2013 (12):40-43.
[16]董倩,孫娜娜,李偉.基于網(wǎng)絡(luò)搜索數(shù)據(jù)的房地產(chǎn)價(jià)格預(yù)測(cè)[J].統(tǒng)計(jì)研究,2014,31(10):81-88.
[17]姜東民,崔麗敏,管田超.基于網(wǎng)絡(luò)搜索量的世園會(huì)客流量預(yù)測(cè)[J].中國(guó)管理信息化,2013,16(8):44-47.
[18]任樂(lè),崔東佳.基于網(wǎng)絡(luò)搜索數(shù)據(jù)的國(guó)內(nèi)旅游客流量預(yù)測(cè)研究——以北京市國(guó)內(nèi)旅游客流量為例[J].經(jīng)濟(jì)問(wèn)題探索,2014(4):67-73.
[19]劉穎,呂本富,彭賡,等.網(wǎng)絡(luò)搜索對(duì)股票市場(chǎng)的預(yù)測(cè)能力:理論分析與實(shí)證檢驗(yàn)[J].經(jīng)濟(jì)管理,2011,33(1):172-180.
[20]王煉,賈建民.突發(fā)性災(zāi)害事件風(fēng)險(xiǎn)感知的動(dòng)態(tài)特征:來(lái)自網(wǎng)絡(luò)搜索的證據(jù)[J].管理評(píng)論,2014,26(5):169-176.
[21]孫毅,呂本富,陳航,等.基于網(wǎng)絡(luò)搜索行為的消費(fèi)者信心指數(shù)構(gòu)建及應(yīng)用研究[J].管理評(píng)論,2014,26(10):117-125.
[22]中國(guó)互聯(lián)網(wǎng)絡(luò)信息中心.中國(guó)互聯(lián)網(wǎng)絡(luò)狀況統(tǒng)計(jì)報(bào)告[R].北京:中國(guó)互聯(lián)網(wǎng)絡(luò)信息中心,2015.
[23]李國(guó)杰,程學(xué)旗.大數(shù)據(jù)研究:未來(lái)科技及經(jīng)濟(jì)社會(huì)發(fā)展的重大戰(zhàn)略領(lǐng)域——大數(shù)據(jù)的研究現(xiàn)狀與科學(xué)思考[J].中國(guó)科學(xué)院院刊,2012(6):647-657.
[24]俞立平.大數(shù)據(jù)與大數(shù)據(jù)經(jīng)濟(jì)學(xué)[J].中國(guó)軟科學(xué),2013 (7):177-183.
[25]楊善林,周開(kāi)樂(lè).大數(shù)據(jù)中的管理問(wèn)題:基于大數(shù)據(jù)的資源觀[J].管理科學(xué)學(xué)報(bào),2015,18(5):1-7.
[責(zé)任編輯:余志虎]
肖夕林(1993-),男,江蘇南通人,碩士研究生,研究方向:區(qū)域經(jīng)濟(jì)與可持續(xù)發(fā)展;
劉思佳(1992-),女,山西運(yùn)城人,碩士研究生,研究方向:企業(yè)管理。
中圖分類號(hào):F207
文獻(xiàn)標(biāo)志碼:A
文章編號(hào):1007-5097(2016)08-0060-07
收稿日期:2016-05-20
基金項(xiàng)目:安徽省自然科學(xué)基金項(xiàng)目(1508085QG146);中國(guó)博士后科學(xué)基金項(xiàng)目(2014M551792)
作者簡(jiǎn)介:李方一(1985-),男,湖南常德人,副教授,博士,研究方向:區(qū)域經(jīng)濟(jì)與可持續(xù)發(fā)展;
Research on Early-warning of Regional Economy based on Web Search Data
LI Fang-yi,XIAO Xi-lin,LIU Si-jia
(School of Management,Hefei University of Technology,Hefei 230009,China)
Abstract:As the number of Web users continues to grow,the function of Web search data for indicating social and economic development is discovered and studied,since Web Search Data directly reflects the users'behavior and psychology.Taking Anhui province as an example,we selected industrial value-added and other indicators as forecast targets in this paper.Based on the theories of economic fluctuation and Big Data,we used K-L information method and time difference correlation analysis to screen a series of international and domestic economic indicators and Web search data of specific keywords.After that a series of leading indicators were screened out to build a regional early-warning model.The results show that Web search data of certain keywords can be used to forecast monthly change of regional industrial value-added and total retail of consumer goods based on fitting test and predicting test,and the early warning model,with good accuracy and timeliness,can provide references for government and enterprises to reply to economic fluctuations.
Keywords:economic fluctuation;leading indicator;Web search data;K-L information method;regional economy