【摘要】近年來,由于互聯(lián)網(wǎng)的快速發(fā)展,搜索引擎已經(jīng)成為網(wǎng)民普遍使用的工具。百度指數(shù)記錄了用戶的搜索關(guān)注與需求,為研究互聯(lián)網(wǎng)搜索行為與實際的市場需求之間的關(guān)系提供了必要的數(shù)據(jù)基礎(chǔ)。本文基于百度指數(shù),利用計量經(jīng)濟(jì)學(xué)中的協(xié)整理論和格蘭杰因果關(guān)系分析了互聯(lián)網(wǎng)搜索量與國內(nèi)大眾途觀汽車實際銷售量之間的關(guān)系,建立了引入互聯(lián)網(wǎng)搜索量的市場需求預(yù)測模型;并且通過建立對比模型,比較加入百度關(guān)鍵詞搜索量前后的預(yù)測模型的精度,結(jié)果表明加入百度指數(shù)后的模型精度有了很大的提高,這對于企業(yè)進(jìn)行產(chǎn)量決策具有重大的指導(dǎo)意義。
【關(guān)鍵詞】汽車產(chǎn)業(yè) 百度指數(shù) 時間序列 大數(shù)據(jù) 預(yù)測
一、前言
汽車工業(yè)是我國國民經(jīng)濟(jì)的支柱產(chǎn)業(yè),是我國賴以實現(xiàn)現(xiàn)代化、城市化的基礎(chǔ)和保障。近日,國內(nèi)最大汽車互聯(lián)網(wǎng)企業(yè)易車發(fā)布的易車指數(shù)顯示:數(shù)據(jù)分析2014車市,國人偏愛SUV。在2014年,SUV在國內(nèi)用戶關(guān)注市場的占比超越緊湊型車,成為最搶眼的細(xì)分市場。對于SUV在中國的前景不論是其一枝獨(dú)秀的銷量,還是頻頻推出的新車,都表明消費(fèi)者已經(jīng)進(jìn)行了投票。而當(dāng)下,我國的汽車產(chǎn)業(yè)也正面臨著重重危機(jī),產(chǎn)能過剩,就是最大風(fēng)險之一。是故汽車生產(chǎn)企業(yè)能否做好產(chǎn)能規(guī)劃就顯得極為重要。本文選取了近幾年在國內(nèi)SUV市場上面,銷量一直穩(wěn)居前茅的大眾途觀為例進(jìn)行探索研究。
隨著大數(shù)據(jù)時代的來臨,搜索引擎的普遍使用,用戶進(jìn)行信息獲取的同時也將自己的搜索痕跡留在了搜索引擎中,大量的搜索記錄信息匯聚在一起,便包含了用戶現(xiàn)實生活中的行為意圖,更能反映出群體用戶的社會性、經(jīng)濟(jì)性規(guī)律的發(fā)展趨勢。最近幾年出現(xiàn)了大量運(yùn)用網(wǎng)絡(luò)搜索數(shù)據(jù)進(jìn)行預(yù)測的研究?;诰W(wǎng)絡(luò)搜索數(shù)據(jù)的流感預(yù)測、失業(yè)率監(jiān)測、旅游及房地產(chǎn)銷售預(yù)測都擁有較高的準(zhǔn)確度,網(wǎng)絡(luò)數(shù)據(jù)的即時性可以很好的彌補(bǔ)傳統(tǒng)預(yù)測方法的滯后性。因此,可以利用網(wǎng)絡(luò)搜索數(shù)據(jù)對網(wǎng)民的在線活動進(jìn)行監(jiān)測,它能從大量搜索數(shù)據(jù)中獲取新的關(guān)聯(lián)信息,能從復(fù)雜數(shù)據(jù)背景中通過數(shù)據(jù)分析創(chuàng)建合成指數(shù),找出解決問題的有效途徑。因此,依托網(wǎng)絡(luò)搜索數(shù)據(jù)的時效性,挖掘用戶對汽車的需求,對于汽車生產(chǎn)企業(yè)制定產(chǎn)能規(guī)劃具有極為現(xiàn)實的意義。
二、國內(nèi)外相關(guān)研究
Ginsberg等(2008)[1]發(fā)現(xiàn)基于Google搜索引擎端的搜索數(shù)據(jù),預(yù)測到了流感的爆發(fā),這比急病防控中心的預(yù)測提前了兩周;Askitas等(2009)[2]運(yùn)用搜索數(shù)據(jù),對德國的失業(yè)率進(jìn)行了研究,發(fā)現(xiàn)上月第三四周的網(wǎng)絡(luò)搜索量與本月失業(yè)率相關(guān)性最強(qiáng)。在國內(nèi),利用網(wǎng)絡(luò)搜索量數(shù)據(jù)進(jìn)行的研究還不多,但也取得了一定的突破,主要是在CPI、旅游業(yè)、汽車行業(yè)、股票市場預(yù)測方面有了比較大的突破:梁志峰(2010)[5]從谷歌搜索引擎端得到的數(shù)據(jù),對我國湘潭地區(qū)的網(wǎng)絡(luò)關(guān)注度進(jìn)行了研究,主要是針對一些熱點(diǎn)關(guān)鍵詞的搜索量做了時間以及空間上的比較。劉穎等(2011)[6]運(yùn)用經(jīng)濟(jì)含義,將搜索數(shù)據(jù)整理為股民行動指數(shù)、市場行情指數(shù)以及宏觀形勢指數(shù)三種,并通過實證證實了搜索指數(shù)對于股票市場具有顯著地預(yù)測能力。
三、實證分析
(一)數(shù)據(jù)的選取
本文通過一些關(guān)鍵詞挖掘工具,選取了“途觀”、“大眾途觀”兩個搜索量最多的關(guān)鍵詞(此二者的搜索量遠(yuǎn)高于其他關(guān)鍵詞搜索量),利用百度指數(shù)可以合并的特點(diǎn),采取“途觀+大眾途觀”的合成檢索,利用其得到的百度指數(shù)作為原始數(shù)據(jù),以2012年1月到2014年12月作為樣本數(shù)據(jù),數(shù)據(jù)量滿足計量經(jīng)濟(jì)學(xué)建模的要求,以2015年1月到2015年6月的數(shù)據(jù)作為檢驗數(shù)據(jù),由圖示法展示2012到2014年實際銷售量與百度關(guān)鍵詞搜索量的曲線圖,可以發(fā)現(xiàn)百度搜索指數(shù)與實際銷售量的走勢基本一致。
(二)互聯(lián)網(wǎng)搜索量數(shù)據(jù)與實際數(shù)據(jù)的關(guān)系
通過對兩組數(shù)據(jù)進(jìn)行單位根檢驗以及協(xié)整檢驗發(fā)現(xiàn):原時間序列的自相關(guān)系數(shù)不是很快的趨近零(如滯后期K=2,3),表明序列是非平穩(wěn)的。然后對其進(jìn)行對數(shù)處理并進(jìn)行差分運(yùn)算再進(jìn)行ADF檢驗,其自相關(guān)與偏相關(guān)系數(shù)很快的趨近零,可初步表明該序列為平穩(wěn)序列。由此判定兩組數(shù)據(jù)為一階單整序列,滿足協(xié)整檢驗前提。其次對兩組變量進(jìn)行普通最小二乘回歸,對其殘差進(jìn)行單位根檢驗,由于檢驗統(tǒng)計量為-8.81,小于顯著性水平0.01時的臨界值-4.25,可認(rèn)為估計殘差序列為平穩(wěn)序列,進(jìn)而得到序列xs1(銷量)與zs1(指數(shù))具有協(xié)整關(guān)系。
(三)預(yù)測模型的對比分析
通過逐步比較定階確定原時間序列分析模型為ARMA(3,2)模型,運(yùn)用此模型對2015年1月到6月的銷量進(jìn)行預(yù)測,然后加入百度指數(shù)重新進(jìn)行模型的預(yù)測,對比分析結(jié)果(表1)
表1 實際銷量與加入指數(shù)前后的模型預(yù)測值對比
單位:萬輛
對比實際值與預(yù)測值,我們發(fā)現(xiàn),較之上述ARMA模型的預(yù)測結(jié)果,預(yù)測精度有了很大程度的提高,改進(jìn)后的模型預(yù)測誤差更小。
四、結(jié)論
本文基于百度指數(shù),利用計量經(jīng)濟(jì)學(xué)中的協(xié)整理論和格蘭杰因果關(guān)系分析了互聯(lián)網(wǎng)搜索量與大眾途觀類型汽車實際銷售量之間的關(guān)系,建立了引入互聯(lián)網(wǎng)搜索量的市場需求預(yù)測模型;并且通過建立對比模型,比較加入百度關(guān)鍵詞搜索量前后的預(yù)測模型的精度,結(jié)果表明加入百度指數(shù)后的模型精度有了很大的提高,這對于企業(yè)進(jìn)行產(chǎn)量決策具有重大的指導(dǎo)意義。
參考文獻(xiàn)
[1]Ginsberg, Mohebbi, Patel, Brammer, Smolinski and Brilliant, 2009, Detecting influenza epidemics using search engine query data [J]. Nature 457: 1012-1014.
[2]Askitas N, Zimmermann K F. 2009. Google econometrics and unemployment forcasting[J]. Applied Economics Quarterly, 55(2):107-120.
[3]劉穎,呂本富,彭賡.網(wǎng)絡(luò)搜索對股票市場的預(yù)測能力: 理論分析與實證檢驗[J].經(jīng)濟(jì)管理,2011, 33(1):172-180.
作者簡介:孔令頂(1989-),男,漢族,河南衛(wèi)輝人,現(xiàn)就讀于蘭州交通大學(xué),碩士研究生,研究方向:運(yùn)營管理、數(shù)據(jù)挖掘。