亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        網(wǎng)絡(luò)搜索指數(shù)與汽車銷量關(guān)系研究

        2016-05-14 20:24:35李憶文瑞楊立成
        現(xiàn)代情報(bào) 2016年8期
        關(guān)鍵詞:預(yù)測(cè)

        李憶 文瑞 楊立成

        〔摘要〕網(wǎng)絡(luò)搜索數(shù)據(jù)是消費(fèi)者在信息搜集和購(gòu)買決策過程中真實(shí)足跡的反映,對(duì)了解消費(fèi)者購(gòu)買需求具有重要價(jià)值。本文運(yùn)用與現(xiàn)有研究不同的關(guān)鍵詞獲取方法,以我國(guó)汽車市場(chǎng)為背景,研究網(wǎng)絡(luò)搜索數(shù)據(jù)與銷量之間的關(guān)系。首先,確定網(wǎng)絡(luò)搜索數(shù)據(jù)的關(guān)鍵詞,主要運(yùn)用了文本挖掘技術(shù),具體而言:①對(duì)抓取的汽車論壇文本進(jìn)行Jieba分詞;②利用Word2vec模型把分詞結(jié)果轉(zhuǎn)化為向量空間模型形式;③結(jié)合TF-IDF算法和余弦相似度算法確定關(guān)鍵詞。然后,基于108個(gè)月的長(zhǎng)面板數(shù)據(jù),建立網(wǎng)絡(luò)搜索與汽車銷量的固定效應(yīng)模型。最后,采取滾動(dòng)窗口的方式預(yù)測(cè)最近12個(gè)月的汽車銷量。實(shí)證結(jié)果顯示:網(wǎng)絡(luò)搜索與汽車銷量之間存在長(zhǎng)期均衡關(guān)系,回歸模型可以解釋76%的方差;網(wǎng)絡(luò)搜索數(shù)據(jù)有助于預(yù)測(cè)我國(guó)汽車銷量。

        〔關(guān)鍵詞〕網(wǎng)絡(luò)搜索數(shù)據(jù);消費(fèi)者;購(gòu)買需求;汽車銷量;文本挖掘;關(guān)鍵詞獲??;長(zhǎng)面板數(shù)據(jù);預(yù)測(cè)

        DOI:10.3969/j.issn.1008-0821.2016.08.026

        〔中圖分類號(hào)〕F27213〔文獻(xiàn)標(biāo)識(shí)碼〕A〔文章編號(hào)〕1008-0821(2016)08-0131-06

        〔Abstract〕The online searching data reflects the real traces that consumers leave behind while gathering some information or making purchase decisions.The online searching data benefits us to know the information of what is the consumers need.In our paper,the selection of keywords differents from the existing researches,on the background of Chinas automobile market,the paper researched the relationship between online searching data and Chinese automobile sales.Firstly,identified the key words of online searching mainly according the text mining technology,to be specific:①Using Jieba segmenting the automobile BBS text captured to words;②Converting segmentary words to the Vector space model by Word2vec model;③Combining TF-IDF algorithm and cosine similarity algorithm to determinate the key words.Then,based on the 108 months long panel data,the paper established a fixed effect model between the online searching data and the automobile sales.Finally,the paper forecasted the automobile sales in nearly 12 months.The empirical result showed that:there is a Long-run equilibrium relationship between the online searching data and the automobile sales,and regression model can explain 76% of the variance.The holdout analysis suggested that online searching data can be of substantial use to forecast the Chinas automobile sales.

        〔Key words〕online searching data;consumer;purchase decision;automobile sales;text mining;keywords obtaining;long panel data;forcast

        搜索引擎已經(jīng)成為消費(fèi)者決策過程中信息搜索和評(píng)價(jià)過程的起點(diǎn),根據(jù)在CNNIC調(diào)查社區(qū)進(jìn)行的搜索營(yíng)銷調(diào)查顯示,有77%的互聯(lián)網(wǎng)用戶在購(gòu)買產(chǎn)品之前會(huì)上網(wǎng)搜索信息[1]。網(wǎng)民的搜索需求在一定程度上反映了他們的關(guān)注點(diǎn)和意圖,而網(wǎng)絡(luò)搜索數(shù)據(jù)正是對(duì)網(wǎng)民搜索需求的客觀記錄。網(wǎng)絡(luò)搜索數(shù)據(jù)的這一特性使其能夠映射用戶實(shí)際生活中的行為特點(diǎn),并影響企業(yè)經(jīng)營(yíng)和政府管理方式,成為目前研究大數(shù)據(jù)的主要方向之一。

        本文以我國(guó)汽車市場(chǎng)為背景,研究網(wǎng)絡(luò)搜索數(shù)據(jù)與汽車銷量之間的關(guān)系。之所以選擇汽車作為研究對(duì)象,是因?yàn)槠嚠a(chǎn)品屬性復(fù)雜并且要求較大資金投入,消費(fèi)者在購(gòu)買汽車時(shí)會(huì)對(duì)汽車產(chǎn)品各種屬性進(jìn)行仔細(xì)考察和評(píng)估。不僅如此,汽車也是研究消費(fèi)者外部搜索相關(guān)文獻(xiàn)中最為常用的產(chǎn)品對(duì)象之一[2]。

        1研究意義與思路

        11研究意義

        網(wǎng)絡(luò)搜索數(shù)據(jù)的利用價(jià)值已經(jīng)得到了學(xué)術(shù)界的廣泛關(guān)注。國(guó)外學(xué)者在房地產(chǎn)[3]、就業(yè)[4]、股票[5]、汽車和旅游[6]等眾多領(lǐng)域都驗(yàn)證了谷歌搜索數(shù)據(jù)的作用。但是在中國(guó),百度是應(yīng)用最多的搜索引擎,因而用百度搜索指數(shù)研究中國(guó)的社會(huì)經(jīng)濟(jì)行為更符合實(shí)際情況。任樂通過計(jì)算相關(guān)系數(shù)、確定領(lǐng)先階數(shù)并合成百度搜索指數(shù),實(shí)證了北京市搜索數(shù)據(jù)與月旅游客流量之間的相關(guān)關(guān)系[7];袁慶玉等從網(wǎng)絡(luò)關(guān)鍵詞搜索數(shù)據(jù)與汽車銷量的角度建立了理論基礎(chǔ)框架,采用綜合賦權(quán)法對(duì)關(guān)鍵詞進(jìn)行提取,預(yù)測(cè)了汽車銷量[8]。

        但是對(duì)國(guó)內(nèi)現(xiàn)有研究而言,利用網(wǎng)絡(luò)搜索數(shù)據(jù)預(yù)測(cè)用戶需求仍屬于一個(gè)新的研究領(lǐng)域,并沒有形成系統(tǒng)的研究體系,還存在以下不足:(1)對(duì)于關(guān)鍵詞的選取還存在爭(zhēng)議。多數(shù)研究是直接指定關(guān)鍵詞,或者是結(jié)合百度自動(dòng)生成的關(guān)鍵詞來提取指數(shù),并沒有考慮關(guān)鍵詞能否代表用戶實(shí)際的網(wǎng)絡(luò)搜索行為。(2)預(yù)測(cè)模型多采用時(shí)間序列的靜態(tài)回歸或者是對(duì)短面板數(shù)據(jù)的建模,不利于控制不同個(gè)體間的差異,也不利于準(zhǔn)確地反映和刻畫在時(shí)間推移的過程中網(wǎng)絡(luò)搜索數(shù)據(jù)對(duì)銷售影響的動(dòng)態(tài)變化。

        為彌補(bǔ)現(xiàn)有研究存在的不足,本文在關(guān)鍵詞選擇和模型設(shè)定上都作出了改進(jìn),目的是驗(yàn)證網(wǎng)絡(luò)搜索數(shù)據(jù)如何反映當(dāng)前的汽車銷量并預(yù)測(cè)未來的銷量變化趨勢(shì)。本文的主要工作是:提出了一套結(jié)構(gòu)化的流程來提取網(wǎng)絡(luò)搜索數(shù)據(jù)關(guān)鍵詞,并應(yīng)用于我國(guó)汽車市場(chǎng)的研究。該流程為網(wǎng)絡(luò)搜索數(shù)據(jù)在其他領(lǐng)域的研究提供了參考。

        12研究思路

        本文的研究思路如下:①對(duì)汽車銷量預(yù)測(cè)和網(wǎng)絡(luò)搜索數(shù)據(jù)應(yīng)用的相關(guān)研究進(jìn)行梳理,總結(jié)出現(xiàn)有研究存在的不足;②以2007-2015年國(guó)內(nèi)市場(chǎng)的汽車銷量為研究對(duì)象,基于文本挖掘技術(shù),提出一套結(jié)構(gòu)化的流程,獲得網(wǎng)絡(luò)搜索數(shù)據(jù)的關(guān)鍵詞,用于提取出百度搜索指數(shù);③為避免百度搜索指數(shù)和汽車銷量之間存在偽回歸的可能性,對(duì)變量做了單位根檢驗(yàn)和格蘭杰因果檢驗(yàn);④基于108個(gè)月的長(zhǎng)面板數(shù)據(jù),建立百度搜索指數(shù)與汽車銷量的固定效應(yīng)模型,據(jù)此驗(yàn)證網(wǎng)絡(luò)搜索數(shù)據(jù)如何反映當(dāng)前的銷量;⑤采用滾動(dòng)窗口的方式預(yù)測(cè)最近12個(gè)月的汽車銷量,來檢驗(yàn)網(wǎng)絡(luò)搜索數(shù)據(jù)的預(yù)測(cè)效力。

        2文獻(xiàn)綜述

        21有關(guān)汽車銷量預(yù)測(cè)的相關(guān)研究

        關(guān)于國(guó)內(nèi)汽車銷量的預(yù)測(cè),從以往的相關(guān)研究來看,學(xué)者從定性和定量?jī)蓚€(gè)方面進(jìn)行了相關(guān)研究。在定性方面,如:門峰等針對(duì)我國(guó)汽車產(chǎn)業(yè)的發(fā)展方向進(jìn)行研究,認(rèn)為我國(guó)汽車產(chǎn)業(yè)已經(jīng)成為國(guó)民經(jīng)濟(jì)的重要支柱產(chǎn)業(yè),并預(yù)測(cè)未來5~10年是我國(guó)由汽車工業(yè)大國(guó)向汽車工業(yè)強(qiáng)國(guó)轉(zhuǎn)變的重要時(shí)期[9];王莉分析了國(guó)際金融危機(jī)給中國(guó)汽車行業(yè)帶來的總體影響[10]。定量方面的研究則可以分為兩個(gè)層面:一是單方法預(yù)測(cè)法(包括多元回歸分析法、時(shí)間序列預(yù)測(cè)法、神經(jīng)網(wǎng)絡(luò)分析法),如:陳歡通過定性灰色預(yù)測(cè)模型的方法對(duì)汽車銷量進(jìn)行了預(yù)測(cè)[11],該方法能夠反映復(fù)雜數(shù)據(jù)的非線性和汽車銷量數(shù)據(jù)自身的規(guī)律性,但對(duì)歷史數(shù)據(jù)過于依賴,歷史數(shù)據(jù)越多,預(yù)測(cè)結(jié)果越可靠;郭順生等基于時(shí)間序列ARMA模型對(duì)中國(guó)汽車的月銷量數(shù)據(jù)進(jìn)行預(yù)測(cè)[12];汪玉秀等綜合汽車顏色、排量及版本類型3個(gè)因素,建立了馬爾科夫過程的4S店汽車銷量預(yù)測(cè)模型(預(yù)測(cè)絕對(duì)誤差均小于5%)[13]。二是組合預(yù)測(cè)方法,如:李響等基于ARMA模型與RBF神經(jīng)網(wǎng)絡(luò)相結(jié)合的混合模型預(yù)測(cè)了天津市日汽車銷量,認(rèn)為組合模型相對(duì)于單一的預(yù)測(cè)模型有較高的預(yù)測(cè)精度[14];蔡賓等采用改進(jìn)差分進(jìn)化算法和灰色模型對(duì)幾個(gè)主要汽車品牌的銷量進(jìn)行了預(yù)測(cè),并對(duì)汽車銷量的發(fā)展趨勢(shì)作出了判斷[15];李莉通過建立灰色模型和馬爾科夫模型相結(jié)合的組合預(yù)測(cè)模型預(yù)測(cè)了我國(guó)小排量汽車的銷量,該模型整合了GM(1,1)模型處理光滑序列的有效性和灰色馬爾科夫鏈處理隨機(jī)序列的有效性,反映出了數(shù)據(jù)序列的發(fā)展趨勢(shì)[16]。

        無論是傳統(tǒng)的定性預(yù)測(cè)方法,還是定量預(yù)測(cè)都只能依賴于歷史數(shù)據(jù),但歷史數(shù)據(jù)具有很強(qiáng)的延遲性,而且其預(yù)測(cè)的粒度較大,一般為汽車銷量的年度數(shù)據(jù)。另外,與傳統(tǒng)的預(yù)測(cè)方法相比,人工智能建模方法雖然預(yù)測(cè)精度較高,但也存在算法復(fù)雜性高,應(yīng)用廣泛性和對(duì)原始數(shù)據(jù)的變化趨勢(shì)依賴性較強(qiáng)等缺陷和不足。

        22基于網(wǎng)絡(luò)搜索數(shù)據(jù)的經(jīng)濟(jì)類、社會(huì)類行為相關(guān)性研究目前基于網(wǎng)絡(luò)搜索數(shù)據(jù)的經(jīng)濟(jì)社會(huì)類行為預(yù)測(cè)已成為各領(lǐng)域?qū)W者們研究的一個(gè)新的熱點(diǎn),并在國(guó)內(nèi)外都取得了一定的研究成果。在宏觀經(jīng)濟(jì)領(lǐng)域,Vosen等利用網(wǎng)絡(luò)搜索趨勢(shì)也對(duì)家庭支出做出了預(yù)測(cè)[17];Choi等研究如何利用網(wǎng)絡(luò)搜索數(shù)據(jù)預(yù)測(cè)短期經(jīng)濟(jì)價(jià)值,文中的例子包括房地產(chǎn)、失業(yè)索賠、旅游目的地規(guī)劃和消費(fèi)者信心[18]。在社會(huì)領(lǐng)域,Ripberger等使用網(wǎng)絡(luò)Query搜索數(shù)據(jù)對(duì)公眾的注意力進(jìn)行衡量,取得了良好效果[19]。國(guó)內(nèi)學(xué)者張崇等揭示了網(wǎng)絡(luò)搜索數(shù)據(jù)與居民消費(fèi)價(jià)格指數(shù)(CPI)之間存在一定的相關(guān)關(guān)系和先行滯后關(guān)系,并取得了良好的預(yù)測(cè)效果[20]。董倩等發(fā)現(xiàn)網(wǎng)絡(luò)搜索數(shù)據(jù)不但能夠較好地預(yù)測(cè)房?jī)r(jià)指數(shù),而且能夠分析經(jīng)濟(jì)主體行為的趨勢(shì)與規(guī)律,有一定的時(shí)效性[21]。孫毅等對(duì)相關(guān)研究進(jìn)行了綜述,提出基于網(wǎng)絡(luò)搜索數(shù)據(jù)的相關(guān)性研究是典型的交叉研究,而對(duì)于網(wǎng)絡(luò)搜索數(shù)據(jù)與經(jīng)濟(jì)行為之間的相關(guān)性的機(jī)理分析、關(guān)鍵詞的選擇和數(shù)據(jù)處理模型選擇是需要解決的關(guān)鍵問題[22]。

        網(wǎng)絡(luò)搜索數(shù)據(jù)也開始用來預(yù)測(cè)汽車銷量。Du等發(fā)現(xiàn)從谷歌搜索數(shù)據(jù)中對(duì)38個(gè)主要汽車品牌提取出來的7大趨勢(shì)可以從品牌層面解釋美國(guó)市場(chǎng)74%的汽車銷量[23]。國(guó)內(nèi)學(xué)者王煉等以百度搜索指數(shù)為數(shù)據(jù)基礎(chǔ),探討網(wǎng)絡(luò)搜索在我國(guó)汽車市場(chǎng)的預(yù)測(cè)作用,結(jié)果顯示網(wǎng)絡(luò)搜索數(shù)據(jù)對(duì)汽車銷量具有顯著的正向影響,研究還發(fā)現(xiàn),在其他傳統(tǒng)指標(biāo)的數(shù)據(jù)無法獲得時(shí),網(wǎng)絡(luò)搜索數(shù)據(jù)依然能夠發(fā)揮重要預(yù)測(cè)作用[24]。但王煉等是對(duì)短面板數(shù)據(jù)進(jìn)行建模回歸,數(shù)據(jù)量較少,不利于刻畫百度搜索指數(shù)與社會(huì)經(jīng)濟(jì)活動(dòng)的動(dòng)態(tài)變化,也不能確定變量之間是否存在著長(zhǎng)期的均衡關(guān)系。

        綜上所述,雖然網(wǎng)絡(luò)搜索數(shù)據(jù)可以作為傳統(tǒng)數(shù)據(jù)的良好補(bǔ)充來實(shí)現(xiàn)對(duì)市場(chǎng)需求的預(yù)測(cè),但仍有以下方面可以改進(jìn):(1)該領(lǐng)域的很多研究都是以谷歌趨勢(shì)為數(shù)據(jù)源。雖然谷歌是全球最大的搜索引擎,但依然存在很多像中國(guó)這樣的國(guó)家偏向于使用本地的搜索引擎,因而應(yīng)用百度搜索指數(shù)研究我國(guó)市場(chǎng)需求更符合實(shí)際情況。(2)在確定獲取百度搜索指數(shù)的關(guān)鍵詞上,并沒有一個(gè)系統(tǒng)化、統(tǒng)一的的方法。之前的研究普遍都是手動(dòng)指定關(guān)鍵詞,或者是利用百度自動(dòng)生成的詞。在本文中,我們基于文本挖掘技術(shù),提出了一個(gè)結(jié)構(gòu)化的流程來確定檢索關(guān)鍵詞,可以真實(shí)地反映出用戶網(wǎng)絡(luò)搜索的習(xí)慣。(3)以往的研究大都采用時(shí)間序列數(shù)據(jù),或是短面板數(shù)據(jù),不利于檢驗(yàn)更復(fù)雜的行為模型。本文收集了國(guó)內(nèi)市場(chǎng)最近9年的汽車月度銷量數(shù)據(jù),采用長(zhǎng)面板數(shù)據(jù)建模,可以準(zhǔn)確地反映和刻畫在時(shí)間長(zhǎng)期推移的過程中網(wǎng)絡(luò)搜索數(shù)據(jù)對(duì)銷售影響的動(dòng)態(tài)變化。

        3實(shí)證分析

        31數(shù)據(jù)來源

        311汽車銷量

        本文的汽車銷量數(shù)據(jù)來源于搜狐網(wǎng)站汽車頻道(http∥db.auto.sohu.com/cxdata/),該數(shù)據(jù)為月度更新數(shù)據(jù)。為了研究網(wǎng)絡(luò)搜索數(shù)據(jù)與汽車銷量之間的長(zhǎng)期相關(guān)關(guān)系,我們選取的時(shí)間段為2007年1月至2015年12月,共108個(gè)月。考慮到車型數(shù)據(jù)在此期間的持續(xù)可獲得性,我們將連續(xù)12個(gè)月無銷量的車型排除。最終,我們收集了55款車型在此期間的國(guó)內(nèi)市場(chǎng)月度銷量數(shù)據(jù)。

        312網(wǎng)絡(luò)搜索

        本文使用的網(wǎng)絡(luò)搜索數(shù)據(jù)源于百度搜索指數(shù)。百度(baidu.com)是全球最大的中文搜索引擎,截至2015年第三季度,百度在國(guó)內(nèi)的市場(chǎng)份額達(dá)到823%,遠(yuǎn)超過其后的“谷歌中國(guó)”(79%)、搜狗(48%)、360搜索(38%)[25]。百度搜索指數(shù)是以百度網(wǎng)頁(yè)搜索為基礎(chǔ)的免費(fèi)海量數(shù)據(jù)分析服務(wù),可以反映不同關(guān)鍵詞在過去一段時(shí)間里的“用戶關(guān)注度”。用戶關(guān)注度以數(shù)千萬網(wǎng)民在百度的搜索量為數(shù)據(jù)基礎(chǔ),以關(guān)鍵詞為統(tǒng)計(jì)對(duì)象,代表了各個(gè)關(guān)鍵詞在百度網(wǎng)頁(yè)搜索中的搜索頻次,每天更新1次。圖1是網(wǎng)絡(luò)搜索數(shù)據(jù)的1個(gè)示例。顯示的是兩款車型“普力馬”和“福美來”在2015年用戶關(guān)注度的變化趨勢(shì)??梢钥吹?,在2015年的大部分時(shí)間里,“福美來”受關(guān)注程度要高于“普力馬”,在2月初,“普力馬”的用戶關(guān)注度大幅上升而超過“福美來”,而在6月份以后,“普力馬”的受關(guān)注程度又始終低于“福美來”。

        32遴選關(guān)鍵詞

        在研究汽車銷量與百度搜索指數(shù)之間關(guān)系的過程中,選取恰當(dāng)?shù)木W(wǎng)絡(luò)搜索關(guān)鍵詞是非常重要的,直接影響研究結(jié)果的可靠性。一方面,由于汽車是屬性復(fù)雜并且要求較大資金投入的產(chǎn)品,消費(fèi)者在購(gòu)買汽車時(shí)會(huì)對(duì)汽車的各種屬性進(jìn)行仔細(xì)考察和評(píng)估。另一方面,根據(jù)CNNIC調(diào)查社區(qū)開展的搜索營(yíng)銷調(diào)查結(jié)果,有77%的互聯(lián)網(wǎng)用戶在購(gòu)買產(chǎn)品前會(huì)上網(wǎng)搜索信息[1]。考慮到這一點(diǎn),我們選取了用戶活躍度最高的汽車論壇——汽車之家論壇來提取關(guān)鍵詞。為了準(zhǔn)確地反映消費(fèi)者考慮購(gòu)買汽車并上網(wǎng)搜索信息時(shí)所采用的搜索詞,我們采取以下詳細(xì)步驟來確定搜索關(guān)鍵詞。

        321確定基本詞條

        我們根據(jù)搜狐網(wǎng)站汽車頻道(http:∥db.auto.sohu.com/cxdata/)所提供的車型名以及“品牌名+車型名”的組合(如:A4L以及奧迪A4L)來作為最初的基本詞條。

        322獲取基本詞條的近義詞

        在汽車之家論壇(http:∥club.autohome.com.cn/)該車型的論壇主題下,通過自主開發(fā)的軟件程序,采用抓取網(wǎng)頁(yè)的方式收集了論壇帖子的內(nèi)容。為了更準(zhǔn)確地確定關(guān)鍵詞,我們用文本挖掘技術(shù)找出基本詞條的同義詞。具體過程為:先對(duì)抓取后的文本語(yǔ)料進(jìn)行Jieba分詞;利用深度學(xué)習(xí)的Word2vec模型對(duì)分好詞的語(yǔ)料做訓(xùn)練,把詞轉(zhuǎn)化為向量空間模型的形式;然后結(jié)合TF-IDF算法和余弦相似度算法找出與基本詞條相似的詞條(對(duì)于延伸詞條我們不予考慮,如A4L油耗),即近義詞。對(duì)找出來的近義詞繼續(xù)做訓(xùn)練,重復(fù)多次,總共得到了452個(gè)詞條。經(jīng)過結(jié)構(gòu)化查詢語(yǔ)言(SQL)去重后得到了318個(gè)詞條。

        323選取論壇高頻詞條

        對(duì)每一詞條我們都在論壇的文本中統(tǒng)計(jì)出詞頻,并選取詞頻較多的詞作為百度搜索指數(shù)中檢索的目標(biāo)關(guān)鍵詞。對(duì)于仍有歧義的詞條,我們會(huì)加上品牌名來作為目標(biāo)檢索關(guān)鍵詞,如“金剛”,目標(biāo)詞則為“吉利金剛”。類似的例子還包括“雨燕”、“北斗星”、“高爾夫”等。

        324確定最終搜索詞條

        對(duì)目標(biāo)詞在百度搜索指數(shù)中進(jìn)行檢索,我們選取在百度指數(shù)中排名最高的詞作為關(guān)鍵詞。對(duì)于仍不能確定排名的詞,我們?cè)龠x取其與銷量之間在不同滯后期0~6期皮爾遜相關(guān)系數(shù)最高的詞作為搜索關(guān)鍵詞。最終得到了55款車型可各自用于百度指數(shù)檢索的惟一關(guān)鍵詞。

        對(duì)每一個(gè)關(guān)鍵詞指數(shù)我們都計(jì)算了其與銷量在0~12滯后期的皮爾遜相關(guān)系數(shù),表1是關(guān)鍵詞的百度搜索指數(shù)與銷量之間基于最大皮爾遜相關(guān)系數(shù)的滯后階數(shù)??梢钥闯鰷笃谄毡榧性?~2期,且其中大多數(shù)滯后期都為0期。對(duì)該現(xiàn)象可能的解釋是:盡管現(xiàn)實(shí)當(dāng)中消費(fèi)者在最終購(gòu)買前可能會(huì)產(chǎn)生幾個(gè)月的信息搜索和評(píng)價(jià)過程,但是他們搜索的數(shù)量和強(qiáng)度都比較小,直到在購(gòu)買的前1個(gè)月其搜索數(shù)量會(huì)達(dá)到1個(gè)臨界點(diǎn)。

        4百度搜索指數(shù)與汽車銷量的關(guān)系

        41單位根檢驗(yàn)

        本文選擇實(shí)際汽車銷量(S)為因變量,以百度搜索指數(shù)(B)為自變量。為了減少異方差對(duì)檢驗(yàn)結(jié)果帶來的影響,本文數(shù)據(jù)全部對(duì)數(shù)處理(lnS,lnB),這樣處理也是考慮到了銷量和搜索指數(shù)的偏斜分布。進(jìn)行對(duì)數(shù)處理還有一個(gè)好處是,在解釋估計(jì)結(jié)果時(shí)能夠以百分比變化而非絕對(duì)值的變化解釋搜索的預(yù)測(cè)作用。

        由于本文的樣本數(shù)據(jù)均為面板數(shù)據(jù),和時(shí)間序列數(shù)據(jù)一樣,為了保證變量的平穩(wěn)性和避免偽回歸現(xiàn)象,在建立計(jì)量經(jīng)濟(jì)學(xué)模型之前要對(duì)變量進(jìn)行單位根檢驗(yàn)和協(xié)整檢驗(yàn)。常用的面板數(shù)據(jù)單位根檢驗(yàn)方法有LLC檢驗(yàn)、PP檢驗(yàn)、IPS檢驗(yàn)和ADF檢驗(yàn)等,本文采用這4種方法同時(shí)進(jìn)行檢驗(yàn),檢驗(yàn)結(jié)果如表2所示,由于檢驗(yàn)原理不同,不同檢驗(yàn)方法的結(jié)果不盡相同,本文以4種方法結(jié)果一致為準(zhǔn),得到汽車銷量和網(wǎng)絡(luò)搜索指數(shù)在所有情況下都為水平平穩(wěn)。由于協(xié)整檢驗(yàn)的目的是看一組非平穩(wěn)序列的線性組合是否具有協(xié)整關(guān)系[26],所以本文不再對(duì)汽車銷量和網(wǎng)絡(luò)搜索數(shù)據(jù)做協(xié)整檢驗(yàn),而直接進(jìn)入Granger因果檢驗(yàn)。

        42格蘭杰因果檢驗(yàn)

        從實(shí)際生活來看,消費(fèi)者會(huì)在購(gòu)買汽車前上網(wǎng)搜索信息,那么網(wǎng)絡(luò)搜索發(fā)生在購(gòu)買汽車之前,也即百度搜索指數(shù)是汽車銷量的原因,為了驗(yàn)證實(shí)際數(shù)據(jù)能否支撐該結(jié)論,必須進(jìn)行格蘭杰因果檢驗(yàn),檢驗(yàn)的前提條件是數(shù)據(jù)平穩(wěn)。從網(wǎng)絡(luò)搜索到汽車購(gòu)買,實(shí)際產(chǎn)出滯后期有0~2個(gè)月,但本研究以網(wǎng)絡(luò)搜索數(shù)據(jù)對(duì)汽車銷量的預(yù)測(cè)為目的,對(duì)同期影響不作考慮。因此本文在進(jìn)行格蘭杰因果檢驗(yàn)時(shí)將滯后期設(shè)定為1~2期,結(jié)果如表3所示。

        從格蘭杰因果檢驗(yàn)的結(jié)果看,在滯后1期和2期的情況下網(wǎng)絡(luò)搜索指數(shù)與汽車銷量存在著雙向互動(dòng)的因果關(guān)系。但格蘭杰因果檢驗(yàn)度量對(duì)汽車銷量進(jìn)行預(yù)測(cè)時(shí),網(wǎng)絡(luò)搜索數(shù)據(jù)的前期信息對(duì)均方誤差MSE減少的貢獻(xiàn)要大于另外一種情況。因此網(wǎng)絡(luò)搜索數(shù)據(jù)對(duì)汽車銷量具有預(yù)測(cè)作用。

        51模型設(shè)定

        采用面板數(shù)據(jù)分析網(wǎng)絡(luò)搜索與銷量關(guān)系時(shí),首先需要用F檢驗(yàn)來分析是采用混合回歸還是面板數(shù)據(jù),結(jié)果發(fā)現(xiàn)本文應(yīng)該采用面板數(shù)據(jù)。在研究它們的關(guān)系時(shí)很有可能會(huì)產(chǎn)生遺漏相關(guān)變量的問題。在回歸模型中,遺漏重要的相關(guān)變量是導(dǎo)致內(nèi)生性的主要原因。因?yàn)橐坏┻@個(gè)被遺漏的變量同時(shí)與因變量和目標(biāo)自變量相關(guān),那么目標(biāo)自變量與隨機(jī)擾動(dòng)項(xiàng)的無關(guān)性假定就不再成立,這時(shí)如果用最小二乘估計(jì),目標(biāo)自變量的估計(jì)就是有偏的。出于此考慮,本文首先采用固定效應(yīng)模型對(duì)面板數(shù)據(jù)做估計(jì),由此來控制由于遺漏變量而產(chǎn)生的內(nèi)生性影響,用固定效應(yīng)模型控制截面變異也是面板數(shù)據(jù)模型對(duì)于截面數(shù)據(jù)模型的一大優(yōu)勢(shì)所在,而且Hausman檢驗(yàn)的結(jié)果也拒絕了采用隨機(jī)效應(yīng)模型來建模。考慮到銷量與網(wǎng)絡(luò)搜索之間存在滯后期,在該模型當(dāng)中,使用前一期搜索指數(shù)和前兩期搜索指數(shù)作為自變量,以檢驗(yàn)前1個(gè)月網(wǎng)絡(luò)搜索和前兩期搜索是否都能夠預(yù)測(cè)銷量。對(duì)車型i在時(shí)間t的銷量有如下模型:

        圖2為??怂谷龓麑?shí)際銷量數(shù)據(jù)和預(yù)測(cè)銷量數(shù)據(jù)的對(duì)比圖,其中l(wèi)nS為實(shí)際銷量數(shù)據(jù)的對(duì)數(shù)值,lnF1、lnF2分別為提前1個(gè)月和2個(gè)月的預(yù)測(cè)。從對(duì)比圖可以看出,百度搜索指數(shù)與汽車銷量結(jié)合程度較好,模型預(yù)測(cè)效果很好。該結(jié)果再次體現(xiàn)了網(wǎng)絡(luò)搜索數(shù)據(jù)的預(yù)測(cè)效力。圖2??怂谷龓麑?shí)際銷量數(shù)據(jù)與預(yù)測(cè)數(shù)據(jù)對(duì)比圖

        按照Hyndman[28]提出的方法,本文選擇平均絕對(duì)誤差(MAE)作為評(píng)價(jià)預(yù)測(cè)效力的指標(biāo)。平均絕對(duì)誤差的單位與因變量的單位一致,易于解釋。此外,本文還計(jì)算了預(yù)測(cè)值的均方根誤差(RMSE),因?yàn)檫@一指標(biāo)比平均絕對(duì)誤差對(duì)異常值更加敏感,同時(shí)使用能夠更加全面地評(píng)價(jià)模型的預(yù)測(cè)效力??紤]到要反映誤差大小的相對(duì)值,本文又計(jì)算了不受量綱影響的平均相對(duì)誤差MPE。

        預(yù)測(cè)結(jié)果顯示在表5當(dāng)中,模型預(yù)測(cè)效果很好,加入百度搜索指數(shù)之后模型的擬合優(yōu)度和預(yù)測(cè)精度都有了提高,這和格蘭杰因果檢驗(yàn)百度搜索指數(shù)是汽車銷量的原因一致。對(duì)比網(wǎng)絡(luò)搜索提前1個(gè)月和提前2個(gè)月的預(yù)測(cè)誤差,可看出總體差別不大,提前1個(gè)月的百度搜索指數(shù)預(yù)測(cè)效果要略優(yōu)于提前2個(gè)月的預(yù)測(cè)。表5各預(yù)測(cè)期樣本外預(yù)測(cè)誤差結(jié)果

        誤差指標(biāo)MAERMSE〖〗MPE提前1個(gè)月098315790342提前2個(gè)月0986158003426結(jié)語(yǔ)

        本文用文本挖掘技術(shù),對(duì)汽車之家論壇帖子提取關(guān)鍵詞,以關(guān)鍵詞的百度搜索指數(shù)為數(shù)據(jù)基礎(chǔ),研究了網(wǎng)絡(luò)搜索數(shù)據(jù)與我國(guó)汽車銷量之間的關(guān)系,發(fā)現(xiàn):①網(wǎng)絡(luò)搜索數(shù)據(jù)與汽車銷量之間存在著長(zhǎng)期均衡關(guān)系,且網(wǎng)絡(luò)搜索數(shù)據(jù)可以解釋汽車銷量76%的方差;②可以用提前1個(gè)月或2個(gè)月的網(wǎng)絡(luò)搜索數(shù)據(jù),對(duì)我國(guó)汽車銷量做預(yù)測(cè)。

        本文的理論意義在于:①基于文本挖掘技術(shù),提出了結(jié)構(gòu)化的流程確定搜索數(shù)據(jù)關(guān)鍵詞,為網(wǎng)絡(luò)搜索數(shù)據(jù)在其他領(lǐng)域的研究提供了參考;②對(duì)近9年的長(zhǎng)面板數(shù)據(jù)建立模型,檢驗(yàn)了網(wǎng)絡(luò)搜索數(shù)據(jù)對(duì)汽車銷量的預(yù)測(cè)作用。本文的實(shí)踐意義在于:在不依賴歷史銷量數(shù)據(jù)的情況下,可以預(yù)測(cè)中國(guó)市場(chǎng)的汽車銷量變動(dòng)情況,有利于汽車企業(yè)制定相關(guān)營(yíng)銷策略和調(diào)整生產(chǎn)計(jì)劃,同時(shí)也為政府部門制定相關(guān)政策提供了參考。

        本文的研究局限體現(xiàn)在:采用固定效應(yīng)模型來探索網(wǎng)絡(luò)搜索數(shù)據(jù)對(duì)我國(guó)汽車銷量的影響,在預(yù)測(cè)效果上還可以使用其他模型來完善。另一方面,本文是基于汽車之家論壇來確定網(wǎng)絡(luò)檢索的關(guān)鍵詞,但在以后的研究上可以考慮綜合如微信、微博、博客等其他社交媒體來全方位捕捉消費(fèi)者的在線行為足跡。

        參考文獻(xiàn)

        [1]中國(guó)互聯(lián)網(wǎng)絡(luò)信息中心.2012年中國(guó)網(wǎng)民消費(fèi)行為調(diào)查報(bào)告[R].中國(guó)互聯(lián)網(wǎng)絡(luò)信息中心,2013.http:∥www.cnnic.cn/hlwfzyj/hlwxzbg/dzswbg/201301/t2013011638522.htm,4-4.

        [2]Klein L R.Evaluating the Potential of Interactive Media through a New Lens:Search versus Experience Goods[J].Journal of Business Research,1998,41(3):195-203.

        [3]Wu L,Brynjolfsson E.The Future of Prediction:How Google Searches Foreshadow Housing Prices and Sales[J].Social Science Electronic Publishing,2014.

        猜你喜歡
        預(yù)測(cè)
        無可預(yù)測(cè)
        黃河之聲(2022年10期)2022-09-27 13:59:46
        基于PCC-CNN-GRU的短期風(fēng)電功率預(yù)測(cè)
        選修2—2期中考試預(yù)測(cè)卷(A卷)答案與提示
        選修2-2期中考試預(yù)測(cè)卷(A卷)
        選修2-2期中考試預(yù)測(cè)卷(B卷)
        選修2—2期中考試預(yù)測(cè)卷(B卷)
        選修2—2期中考試預(yù)測(cè)卷(A卷)
        選修2—2期中考試預(yù)測(cè)卷(B卷)答案與提示
        “預(yù)測(cè)”得準(zhǔn)
        不可預(yù)測(cè)
        久久99热精品免费观看欧美| 亚洲av日韩精品久久久久久a| 精品久久久bbbb人妻| 亚洲狠狠婷婷综合久久久久图片| 激情综合欧美| 久久久久国产精品四虎| 丝袜美腿诱惑区在线播放| 国产大屁股喷水视频在线观看| 老妇女性较大毛片| 日本a在线看| 亚洲一区二区三区成人在线| 亚洲精品久久视频网站| 久久天天躁狠狠躁夜夜不卡| 久久日本三级韩国三级| 日韩欧美国产亚洲中文| 日日麻批视频免费播放器| 开心五月天第四色婷婷| 狠狠色综合7777久夜色撩人| 久久精品国产9久久综合| 国产亚洲日韩AV在线播放不卡| 日韩精品免费av一区二区三区 | 精品18在线观看免费视频| 亚洲三区av在线播放| 亚洲人成网77777色在线播放| 国产成人精品123区免费视频| 国产一国产一级新婚之夜| 亚洲中文字幕第二十三页| 亚洲乱码中文字幕综合久久| 国产精品天堂avav在线| 午夜福利视频合集1000| 国语憿情少妇无码av| 国产99久久久国产精品免费 | 蜜桃视频在线观看免费亚洲| 国产精品毛片久久久久久久| 亚洲视频高清| 中文字幕高清视频婷婷| 色偷偷亚洲第一成人综合网址| 日本免费不卡一区| 久久狠狠髙潮曰十八女人| 精品卡一卡二卡3卡高清乱码 | 精品无码国产自产拍在线观看|