摘要:本文采用Engle-Granger檢驗(yàn)來(lái)探索南充市房?jī)r(jià)與以搜索指數(shù)為代表的大數(shù)據(jù)之間的關(guān)系。選取了2014年1月至2018年11月的房?jī)r(jià)數(shù)據(jù),并利用相關(guān)系數(shù)大于0.5的百度指數(shù)構(gòu)建搜索指數(shù),從而對(duì)其進(jìn)行實(shí)證檢驗(yàn)。結(jié)果發(fā)現(xiàn),南充市房?jī)r(jià)同搜索指數(shù)之間存在著協(xié)整關(guān)系,且其相關(guān)系數(shù)較大,說(shuō)明大數(shù)據(jù)對(duì)于中小城市房?jī)r(jià)具有較強(qiáng)的預(yù)測(cè)。此外,還比較了不同的搜索指數(shù)構(gòu)造方法,發(fā)現(xiàn)以相關(guān)系數(shù)為權(quán)重所構(gòu)造的搜索指數(shù)表現(xiàn)更佳。
關(guān)鍵詞:大數(shù)據(jù);房?jī)r(jià);Engle-Granger檢驗(yàn)
一、引言
眾所周知,房?jī)r(jià)是政府宏觀經(jīng)濟(jì)調(diào)控的重要手段,房?jī)r(jià)的穩(wěn)定在一定程度上影響到經(jīng)濟(jì)的穩(wěn)增長(zhǎng)。因此,國(guó)內(nèi)關(guān)于房?jī)r(jià)的研究文獻(xiàn)較多,(劉莉亞和蘇毅,2005)采用協(xié)整方法測(cè)算了上海房?jī)r(jià)的合理水平,并據(jù)此分析了上海房?jī)r(jià)失調(diào)的程度及原因;(張亞麗,2011)利用房地產(chǎn)價(jià)格決定模型得出當(dāng)期實(shí)際人均可支配收入、預(yù)期收入和預(yù)期房地產(chǎn)收益率是房?jī)r(jià)持續(xù)上漲的主要因素的結(jié)論;(王文雯等,2014)以省級(jí)面板數(shù)據(jù)研究了人口結(jié)構(gòu)、收入分配和經(jīng)濟(jì)政策等變量對(duì)房?jī)r(jià)的影響。綜上,關(guān)于房?jī)r(jià)的研究文獻(xiàn)大多集中在大中城市,而對(duì)于三四線城市的關(guān)注較少。然而就在去年,南充作為一座四線小城市突然受到央視財(cái)經(jīng)頻道《經(jīng)濟(jì)半小時(shí)》欄目報(bào)道,原因就在于南充的房?jī)r(jià)不到半年時(shí)間從5634元飆升至7285元,漲幅高達(dá)29.3%,居于全國(guó)的前列。那么,如何來(lái)分析和預(yù)測(cè)小城市房?jī)r(jià)的變化呢?
2009年,Nature雜志上刊登了一篇利用谷歌搜索日志來(lái)即時(shí)預(yù)測(cè)流感趨勢(shì)的文章,迅速引起了社會(huì)對(duì)于大數(shù)據(jù)的關(guān)注。近年來(lái),人們不斷挖掘大數(shù)據(jù)背后蘊(yùn)含的巨大潛力,將其運(yùn)用于醫(yī)療、交通、商業(yè)推廣等各個(gè)領(lǐng)域,甚至形象地將其稱為“數(shù)字黃金”。而在學(xué)術(shù)界,大數(shù)據(jù)對(duì)于經(jīng)濟(jì)的預(yù)測(cè)能力也逐漸被放在突出位置。(張誼浩等,2014)發(fā)現(xiàn)網(wǎng)絡(luò)搜索能夠用于預(yù)測(cè)股票市場(chǎng),從而構(gòu)造投資組合獲得超額收益;(劉濤雄和徐曉飛,2015)通過(guò)比較政府統(tǒng)計(jì)的結(jié)構(gòu)化數(shù)據(jù)和網(wǎng)絡(luò)搜索的非結(jié)構(gòu)化數(shù)據(jù),討論了能否利用互聯(lián)網(wǎng)搜索預(yù)測(cè)宏觀經(jīng)濟(jì)的問(wèn)題;(王娜,2016)利用百度搜索指數(shù)和媒體指數(shù)證明大數(shù)據(jù)可以提高碳排放權(quán)預(yù)測(cè)的準(zhǔn)確性。
由于大數(shù)據(jù)在經(jīng)濟(jì)領(lǐng)域具有較好的預(yù)測(cè)能力,本文嘗試探索大數(shù)據(jù)和房地產(chǎn)的關(guān)系,希望能夠?yàn)橹行〕鞘薪?jīng)濟(jì)預(yù)測(cè)提供一種思路。
二、搜索指數(shù)對(duì)房?jī)r(jià)影響的理論分析
從經(jīng)濟(jì)學(xué)的角度而言,房屋也是一種商品,那么它的價(jià)格必然由其供需所決定。從供給來(lái)看,房屋的供給在很大程度上取決于土地的供給,而土地作為一種特殊的商品,是缺乏彈性的。因此,短期來(lái)看,房?jī)r(jià)主要受到房屋需求量的影響。而就房屋需求而言,消費(fèi)者的需求主要包括投資需求和投機(jī)需求。其中,投資需求反映了消費(fèi)者的剛需,受到經(jīng)濟(jì)基本面等因素的影響。而投機(jī)需求則取決于房屋的預(yù)期收益,如果預(yù)期房?jī)r(jià)收益率大于社會(huì)資本的一般收益率,則投機(jī)需求增加;反之,則投機(jī)需求下降。
網(wǎng)絡(luò)搜索是一種信息挖掘的手段,在獲取信息的同時(shí)也記錄下投資者的動(dòng)態(tài)。投資者往往不會(huì)搜索與其無(wú)關(guān)或不感興趣的信息,對(duì)于特定關(guān)鍵詞的檢索實(shí)際上反映了投資者的關(guān)注和預(yù)期。例如,投資者搜索房貸利率,常常預(yù)示著該投資者在關(guān)注房地產(chǎn)市場(chǎng),或者表明其有較強(qiáng)的房屋購(gòu)買(mǎi)意愿。正是基于此,本文認(rèn)為充分挖掘網(wǎng)絡(luò)搜索的信息,可以了解投資者的需求,從而預(yù)測(cè)未來(lái)房?jī)r(jià)的變化。但是,關(guān)于二者的影響機(jī)制,目前學(xué)術(shù)界還沒(méi)有公認(rèn)的觀點(diǎn),結(jié)合資產(chǎn)價(jià)格決定理論和行為經(jīng)濟(jì)學(xué)理論,本文提出如下的理論分析。
如圖1所示,網(wǎng)絡(luò)搜索實(shí)際上是投資者情緒和投資者關(guān)注的一種反應(yīng)。當(dāng)投資者情緒高漲時(shí),對(duì)于資產(chǎn)的關(guān)注程度必然上漲,從而表現(xiàn)出較高的網(wǎng)絡(luò)搜索量;而當(dāng)投資者情緒降低時(shí),說(shuō)明投資者對(duì)資產(chǎn)的興趣減弱,而投資者關(guān)注會(huì)伴隨降低,從而表現(xiàn)出較少的網(wǎng)絡(luò)搜索量。根據(jù)行為經(jīng)濟(jì)學(xué)的相關(guān)理論,投資者情緒和投資者關(guān)注是影響投資者偏好和決策的主要因素,而偏好和決策在一定程度上會(huì)引起需求的變化,從而造成價(jià)格的波動(dòng)。具體而言,房地產(chǎn)市場(chǎng)上有投資者和投機(jī)者兩大購(gòu)買(mǎi)方。當(dāng)投資者情緒高漲、關(guān)注上升時(shí),購(gòu)買(mǎi)者常常做出預(yù)期未來(lái)房地產(chǎn)市場(chǎng)會(huì)有超額收益率的判斷,從而影響投資者偏好和決策。此時(shí),投資者方表現(xiàn)為購(gòu)買(mǎi)意愿會(huì)更加強(qiáng)烈,等待交易的時(shí)機(jī)會(huì)縮短,愿意付出的成本對(duì)價(jià)會(huì)更多,從而引起投資需求增加;而投機(jī)者表現(xiàn)為進(jìn)入房屋市場(chǎng)的可能性增強(qiáng),交易數(shù)量增多,交易方向多數(shù)為買(mǎi)人,從而引起投機(jī)需求的增加。因此,房屋市場(chǎng)的總體需求上漲。反之,當(dāng)投資者情緒低迷、關(guān)注下降時(shí),常常意味著預(yù)期未來(lái)房地產(chǎn)市場(chǎng)收益率下降的可能性增強(qiáng),從而影響投資者偏好和決策。此時(shí),投資者的購(gòu)買(mǎi)意愿降低,等待交易的時(shí)機(jī)會(huì)延長(zhǎng),愿意付出的成本對(duì)價(jià)會(huì)減少,從而導(dǎo)致投資需求的降低;而投機(jī)者進(jìn)入市場(chǎng)的可能性下降,交易數(shù)量減少,交易方向多為賣(mài)出,從而導(dǎo)致投資投機(jī)需求的減少。因此,房屋的總體需求下降。根據(jù)供求關(guān)系理論,短期房地產(chǎn)市場(chǎng)的供給不易變化,房屋需求的增加會(huì)導(dǎo)致房?jī)r(jià)的上漲,而需求的降低會(huì)引起房?jī)r(jià)的下跌。綜上所述,利用網(wǎng)絡(luò)搜索能夠預(yù)期未來(lái)房屋需求的變動(dòng),從而預(yù)測(cè)未來(lái)房?jī)r(jià)的變化。
三、實(shí)證檢驗(yàn)
(一)數(shù)據(jù)的來(lái)源和變量的選取
1.房屋價(jià)格指數(shù)P。本文的原始房?jī)r(jià)數(shù)據(jù)來(lái)源于南充房產(chǎn)信息網(wǎng),收集的是南充市市區(qū)(嘉陵、順慶、高坪)住宅商品房成交價(jià)的月度均值。將此數(shù)據(jù)和wind數(shù)據(jù)庫(kù)中的南充房屋月度基準(zhǔn)數(shù)據(jù)進(jìn)行比較,發(fā)現(xiàn)二者的相關(guān)性高達(dá)0.98,因此認(rèn)為該數(shù)據(jù)準(zhǔn)確、可靠。本文選取了2014年1月至2018年11月,共計(jì)59個(gè)月度數(shù)據(jù),并將2014年1月的房屋價(jià)格設(shè)定為100,將數(shù)據(jù)進(jìn)行同比處理得到房屋價(jià)格指數(shù)。
2.搜索指數(shù)的構(gòu)建。借助國(guó)內(nèi)外已有參考文獻(xiàn)的經(jīng)驗(yàn),本文以百度指數(shù)代表投資者的網(wǎng)絡(luò)搜索數(shù)據(jù)。將搜索區(qū)域限制在南充地區(qū),利用Python軟件爬取了2014年1月至2018年11月期間,與房?jī)r(jià)有關(guān)的14個(gè)關(guān)鍵詞的百度指數(shù)。所選取的關(guān)鍵詞都是與房?jī)r(jià)直接或間接相關(guān)的常用詞匯,包括房?jī)r(jià)、買(mǎi)房、買(mǎi)房注意事項(xiàng)、公積金、公積金查詢、存款利率、家裝、房產(chǎn)稅、房貸、房貸利率、房貸計(jì)算器、搜房網(wǎng)、裝修。為了同房?jī)r(jià)保持一致,先將得到的周度百度指數(shù)轉(zhuǎn)化為月度數(shù)據(jù),再按照以下原則對(duì)數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化處理。
其中,SS代表處理后第i個(gè)關(guān)鍵詞在t時(shí)期的百度指數(shù);X代表第i個(gè)關(guān)鍵詞在t時(shí)期的百度指數(shù);n代表所選期間的月份個(gè)數(shù)。
得到標(biāo)準(zhǔn)化的百度指數(shù)后,計(jì)算各個(gè)關(guān)鍵詞與房?jī)r(jià)之間的相關(guān)系數(shù),選取大于0.5的關(guān)鍵詞用于構(gòu)造搜索指數(shù),分別是房?jī)r(jià)SS(β=0.61)、房產(chǎn)稅SS(β=0.51)和房貸計(jì)算器SS(β=0.75)。
如表1所示,本文采用了兩種方法構(gòu)造搜索指數(shù),第一種是簡(jiǎn)單算術(shù)平均的方法,第二種是以相關(guān)系數(shù)進(jìn)行加權(quán)平均的方法。將得到的搜索指數(shù)同房?jī)r(jià)進(jìn)行相關(guān)分析,發(fā)現(xiàn)前者的相關(guān)系數(shù)為0.74,而后者的相關(guān)系數(shù)為0.76。由于加權(quán)得到的搜索指數(shù)與房?jī)r(jià)之間的相關(guān)性更高,因此本文選擇SS作為搜索指數(shù)。
(二)模型設(shè)定
在上文中已經(jīng)通過(guò)理論分析了網(wǎng)絡(luò)搜索跟房地產(chǎn)價(jià)格之間可能存在的關(guān)系,這里將對(duì)其進(jìn)行實(shí)證驗(yàn)證。由于所選擇的變量都是非平穩(wěn)的,不能直接使用經(jīng)典線性回歸模型,所以本文采用Engle-Granger協(xié)整檢驗(yàn)?zāi)P?。如果模型結(jié)果表明存在著協(xié)整關(guān)系,則說(shuō)明變量間存在長(zhǎng)期均衡關(guān)系,則可以利用其相關(guān)關(guān)系進(jìn)行預(yù)測(cè)。對(duì)房地產(chǎn)價(jià)格(P)和搜索指數(shù)(SS)進(jìn)行協(xié)整檢驗(yàn),具體過(guò)程如下。
P=c+aSS(2)
e=P-P(3)
首先建立變量間的線性回歸方程(見(jiàn)等式2),然后得到被解釋變量真實(shí)值和預(yù)測(cè)值之間的離差數(shù)列e(見(jiàn)等式3)。此時(shí),對(duì)e進(jìn)行單位根檢驗(yàn),若結(jié)果平穩(wěn),則說(shuō)明變量之間存在協(xié)整關(guān)系;反之,則說(shuō)明二者之間不存在協(xié)整關(guān)系。
(三)實(shí)證的結(jié)果與分析
1.ADF檢驗(yàn)
對(duì)變量房?jī)r(jià)P和搜索指數(shù)SS進(jìn)行單位根檢驗(yàn),得到表2中的結(jié)果。原時(shí)間序列在1%的顯著水平下均不能拒絕原假設(shè),說(shuō)明原數(shù)列非平穩(wěn)。而它們的一階差分序列d(P)、d(SS)檢驗(yàn)值均明顯小于1%水平的臨界值(-2.61),說(shuō)明變量P和SS為一階單整序列。
2.協(xié)整檢驗(yàn)
由于房?jī)r(jià)P和搜索指數(shù)SS均為一階單整序列,為了判定其是否存在線性關(guān)系,利用EVIEWS 8軟件對(duì)其進(jìn)行Engle-Granger檢驗(yàn),其結(jié)果如上圖所示。
在表3中,tau統(tǒng)計(jì)量的數(shù)值為-3.45,根據(jù)其求得的概率為4.79%;z統(tǒng)計(jì)量的數(shù)值為-18.91,其對(duì)應(yīng)的概率為4.64%。說(shuō)明兩個(gè)統(tǒng)計(jì)量在5%的顯著水平下均拒絕原假設(shè),也即是P和SS存在協(xié)整關(guān)系。
既然房?jī)r(jià)P和搜索指數(shù)SS存在著協(xié)整關(guān)系,則說(shuō)明二者具有長(zhǎng)期均衡關(guān)系,那么可以利用搜索指數(shù)來(lái)建立房?jī)r(jià)模型。為了說(shuō)明二者之間的關(guān)系,采用如下回歸模型。
其中,調(diào)整后的R=0.57,S.E=13.18,F(xiàn)=70,DW=0.59。
根據(jù)模型(4)的結(jié)果,說(shuō)明搜索指數(shù)對(duì)房?jī)r(jià)存在著正向的影響,且影響程度較高,系數(shù)達(dá)到0.76。意味著搜索指數(shù)每變動(dòng)1個(gè)單位,房?jī)r(jià)將隨之變動(dòng)0.76個(gè)單位。又由于相關(guān)系數(shù)大于零,說(shuō)明搜索指數(shù)上漲時(shí)房?jī)r(jià)將會(huì)上漲,搜索指數(shù)下降時(shí)房?jī)r(jià)隨之下降。因此,可以利用搜索指數(shù)的變化來(lái)預(yù)測(cè)未來(lái)房?jī)r(jià)的變化。
四、結(jié)論和啟示
通過(guò)前面的分析,本文主要得到以下結(jié)論。
1.大數(shù)據(jù)對(duì)于中小城市房?jī)r(jià)具有較強(qiáng)的預(yù)測(cè)能力。對(duì)房屋價(jià)格指數(shù)和搜索指數(shù)進(jìn)行Engle-Granger檢驗(yàn),發(fā)現(xiàn)二者之間存在著協(xié)整關(guān)系,且其相關(guān)系數(shù)高達(dá)0.76,說(shuō)明搜索指數(shù)對(duì)南充房?jī)r(jià)市場(chǎng)具有較強(qiáng)的預(yù)測(cè)能力。在一定程度上,這也說(shuō)明了大數(shù)據(jù)對(duì)于區(qū)域經(jīng)濟(jì)預(yù)測(cè)和決策的重要作用。通過(guò)查看已有文獻(xiàn),發(fā)現(xiàn)關(guān)于區(qū)域經(jīng)濟(jì)的研究多數(shù)集中在大中城市,原因就在于中小城市的經(jīng)濟(jì)統(tǒng)計(jì)數(shù)據(jù)較難獲取,這就阻礙了對(duì)于中小城市經(jīng)濟(jì)預(yù)測(cè)的可能性,同時(shí)影響了經(jīng)濟(jì)決策的制定和執(zhí)行。隨著大數(shù)據(jù)的出現(xiàn),改變了中小城市數(shù)據(jù)難以獲取的現(xiàn)狀,能為預(yù)測(cè)和決策提供必要的數(shù)據(jù)支撐。因此,積極探索大數(shù)據(jù)對(duì)于中小城市區(qū)域經(jīng)濟(jì)的影響具有重要價(jià)值。本文僅僅以南充房地產(chǎn)市場(chǎng)作為大數(shù)據(jù)運(yùn)用的一個(gè)方面,希望能夠借此充分挖掘大數(shù)據(jù)的潛力。
2.構(gòu)建搜索指數(shù),以相關(guān)系數(shù)為權(quán)重表現(xiàn)更佳。大數(shù)據(jù)的特點(diǎn)在于數(shù)量多、非結(jié)構(gòu)化、信息冗雜,由于百度搜索引擎是國(guó)人常用的瀏覽器,而百度指數(shù)向大眾提供免費(fèi)查詢個(gè)別關(guān)鍵詞網(wǎng)絡(luò)搜索量的功能。因此,本文選取百度指數(shù)來(lái)構(gòu)建搜索指數(shù)。但是,與房?jī)r(jià)有關(guān)的關(guān)鍵詞很多,本文篩選相關(guān)系數(shù)大于0.5的關(guān)鍵詞進(jìn)行指數(shù)構(gòu)建,這樣在一定程度上對(duì)大數(shù)據(jù)的信息進(jìn)行過(guò)濾。然后,在構(gòu)建指數(shù)的過(guò)程中,分別比較了算術(shù)平均數(shù)和以相關(guān)系數(shù)為權(quán)重的加權(quán)平均數(shù)的構(gòu)造方法,結(jié)果發(fā)現(xiàn)以加權(quán)平均數(shù)來(lái)構(gòu)造權(quán)重的方法得到的搜索指數(shù)跟房?jī)r(jià)的相關(guān)性更大。因此,本文建議在利用大數(shù)據(jù)構(gòu)建搜索指數(shù)時(shí)注重相關(guān)系數(shù)所帶來(lái)的權(quán)重影響。
參考文獻(xiàn):
[1]王娜.基于大數(shù)據(jù)的碳價(jià)預(yù)[T].統(tǒng)計(jì)研究,2016,33(11):56-62.
[2]秦磊,謝邦昌.谷歌流感趨勢(shì)的成功與失誤[J].統(tǒng)計(jì)研究,2016,33(2):107-110.
[3]劉濤雄,徐曉飛.互聯(lián)網(wǎng)搜索行為能幫助我們預(yù)測(cè)宏觀經(jīng)濟(jì)嗎?[J].經(jīng)濟(jì)研究,2015,50(12):68-83.
作者簡(jiǎn)介:
弋微微,南充職業(yè)技術(shù)學(xué)院,四川南充。
①基金:2018年南充市社會(huì)科學(xué)研究“十三五”規(guī)劃項(xiàng)目,項(xiàng)目編號(hào):NC2018C040。