劉娜娜+李雨潔+唐宇+邱益聰
摘要:通過分析人們在互聯(lián)網(wǎng)搜索過程中留下的搜索數(shù)據(jù),我們可以獲取許多有用的信息,本文基于人們利用互聯(lián)網(wǎng)搜索詞進行房價預(yù)測。從確定種子關(guān)鍵詞開始,接下來進行種子關(guān)鍵詞擴充,進而確定核心關(guān)鍵詞,然后利用多元線性回歸進行房價預(yù)測模型建立,并對比擬合值與實際值。
關(guān)鍵詞:大數(shù)據(jù);種子關(guān)鍵詞;多元線性回歸
一、背景
隨著互聯(lián)網(wǎng)的飛速發(fā)展,大數(shù)據(jù)時代已經(jīng)悄然地進入人們的生活當中,大數(shù)據(jù)開啟了巨大的時代轉(zhuǎn)型,就宏觀經(jīng)濟分析而言,大數(shù)據(jù)時代帶來的轉(zhuǎn)變是重大且具有變革意義的。[1]另一方面,房地產(chǎn)市場在大多數(shù)國家屬于支柱性產(chǎn)業(yè),房地產(chǎn)市場的興衰或成敗決定著國家經(jīng)濟形勢的好壞。[2]隨著互聯(lián)網(wǎng)技術(shù)的發(fā)展,也給房地產(chǎn)行業(yè)帶來了一定沖擊和變革,房地產(chǎn)行業(yè)越來越多與互聯(lián)網(wǎng)相加,據(jù)統(tǒng)計,在美國房地產(chǎn)商中,有72%的人利用互聯(lián)網(wǎng)銷售房屋,房地產(chǎn)經(jīng)紀人中有90%的人經(jīng)常利用網(wǎng)絡(luò)與購房者進行交流,互聯(lián)網(wǎng)已成為美國房地產(chǎn)營銷的主要媒體。[3]通過分析消費者利用互聯(lián)網(wǎng)的搜索痕跡,我們可以得到需求方的相關(guān)信息,從而為供給策略提供依據(jù)。在房地產(chǎn)行業(yè)中,我們就可以利用互聯(lián)網(wǎng)搜索引擎中廣大消費者的與房地產(chǎn)相關(guān)的搜索詞匯進行商品房的預(yù)測。
二、關(guān)鍵詞選取
(一)種子關(guān)鍵詞的選取
種子關(guān)鍵詞是在研究開始時所確定的初始關(guān)鍵詞,這些關(guān)鍵詞必然與所要研究的問題密切相關(guān)。其選取基于以下兩個標準:一是要有一定的理論基礎(chǔ)作支撐,且該理論基礎(chǔ)必須貫穿于種子關(guān)鍵詞選取的始終;二是選取的種子關(guān)鍵詞必須與所要研究的問題有密切的關(guān)系。[4]
據(jù)此,我們采用范圍取詞法,即根據(jù)所研究的經(jīng)濟行為的影響因素,確定種子關(guān)鍵詞的選取范圍,然后在范圍內(nèi)選擇合適的關(guān)鍵詞作為種子關(guān)鍵詞。
房地產(chǎn)的價格受宏觀和微觀兩方面因素共同作用,宏觀經(jīng)濟政策及外部環(huán)境的變化影響著供求關(guān)系,而供求關(guān)系決定了商品房的價格?;诤暧^層面,選擇“房貸利率”作為關(guān)鍵詞;基于微觀層面,其中又涉及到兩個主體,供應(yīng)方和需求方,針對房地產(chǎn)開發(fā)商,選擇“成都樓盤”、“成都房地產(chǎn)”作為關(guān)鍵詞,針對購房群體,選擇“成都搜房網(wǎng)”、“成都房價”、“成都租房”、“成都二手房”作為關(guān)鍵詞。
(二)種子關(guān)鍵詞的拓展
通常,在進行相關(guān)搜索時,人們不僅僅會搜索一次,例如當搜索城市樓盤時,如果對搜索結(jié)果不滿意,可能還有根據(jù)百度搜索推薦進行再次搜索,通過這樣多次搜索的過程,來獲取滿意的結(jié)果。因此,對于種子關(guān)鍵詞的拓展,主要采用百度搜索推薦的方法,匯總7個初始種子關(guān)鍵詞的相關(guān)方面,形成關(guān)鍵詞集合,如下表1。
(三)核心關(guān)鍵詞確定
在確定了一組與所要研究的問題密切相關(guān)的關(guān)鍵詞后,在后續(xù)的研究過程中一些相關(guān)關(guān)鍵詞將被視為核心關(guān)鍵詞,圍繞這一核心會派生出更多有價值的關(guān)鍵詞,推動后續(xù)研究的進行。[4]
我們通過2014-2015年的種子關(guān)鍵詞搜索量月度數(shù)據(jù)與成都市商品房月度價格指數(shù)進行相關(guān)性分析,以此確定核心關(guān)鍵詞如下表2。
通過上表我們可以發(fā)現(xiàn),選擇出的核心關(guān)鍵詞的搜索量與商品房價格之間利用多元回歸的擬合結(jié)果與實際值之間誤差很小,其平均相對誤差值為0.88%。利用該模型,我們在知道2015年12月份幾個核心關(guān)鍵詞的搜索量之后,預(yù)估商品房價格指數(shù),如下表6:
四、結(jié)論
“互聯(lián)網(wǎng)+”時代,我們可以利用互聯(lián)網(wǎng)上的“大數(shù)據(jù)”進行房價的預(yù)測,本文采用的方法較為簡單,預(yù)測結(jié)果與實際值之間存在一定差異,同時如何使用恰當?shù)姆椒?,使得估計值與實際值之間的誤差更小,值得我們不斷探索和研究。近幾年政府在房地產(chǎn)行業(yè)也頒布了相關(guān)法律政策,我們也可以利用此種方法預(yù)測國家政策對于商品房價的作用?;ヂ?lián)網(wǎng)大數(shù)據(jù),將會給我們的生產(chǎn)生活帶來意想不到的改變。(作者單位:四川大學(xué)商學(xué)院)
參考文獻:
[1]BreimanL,Randomforests[J].MachineLearing,2001(45).
[2]梁云芳,高鐵梅,賀書平.房地產(chǎn)市場與國民經(jīng)濟協(xié)調(diào)發(fā)展的實證分析[J].中國社會科學(xué),2006,(3):74-84.
[3]楊樹新,董紀昌,李秀婷.基于網(wǎng)絡(luò)關(guān)鍵詞搜索的房地產(chǎn)價格影響因素研究[J].新疆財經(jīng)大學(xué)學(xué)報.2013(3):7.
[4]楊洋.基于灰色關(guān)聯(lián)聚類的房屋銷售額預(yù)測關(guān)鍵詞優(yōu)化研究[D].吉林:吉林大學(xué),2015:14
[5]王惠文,孟潔.多元線性回歸的預(yù)測建模方法[J],北京航空航天大學(xué)學(xué)報.2007,33(4):500.
[6]周復(fù)恭,黃運成.應(yīng)用線性回歸分析[M].北京:中國人民大學(xué)出版社,1989:88-115.
[7]于秀林,任雪松.多元統(tǒng)計分析[M].北京:中國統(tǒng)計出版社,2011:8-30.
[8]葉峰,多元線性回歸在經(jīng)濟技術(shù)產(chǎn)量預(yù)測中的應(yīng)用[J],中外能源,(2):45.