劉永澤
摘 要:房?jī)r(jià)一直是一個(gè)備受全國(guó)上下關(guān)注的熱點(diǎn)問(wèn)題。無(wú)論是房地產(chǎn)商家還是準(zhǔn)備購(gòu)房的消費(fèi)者,合理的估計(jì)房?jī)r(jià)的走勢(shì),或是正確的預(yù)判某套房子的市值變化趨勢(shì),都可以使我們盡可能達(dá)到獲益最大。對(duì)北京市近十年的房?jī)r(jià)進(jìn)行了研究,利用回歸分析的方法,建立了月均房?jī)r(jià)的波動(dòng)走勢(shì)預(yù)測(cè)模型,對(duì)北京市2010年至2018年的月均房?jī)r(jià)走勢(shì)進(jìn)行研究。根據(jù)房?jī)r(jià)數(shù)據(jù)特點(diǎn),我們以2017年3月頒布的限購(gòu)政策為分界點(diǎn),分為2010-2016年和2016-2018年兩段,分別分析了房?jī)r(jià)的線性增長(zhǎng)規(guī)律、周期性波動(dòng)規(guī)律和政策影響波動(dòng)規(guī)律,引入“政策影響期”的虛擬變量,最后完成了經(jīng)多次優(yōu)化改進(jìn)的回歸模型,在2010-2018年北京月均房?jī)r(jià)數(shù)據(jù)集上體現(xiàn)出非常好的擬合和測(cè)試性能。
關(guān)鍵詞:北京房?jī)r(jià)預(yù)測(cè);時(shí)序回歸分析;房?jī)r(jià)政策影響因素
中圖分類(lèi)號(hào):TB 文獻(xiàn)標(biāo)識(shí)碼:Adoi:10.19311/j.cnki.1672-3198.2019.06.092
1 前言
房地產(chǎn)行業(yè)作為國(guó)民經(jīng)濟(jì)新的增長(zhǎng)點(diǎn),為全國(guó)各地大中小城市的經(jīng)濟(jì)快速增長(zhǎng)做出了巨大貢獻(xiàn),但是由于缺乏必要的法律監(jiān)管制度,在巨大的市場(chǎng)需求和不菲的利益驅(qū)動(dòng)下,近十五年來(lái),我國(guó)房?jī)r(jià)不斷攀升,尤其是在一線城市,已經(jīng)出現(xiàn)了十萬(wàn)以上的天價(jià)。一些無(wú)良開(kāi)發(fā)商,囤積土地,延遲開(kāi)發(fā),造成極大的資源浪費(fèi)。還有一些偏遠(yuǎn)地區(qū)開(kāi)發(fā)商,錯(cuò)估了形勢(shì),胡亂開(kāi)發(fā),建造了不少永遠(yuǎn)無(wú)人問(wèn)津的“鬼樓”。從歷史規(guī)律來(lái)看,房產(chǎn)并不能永遠(yuǎn)增值,每一個(gè)房子的市值變化,其背后都隱藏著可預(yù)見(jiàn)和不可預(yù)見(jiàn)的影響因素。因此,不管是想要抓住最佳時(shí)機(jī)的購(gòu)房者、還是想賣(mài)出最合理售價(jià)的房產(chǎn)人,都需要對(duì)房?jī)r(jià)的走勢(shì)和房?jī)r(jià)的影響因素有一個(gè)較為準(zhǔn)確的預(yù)估和預(yù)判。
本文以北京市及周?chē)貐^(qū)的商品房為主要研究對(duì)象,對(duì)北京市近十年的房?jī)r(jià)進(jìn)行了研究,利用回歸分析的方法,建立了月均房?jī)r(jià)的波動(dòng)走勢(shì)預(yù)測(cè)模型,對(duì)北京市2010年至2018年的月均房?jī)r(jià)走勢(shì)進(jìn)行研究。根據(jù)房?jī)r(jià)數(shù)據(jù)特點(diǎn),我們以2017年3月頒布的限購(gòu)政策為分界點(diǎn),分為2010-2016年和2016-2018年兩段,分別分析了房?jī)r(jià)的線性增長(zhǎng)規(guī)律、周期性波動(dòng)規(guī)律和政策影響波動(dòng)規(guī)律,引入“政策影響期”的虛擬變量,最后完成了經(jīng)多次優(yōu)化改進(jìn)的回歸模型,在2010-2018年北京月均房?jī)r(jià)數(shù)據(jù)集上體現(xiàn)出非常好的擬合和測(cè)試性能。
與同類(lèi)型其他研究相比,本文通過(guò)時(shí)序得出房?jī)r(jià)-時(shí)間關(guān)系式,建立了模型并不斷優(yōu)化,因?yàn)檫x取了合適的自變量,預(yù)測(cè)性能與他人相比有了較大的提高。這也說(shuō)明了,模型并非越復(fù)雜越好,而是需要根據(jù)具體情況具體分析,并遵循數(shù)據(jù)挖掘科學(xué)的思想進(jìn)行充分探討,才會(huì)得到比較貼近真實(shí)的預(yù)測(cè)結(jié)果。本文尤其對(duì)樓市政策對(duì)房?jī)r(jià)的影響進(jìn)行了深入研究,并刻畫(huà)了房?jī)r(jià)周期性波動(dòng)的規(guī)律,為未來(lái)的投資提供有價(jià)值的參考。
2 通過(guò)自回歸模型得出房?jī)r(jià)的時(shí)序關(guān)系式
本章通過(guò)從房地產(chǎn)網(wǎng)站搜集資料,建立北京市近十年(2009/1-2018/2)的房?jī)r(jià)按時(shí)序排列的數(shù)據(jù)庫(kù),為了方便后期計(jì)算,將月份從2009年1月起,采用1-110編號(hào)的形式將其標(biāo)注。采用不同類(lèi)型的函數(shù)進(jìn)行線性回歸,以此來(lái)擬合房?jī)r(jià)的變化趨勢(shì),根據(jù)擬合優(yōu)度、p-value等,從中選出擬合程度最好的一種作為預(yù)測(cè)模型。
本章主要研究并建立時(shí)間序列預(yù)測(cè)模型,用到北京月均房?jī)r(jià)數(shù)據(jù)是由安居客網(wǎng)站提供,時(shí)間從2010年2月至2018年2月。數(shù)據(jù)的整體走勢(shì)如圖1所示。
2.1 模型基本假設(shè)
(1)房地產(chǎn)市場(chǎng)整體平穩(wěn),不會(huì)因?yàn)橥饨鐢_動(dòng)而發(fā)生突變。
(2)根據(jù)圖像觀察可知,在研究對(duì)象的時(shí)間范圍內(nèi),北京市房?jī)r(jià)包含兩種長(zhǎng)期走勢(shì):線性增長(zhǎng)特征和周期性波動(dòng)特征。
(3)2017年3月北京市出臺(tái)關(guān)于完善商品住房銷(xiāo)售和差別化信貸政策,受到該政策的影響,北京房?jī)r(jià)產(chǎn)生了短期的政策影響波動(dòng),假設(shè)政策影響分為頒布前期、房?jī)r(jià)抑制期和反彈振蕩期三個(gè)階段。
2.2 模型一:一元線性回歸模型
首先,我們以時(shí)間變化為回歸變量,以“月”為單位,建立了最簡(jiǎn)單的一元線性回歸預(yù)測(cè)模型,來(lái)刻畫(huà)房?jī)r(jià)的線性變化趨勢(shì)。對(duì)于年月信息的處理如下:以2009年12月作為起始,往后第1個(gè)月記為1,往后第二個(gè)月記為2,……,往后第n個(gè)月記為n。表達(dá)式如下:
本文利用excel的數(shù)據(jù)分析工具進(jìn)行擬合,同時(shí)將訓(xùn)練集測(cè)試集劃分為:
(1)訓(xùn)練集:2010年1月——2016年10月。
(2)測(cè)試集:2016年10月——2018年1月。
得到的擬合結(jié)果為表1。
因此,得到模型表達(dá)式為:y=311.51t+20597.47,擬合優(yōu)度為R2=0.8748,說(shuō)明該模型在訓(xùn)練集上的擬合性能還有提升空間。之后在測(cè)試集上對(duì)該模型的預(yù)測(cè)性能進(jìn)行測(cè)試,并且計(jì)算均方根誤差參數(shù)來(lái)衡量預(yù)測(cè)性能,RMSE=8215.43,預(yù)測(cè)性能不夠理想,從圖2真實(shí)房?jī)r(jià)和預(yù)測(cè)房?jī)r(jià)的對(duì)比也可以看出簡(jiǎn)單的線性模型不能較準(zhǔn)確地預(yù)測(cè)房?jī)r(jià),模型需要進(jìn)一步優(yōu)化。
2.3 模型二:加入周期波動(dòng)預(yù)測(cè)模型
通過(guò)研究一元線性回歸模型的殘差,如圖3,可得出訓(xùn)練集上的殘差具有很強(qiáng)的周期性規(guī)律,這種非線性變化的部分反映了北京市房?jī)r(jià)長(zhǎng)期的周期波動(dòng)特征。因此,考慮在后續(xù)的模型優(yōu)化中,加入三角函數(shù)特征表達(dá)式,來(lái)反應(yīng)房?jī)r(jià)的長(zhǎng)期波動(dòng)走勢(shì)。
因此,在模型中加入sinωt和cosωt表達(dá)式,利用正弦和余弦函數(shù)的疊加反應(yīng)任意相差的周期函數(shù)。優(yōu)化后的模型表達(dá)式如下:
根據(jù)圖3訓(xùn)練集殘差走勢(shì),觀察得該函數(shù)的波動(dòng)周期T=38,根據(jù)ω=2πT得知ω=0.165。訓(xùn)練集與測(cè)試集保持不變,利用excel進(jìn)行擬合分析得到的參數(shù),見(jiàn)表2。
該模型的擬合優(yōu)度R2=0.9712,比之前有了相當(dāng)高的提升。說(shuō)明該模型在訓(xùn)練集上具有很好的擬合效果,如圖4所示。與圖3相比,可以明顯看出該模型加入周期波動(dòng)函數(shù)后,對(duì)于房?jī)r(jià)波動(dòng)性描述更為有效。
然而,在圖4中也可以看出,該模型的測(cè)試集預(yù)測(cè)性能依然沒(méi)有達(dá)到預(yù)期,RMSE=5476.19,特別是2016年10月以后的房?jī)r(jià)波動(dòng)規(guī)律幾乎不能反映出來(lái)。究其原因,主要是因?yàn)?017年3月17日北京市頒布的“史上最嚴(yán)格房?jī)r(jià)調(diào)控政策”,打破了房?jī)r(jià)系統(tǒng)的穩(wěn)定性,使該系統(tǒng)不再滿(mǎn)足穩(wěn)定性假設(shè),因而難以使用歷史數(shù)據(jù)進(jìn)行預(yù)測(cè)?;诖?,我們進(jìn)一步優(yōu)化模型,在模型中加入“政策影響”修正量,使模型性能進(jìn)一步提高。
2.4 模型三:引入“政策影響”修正量的回歸模型
通過(guò)對(duì)2016年10月后的房?jī)r(jià)波動(dòng)規(guī)律觀察,我們發(fā)現(xiàn)政策帶來(lái)的影響同樣是具有一定的波動(dòng)周期的。通過(guò)對(duì)大量文獻(xiàn)的研讀和對(duì)時(shí)政的分析,我們認(rèn)為政策的頒布會(huì)對(duì)房?jī)r(jià)產(chǎn)生三個(gè)階段的影響:
(1)頒布前期(2016年11月——2017年3月):這個(gè)階段政策尚未頒布,但關(guān)于政策的消息和風(fēng)聲已經(jīng)廣為流傳。因此,房產(chǎn)市場(chǎng)無(wú)論是賣(mài)方還是買(mǎi)房都希望能夠在政策頒布前完成購(gòu)房買(mǎi)賣(mài),盡量降低政策對(duì)自己帶來(lái)的影響。這種心態(tài)引發(fā)了一波交易量的迅猛上漲,也連帶著導(dǎo)致了房?jī)r(jià)的飆升。
(2)房?jī)r(jià)抑制期(2017年3月——2017年8月):這個(gè)階段政策剛剛出臺(tái),其嚴(yán)格的規(guī)定對(duì)房地產(chǎn)市場(chǎng)產(chǎn)生了極大的抑制作用,使交易量迅速下降至冰點(diǎn),因而房?jī)r(jià)也一路狂跌直至2017年夏天。
(3)房?jī)r(jià)波動(dòng)期(2017年8月——2018年):由于很多人購(gòu)房存在剛性需求,幾個(gè)月的交易量抑制后必然會(huì)存在反彈,并隨著2017年冬天的到來(lái)再次下降。后續(xù)的波動(dòng)依舊存在,雖然我們很難預(yù)測(cè)政策影響的波動(dòng)期會(huì)持續(xù)多久,但毫無(wú)疑問(wèn)2018年年初仍然在政策影響的范圍內(nèi)。
經(jīng)過(guò)以上的分析,我們?cè)谀P椭幸搿罢哂绊憽毙拚縋,以虛擬變量的形式存在。P可以取值0和1,當(dāng)市場(chǎng)處于政策影響期時(shí),P取1;市場(chǎng)處于非政策影響期時(shí),P取0。因此優(yōu)化后的模型表達(dá)式為:
其中φ為被這一輪政策影響的第一個(gè)月份的t值,本文研究中對(duì)應(yīng)為83。與前文同理,通過(guò)觀察得政策波動(dòng)函數(shù)的波動(dòng)周期約為T(mén)=10,用k=2πT求解k=0.628。劃分訓(xùn)練集和測(cè)試集為:
(1)訓(xùn)練集:2010年1月——2017年5月。
(2)測(cè)試集:2017年6月——2018年1月。
利用excel進(jìn)行擬合分析得到的參數(shù)結(jié)果,代入表達(dá)式得到最終的模型為:
Y=338.69t+3632.37sin0.165t+22891.51+4785.55sin(0.628(t-83))
最終擬合得到的擬合優(yōu)度為R2=0.98597,說(shuō)明該模型在訓(xùn)練集上具有更好的擬合效果。之后在測(cè)試集上對(duì)該模型的預(yù)測(cè)性能進(jìn)行測(cè)試,得到RMSE=1369.87,如圖6,可以看出考慮政策影響因素后,模型能夠很好地反應(yīng)出北京房?jī)r(jià)變化的規(guī)律,訓(xùn)練集和測(cè)試集均具有良好的性能,說(shuō)明該模型并不存在過(guò)擬合的問(wèn)題。這種結(jié)果支持了我們對(duì)于房?jī)r(jià)的線性增長(zhǎng)、周期性變化和政策波動(dòng)三個(gè)特征相疊加的假設(shè)。
3 總結(jié)與分析
本文對(duì)北京市近十年的房?jī)r(jià)進(jìn)行了研究,利用回歸分析的方法,建立了月均房?jī)r(jià)的波動(dòng)走勢(shì)預(yù)測(cè)模型,對(duì)北京市2010年至2018年的月均房?jī)r(jià)走勢(shì)進(jìn)行研究。根據(jù)房?jī)r(jià)數(shù)據(jù)特點(diǎn),我們以2017年3月頒布的限購(gòu)政策為分界點(diǎn),分為2010-2016年和2016-2018年兩段,分別分析了房?jī)r(jià)的線性增長(zhǎng)規(guī)律、周期性波動(dòng)規(guī)律和政策影響波動(dòng)規(guī)律,引入“政策影響期”的虛擬變量,最后完成了經(jīng)多次優(yōu)化改進(jìn)的回歸模型,在2010-2018年北京月均房?jī)r(jià)數(shù)據(jù)集上體現(xiàn)出非常好的擬合和測(cè)試性能。
總的來(lái)說(shuō),我們共構(gòu)建了三個(gè)模型,分別是一元線性回歸模型、加入周期因素的回歸模型和加入政策影響因子的回歸模型。三個(gè)模型的性能總結(jié)如下:
(1)一元線性回歸模型:R2=0.8748,RMSE=8215.43。
(2)加入周期因素的回歸模型:R2=0.9712,RMSE=5476.19。
(3)加入政策影響因素的回歸模型:R2=0.98597,RMSE=1369.87。
可以看出,隨著模型的不斷優(yōu)化,訓(xùn)練集和測(cè)試集上的性能都在不斷上升,說(shuō)明模型越來(lái)越接近于數(shù)據(jù)客觀存在的規(guī)律。然而即使最完善的時(shí)間序列預(yù)測(cè)模型,也很難達(dá)到非常精準(zhǔn)的預(yù)測(cè),因?yàn)槟P椭锌紤]因素少、忽略了一些重要的影響因素。因此,在后續(xù)研究中,我們可以再進(jìn)一步探究多種影響房?jī)r(jià)的因素,并提高對(duì)未來(lái)的房?jī)r(jià)預(yù)測(cè)的性能。
參考文獻(xiàn)
[1]Zhu H,Xiong H,Tang F,et al.Days on Market:Measuring Liquidity in Real Estate Markets[C]// ACM SIGKDD International Conference on Knowledge Discovery and Data Mining.ACM,2016:393-402.
[2]Min Hwang and Quigley,John M.Economic fundamentals in local housing markets:evidence from U.S.metropolitan regions[J].Journal of Regional Science,2006,8(46):425-453.
[3]王聰.基于多因素LOGISTIC的城市房地產(chǎn)價(jià)格預(yù)測(cè)模型研究[D].大連:大連理工大學(xué),2008.
[4]牛刀.穩(wěn)定房?jī)r(jià)——政府與地產(chǎn)商的博弈[EB/OL].(2006-06-10).http://www.niudaoblog.com/shichang/285.html.
[5]多元回歸分析[EB/OL].https://baike.baidu.com/item/多元回歸分析/10843316?fr=aladdin.
[6]自回歸模型[EB/OL].https://baike.baidu.com/item/自回歸模型/1037587?fr=aladdin.