劉楊柏紅
(哈爾濱商業(yè)大學(xué)金融學(xué)院,黑龍江 哈爾 濱 150000)
房地產(chǎn)價(jià)格的大變革要追溯到1998 年國(guó)家頒布的《國(guó)務(wù)院關(guān)于進(jìn)一步深化城鎮(zhèn)住房制度改革加快住房建設(shè)的通知》,該通知取消了原有的住房分配制度轉(zhuǎn)而施行住房商品化社會(huì)化,全國(guó)房地產(chǎn)市場(chǎng)迅速發(fā)展[1]。2003 年國(guó)務(wù)院發(fā)布“18 號(hào)文件”首次公開(kāi)肯定了房地產(chǎn)在國(guó)民經(jīng)濟(jì)發(fā)展中的支柱地位[2]。2019 年8 月,中國(guó)人民銀行發(fā)布公告,提出“住房只住不炒”,進(jìn)一步施行房貸利率改革,實(shí)施貸款市場(chǎng)報(bào)價(jià)利率[3]。2020 年5 月,十三屆全國(guó)人大三次會(huì)議提出新定位:“堅(jiān)持房子是用來(lái)住的、不是用來(lái)炒的”,與此同時(shí)要根據(jù)每個(gè)城市的特色和不同人群的需求發(fā)展相應(yīng)的房地產(chǎn)事業(yè),促進(jìn)各地房地產(chǎn)市場(chǎng)平穩(wěn)健康發(fā)展。由此可見(jiàn),房地產(chǎn)市場(chǎng)和房地產(chǎn)價(jià)格受到了大眾以及國(guó)家的廣泛關(guān)注。2020 年11 月,哈爾濱市印發(fā)了《關(guān)于疫情期間促進(jìn)我市房地產(chǎn)市場(chǎng)平穩(wěn)健康發(fā)展相關(guān)政策的通知》,該通知旨在鼓勵(lì)房地產(chǎn)企業(yè)“賣(mài)房”。因此,房地產(chǎn)的健康發(fā)展關(guān)系到民生,而價(jià)格毫無(wú)疑問(wèn)是房地產(chǎn)發(fā)展是否健康的重要指標(biāo)。
因此,針對(duì)住宅商品房?jī)r(jià)格成倍增長(zhǎng)的現(xiàn)象,選取了以二線城市-哈爾濱市為例利用SPSS 以及MATLAB 工具,進(jìn)行因子分析,建立多元回歸模型和BP 神經(jīng)網(wǎng)絡(luò),以研究預(yù)測(cè)哈爾濱市住宅商品房?jī)r(jià)格和走勢(shì)。圖1 為哈爾濱市住宅商品房?jī)r(jià)格走勢(shì)圖。
圖1 哈爾濱市住宅商品房?jī)r(jià)格走勢(shì)圖
對(duì)于房地產(chǎn)價(jià)格問(wèn)題很早就有學(xué)者通過(guò)構(gòu)建有效、多樣的模型對(duì)房地產(chǎn)價(jià)格進(jìn)行進(jìn)行研究、探討和預(yù)測(cè)。國(guó)外研究學(xué)者很多是通過(guò)利用基本經(jīng)濟(jì)學(xué)原理建立傳統(tǒng)線性模型對(duì)房地產(chǎn)引發(fā)的交易事件進(jìn)行分析。我國(guó)在該領(lǐng)域的研究相對(duì)于國(guó)外研究來(lái)說(shuō)時(shí)間相對(duì)晚一些。但是,隨著理論與實(shí)踐研究的深入,我國(guó)研究房地產(chǎn)價(jià)格變化的學(xué)者也越來(lái)越多。羅博煒、洪智勇利用Python 工具基于多元線性回歸統(tǒng)計(jì)模型對(duì)美國(guó)部分地區(qū)房?jī)r(jià)進(jìn)行預(yù)測(cè),并對(duì)模型進(jìn)行修正和優(yōu)化;吳承業(yè)、沈逸珺等利用Eviews 軟件,建立ARMA 模型對(duì)杭州市房?jī)r(jià)進(jìn)行預(yù)測(cè),得出房?jī)r(jià)整體處于較快上升趨勢(shì)的結(jié)果;賈建英利用GM(1,1)模型對(duì)唐山市房?jī)r(jià)進(jìn)行預(yù)測(cè);李秀芝、劉成林等利用馬爾科夫鏈對(duì)宜賓市商品房銷(xiāo)售價(jià)格進(jìn)行預(yù)測(cè),得出宜賓市的房?jī)r(jià)處于波動(dòng)狀態(tài),上升勢(shì)頭明顯;張雙妮利用逐步回歸模型擬合房?jī)r(jià)預(yù)測(cè)模型得出長(zhǎng)期來(lái)看房?jī)r(jià)普遍上漲的結(jié)論;楊莎莎基于模型平均對(duì)房?jī)r(jià)進(jìn)行預(yù)測(cè)和實(shí)證研究。通過(guò)學(xué)習(xí),本文運(yùn)用多元線性回歸與BP 神經(jīng)網(wǎng)絡(luò)兩種工具進(jìn)行預(yù)測(cè),獲得準(zhǔn)確性更高的房?jī)r(jià)預(yù)測(cè)工具。
利用從國(guó)家統(tǒng)計(jì)局收集到的相關(guān)數(shù)據(jù)進(jìn)行篩選后,按照年份進(jìn)行排列。哈爾濱市國(guó)內(nèi)生產(chǎn)總值(億元)、哈爾濱市年末總?cè)丝冢ㄈf(wàn)人)、哈爾濱市房地產(chǎn)開(kāi)發(fā)投資額(億元)、哈爾濱市房地產(chǎn)開(kāi)發(fā)住宅投資額(億元)、哈爾濱市住宅商品房銷(xiāo)售面積(萬(wàn)平方米)、哈爾濱市城鄉(xiāng)居民儲(chǔ)蓄年末余額(億元)作為自變量,分別記為X1、X2、X3、X4、X5、X6;哈爾濱市住宅商品房平均銷(xiāo)售價(jià)格(元/平方米)作為因變量記為Y。表1 為哈爾濱市2002-2019 年相關(guān)數(shù)據(jù)。
表1 哈爾濱市2002-2019 年相關(guān)數(shù)據(jù)
因子分析總的來(lái)說(shuō)就是一種降維的思想,就是將收集到的多個(gè)滿足真實(shí)性和有效性的數(shù)據(jù)變量轉(zhuǎn)換為幾個(gè)更具代表性的綜合指標(biāo),再將相關(guān)性相對(duì)較高的數(shù)據(jù)變量組合在一起,以減少因解釋變量過(guò)多導(dǎo)致深入分析過(guò)程變得復(fù)雜的現(xiàn)象。
運(yùn)用因子分析的前提是因子之間存在相關(guān)性。因此,在利用SPSS 工具對(duì)7 個(gè)變量進(jìn)行因子分析之前要驗(yàn)證各變量之間的線性關(guān)系。本文利用KMO 和巴特利特檢驗(yàn)方法進(jìn)行分析。KMO 是比較變量間簡(jiǎn)單和偏相關(guān)系數(shù)的指標(biāo),取值在(0,1)之間。經(jīng)過(guò)KMO 檢驗(yàn)得出的結(jié)果大于0.5,說(shuō)明該組變量可以進(jìn)行因子分析;巴特利特檢驗(yàn)是計(jì)算各個(gè)變量之間相關(guān)性程度的方法。本文數(shù)據(jù)檢驗(yàn)結(jié)果如下:
表2 總方差解釋
KMO 值=0.736,巴特利特檢驗(yàn)顯著性 sig=0.000。該結(jié)果說(shuō)明所選取的數(shù)據(jù)適合做因子分析。
由生成的總方差解釋結(jié)果表可以分析出:第一和第二主成分初始特征值總計(jì)分別為5.240,1.395,兩個(gè)主成分的初始特征值累計(jì)貢獻(xiàn)率總共達(dá)到94.782%。該比例說(shuō)明有效信息損失少,通過(guò)獲取第一和第二個(gè)公共因子就能最大限度的解釋該組解釋變量的整體情況并提供所需要的信息。由于第一主成分的貢獻(xiàn)率最大,可以根據(jù)第一主成分的數(shù)據(jù)來(lái)判斷其他各因素的重要程度:
利用SPSS 對(duì)數(shù)據(jù)進(jìn)行擬合分析,確定各個(gè)因素與因變量之間的關(guān)系。建立多元回歸分析模型:
本次多元回歸利用的是逐步回歸模型方法:將每個(gè)要進(jìn)行分析的解釋變量單獨(dú)輸入到模型中,每輸入一個(gè)解釋變量后都進(jìn)行一次F 檢驗(yàn),對(duì)上一步已經(jīng)選定的解釋變量再逐個(gè)進(jìn)行t 檢驗(yàn)。若原來(lái)輸入的解釋變量由于后來(lái)解釋變量的引入變得不顯著,則將后者刪除,以此來(lái)確保最后得到的解釋變量集合的檢驗(yàn)結(jié)果是最優(yōu)集合。依據(jù)上述方法得出哈爾濱市房?jī)r(jià)的多元回歸模型為:
整個(gè)回歸過(guò)程進(jìn)行了一步,進(jìn)入變量為X6,標(biāo)準(zhǔn)化系數(shù)為0.982,得到的德賓-沃森數(shù)值為1.035,查表(n=7,k=1),顯著性水平為0.016(在0.01 左右),因此選擇A-1 德賓-沃森統(tǒng)計(jì)量臨界值表中的對(duì)應(yīng)數(shù)值,得出=0.435,=1.036。在ANOVA 表中,模型sig 統(tǒng)計(jì)值小于0.05,解釋變量系數(shù)顯著。得出單方程模型為:
圖3 BP 神經(jīng)網(wǎng)訓(xùn)練過(guò)程
將2016、2017、2018、2019年城鄉(xiāng)居民儲(chǔ)蓄年末余額(X6)帶入中,可以得出預(yù)測(cè)值(如表3 所示)。
表3 多元回歸模型預(yù)測(cè)結(jié)果
通過(guò)結(jié)果可以看出,住宅商品房預(yù)測(cè)值與實(shí)際值存在一定誤差并且波動(dòng)較大,誤差仍在合理的預(yù)測(cè)區(qū)間內(nèi)。
BP 神經(jīng)網(wǎng)絡(luò)(Back Propagation)是一種按誤差逆?zhèn)鞑ニ惴ㄓ?xùn)練的多層前饋網(wǎng)絡(luò),人工神經(jīng)元的研究起源于腦神經(jīng)元學(xué)說(shuō),人工神經(jīng)網(wǎng)絡(luò)是有大量的簡(jiǎn)單基本元件——神經(jīng)元相互連接而成的自適應(yīng)非線性動(dòng)態(tài)系統(tǒng)[4]。
BP神經(jīng)網(wǎng)絡(luò)是由輸入層(input)、隱含層、輸出層(output)組成,首先給網(wǎng)絡(luò)的各連接權(quán)值賦予(0,1)區(qū)間內(nèi)的隨機(jī)值,也就是我們所說(shuō)的歸一化處理,將輸入層對(duì)應(yīng)的數(shù)據(jù)和圖像模式輸入給網(wǎng)絡(luò),通過(guò)計(jì)算隱含層中神經(jīng)元權(quán)重的不同,將各神經(jīng)元權(quán)值加權(quán)求和,利用激活函數(shù)進(jìn)行非線性運(yùn)算,得到網(wǎng)絡(luò)輸出結(jié)果并與原數(shù)據(jù)進(jìn)行比較,從而達(dá)到預(yù)測(cè)數(shù)據(jù)的效果。
BP 神經(jīng)網(wǎng)絡(luò)通過(guò)對(duì)輸入的數(shù)據(jù)進(jìn)行不斷訓(xùn)練,訓(xùn)練結(jié)束后輸入預(yù)測(cè)值的自變量從而得到與預(yù)測(cè)值相近或者與原預(yù)測(cè)數(shù)據(jù)相同的數(shù)據(jù)值并輸出?;贐P 神經(jīng)網(wǎng)絡(luò)的優(yōu)勢(shì),我們利用其作為工具,來(lái)完成本文要達(dá)到的目的。圖2 為BP 神經(jīng)網(wǎng)絡(luò)訓(xùn)練過(guò)程。
圖2 BP 神經(jīng)網(wǎng)絡(luò)訓(xùn)練過(guò)程
4.2.1 數(shù)據(jù)預(yù)處理
在初始建立模型之前,本文使用Mapminmax(X)對(duì)每一行數(shù)據(jù)進(jìn)行歸一化處理,將數(shù)據(jù)統(tǒng)一在[-1,1]的范圍之中,可以在一定程度上避免所輸入的數(shù)據(jù)出現(xiàn)不必要的數(shù)值問(wèn)題。在神經(jīng)網(wǎng)絡(luò)對(duì)于數(shù)據(jù)訓(xùn)練結(jié)束之后,需要再對(duì)輸出數(shù)據(jù)進(jìn)行Mapminmax(‘reverse’,X,Y)的反歸一化處理,將數(shù)據(jù)恢復(fù)成與輸入數(shù)據(jù)相同的形式。
4.2.2 選取神經(jīng)元節(jié)點(diǎn)個(gè)數(shù)
通過(guò)6 個(gè)影響因素對(duì)住宅價(jià)格進(jìn)行預(yù)測(cè),建立三層BP神經(jīng)網(wǎng)絡(luò)模型,網(wǎng)絡(luò)輸入層節(jié)點(diǎn)數(shù)n=6,輸出神經(jīng)元n=1,利用Hornik 公式可以計(jì)算出中間層(隱含層)節(jié)點(diǎn)數(shù)范圍:
計(jì)算出的中間層神經(jīng)元節(jié)點(diǎn)數(shù)范圍為[4,13],再該范圍內(nèi)選擇最優(yōu)的節(jié)點(diǎn)數(shù),經(jīng)過(guò)實(shí)驗(yàn),本位選取的最優(yōu)節(jié)點(diǎn)數(shù)為8。
4.2.3 訓(xùn)練及預(yù)測(cè)分析
選取2002-2015 年6 個(gè)自變量數(shù)據(jù)作為訓(xùn)練數(shù)據(jù),Sigmoid 函數(shù)作為激活函數(shù),tansig 作為傳遞函數(shù),訓(xùn)練次數(shù)5000 次,最小誤差10-6。在經(jīng)過(guò)了363 次迭代后,誤差小于等于10-6時(shí)停止訓(xùn)練。
訓(xùn)練數(shù)集通過(guò)訓(xùn)練,在到達(dá)10-6后,曲線變得平緩,并最終落在目標(biāo)誤差線上。訓(xùn)練后的誤差(mse)值,最大誤差為0.0413,目標(biāo)誤差為1.00e-06,實(shí)際誤差為9.953e-08。隨后以2016—2019 年6 個(gè)自變量數(shù)據(jù)為基礎(chǔ),通過(guò)E 計(jì)算真實(shí)值與預(yù)測(cè)值之間誤差,mse(E)表示均值方差誤差值,對(duì)因變量進(jìn)行預(yù)測(cè)。
通過(guò)表4 中計(jì)算的誤差結(jié)果我們可以看出,2016-2019年誤差逐漸升高,波動(dòng)較規(guī)律,可見(jiàn)預(yù)測(cè)相近年份的數(shù)據(jù)準(zhǔn)確度更高。從一定程度上預(yù)測(cè)了與真實(shí)值相同的房?jī)r(jià)走勢(shì)。
表4 BP 神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)數(shù)據(jù)誤差
我們可以從圖4 中觀察到,X2(哈爾濱市年末總?cè)丝跀?shù))從2002 年開(kāi)始一直處于緩慢的下降趨勢(shì);X3(哈爾濱市房地產(chǎn)開(kāi)發(fā)投資額)與X4(哈爾濱市房地產(chǎn)開(kāi)發(fā)住宅投資額)走勢(shì)較為接近。X3隨著X3的增長(zhǎng)而增長(zhǎng),由于包括哈爾濱市在內(nèi)的東北地區(qū)整體經(jīng)濟(jì)增長(zhǎng)能力不足,導(dǎo)致在2013 年之后X3開(kāi)始逐步下滑,相應(yīng)的X4也逐步下滑,由于X3的減少,X5(哈爾濱市住宅商品房銷(xiāo)售面積)在2013 年達(dá)到最高水平后開(kāi)始下跌。而房X3和X5的減少會(huì)影響到住宅商品房市場(chǎng)的供給與需求的失衡;X6(哈爾濱市城鄉(xiāng)居民儲(chǔ)蓄年末余額)是多元回歸模型中提取出的主要因素,在2019 年X6急速上漲超過(guò)了X1(哈爾濱市國(guó)內(nèi)生產(chǎn)總值),這體現(xiàn)出哈爾濱市居民傳統(tǒng)的投資理念:一部分居民將手里的錢(qián)用于存款儲(chǔ)蓄,另外一部分居民對(duì)銀行利率不看好,直接將儲(chǔ)蓄投資于房地產(chǎn)。存款儲(chǔ)蓄多一般情況能反映出現(xiàn)金流量多,貨幣流通周轉(zhuǎn)速度快,貨幣創(chuàng)造能力強(qiáng)。但是伴隨著X1的下降,產(chǎn)出以及投資減少,居民的儲(chǔ)蓄并沒(méi)有最大效率的實(shí)現(xiàn)貨幣加倍創(chuàng)造的能力,沒(méi)有達(dá)到預(yù)期的經(jīng)濟(jì)增長(zhǎng)水平。住宅商品房?jī)r(jià)格在各因素的影響下仍在不斷升高,除文中提到的六個(gè)因素外,還受例如政府調(diào)控、國(guó)家政策、人均可支配收入、房貸利率等諸多因素的影響,需要進(jìn)一步進(jìn)行研究與挖掘。
圖4 住宅商品房影響因素折線圖
多元回歸模型在對(duì)住宅商品房?jī)r(jià)格進(jìn)行預(yù)測(cè)時(shí)X6(城鄉(xiāng)居民儲(chǔ)蓄年末余額)對(duì)價(jià)格影響最大,BP 神經(jīng)網(wǎng)絡(luò)則是受到不同權(quán)重影響因素的影響,相比之下,BP 神經(jīng)網(wǎng)絡(luò)模型的誤差值更小,預(yù)測(cè)更準(zhǔn)確。由于影響住宅商品房?jī)r(jià)格的因素較為復(fù)雜和繁瑣,本次研究只抽取六個(gè)影響因素的相關(guān)數(shù)據(jù)。因此,對(duì)兩種模型的學(xué)習(xí)和比較為今后進(jìn)行深入研究提供了基礎(chǔ)。