張學(xué)新 吳凱澤
摘 要 基于武漢市二手房中介發(fā)布的數(shù)據(jù),用一種新線性模型測(cè)度了二手房個(gè)體交易價(jià)格及首付額的主要影響因素.依據(jù)二手房?jī)r(jià)的分布,按二手房所在行政區(qū)域分段建立了價(jià)格預(yù)測(cè)模型,同時(shí)給出了二手房交易價(jià)格等級(jí)的推理規(guī)則.統(tǒng)計(jì)學(xué)檢驗(yàn)表明,首付額預(yù)測(cè)模型性能優(yōu)良,可用于實(shí)際二手房個(gè)戶交易價(jià)格的預(yù)測(cè).
關(guān)鍵詞 價(jià)格學(xué);二手房?jī)r(jià)格預(yù)測(cè);新線性模型;因素重要度;推理規(guī)則
中圖分類號(hào) F293.3 文獻(xiàn)標(biāo)識(shí)碼 A
Abstract In this paper, a new linear model was used to measure the main factors that affect the individual transaction price and the down payment on a secondhand house, based on the secondhand house data obtained from some property agencies in Wuhan. in terms of the distribution of secondhand housing price, some prediction models were established piecewise corresponding to the administrative region in which secondhand houses are located, meanwhile, the inference rule model for the classification level of secondhand housing transaction price was discussed. Prediction models of down payment were excellent from the point of view of statistical test, and can be used to forecast the transaction price of real secondhand housing.
Key words Price science; Prediction of secondhand housing price; A new linear model; Factor importance; Inference rule
1 引 言
2017年商品房交易總量數(shù)據(jù)顯示,滬、京、深、福、廈、穗、津7 個(gè)城市的二手房交易已經(jīng)超過(guò)新房交易的一半.研究一個(gè)城市二手房交易狀況,尋找二手房成交價(jià)格規(guī)律,將有助于對(duì)二套房貸和二手房交易營(yíng)業(yè)稅等相關(guān)政策的正確調(diào)整,為樓市管理提供科學(xué)依據(jù).
國(guó)外已有文獻(xiàn)研究新房?jī)r(jià)格的相關(guān)問(wèn)題.Ernawati等(2016)[1]研究周邊環(huán)境質(zhì)量對(duì)住宅價(jià)值的影響及其機(jī)制,從區(qū)位、宏觀經(jīng)濟(jì)因素、人口因素、土地、產(chǎn)業(yè)等方面研究影響房?jī)r(jià)的主要因素.Gao和Kwong(2015)[2]實(shí)證研究了消費(fèi)物價(jià)指數(shù)、通貨膨脹率對(duì)上海新商品房長(zhǎng)期均衡價(jià)格的影響.
但是,關(guān)于二手房這方面的研究尚比較少見(jiàn).許浩(2017)[3]使用對(duì)數(shù)回歸模型分析合肥二手房特征價(jià)格,得出面積是房屋總價(jià)的最大影響因素.郭倩蓉和張敏鋒(2017)[4] 實(shí)證研究房?jī)r(jià)和地價(jià)的關(guān)系,鄭永坤和劉春(2018)[5]利用ARIMA模型預(yù)測(cè)廣州和深圳、南寧二手房成交均價(jià),董倩等(2014)[6]利用網(wǎng)絡(luò)搜索數(shù)據(jù),對(duì)16個(gè)城市的二手房?jī)r(jià)格和新房?jī)r(jià)格進(jìn)行了擬合和預(yù)測(cè).陳懷東(2017)[7]探討北京二手房銷售價(jià)格與房屋租賃價(jià)格之間相關(guān)的關(guān)系.劉越(2017)[8]利用可加AR模型實(shí)證研究天津市房地產(chǎn)市場(chǎng)二手房銷售價(jià)格指數(shù)變化趨勢(shì).利用簡(jiǎn)單線性回歸模型、方差分析,實(shí)證研究城市的住宅價(jià)格,獲得城市二手房住宅特征價(jià)格模型.這些方法涉及到時(shí)間序列的分布是否滿足假定的條件、不同城市的房?jī)r(jià)數(shù)據(jù)是否同質(zhì)問(wèn)題,選用模型對(duì)異地混合數(shù)據(jù)的分布有較嚴(yán)格的要求.提出一種新的線性回歸模型,直接研究二手房的交易價(jià)格,給出影響(大)城市二手房個(gè)戶交易價(jià)格的主要因素可能是有其價(jià)值的.通過(guò)建立分段模型對(duì)二手房的交易價(jià)格進(jìn)行精確預(yù)測(cè),取得了較好的結(jié)果.
2 數(shù)據(jù)及變量
數(shù)據(jù)來(lái)源于武漢二手房房產(chǎn)網(wǎng)(https://wuhan.anjuke.com/sale/),首次獲取信息777條,半個(gè)月后,又采集了545條記錄,經(jīng)檢查兩批數(shù)據(jù)沒(méi)有重復(fù),共獲取二手房最新信息1322條,涉及1126個(gè)不同的中介聯(lián)系人.由中介所及二手房的地域分布看,樣本具有很好的代表性.這些信息是文本結(jié)構(gòu),需要進(jìn)行復(fù)雜的處理.首先依據(jù)“業(yè)主心態(tài)”,“小區(qū)配套”等語(yǔ)句描述,選擇最能反映房屋周邊環(huán)境的字符建立關(guān)鍵詞詞庫(kù)(表1),提取關(guān)鍵詞.
關(guān)鍵詞主要選擇是:所在區(qū)、所在區(qū)類別(中心城區(qū)、郊區(qū)、國(guó)家級(jí)開(kāi)發(fā)區(qū))、房齡、房屋類型、建筑面積平方米、房屋朝向、所在樓層層次、裝修程度、房屋戶型(室廳)、周邊商業(yè)金融、周邊休閑場(chǎng)所、周邊地鐵、周邊公交車、基礎(chǔ)教育設(shè)施、高等教育設(shè)施、生活配套設(shè)施、房?jī)r(jià)(元/平方米)、房?jī)r(jià)等級(jí).
針對(duì)研究個(gè)體設(shè)置了不同的虛擬變量.如果一個(gè)研究個(gè)體具備某個(gè)屬性,則賦予它的虛擬變量值1,否則賦值為0.對(duì)房屋周邊環(huán)境,以是否具備關(guān)鍵詞庫(kù)的分條目之一為屬性設(shè)置了13個(gè)虛擬變量:中心城區(qū)否、普通住宅否、低樓層否、毛坯房否、小區(qū)配套設(shè)施、生活配套設(shè)施、周邊醫(yī)院、周邊商業(yè)金融、周邊休閑場(chǎng)所、周邊地鐵、周邊公交車、基礎(chǔ)教育設(shè)施、高等教育設(shè)施.
對(duì)其他變量水平的編碼.
房屋戶型:1室0廳、1室1廳=1,1室2廳=1.5,2室1廳=2,2室2廳=2.5,3室1廳=3,3室2廳、3室3廳=3.5,4室1廳、4室2廳=4,4室3廳=4.5,5室2廳=5,6室2廳=6,6室3廳、6室4廳=6.5.
房屋類型:普通住宅、其它=1,公寓=2,別墅=3.裝修等級(jí):毛坯、簡(jiǎn)單裝修 =1,精裝修 =2,豪華裝修 =3.
房屋朝向:東北、西南=1.5,東西=1,東南、西北=2.5,南北=2.
樓層類別:低層=1,中層=2,高層=3.
二手房?jī)r(jià)等級(jí):1萬(wàn)以下=1,[1萬(wàn), 1.5萬(wàn))=2,[1.5萬(wàn),2萬(wàn))=3,[2萬(wàn),2.5萬(wàn))=4,[2.5萬(wàn),3萬(wàn))=5,3萬(wàn)及以上=6.3房屋價(jià)格分布及特征數(shù)
武漢市二手房?jī)r(jià)格(元/平方米)、首付房款(萬(wàn)元)的分布極其復(fù)雜,見(jiàn)圖1.
房?jī)r(jià)頻率直方圖與首付額頻率直方圖均呈明顯的非對(duì)稱性,多峰態(tài).JarqueBera檢驗(yàn)也證實(shí),二手房?jī)r(jià)序列、二手房首付房款序列及它們的自然對(duì)數(shù)序列、平方根的自然對(duì)數(shù)序列等均不服從正態(tài)分布,因此通過(guò)某個(gè)數(shù)據(jù)變換建立統(tǒng)一的回歸模型非常困難.
不同房屋類型(普通住宅、公寓、別墅),不同裝修程度(毛坯、精裝修、豪華裝修)之間的房屋均價(jià)的差異是顯然的.進(jìn)一步通過(guò)單因素方差分析可得以下結(jié)論.
總體看,各區(qū)平均房?jī)r(jià)16026.68元,其中武昌區(qū)二手房的均價(jià)最高.區(qū)域間的房?jī)r(jià)均值有顯著性差異.但是江岸、江漢之間,青山、洪山、硚口、漢陽(yáng)之間的差異不顯著.
從房屋朝向看,不同朝向間房?jī)r(jià)均值差異顯著.東北、西南方向均價(jià)最高,南北方向均價(jià)最低.
從樓層看,低、中、高層的房?jī)r(jià)(元/平方米)均值依次為17095.28,15681.09和15665.42.中、低層間均價(jià)差異不大,但是與高層均價(jià)的差異顯著.
不同房屋戶型的平均房?jī)r(jià)(元/平方米)有顯著性差異,但是1室0廳、1室2廳、1室1廳之間,2室1廳、3室2廳、3室1廳、4室2廳、2室2廳之間差異不大.從標(biāo)準(zhǔn)差看,1室0廳、1室1廳,3室1廳的波動(dòng)性最大,2室1廳波動(dòng)性最小.
4 新線性回歸模型
當(dāng)分類因素較多、有協(xié)變量、各因子水平組合之下試驗(yàn)次數(shù)不等時(shí),使用方差分析模型不方便.這里提出一種新線性回歸模型,它把包含某些變量的回歸平方和與不包含這些變量的回歸平方和之差,視為這些變量的“偏”回歸平方和,把方差分析中的因子平方和變成各個(gè)效應(yīng)所對(duì)應(yīng)的回歸變量的“偏”回歸平方和.
考察各個(gè)二手房首付額預(yù)測(cè)值與實(shí)際值的偏差(殘差),可知對(duì)漢南、新洲區(qū)的預(yù)測(cè)效果最好,其平均絕對(duì)誤差2.41992萬(wàn)元,最小絕對(duì)誤差0.074750萬(wàn)元.對(duì)青山、洪山、硚口、漢陽(yáng)區(qū)的預(yù)測(cè)效果稍差,其平均絕對(duì)誤差6.47490萬(wàn)元,最小絕對(duì)誤差0.03553萬(wàn)元.
7 二手房?jī)r(jià)預(yù)測(cè)
預(yù)測(cè)了首付額,如能再確定首付比例,就能預(yù)測(cè)房?jī)r(jià)總額,再除以建筑面積就是二手房?jī)r(jià).考察全部1321戶二手房的首付比例(見(jiàn)圖3).
首付比例最小值0.298834251,最大值0.300218933,首付比例波動(dòng)性很小,由此可以認(rèn)為武漢市二手房市場(chǎng)的首付比例是30%.說(shuō)明武漢市二手房交易市場(chǎng)采用了國(guó)辦發(fā)[2006]37號(hào)文件規(guī)定的下限:個(gè)人住房按揭貸款首付款比例不得低于30%.
把用模型預(yù)測(cè)得到的首付額乘以10/3就是二手房?jī)r(jià)總額的預(yù)測(cè)值,再除以該二手房的建筑面積就是該二手房的單位面積價(jià)格.例如,對(duì)武昌、江岸、江漢區(qū),二手房的單位面積價(jià)格的預(yù)測(cè)模型是:
二手房?jī)r(jià)(萬(wàn)/平方米)=1.521+(6.044 房屋朝向-0.334 房齡) /建筑面積(平方米),(15)
8 結(jié) 論
享樂(lè)定價(jià)模型(Hedonic模型)被廣泛應(yīng)用于房地產(chǎn)的定價(jià).依據(jù)享樂(lè)定價(jià)模型的原理,價(jià)格是由在售商品的內(nèi)在特征與外部影響因素決定的.新線性模型對(duì)影響二手房?jī)r(jià)的因素分析印證了這個(gè)原理.對(duì)影響二手房?jī)r(jià)的因素重要性分析顯示,二手房所在區(qū)位、裝修程度、房屋已使用年限及房屋類型是交易雙方最看重的因素,而建筑面積、交通便捷性、高等教育與基礎(chǔ)教育環(huán)境并不受到特別關(guān)注.有些現(xiàn)象是大城市二手房?jī)r(jià)的共性,有些是武漢市二手房?jī)r(jià)的個(gè)性.建筑面積沒(méi)有排在前面重要因素里,但是在首付額預(yù)測(cè)模型里仍舊是重要的預(yù)測(cè)因子.對(duì)于武漢市而言,現(xiàn)有地鐵14條線路,主城區(qū)里平均步行500米即可到達(dá)一座地鐵站.有550余條公交線路及1條快速公交線路(BRT),四通八達(dá)的公交設(shè)施非常方便市民出行.武漢市有高等院校82所,在校大學(xué)生100多萬(wàn),居住區(qū)散布武漢各行政區(qū).武漢社區(qū)醫(yī)療服務(wù)體系較完善, 多達(dá)302家醫(yī)院與36家社區(qū)衛(wèi)生服務(wù)中心合理地分布在武漢市各行政區(qū).這些使得交通、教育、醫(yī)療保健對(duì)二手房?jī)r(jià)的影響力逐步減弱.
享樂(lè)定價(jià)模型只用于確定環(huán)境或生態(tài)系統(tǒng)因素對(duì)商品(通常是房屋)價(jià)格的影響程度,只能捕捉消費(fèi)者在感知房屋環(huán)境差異及其帶來(lái)的后果后付費(fèi)的意愿.相比之下,按二手房所在行政區(qū)域建立的分段回歸模型能精準(zhǔn)地預(yù)測(cè)二手房個(gè)戶交易價(jià)格.享樂(lè)定價(jià)模型能夠估計(jì)房地產(chǎn)價(jià)值的前提是必須具有現(xiàn)成的、準(zhǔn)確的數(shù)據(jù),同樣的,雖然武漢市二手房?jī)r(jià)預(yù)測(cè)模型在統(tǒng)計(jì)意義上是優(yōu)良的,但是仍有改進(jìn)余地.只要獲得“當(dāng)年住房購(gòu)買總額”、“周邊新房均價(jià)”等相關(guān)變量的觀測(cè)數(shù)據(jù),把它們加入到研究的模型中,預(yù)測(cè)的精度就會(huì)提高.二手房中介費(fèi)是否被加在房?jī)r(jià)里,也是一個(gè)不可觀測(cè)的變量.這些關(guān)鍵信息數(shù)據(jù)很難獲得,是研究進(jìn)一步完善二手房交易價(jià)格模型的困難所在.
對(duì)二手房?jī)r(jià),如果不需要精確的數(shù)字,只粗略了解二手房?jī)r(jià)的價(jià)位等級(jí),也可以使用推理規(guī)則.一個(gè)推理規(guī)則的基本形式是 (規(guī)則前件-規(guī)則后件),其置信度定義為規(guī)則后件發(fā)生的條件下規(guī)則前件發(fā)生的概率.把影響二手房?jī)r(jià)的全部因素納入推理是很復(fù)雜的,而且也缺乏置信度.為此,依據(jù)第3節(jié)變量重要度的分析結(jié)果,只提取最重要的前四個(gè)因素,利用樹(shù)圖歸納建立推理規(guī)則(模型).為此,先把第一批采集的777個(gè)樣品集隨機(jī)分割為85%與15%兩部分,分別用于訓(xùn)練模型與測(cè)試模型性能表現(xiàn).舍棄一些置信度較小的信息樣品,最后獲得置信度超過(guò)65%的推理規(guī)則12條,例如:
1)如果 所在區(qū) = 新洲或漢南,則二手房?jī)r(jià)在1萬(wàn)以下.
2)如果 5年<房齡 <= 9年 且 裝修程度 = 毛坯,則二手房?jī)r(jià)在 1萬(wàn)~1.5萬(wàn)之間.
3)如果 所在區(qū) = 硚口 且 房齡 > 4年,則二手房?jī)r(jià)在 1.5萬(wàn)~2萬(wàn)之間.
4)如果 所在區(qū) = 洪山 且 房齡 <= 2年 且 裝修程度 = 精裝,則二手房?jī)r(jià)在2萬(wàn)~2.5萬(wàn)之間.
為了檢驗(yàn)推理規(guī)則(模型)的表現(xiàn),再把它應(yīng)用于第二批采集數(shù)的545條記錄,預(yù)測(cè)正確率為53.26%,表明推理規(guī)則還需改進(jìn),關(guān)鍵在于找到一個(gè)對(duì)二手房?jī)r(jià)等級(jí)較為合適的劃分.
參考文獻(xiàn)
[1] EMAWATI M K, HASNANYWATI H, ATACYA O. Factors Influencing the Housing Price:DevelopersPerspective[J].International Scholarly and Scientific Research & Innovation, 2016,10(5):1676-1682.
[2] GAO L Z, KWONG W, CHAU.Determinants and Sustainability of House Prices: Thee Case of Shanghai, China [J].Sustainability,2015,7(4):4524-4548.
[3] 許浩.合肥市二手房市場(chǎng)價(jià)格研究[D].蕪湖:安徽師范大學(xué)數(shù)學(xué)與統(tǒng)計(jì)學(xué)院,2017.
[4] 郭倩蓉,張敏鋒.我國(guó)一二三線城市房?jī)r(jià)與地價(jià)關(guān)系的實(shí)證研究[J].閩南師范大學(xué)學(xué)報(bào):自然科學(xué)版,2017,(2):109-114.
[5] 鄭永坤,劉春.基于ARIMA模型的二手房?jī)r(jià)格預(yù)測(cè)[J].計(jì)算機(jī)與現(xiàn)代化,2018,0(4):122-126.
[6] 董倩,孫娜娜,李偉.基于網(wǎng)絡(luò)搜索數(shù)據(jù)的房地產(chǎn)價(jià)格預(yù)測(cè)[J].統(tǒng)計(jì)研究,2014,31(10):81-87.
[7] 陳懷東.基于COPULA及LPPL模型對(duì)北京二手房及租賃價(jià)格的研究[J].中國(guó)經(jīng)貿(mào)導(dǎo)刊,2017,(8):46-51.
[8] 劉越. 天津市二手房銷售價(jià)格指數(shù)走勢(shì)分析及預(yù)測(cè)[D].天津:天津商業(yè)大學(xué)理學(xué)院,2017.