鄧沛能
[摘 要] 住房是城市一切活動不可缺少的基本要素,住房價格則是住房市場資源有效配置的中心環(huán)節(jié),研究住房價格的影響因素具有十分重要的意義。目前對武漢地區(qū)的研究和直接獲取的住房成交資料所含信息較少,難以滿足研究的需要。基于此,通過Python網(wǎng)絡(luò)爬蟲技術(shù)解決數(shù)據(jù)獲取的難題。在對住房價格影響因素實證研究時,考慮到傳統(tǒng)OLS估計結(jié)果是有偏的,分別構(gòu)建空間滯后模型和空間誤差模型。最終對武漢洪山區(qū)二手房市場的實證研究表明,空間滯后模型擬合效果更好;中南路-武珞路商務(wù)中心、徐東商務(wù)中心和光谷商務(wù)中心對二手房價格有輻射效應(yīng),距離越近房價越貴。
[關(guān)鍵詞] Python網(wǎng)絡(luò)爬蟲;特征價格模型;住宅特征;空間計量模型
[中圖分類號] F293 [文獻標識碼] A [文章編號] 1009-6043(2018)08-0050-03
一、文獻綜述
最早把特征價格理論應(yīng)用到住宅市場分析的學者是Ridker(1967),分析了空氣污染對于住宅價格的影響。隨后,Lancaster(1966,1971)、Rosen(1974)分別從消費者理論,市場均衡理論完善了特征價格理論,奠定了特征價格分析方法的理論基礎(chǔ),在研究中研究者都把住宅的屬性分解為三類:建筑特征,鄰里特征,區(qū)位特征;變量的選擇雖大致相同,但都結(jié)合了研究對象的實際情況選取了具有區(qū)域特點的變量。
在19世紀80年代之后,世界各地的學者應(yīng)用特征價格模型對各地區(qū)住宅價格進行了評估。國內(nèi)相關(guān)研究主要集中發(fā)達地區(qū),如溫海珍(2003)、張鑫(2008)研究杭州西湖區(qū)的二手房,王旭育(2006)研究上海的住宅市場,羅洲軍(2012)研究西安二手房市場,李志輝(2008)、楊波(2009)研究武漢二手房市場,這些研究都是從構(gòu)建的特征價格模型中得到各特征屬性的隱含價格。隨著HPM模型的應(yīng)用逐漸成熟,一些學者開始研究單一因素對住房價格產(chǎn)生的偏效應(yīng)。如,王雪、吳連喜(2016)以南昌市地鐵一號線對例,研究南昌市地鐵一號線對沿線二手房價格的影響。Haizhen Wen等(2017)以杭州為例,定量評估城市義務(wù)教育質(zhì)量對房價的影響。Celine Grislain-Letremy等(2014)以法國三所城市為對象,研究危險的工業(yè)設(shè)施對于房價的影響。這些研究十分具有現(xiàn)實意義,為特征價格研究開啟了新的視角,特征價格模型有了廣泛的應(yīng)用,邁向成熟階段。
在實證研究過程中,有研究者指出即使考慮了區(qū)位特征變量,特征價格模型也會導(dǎo)致有偏的估計結(jié)果,這是因為住宅價格是一種空間數(shù)據(jù)存在空間自相關(guān),住宅區(qū)位不同,價格往往差異很大。(溫海珍等,2011)傳統(tǒng)HPM模型的不足是它忽略了住宅的空間固定性,假定住宅價格在空間分布上具有相互獨立性(Anselin,1988);然而空間計量模型卻能夠反映住房價格數(shù)據(jù)存在的依賴性、異質(zhì)性,所以許多學者開始考慮用空間計量技術(shù)來改善HPM模型,使HPM模型能夠更好的應(yīng)用于房地產(chǎn)價格的研究中。如,施雅娟(2013)研究杭州住宅價格,發(fā)現(xiàn)普通住宅特征價格模型忽略了住宅價格及其特征的空間效應(yīng),并從空間計量的角度,運用空間Durbin模型(SDM)對城市住宅的特征價格進行研究,揭示了住宅特征價格的空間效應(yīng)。柳熊赳(2015)對昆明市27個住宅小區(qū)2014年的商品房交易數(shù)據(jù)進行分析,運用了傳統(tǒng)的HPM、SEM和SLM模型進行對比分析,實證結(jié)果表明昆明市住宅小區(qū)的商品房價格存在空間相關(guān)性,這些研究都表明住宅價格確實是一種空間數(shù)據(jù),運用空間計量模型更好。
二、特征價格模型的建立
(一)傳統(tǒng)特征價格模型
特征價格模型(Hedonic Price Model)表明,住房是一種復(fù)合商品,住房價值取決于其各種屬性的價值。消費者購買住房是為了獲得住房的各種屬性,從而實現(xiàn)效用最大化。它將住房屬性分成三個方面的特征:建筑特征、區(qū)位特征以及鄰里特征。住宅的價值是由其特征屬性的價值決定的P=f(z1,z2,z3)——其中,分別表示建筑特征、區(qū)位特征和鄰里特征。
(二)特征變量選取及量化
參考國內(nèi)外研究人員對住房特征價格的研究成果,并結(jié)合本地區(qū)的實際情況,共選擇了13個特征變量。其中有6個定性變量,樓層(底層、中層、高層),裝修程度(毛坯、簡裝修、中裝修、精裝修、豪華裝修),生活配套、文體配套、地鐵站、公交站。對這些定性變量的基礎(chǔ)數(shù)據(jù)需要進行量化。
(三)基于空間計量的特征價格模型
建立多元線性模型運用OLS方法估計就可以從回歸系數(shù)中得到特征屬性的偏效應(yīng)?,F(xiàn)有研究表明對數(shù)模型的擬合效果更好,對連續(xù)變量均取對數(shù)。但是,由于住宅在空間上具有固定性,故其價格是一種空間數(shù)據(jù),表現(xiàn)出空間自相關(guān)和空間異質(zhì)性(Anselin),空間自相關(guān)指的是住宅價格的鄰里效應(yīng),是不同地理空間上同一屬性的觀測值之間的相互關(guān)聯(lián);而空間異質(zhì)性指的是住宅價格數(shù)據(jù)的結(jié)構(gòu)效應(yīng),是不同空間位置的住宅價格存在系統(tǒng)性差異,導(dǎo)致誤差項具有異方差。
模型一和模型二分別是空間滯后模型和空間誤差模型,空間滯后模型相對于基礎(chǔ)模型加入了空間滯后項,為空間相關(guān)系數(shù),表示相鄰區(qū)域之間的相關(guān)性;空間誤差模型則主要假定誤差項之間存在空間自相關(guān)。其中是空間權(quán)重矩陣,權(quán)重矩陣的構(gòu)造方法有0-1空間權(quán)重矩陣、K-最近點權(quán)重矩陣、閾值權(quán)重矩陣等(王紅亮,蔡之兵,梁洪運)??紤]到容易通過距離判斷各樣本之間是否相鄰,選擇基于樣本地理距離的閾值權(quán)重矩陣:同一小區(qū)的住房之間的距離記為0;當樣本之間的距離小于時,則認為相鄰記為1,否則為0。在經(jīng)過多次測算之后,取閾值為700m。
三、實證分析
(一)數(shù)據(jù)來源
現(xiàn)有住房價格研究中,數(shù)據(jù)難以獲取的兩個原因:一是住房成交價格屬于中介及開發(fā)商的商業(yè)秘密;二是從政府部門得到的成交資料所包含的信息不足。這對相關(guān)研究的深入產(chǎn)生了障礙。已有研究表明掛盤價格和實際成交價格存在比較穩(wěn)定的關(guān)系(溫海珍,2004;李志輝,2008)。
與此同時,隨著互聯(lián)網(wǎng)的發(fā)展,越來越多的信息可以從網(wǎng)絡(luò)上獲得。如果能利用各大房地產(chǎn)家居網(wǎng)絡(luò)平臺發(fā)布的掛牌信息,從中獲取數(shù)據(jù),住房價格研究中的數(shù)據(jù)難題就能夠解決。鑒于此,把Python爬蟲技術(shù)用于數(shù)據(jù)獲取、把百度地圖WebAPI服務(wù)用于獲取樣本經(jīng)緯度坐標、把Pandas數(shù)據(jù)分析技術(shù)用于各類數(shù)據(jù)整合和計算,從而形成將計算機技術(shù)與地理學、經(jīng)濟學相結(jié)合的跨學科解決方案(見下圖)?;诒狙芯總?cè)重于方法論,所以只以武漢洪山區(qū)的二手房數(shù)據(jù)為例進行實證分析。雖然掛牌價格與最終的成交價格存在區(qū)別,但同時具有比較穩(wěn)定的關(guān)系,做近似處理用掛盤價格代替成交價格。
原始數(shù)據(jù)經(jīng)過數(shù)據(jù)的清理、量化、合并均在Python中實現(xiàn),最后在剔除異常值后篩選出1510個二手房樣本的實證數(shù)據(jù),各變量的描述統(tǒng)計見表1。
(二)基于空間計量的特征價格模型分析結(jié)果
對于空間計量的估計方法有最大似然法、準最大似然法、工具變量法等,用PaulElhorst編寫的程序在Matlab軟件中進行估計,估計結(jié)果及相關(guān)檢驗見表2。
在空間效應(yīng)檢驗中(見表2),MoransI為0.1126,并且在1%的水平是顯著的,說明住房價格之間存在顯著的空間效應(yīng),檢驗通過可以建立空間計量模型(溫海珍,2011)。住宅的空間分布并不是完全隨機的,表現(xiàn)出一定的空間相關(guān)性。LM-Error、LM-Lag統(tǒng)計量分別是247.725,109.711,都在1%的水平顯著,與MoransI檢驗結(jié)果相一致,說明確實存在空間效應(yīng),傳統(tǒng)模型由于沒有考慮空間相關(guān),結(jié)果是有偏的。
基本模型的擬合優(yōu)度為91.08%,回歸方程能夠解釋91.08%的房價的變動。樓層、文體配套、自然環(huán)境、到中南路-武珞路商業(yè)中心的距離這4個變量在10%的顯著性水平下不顯著;教育配套、公交站個數(shù)的符號與預(yù)期相反;其余變量均與預(yù)期符號一致。對比空間計量模型,空間計量模型的Log_L值(對數(shù)似然函數(shù))更大,AIC和BIC值更小,空間模型比基本模型更優(yōu),擬合效果更好。并且,SLM模型的Log_L值更大,AIC、BIC值更小,LR值更加顯著,所以SLM模型更加適宜。針對SLM模型可以得出以下結(jié)果:
1.洪山區(qū)住房價格之間不僅存在著較強的鄰里效應(yīng),也存在一定的空間異質(zhì)性。SLM模型ρ=0.9257且在1%的水平上顯著,表明住宅價格在一定空間距離之內(nèi)存在很強的空間依賴性。
2.在顯著的變量中,對房價影響最大的特征變量是:建筑面積、離CBD的距離。除了公交車站個數(shù)的系數(shù)是-0.0096之外,其余變量符號都與預(yù)期一致。這種現(xiàn)象在以前有關(guān)的研究中也有出現(xiàn)(Wen,2017),其原因可能是:隨著公交線路的增加可能會對周邊小區(qū)產(chǎn)生負的效應(yīng),比如噪音污染和環(huán)境污染。很多人更喜歡駕駛私家車出行,對公交的依賴度低。離CBD距離的3個變量對二手房價格的影響是不同的,共同的特點是它們的符號都是負的,表明在其他條件不變的情況下,離CBD越近,住房的價格就越貴。
3.在10%水平下都不顯著的變量有:綠化率、教育配套、自然環(huán)境、到中南路—武珞路CBD距離。分析造成這一結(jié)果的原因可能是:洪山區(qū)住宅小區(qū)的綠化、教育資源豐富,小區(qū)周邊大都配有幼兒園、小學和中學,從數(shù)據(jù)上看綠化率和教育配套得分變化幅度也不大,均值分別是0.3575和2.4755,標準差只有0.0428和0.8304,故也可能數(shù)據(jù)過于集中導(dǎo)致的不顯著。到中南路-武珞路CBD距離對房價影響不顯著,是與徐東CBD距離存在相關(guān)性,相關(guān)系數(shù)高達0.9483,存在共線性。
4.對價格彈性分析,對數(shù)模型中的連續(xù)變量如住房面積,距中南路-武珞路商業(yè)中心、徐東商務(wù)中心和光谷商務(wù)中心的距離,這些變量的系數(shù)通過公式轉(zhuǎn)換,得到價格彈性系數(shù)。在其他條件不變的情況下,建筑面積每增加1%,二手房總價增加1.07%;樓層每高一個檔次,二手房總價減少0.008%;裝修每上升一個檔次,二手房總價增加0.025%。其他彈性同理可得。
四、結(jié)語
在特征價格理論的基礎(chǔ)上,通過應(yīng)用計算機技術(shù)、實現(xiàn)了在數(shù)據(jù)收集上的創(chuàng)新。考慮到住宅價格之間存在著空間自相關(guān)和空間異質(zhì)性,傳統(tǒng)的特征價格模型在進行OLS估計雖簡單易于實現(xiàn),但忽略了住宅價格的空間效應(yīng),基于這樣的矛盾構(gòu)建空間滯后模型、空間誤差模型,使模型更具有解釋力度。實證結(jié)果表明洪山區(qū)二手房價存在空間效應(yīng),并且在空間計量模型中SLM模型更適合特征價格分析。
綜上所述,得出如下結(jié)論:第一,與傳統(tǒng)特征價格模型相比,SLM模型能更好解釋各因素對住房價格影響。第二,在影響住房價格的7個鄰里特征中,并不是所有因素都對房價有顯著影響。第三,其他條件不變的情況下,距離CBD越近,住房的價格會越高。
[參考文獻]
[1]Waugh F.V. Quality factors influencing vegetable prices[J].Journal of Farm Economics,1928, (10): 185-196.
[2]Court A.T. Hedonic Price Indexes with Automotive Examples[J].In The Dynamics of Automobile Demand,1939.
[3]Ridker R.G.-&-Henning-J.A.The determinants of residential property values with special reference to air pollution[J]. The Review of Economics and Statistics, 1967(49): 246-257.
[4]Rosen S. Hedonic prices and implicit markets: Product differentiation in pure competition[J]. Journal of Political Economy, 1974, 82(1): 35-55.
[5]Lancaster,Kelvin J. Consumer Demand:A New Approach[M]. New York City: Columbia University press, 1971.
[6]Lancaster K.J. A new approach to consumer theory[J]. Jounal of Political Economy,1966(74): 132-157.
[7]溫海珍.城市住宅的特征價格:理論分析與實證研究[D].浙江:浙江大學,2004.
[8]張鑫.基于特征價格的二手房價格評估方法研究[D].浙江:浙江大學,2007.
[9]王旭育.基于Hedonic模型的上海住宅特征價格研究[D].上海:同濟大學,2006.
[10]羅洲軍.多方機制下的西安二手房市場特征價格研究[D].西安:西安建筑科技大學,2012.
[11]李志輝.基于Hedonic模型的武漢住宅特征價格研究[D].武漢:華中農(nóng)業(yè)大學,2008.
[12]楊波.基于Hedonic模型的武漢市住宅二級市場特征價格研究[D].武漢:華中農(nóng)業(yè)大學,2009.
[13]王雪,吳連喜.軌道交通對城市二手房價格的影響——以南昌市地鐵一號線為例[J].江西科學,2016(5):722-727.
[14]Haizhen Wen,Yue Xiao,Ling Zhang. School district,education quality,and housing price: Evidence from a natural experiment in Hangzhou, China[J].Cities, 2017(66):72-80.
[15]C.Grislain-Letremy, A.Katossky. The impact of hazardous industrial facilities on housing prices: A comparison of parametric and semiparametric hedonic price models[J].Regional Science and Urban Economics, 2014(49):93-107.
[16]溫海珍,張之禮,張凌.基于空間計量模型的住宅價格空間效應(yīng)實證分析:以杭州市為例[J].系統(tǒng)工程理論與實踐,2011(9):1661-1667.
[17]Anselin L.Spatial Econometrics: Methods and models[J].Economic Geography,1988, 65(2):160.
[18]施雅娟.基于空間Durbin模型的城市住宅特征價格研究[D].浙江:浙江大學,2013.
[19]柳雄赳.基于空間計量模型的昆明市住房特征價格研究[D].昆明:云南財經(jīng)大學,2015.
[20]王紅亮,胡偉平,吳馳.空間權(quán)重矩陣對空間自相關(guān)的影響分析——以湖南省城鄉(xiāng)收入差距為例[J].華南師范大學學報(自然科學版),2010(1):110-115.
[21]蔡之兵,周儉初.財政支出結(jié)構(gòu),空間溢出與經(jīng)濟增長——來自四種空間權(quán)重矩陣的證據(jù)[C].中國區(qū)域經(jīng)濟,2012.
[22]梁洪運,周其龍,孫亞林.空間權(quán)重矩陣對空間自相關(guān)影響分析[J].科技資訊,2013(9):141-143,181.
[23]黎珍惜,黎家勛.基于經(jīng)緯度快速計算兩點間距離及測量誤差[J].測繪與空間地理信息,2013(11):235-237.
[責任編輯:高萌]