張琳琳, 黃振生
(南京理工大學 理學院,南京 210094)
近幾年隨著市場經(jīng)濟的不斷發(fā)展壯大,房地產(chǎn)估值數(shù)據(jù)越來越受到重視,探尋房價的影響因素及房價與這些影響因素間的相關(guān)關(guān)系已經(jīng)成為統(tǒng)計學者的研究熱點。很多研究人員對房地產(chǎn)估值數(shù)據(jù)進行了建模分析,Yeh[1]提出了一種創(chuàng)新的房地產(chǎn)估價方法——定量比較法,并通過房地產(chǎn)估值數(shù)據(jù)證明了定量比較方法比兩種經(jīng)典的享樂價格方法(多元回歸分析和神經(jīng)網(wǎng)絡(luò))更準確。同時,利用排序分位數(shù)方法,將房價的影響因素按照重要性從高到低的順序排序為房屋到最近的捷運站的距離、步行圈內(nèi)便利店的數(shù)量、房屋年齡和交易日期;Huang和Lou[2]考慮所觀測到的房屋位置變量(緯度和經(jīng)度)帶有測量誤差,從而利用帶測量誤差的單指標模型研究了房屋位置和房屋價格之間的關(guān)系;Wang[3]對影響房屋價格的因素進行了系統(tǒng)的分析,并針對近些年來的大眾評價模型及方法進行了系統(tǒng)的文獻綜述;Wilhelmsson[4]在傳統(tǒng)的房地產(chǎn)模型中考慮房地產(chǎn)數(shù)據(jù)的空間維度,采用傳統(tǒng)的線性空間自回歸模型解決問題,結(jié)果表明房價數(shù)據(jù)間存在空間自相關(guān),而空間維度的加入解釋了更多的價格變化。
在空間自回歸模型中,部分線性空間自回歸模型不僅保持了非參數(shù)空間自回歸模型的靈活性,而且保持了參數(shù)空間自回歸模型的解釋力,從而在近些年引起了人們的廣泛關(guān)注。Su和Jin[5]首次提出了部分線性空間自回歸模型,并利用一種剖面擬極大似然方法來估計未知函數(shù)m(·)和參數(shù)向量(βT,ρ,σ2)T,然后系統(tǒng)地研究了所得估計量的漸近性質(zhì)。為了考慮誤差項的異方差性,Zhang[6],Zhang和Yang[7]分別針對部分線性空間自回歸模型提出了二元差分估計方法和工具變量估計方法;Li和Mei[8-9]提出了廣義似然比檢驗法來檢驗非參數(shù)部分m(·)是否呈現(xiàn)一些有趣的參數(shù)形式,以及參數(shù)向量(βT,ρ)T是否滿足某些線性約束條件;Wei和Guo[10]提出了一種半?yún)?shù)部分線性變系數(shù)空間自回歸模型,它是標準空間自回歸模型和部分線性空間自回歸模型的推廣。另外,為了估計未知的空間滯后參數(shù)、常數(shù)系數(shù)和系數(shù)函數(shù),提出了一種基于局部線性方法的輪廓擬極大似然方法,為了檢驗空間效應的存在性,提出了一種廣義似然比檢驗統(tǒng)計量,并利用基于殘差的自舉過程導出了檢驗的p值。
目前大多數(shù)對房地產(chǎn)數(shù)據(jù)研究的文獻仍停留在傳統(tǒng)的參數(shù)模型上,但眾所周知,空間因素是影響房價的不可或缺的因素。雖然有一些文獻[4]在模型中考慮空間自相關(guān)性,并基于此對相關(guān)變量給出更合理的參數(shù)解釋,但卻沒有將自變量的非線性影響考慮在內(nèi),而往往解釋變量與因變量的關(guān)系不是線性的,這就產(chǎn)生了一些局限性?;谏鲜隹紤],針對現(xiàn)有的房地產(chǎn)估值模型中不包含空間自相關(guān)性以及非線性影響因素的問題,提出了可以靈活解釋變量意義的部分線性空間自回歸模型來擬合房地產(chǎn)估值數(shù)據(jù),并對擬合結(jié)果給出合理解釋。
房地產(chǎn)估值的市場歷史數(shù)據(jù)集來自臺灣新北市新店區(qū)。數(shù)據(jù)集包含2012-06—2013-05的414個樣本,共6個變量,變量意義見表1,相關(guān)數(shù)據(jù)可見文獻[1]。首先通過繪制變量間的散點圖來判斷房價(Y)與各影響因素(X1,X2,Z)間的相關(guān)關(guān)系,其中經(jīng)度和緯度作為影響房價的位置信息,以空間權(quán)重矩陣的形式包含在模型中。從圖1,圖2,圖3及現(xiàn)實意義中可以看出房價(Y)與房屋到最近的捷運站的距離(X1)和步行生活圈中便利店的數(shù)量(X2)存在線性關(guān)系,而與房屋年齡(Z)存在非線性關(guān)系。為了更進一步挖掘出變量數(shù)據(jù)中的隱含信息,進一步利用部分線性空間自回歸模型對數(shù)據(jù)集進行擬合。
表1 房地產(chǎn)估值數(shù)據(jù)變量
圖1 Y與X1的散點圖
圖2 Y與X2的散點圖
圖3 Y與Z的散點圖
表2 變量間的相關(guān)系數(shù)矩陣
部分線性空間自回歸模型具有形式:
Yn=Xnβ0+m0(Zn)+ρ0WnYn+Un
(1)
(2)
在第二步中,考慮最大化下列似然函數(shù)
(Tn(ρ)Yn-Xnβ-mθ(Zn))
其中mθ(Zn)=(mθ(zn,1),…,mθ(zn,n))T,令Sn=(s(zn,1),…,s(zn,n)),在擬對數(shù)似然函數(shù)中,對于給定的ρ,β的QMLE估計為
σ2的QMLE估計為
采用臺灣新北市新店區(qū)2012-06—2013-05的房地產(chǎn)估值數(shù)據(jù),共有414個樣本,6個變量。利用變量中的經(jīng)度(DLON)和緯度(DLAT)來建立空間權(quán)重矩陣,將數(shù)據(jù)應用于部分線性空間自回歸模型Y=X1β1+X2β2+m(Z)+ρWnY+U中,并對指標變量進行標準化處理。令Wn=(wij),wij=max(1-dij/d0,0),其中dij為歐幾里得距離,選擇閾值距離d0為0.05,并對空間權(quán)重矩陣Wn進行標準化,使其行和為1。此外利用EPANECHNIKOV核函數(shù),通過大拇指法則選取帶寬h=0.317 6進行估計。部分線性空間自回歸模型指標參數(shù)的估計值見表3。
表3 未知參數(shù)估計值
未知函數(shù)的擬合結(jié)果如圖4所示。
圖4 m(Z)的估計
從表3可以看出,單位面積房價(Y)指標之間存在負空間相關(guān)性,房屋到最近的捷運站的距離(X1)與房價(Y)呈負相關(guān)關(guān)系,即離最近的捷運站距離越近,房價越高;而步行生活圈中便利店的數(shù)量(X2)與房價(Y)呈正相關(guān)關(guān)系,便利店數(shù)量越多,房價越高;這與實際意義相符,同時也證明模型具有現(xiàn)實意義。從圖4可以看出房價(Y)與房屋年齡(Z)之間存在非線性關(guān)系,部分線性空間自回歸模型可以較好地擬合房地產(chǎn)估價數(shù)據(jù)。
采用部分線性空間自回歸模型對房地產(chǎn)估值數(shù)據(jù)進行統(tǒng)計研究,與之前文獻研究所不同的是,加入了空間和非線性因素的影響,對于部分線性空間自回歸模型的估計問題,首先利用局部多項式估計法對非參數(shù)部分進行估計,從而得到含參數(shù)形式的非參函數(shù)估計,再將此估計表達式代入對數(shù)似然函數(shù)中,通過極小化對數(shù)似然函數(shù)得到參數(shù)部分的估計。在房地產(chǎn)估值數(shù)據(jù)的擬合過程中,不同于之前文獻中計算空間相關(guān)矩陣的方法,利用經(jīng)度、緯度計算房屋之間的歐幾里得距離,從而將空間位置因素以空間相關(guān)矩陣的形式引入模型中。結(jié)果表明,房價數(shù)據(jù)之間存在著空間相關(guān)性,房屋到最近的捷運站的距離與房價呈負相關(guān)關(guān)系,而步行生活圈中便利店的數(shù)量與房價呈正相關(guān)關(guān)系,這與現(xiàn)實意義上的解釋是相通的。另外房屋年齡與房價之間的非線性關(guān)系也被體現(xiàn)出來。部分線性空間自回歸模型能更加客觀和靈活地解釋房地產(chǎn)估值數(shù)據(jù)的現(xiàn)實意義。