□文/楊凱博
(東北林業(yè)大學(xué) 黑龍江·哈爾濱)
[提要] 在房產(chǎn)稅稅基評(píng)估新要求下,房地產(chǎn)評(píng)估行業(yè)對(duì)于二手房?jī)r(jià)格評(píng)估有了更高的要求。本文基于特征價(jià)格理論,選取哈爾濱市主城區(qū)六區(qū)的13,694條二手房成交數(shù)據(jù)建立地理加權(quán)回歸模型。結(jié)果顯示:擬合優(yōu)度R2為0.595,模型擬合良好,在保證評(píng)估精確度的同時(shí),為二手房稅基評(píng)估提供新思路。
房地產(chǎn)批量評(píng)估一直以來(lái)都廣泛受到資產(chǎn)評(píng)估界的關(guān)注。與傳統(tǒng)針對(duì)個(gè)案使用成本法、收益法、市場(chǎng)法相比,批量評(píng)估能夠快速、高效地確定房地產(chǎn)價(jià)值,在確定房產(chǎn)稅稅基等領(lǐng)域有著廣泛地用途。
目前,國(guó)外學(xué)者將統(tǒng)計(jì)學(xué)與計(jì)算機(jī)技術(shù)相結(jié)合,研究出CAMA(Computer Assisted Mass Appraisal)、地理信息系統(tǒng) GIS(Geography Information System)、人工神經(jīng)網(wǎng)絡(luò)ANN(Artificial Neural Network)等技術(shù)作為批量評(píng)估方法應(yīng)用于房地產(chǎn)價(jià)格評(píng)估之中。我國(guó)仍處于使用傳統(tǒng)特征價(jià)格模型階段,一般采用基于特征價(jià)格理論的多元線性回歸模型,然而使用傳統(tǒng)OLS進(jìn)行批量估價(jià)會(huì)忽略各個(gè)影響因素在空間上的變化。因此,從空間統(tǒng)計(jì)學(xué)出發(fā)應(yīng)用地理加權(quán)回歸模型,探索更加準(zhǔn)確、公平的評(píng)估方法,有利于提高房地產(chǎn)估價(jià)的科學(xué)性和創(chuàng)新性。
(一)研究區(qū)域與研究數(shù)據(jù)。哈爾濱市共轄18個(gè)縣級(jí)行政區(qū),因其二手房成交量主要存在于主城區(qū),其余行政區(qū)的二手房成交量較小,故選取包括南崗區(qū)、道里區(qū)、香坊區(qū)、道外區(qū)、松北區(qū)、呼蘭區(qū)這六個(gè)主城區(qū)作為研究區(qū)域。哈爾濱主城區(qū)2019年二手房均價(jià)在第1至第44周上漲較為平穩(wěn),從45周開(kāi)始有較大幅度上漲。為避免極端值對(duì)二手房?jī)r(jià)格評(píng)估模型的影響,選取2019年前三季度主城區(qū)六區(qū)的二手房成交數(shù)據(jù),共獲得成交記錄13,694條,涵蓋825個(gè)小區(qū)。
(二)變量選取。特征價(jià)格理論認(rèn)為,房地產(chǎn)的價(jià)格可以分解為不同的特征變量進(jìn)行反映,本文借鑒國(guó)內(nèi)外對(duì)房地產(chǎn)價(jià)格批量評(píng)估的研究文獻(xiàn),結(jié)合哈爾濱市的實(shí)際情況,按照特征價(jià)格理論中的建筑特征、區(qū)位特征和鄰里特征選取容積率、綠化率、物業(yè)費(fèi)、建筑年齡、與最近小學(xué)距離、與最近公園距離、與最近三甲醫(yī)院距離、與最近大型超市距離、最近地鐵站距離、與最近公交站距離等10個(gè)特征變量作為影響哈爾濱市二手房成交價(jià)的空間分異因素。
(三)地理加權(quán)回歸模型的構(gòu)建。地理加權(quán)回歸模型(GWR)是局部模型,主要思想是認(rèn)為回歸系數(shù)根據(jù)地理位置的變化而變化,考慮了數(shù)據(jù)在空間上的非平穩(wěn)性,對(duì)每個(gè)樣本點(diǎn)都設(shè)定了一系列的局部變量回歸系數(shù),樣本點(diǎn)與擬合點(diǎn)間的地理位置間隔越小,權(quán)重越大,能夠探測(cè)參數(shù)在區(qū)間內(nèi)的非平穩(wěn)變化,因此優(yōu)于普通的線性回歸模型。
構(gòu)建完整的地理加權(quán)回歸模型分為三步:
首先是確定地理加權(quán)回歸模型的基本公式:
式中,(ui,vi)為第i個(gè)樣本點(diǎn)的坐標(biāo),xik是第i個(gè)樣本點(diǎn)的第k個(gè)解釋變量,回歸系數(shù)βk(ui,vi)是地理坐標(biāo)(ui,vi)的函數(shù)。殘差 εi~N(0,σ2),不同樣本點(diǎn) i和點(diǎn) j的隨機(jī)誤差相互獨(dú)立,協(xié)方差為0。
其次是空間權(quán)函數(shù)的選擇??臻g權(quán)重矩陣定量反映了地理要素之間的空間關(guān)系,是構(gòu)造地理加權(quán)回歸模型最關(guān)鍵的一步,不恰當(dāng)?shù)倪x擇空間權(quán)函數(shù)將無(wú)法對(duì)參數(shù)進(jìn)行有效估計(jì)。常用的空間權(quán)函數(shù)有以下四種:(1)距離閾值法:選取合適的距離閾值,然后將數(shù)據(jù)點(diǎn)與回歸點(diǎn)之間的距離與閾值進(jìn)行比較,如果二者之間的距離大于該域值,則賦予權(quán)重為0,否則為1。距離閾值法的實(shí)質(zhì)其實(shí)就是劃定一個(gè)判斷范圍,超出范圍的距離點(diǎn)將不被賦予權(quán)重。距離閾值法雖然簡(jiǎn)單,但其缺點(diǎn)為分段函數(shù),因此無(wú)法對(duì)參數(shù)進(jìn)行估計(jì)。(2)距離反比法:在空間地理位置上距離回歸點(diǎn)相近的數(shù)據(jù)點(diǎn)比相遠(yuǎn)的數(shù)據(jù)點(diǎn)對(duì)回歸點(diǎn)的影響更強(qiáng),因此在估計(jì)回歸點(diǎn)的參數(shù)時(shí),應(yīng)對(duì)距離相近的數(shù)據(jù)點(diǎn)賦予更高的權(quán)重。距離反比法采用數(shù)據(jù)點(diǎn)與回歸點(diǎn)距離倒數(shù)的一次方或二次方作為權(quán)重,但是當(dāng)出現(xiàn)回歸點(diǎn)與數(shù)據(jù)點(diǎn)重合時(shí),二者距離為0,回歸點(diǎn)觀測(cè)值權(quán)重將變得無(wú)限大,而刪除數(shù)據(jù)點(diǎn)將降低參數(shù)估計(jì)的精度,因此無(wú)法直接用于地理加權(quán)回歸進(jìn)行參數(shù)估計(jì)。(3)高斯核函數(shù)法:構(gòu)建一個(gè)單調(diào)遞減函數(shù)反映所賦予的權(quán)重與回歸點(diǎn)和數(shù)據(jù)點(diǎn)之間距離兩個(gè)變量之間的關(guān)系。用帶寬描述權(quán)重與距離之間單調(diào)遞減關(guān)系的快慢,帶寬越大,權(quán)重隨距離衰減得越慢,帶寬越小,權(quán)重隨距離衰減得越快。因此,高斯核函數(shù)可以克服上述空間權(quán)函數(shù)為分段函數(shù)的缺點(diǎn),適合作為地理加權(quán)回歸模型的空間權(quán)函數(shù)。(4)截尾型函數(shù)法:實(shí)際估計(jì)中,截去對(duì)回歸參數(shù)沒(méi)有影響的數(shù)據(jù)點(diǎn),使其不參與回歸模型的計(jì)算,并使用有限高斯函數(shù)代替高斯函數(shù),最常用的截尾型函數(shù)為bi-square函數(shù)。bi-square函數(shù)可以視為距離閾值法和高斯核函數(shù)法的結(jié)合,在距離閾值即帶寬范圍以內(nèi)的回歸點(diǎn),通過(guò)有限高斯函數(shù)計(jì)算并賦予數(shù)據(jù)點(diǎn)權(quán)重,在距離閾值即帶寬范圍以外的數(shù)據(jù)點(diǎn),賦予的權(quán)重為0。通常地理加權(quán)回歸模型選取高斯核函數(shù)法或bi-square函數(shù)法作為空間權(quán)函數(shù)進(jìn)行參數(shù)估計(jì)。
最后是帶寬的確定與優(yōu)化。地理加權(quán)回歸模型對(duì)選取高斯核函數(shù)法還是bi-square函數(shù)法作為空間權(quán)函數(shù)并不是非常敏感,但對(duì)其帶寬的確定卻非常敏感。因此,確定并計(jì)算合理的帶寬是保證地理加權(quán)回歸模型參數(shù)估計(jì)無(wú)偏性、有效性的關(guān)鍵,常用的方法有兩種:(1)交叉驗(yàn)證法:應(yīng)用于帶寬確定時(shí),表示對(duì)于回歸參數(shù)進(jìn)行估計(jì)時(shí),將排除回歸點(diǎn)本身,只根據(jù)回歸點(diǎn)附近的數(shù)據(jù)進(jìn)行參數(shù)估計(jì),然后把不同的帶寬和不同交叉驗(yàn)證到的CV值繪制成趨勢(shì)線,當(dāng)CV值為最小時(shí),對(duì)應(yīng)帶寬為最佳帶寬。(2)AIC最小信息準(zhǔn)則:又稱為赤池信息量準(zhǔn)則,建立在信息熵的基礎(chǔ)上,衡量所建立的模型的復(fù)雜程度和模型擬合數(shù)據(jù)能力的優(yōu)良性。當(dāng)模型有大量可供選擇的參數(shù)時(shí),應(yīng)選取AIC值最小的。因?yàn)锳IC值的大小與模型獨(dú)立參數(shù)的個(gè)數(shù)呈反比,模型參數(shù)個(gè)數(shù)越少,AIC值越??;AIC值的大小與模型的極大似然函數(shù)呈正比,模型極大似然函數(shù)越大,AIC值越小。當(dāng)模型參數(shù)較少時(shí),模型較為簡(jiǎn)潔,當(dāng)模型極大似然函數(shù)較大時(shí),模型較為精確。因此,AIC值和評(píng)價(jià)模型擬合優(yōu)度的調(diào)整R2類似,在評(píng)價(jià)模型對(duì)數(shù)據(jù)的擬合能力時(shí)兼顧了簡(jiǎn)潔性和精確性。當(dāng)兩個(gè)模型之間存在較大差異時(shí),體現(xiàn)為兩個(gè)模型的極大似然函數(shù)差別較大;當(dāng)兩個(gè)模型之間不存在顯著差異時(shí),參數(shù)越少的模型擬合能力越好,因此這個(gè)準(zhǔn)則被稱為最小信息準(zhǔn)則。當(dāng)利用AIC準(zhǔn)則確定帶寬時(shí),有利于評(píng)價(jià)地理加權(quán)回歸模型是否比多元線性回歸模更好地?cái)M合數(shù)據(jù)。
(四)結(jié)果分析。地理加權(quán)回歸模型是對(duì)傳統(tǒng)多元線性回歸模型的拓展,因樣本數(shù)據(jù)沒(méi)有過(guò)于離散的點(diǎn),故選取混合高斯函數(shù)作為空間權(quán)函數(shù),擬合優(yōu)度較好的交叉驗(yàn)證(cross-validation,CV)方法作為驗(yàn)證最優(yōu)帶寬方法。利用GWR4.0軟件對(duì)樣本點(diǎn)進(jìn)行回歸分析,模型評(píng)價(jià)采用擬合優(yōu)度R2和比率檢驗(yàn)指標(biāo)進(jìn)行評(píng)估。
根據(jù)回歸模型計(jì)算結(jié)果OLS模型擬合優(yōu)度R2和調(diào)整的R2為0.574和0.568,GWR模型擬合優(yōu)度R2和調(diào)整的R2為0.595和0.587,說(shuō)明地理加權(quán)回歸模型的總體擬合效果較好,解釋變量對(duì)被解釋變量具有一定的解釋能力。
為進(jìn)一步分析二手房?jī)r(jià)格評(píng)估的精確性,引入國(guó)際評(píng)估協(xié)會(huì)(IAAO)對(duì)于房地產(chǎn)價(jià)格評(píng)估模型準(zhǔn)確性與公平性判定的三項(xiàng)指標(biāo):比率中位數(shù)、離散系數(shù)、相關(guān)價(jià)格差異系數(shù)。比率中位數(shù)是將預(yù)測(cè)值與真實(shí)值相除得到的一組比率按升序或降序排列后取其中值的方法;離散系數(shù)是衡量回歸結(jié)果離散程度的相對(duì)統(tǒng)計(jì)量;相關(guān)價(jià)格差異系數(shù)是評(píng)估結(jié)果累進(jìn)性或累退性的統(tǒng)計(jì)指標(biāo)。如表1所示,地理加權(quán)回歸模型的三項(xiàng)評(píng)價(jià)指標(biāo)均符合國(guó)際評(píng)估協(xié)會(huì)制定的標(biāo)準(zhǔn),相較于傳統(tǒng)的多元線性回歸模型,地理加權(quán)回歸模型在評(píng)估的精確性上更優(yōu)。(表1)
表1 OLS模型與GWR模型比率檢驗(yàn)指標(biāo)對(duì)比一覽表
本文結(jié)合特征價(jià)格理論和地理加權(quán)回歸模型對(duì)哈爾濱市二手房?jī)r(jià)格進(jìn)行評(píng)估,一方面GWR模型克服了傳統(tǒng)OLS模型無(wú)法解決的空間非平穩(wěn)性問(wèn)題;另一方面為批量評(píng)估房產(chǎn)稅稅基提供了一種可行的思路。對(duì)于大數(shù)據(jù)下的二手房?jī)r(jià)格批量評(píng)估研究,不僅要提高模型的精度,更要提高模型的運(yùn)算效率。