葉 健,胡 鑫,徐鴻蒙,陳 曦,呂 琦
西南交通大學地球科學與環(huán)境工程學院,四川 成都 611756
空間位置和時間是城市住宅價格時空變化建模中的決定因素[1]。文獻[2]認為“尺度可能是地理信息科學中最重要的課題”;文獻[3]同樣認為,“尺度幾乎是所有地理調(diào)查的內(nèi)在因素”,因此,尺度問題是住宅價格時空關系建模中不得不考慮的問題。
由于地理加權回歸(geographically weighted regression,GWR)方法可通過建立空間范圍內(nèi)每個點處的局部回歸方程,來探索研究對象在某一尺度下響應變量和一組協(xié)變量之間關系,近年來在住宅價格驅動因素建模分析方面受到廣泛關注[4]。然而,從住宅價格建模的角度來看,市場趨勢、通貨膨脹等時間效應的作用對于住宅價格的影響不可忽略。文獻[1]將時間維融入GWR技術,提出了時空地理加權回歸(geographically and temporally weighted regression,GTWR)分析技術并應用到住宅價格時空關系建模中。近年來,GTWR一直被不斷地創(chuàng)新和演化[5],時空地理加權自回歸模型[6]和基于局部多項式[7]求解的GTWR等分析方法相繼被提出。
尺度的概念是地理學中的一個重要問題[2,8],空間和時空現(xiàn)象本質上受尺度效應的影響[9],空間上可分為全局尺度與局部尺度,時間上可分為長期尺度與短期尺度?;旌螱WR(mixed GWR)[10-11]將模型參數(shù)分為全局和局部兩種尺度特征,利用后向迭代算法對模型進行估計。盡管混合GWR能夠對GWR模型參數(shù)估計尺度進行差異化呈現(xiàn),參與局部估計的參數(shù)對應同樣的尺度特征,區(qū)分仍然相對單一,缺乏對細節(jié)差異的精準呈現(xiàn)[12]。文獻[13]提出了MGWR(multiscale geographically weighted regression),為模型中的每個關系產(chǎn)生單獨的優(yōu)化帶寬,從而指示不同關系如何在不同空間尺度上操作,并產(chǎn)生更精確的局部參數(shù)估計。多尺度GTWR(multiscale geographically and temporally weighted regression)方法的提出[14]不僅考慮了位置和時間而且充分考慮了多尺度在住宅價格時空關系建模中的作用。
空間距離度量方法的不同會對空間分析模型產(chǎn)生重要的影響[15-16]。歐氏距離易于實現(xiàn)常被作為空間距離的度量方法[17],但路網(wǎng)距離[18]在測量空間可達性方面常常被認為更有效[19],因此在計量空間距離時,路網(wǎng)距離通常被認為比歐氏距離更具合理性[20],然而在路網(wǎng)密集的城市地區(qū),歐氏距離仍被認為可代替路網(wǎng)出行距離[21]。由于城市路網(wǎng)密集程度以及模型的穩(wěn)定性仍是多尺度GTWR模型穩(wěn)定發(fā)揮的重要因素,因此多尺度GTWR模型不僅需要歐氏距離檢測,更需要路網(wǎng)距離的進一步檢測。為了完成模型的正確性和通用性的檢測,需檢測在不同空間距離度量方法約束下,多尺度GTWR模型對于城市住宅價格的實際影響作用,以滿足城市住宅價格的實際建模需求。
本文在考慮位置和時間因素的基礎上,將多尺度及其路網(wǎng)距離(非歐氏距離)等因素運用到住宅價格時空關系模型建模中,以路網(wǎng)較為密集的成都市為例,構建多尺度GTWR模型,對比歐氏距離約束和路網(wǎng)距離約束條件下典型POI影響因素對城市住宅價格的實際影響,為城市規(guī)劃提供有價值的分析與判斷,同時也為城市規(guī)劃領域在時空多尺度建模方面提供重要的參考。
為了辨別時空數(shù)據(jù)中的異質性,文獻[1]將GWR模型[22]擴展到GTWR,模型描述為
i=1,2,…,n
(1)
式中,xik是位于位置(ui,vi,ti)的第k個自變量;βk(ui,vi,ti)是位置(ui,vi,ti)處基于單一空間帶寬和時間帶寬的第k個系數(shù);εi是誤差項;yi是因變量。GTWR模型中空間權重的計算采用了時空距離與時空帶寬的概念,例如高斯空間權重函數(shù)在GTWR模型中形式為
(2)
GTWR模型擁有擬合時空異質性的能力,但是GTWR限制了模型內(nèi)的每個局部關系在單一尺度下進行變化。為了解決空間尺度效應問題,本文采用多尺度GTWR模型,將GTWR模型擴展到不同時空尺度,為每一個自變量提供了獨有的時空帶寬。其表達式為
i=1,2,…,n
(3)
式中,xik是位于位置(ui,vi,ti)的第k個自變量;βbwtksk(ui,vi,ti)表示位置(ui,vi,ti)處基于特定空間帶寬bwsk和時間帶寬bwtk的第k個自變量的估計系數(shù);εi是誤差項;yi是因變量。
與單一最優(yōu)帶寬的求解方法有所不同,單一帶寬求解僅需要將所有參數(shù)一起校準,但這樣可能會導致強烈的參數(shù)干擾和沉重的計算負擔[23]。多尺度GTWR模型的實現(xiàn)需要求解各自變量帶寬,后向擬合算法[24]能夠很好地解決這一問題。該算法是一個迭代過程,主要用于擬合廣義可加模型[25],其基本思想是假設所有其他項都已知,用更平滑的方式校準模型中的每個項。其中,多尺度GTWR中的βbwtksk(ui,vi,ti)xik被定義為第k個加法項fk,從而可以將多尺度GTWR模型表示為
(4)
(1) 首先,使用GTWR回歸模型對參數(shù)進行初始化,計算局部參數(shù),以此獲得所有加項fk的初始估計值,并計算殘差ε。
(2) 殘差項ε加上第1項f1的當前值作為新的因變量y,x1作為自變量,使用GTWR回歸,這將為自變量x1選擇出最優(yōu)的時空帶寬bw1,并為該模型生成了新的估計參數(shù)β,以此更新f1的值,并使用更新后的f1計算新的殘差ε。
(3) 同樣,將殘差ε加上f2,在x2上使用GTWR回歸,以生成時空帶寬bw2,并更新f2。直到最后一個加項fm完成更新,以此來完成一次迭代。
(4) 計算COS-CAT,COS-CAT由式(5)可得,根據(jù)COS-CAT的大小決定是否終止迭代,否則跳轉至第2步
(5)
算法:多尺度GTWR后向擬合算法
輸入:帶有時空位置信息的樣本數(shù)據(jù)(y,x1,x2,…,xm)
輸出:多尺度GTWR模型擬合結果,包括模型整體擬合信息R2、AIC值,以及各變量最佳時間、空間帶寬和估計參數(shù)β值等
(1) 利用GTWR模型初始化各加項fk
(2) do
k←1
whilek≤mdo
通過GTWR建立e+fk與xk的回歸關系,計算xk的最佳帶寬
計算AIC和參數(shù)β的值,利用新的估計更新fk的值
k++
end
計算COSCAT的值
while COSCAT<10-5
(3) 輸出擬合結果
多尺度GTWR模型通過后向擬合算法,單獨對每一項自變量帶寬進行校準,為模型中的每個自變量與因變量的映射關系產(chǎn)生獨有的優(yōu)化時空帶寬,通過迭代不斷地對每一個加項fk進行更新,直到fk的變化程度小到達到迭代標準,以此來較為精確地擬合自變量與因變量間的模型,從而達到縮小殘差的效果,直觀展示不同映射關系如何在不同時空尺度上獲取不同的優(yōu)化時空帶寬。
2.2.1 數(shù)據(jù)準備
模擬試驗的時空布局被設計為10×10×10的規(guī)則立方體,(ui,vi,ti)為樣本點的時空坐標,通過循環(huán)遍歷區(qū)間[0,9]內(nèi)的所有整數(shù)值。根據(jù)式(6)設計了模擬數(shù)據(jù)
yi=β1(ui,vi,ti)+β2(ui,vi,ti)xi2+
β3(ui,vi,ti)xi3+εi
(6)
式中,xi2、xi3的值是從正態(tài)分布N(0,2)中隨機產(chǎn)生的,誤差項εi是從正態(tài)分布N(0,0.2)中產(chǎn)生的。
模擬測試中,不同的自變量擁有不同時空異質性的β參數(shù),參數(shù)表達式為
(7)
2.2.2 模擬結果
本次模擬設計中,獲得了GTWR與多尺度GTWR的最佳帶寬(表1)。從表1可以看出,多尺度GTWR正確地識別了局部參數(shù)變化的3個不同尺度:β1的最佳帶寬比較大,識別了全局這一尺度;而β2和β3的最佳帶寬相對較小,表示更局部的尺度。同時,多尺度GTWR模型的AIC(Akaike information criterion)值與RSS值均小于GTWR模型,R平方值高于GTWR模型,表明多尺度GTWR模型的擬合度優(yōu)于GTWR。
表1 多尺度GTWR模擬測試結果Tab.1 The result of multiscale GTWR simulation test
GTWR和多尺度GTWR復制已知參數(shù)面的能力由系數(shù)βj的均方根誤差(RMSE)來估量,較小的RMSE值表示對已知局部參數(shù)集的更準確復制。如圖1(a)所示,多尺度GTWR比GTWR更精確地擬合了3個參數(shù),尤其是對β1、β2參數(shù)的復制。圖1(b)進一步表明,多尺度GTWR模型參數(shù)面的復制情況優(yōu)于GTWR模型。多尺度GTWR可以較為精確地復制所有3個參數(shù)面,而GTWR在復制β1、β2時出現(xiàn)了明顯的形變。
圖1 GTWR和多尺度GTWR模型β參數(shù)結果對比Fig.1 Comparison of β parameter results between GTWR model and multiscale GTWR model
本文以成都主城區(qū)為主要研究區(qū)域,包括錦江區(qū)、武侯區(qū)、成華區(qū)、金牛區(qū)、青羊區(qū)、高新西區(qū)、高新南區(qū)、龍泉驛區(qū)、新都區(qū)、郫都區(qū)、雙流區(qū)、溫江區(qū)等,研究區(qū)域內(nèi)住宅價格的時空分布格局以及各類影響住宅價格的相關因素。
研究區(qū)域內(nèi)有關住宅價格的數(shù)據(jù)均來自鏈家網(wǎng)(https:∥www.lianjia.com/),以成都市出售的新房或二手房單位面積成交均價作為住宅價格數(shù)據(jù)源,采集2015年至2018年共1641條住宅價格數(shù)據(jù),具體信息如圖2所示。
圖2 住宅價格數(shù)據(jù)統(tǒng)計特征Fig.2 Statistical characteristics of housing price data
各類特征點數(shù)據(jù)由成都市門戶網(wǎng)站獲取,包括公立中小學、公立三甲醫(yī)院、五星級酒店、大型商場、地鐵站點、成都火車站、雙流機場、旅游景點、中心商務區(qū),并隨住宅價格點數(shù)據(jù)一同錄入到ArcMap中。
地理加權回歸分析常采用歐氏距離作為度量空間距離的標準,歐氏距離反映了數(shù)據(jù)點之間的最短距離,但城市間的空間距離不能簡單等同于直線距離,使用路網(wǎng)距離更能代表表示城市OD空間距離。如圖3所示,路網(wǎng)距離是基于交通網(wǎng)絡的最短路徑距離。為了驗證路網(wǎng)距離約束在表達空間距離時的準確性,本文研究分別采用歐氏距離和路網(wǎng)距離,通過GTWR和多尺度GTWR試驗分析驗證。
圖3 成都市道路網(wǎng)Fig.3 Road network of Chengdu
路網(wǎng)距離由ArcMap的network analyst模塊進行解算,在模塊中分別計算成都市住宅價格點的空間距離矩陣,以及住宅價格點與各類POI點基于路網(wǎng)的最短距離(表2),并將結果作為字段保存到住宅價格點的屬性表中。
表2 變量含義說明Tab.2 Definition of variable
數(shù)據(jù)中多重共線性的存在會對地理加權回歸分析的結果產(chǎn)生較大影響,必須排除數(shù)據(jù)中的多重共線性,本文使用方差膨脹系數(shù)(VIF)作為判別是否具有多重共線性的標準。由于住宅價格中的部分數(shù)據(jù)存在明顯多重共線性,選擇保留公立中學、地鐵站點、大型商場、成都火車站、著名景點、公立三甲醫(yī)院、高規(guī)格酒店的最短路網(wǎng)距離數(shù)據(jù)作為最終的自變量(表3)??梢杂杀?看出,處理后所有數(shù)據(jù)的VIF值均小于10。
表3 多重共線性檢測Tab.3 Detect multicollinearity
依據(jù)成都市住宅價格數(shù)據(jù),分別通過路網(wǎng)距離約束和歐氏距離約束構造多尺度GTWR和GTWR模型,通過兩者之間的對比來探索不同距離度量標準之間回歸模型的不同之處。對比結果見表4。相對于GTWR的結果,多尺度GTWR殘差平方和(RSS)、擬合優(yōu)度(R2)得到明顯的改善。
表4 擬合結果Tab.4 The result of goodness-of-fit
同時,使用路網(wǎng)距離作為度量標準也有效地改善了模型的擬合效果。結果表明,相較使用歐氏距離約束的GTWR與多尺度GTWR模型,路網(wǎng)距離約束的GTWR(RD)模型的擬合優(yōu)度提高了0.007,多尺度GTWR(RD)模型的擬合優(yōu)度提高了0.092,并且GTWR(RD)模型殘差平方和降低了1.97×108,多尺度GTWR(RD)模型殘差平方和降低了2.722×109。
圖4展示了4個模型中不同變量的AIC值。試驗結果顯示,在同一距離約束下,多尺度GTWR模型相較GTWR模型, 可以有效降低所有變量的AIC值,表明多尺度GTWR對各個變量更具有解釋性。同樣,在同一模型下,使用路網(wǎng)距離約束相較使用歐氏距離約束也能降低各變量AIC值。這說明在路網(wǎng)密集的成都市,盡管歐氏距離能夠基本滿足多尺度GTWR城市住宅價格建模需求,但路網(wǎng)距離更能反映成都市中心城區(qū)空間距離,且能夠有效地增加模型的解釋能力。
圖4 不同模型下AIC值的對比Fig.4 Comparison of AIC values under different models
基于路網(wǎng)距離約束,得到GTWR(RD)模型以及多尺度GTWR(RD)模型的擬合結果(表5、表6)。對于多尺度GTWR(RD)來說,所有空間帶寬介于0.34 km和10.13 km之間,時間帶寬介于0.23季度與12.51季度之間,對于GTWR(RD),空間和時間帶寬分別為2.30 km和2.10季度,可以看作多尺度GTWR模型帶寬進行加權平均的結果。說明多尺度GTWR可以有效地測量和識別時空關系的尺度,這些不同尺度代表了時空異質性。
表6 多尺度GTWR(RD)結果Tab.6 The result of multiscale GTWR(RD)
分析每個變量的帶寬,可以看出,商場的空間帶寬與時間帶寬分別為10.13 km和12.51季度,均大于GTWR的時間帶寬與空間帶寬結果,并且與本項目所研究的時空范圍最接近(空間范圍約為30 km×30 km,時間范圍為2015至2018年16個季度)??臻g帶寬與時間帶寬過大表明變量沒有明顯的空間與時間異質性,說明商場對住宅價格的影響在空間與時間上是全局的。
與此相反,地鐵、景點、醫(yī)院、酒店這4個變量的時間帶寬、空間帶寬均小于GTWR中的結果,表明這些變量在更小的尺度上影響成都市住宅價格的趨勢。同時,中學、火車站的空間帶寬小于GTWR中的空間帶寬,而其時間帶寬卻大于GTWR中的時間帶寬,說明不同的變量,其時間異質性與空間異質性水平也有所不同。
4.3.1 分析時間維中估計系數(shù)的變化
如圖5所示,在2015—2018年16個季度內(nèi),變量scenic、hotel的估計系數(shù)可視為負,即距離此類POI點越遠,住宅價格越表現(xiàn)出更低的價格。熱門旅游景區(qū)資源以及高規(guī)格酒店一直是影響住宅價格的重要因素,考慮到旅游帶來的經(jīng)濟效應,購房者會傾向于投資靠近景區(qū)的住宅。同樣的,高規(guī)格的酒店也會帶動周邊的商業(yè),但影響程度不如熱門景區(qū)資源大。
圖5 各變量估計系數(shù)的時間變化(數(shù)值為全時期估計系數(shù)平均值)Fig.5 Time variation of estimated coefficients for each variable (data are the average value of estimated coefficients for the whole period)
變量M-school、metro的估計系數(shù)整體上表現(xiàn)為負值。一般來說,購房者會傾向于購買高交通便捷度以及附近擁有教育設施的住宅。變量metro在第14季度有明顯的波動,可能是受地鐵1號線三期開通的影響。地鐵1號線三期是深入天府新區(qū)核心區(qū)的首條地鐵線路,1號線三期的開通連接了中心城區(qū)和天府新區(qū)核心區(qū),對住宅價格造成較大影響。
變量rail、hospital以及mall的估計系數(shù)起伏不定,在不同時間段對住宅價格表現(xiàn)出不同的影響作用,但最終表現(xiàn)為正值。分析可知,此類特征點會導致周邊宜居程度降低,居民會傾向于購買其他宜居程度高的住宅。
4.3.2 分析空間維中估計系數(shù)的變化
圖6以2018年下半年中變量mall與metro為例分析估計系數(shù)在空間維中的變化。圖6(a)展示了變量mall估計系數(shù)在空間位置中的分布,變量mall仍然展示了其全局性,估計系數(shù)在空間中并未出現(xiàn)較大差異,整體維持在0.08至0.26這一范圍內(nèi),并大致由西向東緩慢增加,說明成都市以東的區(qū)域住宅價格受商場分布的影響更大。
圖6(b)展示了變量metro估計系數(shù)在空間位置中的分布,可以看出,相對于mall而言,變量metro在空間維度上表現(xiàn)出較為顯著的空間異質性,估計系數(shù)的波動較大,metro系數(shù)為正的區(qū)域主要位于成都東北端,系數(shù)為負的區(qū)域主要位于南端以及西北端,而在城市中心區(qū)域則表現(xiàn)出正負系數(shù)相互嵌套的現(xiàn)象。說明地鐵站點在成都市大部分區(qū)域對住宅價格起著促進增長的作用,在東北端則表現(xiàn)出對住宅價格的消極影響??赡苡捎谡罔F規(guī)劃部分主要在中南端,導致了此區(qū)域系數(shù)估計值的異常。
圖6 mall和metro估計系數(shù)的空間變化(2018年下半年)Fig.6 Spatial variation of mall and metro estimated coefficients (second half of 2018)
傳統(tǒng)的GWR模型只能對空間異質性進行量化,缺少對時間維度的刻畫,并不具備識別獨立關系的能力。GTWR模型將GWR模型拓展至時間維度,但仍然缺乏探索多尺度效應的能力。本文將多尺度和時間維同時擴展到城市住宅價格的建模中,展示了如何使用多尺度GTWR來識別和測量不同過程操作的不同時空尺度。另外,由于空間距離一直是制約地理時空加權回歸模型求解精度的關鍵,本文以路網(wǎng)較為密集的成都市為案例區(qū)域,分別基于歐氏距離約束和路網(wǎng)距離約束,獲取模型的擬合優(yōu)度,確定不同空間距離約束下模型的正確性和通用性。
在基于多尺度GTWR住宅價格建模方面,多尺度GTWR的建模精度優(yōu)于不考慮多尺度時空非平穩(wěn)性的GTWR,多尺度GTWR中殘差平方和(RSS)、擬合優(yōu)度(R2)得到了明顯的改善,表明模型較好地擬合了整體數(shù)據(jù),對各解釋變量具有更好的解釋作用。
通過充分對比路網(wǎng)距離和歐氏距離對成都市住宅價格模型建模的影響以后研究發(fā)現(xiàn),GTWR和多尺度GTWR利用路網(wǎng)距離測算時空距離均要比歐氏距離建模擬合精度更高,其中GTWR(RD)模型的擬合優(yōu)度提高了0.007,多尺度GTWR(RD)模型的擬合優(yōu)度提高了0.092,AIC值明顯優(yōu)化,再次說明了路網(wǎng)距離在測量成都市空間可達性方面更有效。在時空維度分析中,路網(wǎng)約束的多尺度GTWR模型的結果進一步展示了模型的可靠性。結果表明,在多尺度GTWR模型中,路網(wǎng)距離約束相較于歐氏距離約束在成都市空間距離度量方面的表現(xiàn)更具有合理性。
多尺度GTWR不僅可以研究時空過程中的時空異質性,而且可以通過識別不同時空帶寬,從而指示不同關系如何在不同時空尺度上操作,因此在解釋住宅價格變化方面具有更好的表現(xiàn)。盡管歐氏距離能夠基本滿足多尺度GTWR城市住宅價格建模需求,但路網(wǎng)距離更能反映成都市中心城區(qū)空間距離,能夠更有效提升地理時空加權回歸模型求解精度,本文全面驗證了模型的正確性和通用性。
本文結果能夠為城市規(guī)劃人員促進住房市場發(fā)展提供新的觀點和啟示。近年來,GTWR已逐步擴展到景觀動態(tài)[26]、社會學[27]和環(huán)境保護[28-29]等領域,本文提出的建模方法及其應用具有很好的前景和應用價值。