馬曉磊, 張繼宇, 劉劍鋒, 王江鋒, 李金海
(1. 北京航空航天大學(xué)交通科學(xué)與工程學(xué)院, 北京 100191;2. 北京城建設(shè)計發(fā)展集團(tuán)股份有限公司, 北京 100037; 3. 北京交通大學(xué)交通運(yùn)輸學(xué)院, 北京 100044)
地鐵站點(diǎn)客流特征與土地利用關(guān)系研究
馬曉磊1, 張繼宇1, 劉劍鋒2, 王江鋒3, 李金海2
(1. 北京航空航天大學(xué)交通科學(xué)與工程學(xué)院, 北京 100191;2. 北京城建設(shè)計發(fā)展集團(tuán)股份有限公司, 北京 100037; 3. 北京交通大學(xué)交通運(yùn)輸學(xué)院, 北京 100044)
討論軌道交通站點(diǎn)客流的時間變化規(guī)律,根據(jù)客流的時序特征,利用時間序列聚類的K-means算法對軌道交通站點(diǎn)進(jìn)行分類,對比不同類別站點(diǎn)的客流差異,同時探究軌道交通站點(diǎn)早晚高峰進(jìn)出站客流與站點(diǎn)周圍用地密度之間的相關(guān)關(guān)系,在考慮空間相關(guān)性的基礎(chǔ)上,采用地理加權(quán)回歸定量計算回歸方程,詳細(xì)分析客流與用地之間的相關(guān)系數(shù)在空間的分布情況。通過分析為不同站點(diǎn)制定有針對性的運(yùn)營管理措施,以及為軌道交通規(guī)劃提供理論支持。
城市軌道交通; 地鐵客流特征; 土地利用; 地理加權(quán)回歸; 時序聚類分析
車站作為軌道交通的核心,客流問題尤為突出,這些問題與車站周圍用地有著密切的聯(lián)系。探索車站客流規(guī)律,挖掘客流與用地之間的關(guān)系,對于完善軌道交通系統(tǒng)至關(guān)重要。
軌道交通系統(tǒng)的客流特征一直都是研究的重點(diǎn)問題[1-2]。王靜等利用IC卡數(shù)據(jù)從時間、空間分布來探究軌道交通網(wǎng)絡(luò)化運(yùn)營的客流特征[3]。馬小毅等利用廣州市軌道交通運(yùn)營資料,總結(jié)軌道交通從單線發(fā)展到網(wǎng)絡(luò)的客流規(guī)律[4]。劉劍鋒等從不同線路的角度出發(fā)提取不同的客流特征信息并總結(jié)規(guī)律[5]。
在土地利用方面,很多學(xué)者研究客流與土地利用的關(guān)系。張寧等以東京為例研究車站日均上下車客流量與車站影響范圍內(nèi)的容積率、人口、崗位等數(shù)據(jù)之間定量和定性的關(guān)系[6]。彭沙沙等提出軌道交通線網(wǎng)和土地利用各自的評價體系并建立了協(xié)調(diào)評價模型[7]。李世民等研究北京地鐵5號線開通后沿線的人口變化規(guī)律,得出客流與沿線用地開發(fā)的互動關(guān)系[8]。
已有研究多集中在地鐵客流與土地利用的整體關(guān)系,但缺少對微觀層面的客流分析。本研究以北京IC卡數(shù)據(jù)為基礎(chǔ),詳細(xì)探究微觀層面車站的客流規(guī)律,利用時間序列聚類對車站進(jìn)行分類,總結(jié)不同類型站點(diǎn)的客流分布。根據(jù)客流分布規(guī)律,使用GWR定量計算客流特征值與用地密度之間的相關(guān)關(guān)系,為軌道交通規(guī)劃運(yùn)營提供數(shù)據(jù)支持。
軌道交通系統(tǒng)車站眾多,很多車站的客流分布有相似之處,所以利用車站客流對車站進(jìn)行聚類,能夠簡化研究,更好地挖掘客流規(guī)律。車站的單日進(jìn)出站客流是典型的時間序列數(shù)據(jù),所以本次研究選擇基于K-means的時序聚類方法。這種方法將時序數(shù)據(jù)處理成K-means能夠識別的數(shù)據(jù)結(jié)構(gòu),適用于大數(shù)據(jù)的聚類[9]。
K-means聚類首先按照固定規(guī)則確定k個初始中心,分別計算每個個體到初始中心的距離,將其劃分至距離最近的類別中,然后重新確定初始中心,不斷迭代直到符合聚類標(biāo)準(zhǔn)。
(1)
B值越大表示類與類之間的差別越大,反之則表示類之間差距越小。同樣定義類內(nèi)系數(shù)W,表示每一類的類內(nèi)個體差異。
(2)
W值越大,表示類內(nèi)之間個體差異越大,反之表示類內(nèi)個體差異越小。
根據(jù)B和W的含義可以定義多種參數(shù)來判斷k值的合理性。其中,Calinski和Harabasz criterion為最常用的系數(shù)。
(3)
式中,n表示集合S的個體總數(shù)。C值越大則k的取值越合理。
K-means算法對初始中心的選擇十分敏感,基于K-means的時序聚類提供多種初始中心確定方法,本次研究選擇最大距離法確定初始中心。首先選擇兩個距離最遠(yuǎn)的個體作為初始聚類中心,然后將已選擇距離最遠(yuǎn)的個體添加進(jìn)聚類中心集合。這種方法能夠保證初始聚類中心之間的距離最遠(yuǎn),符合聚類的基本原則。
本次研究所用數(shù)據(jù)為通過IC卡得到的北京地鐵2015年6月第一周工作日266座車站96時段(15 min一段,標(biāo)號1~96,去除地鐵每天停運(yùn)時間0:00-5:00,共76個時段)的進(jìn)出站客流量,取周一至周五的平均值。
為了同時考慮進(jìn)站和出站雙方向客流,本次研究分別對進(jìn)站和出站客流進(jìn)行聚類,然后交叉分類得到最終結(jié)果。根據(jù)聚類方案,需要同時確定進(jìn)站和出站兩個k值。陶志祥等觀察不同車站的進(jìn)出站客流時間分布形態(tài),大致將客流分布分為5種:單向峰型、雙向峰型、全峰型、突峰型和無峰型[10]。所以本次研究k值的范圍選擇4~6,通過計算參數(shù)Calinski和Harabasz criterion確定最終的聚類數(shù)k。
利用R軟件的kml語言包進(jìn)行聚類計算,得到參數(shù)結(jié)果如表1所示。進(jìn)站和出站都選擇k=5,然后進(jìn)行交叉分類,將北京地鐵266座車站分成10類,如圖1所示。通過觀察每一類站點(diǎn)的客流規(guī)律,進(jìn)行進(jìn)一步分類,最終將地鐵站點(diǎn)分成3大類10小類,分別為雙峰型、工作型和居住型(見表2)。
表1 Calinski-Harabasz criterion計算結(jié)果
圖1 交叉分類Fig.1 Cross classification
Aa類是典型的雙峰型站點(diǎn),占車站總數(shù)的43.6%,是包含車站數(shù)目最多的一類站點(diǎn),基本覆蓋了北京市線網(wǎng)的各個部分,但是整體的客流量較小,全天客流在6 000人次左右,平均高峰期客流為320人次/15min。
表2 車站分類結(jié)果
工作型站點(diǎn)共有78座,占車站總數(shù)29.3%。圖2和圖3分別表示工作型中Cd類站點(diǎn)的客流分布和空間分布??土鞲叻寮性诔稣驹绺叻搴瓦M(jìn)站晚高峰,是典型的工作方向流動。平均總客流量達(dá)到30 000人次/d,最大的單位時間客流達(dá)到2 800人次/15 min,車站需要采取相應(yīng)限流措施以保證正常運(yùn)營。從空間分布可以看出,Cd類有3個地理中心,分別是中關(guān)村、復(fù)興門和國貿(mào),都是北京市內(nèi)重要的科技商業(yè)中心。
圖2 Cd類車站客流時間分布Fig.2 Average passenger temporal distribution of Cd station
圖3 Cd車站位置分布Fig.3 Cd station location distribution
居住型站點(diǎn)共有57座,占車站總數(shù)的21.4%。早高峰以進(jìn)站客流為主,晚高峰以出站客流為主,另外兩個方向幾乎沒有峰值出現(xiàn)。圖4和圖5表示居住型Dc類客流分布曲線和空間分布。從圖中可以看出,Dc類站點(diǎn)客流分布更集中,最大客流達(dá)到2 700人次/15 min。車站集中分布在回龍觀和天通苑附近,是北京市重要的居住中心。
圖4 Dc類車站客流時間分布Fig.4 Average passenger temporal distribution of Dc station
圖5 Dc車站位置分布Fig.5 Dc station location distribution
提取用地密度首先應(yīng)該確定地鐵站的輻射范圍。本文利用緩沖區(qū)和泰森多邊形疊加的方法尋找適當(dāng)?shù)能囌据椛浞秶椛浒霃竭x取1 000 m,保證了輻射范圍沒有重疊。根據(jù)確定的輻射范圍可以計算每一個車站區(qū)域的面積。
本次研究的用地數(shù)據(jù)來自于北京市國土資源和規(guī)劃部門,數(shù)據(jù)格式為GIS地圖,其中包括北京市內(nèi)各個領(lǐng)域的用地,每一條數(shù)據(jù)包括該地點(diǎn)的用地類型、地址、地理坐標(biāo)等,基本涵蓋北京市所有的用地信息?;镜臄?shù)據(jù)結(jié)構(gòu)為興趣點(diǎn)(point of interest),是地理統(tǒng)計中常用的基本單元。例如停車場興趣點(diǎn)包含北京市內(nèi)商場、寫字樓的室內(nèi)停車場以及各個室外停車場和路側(cè)停車場,涵蓋信息非常全面。根據(jù)本次的研究內(nèi)容,選取了餐飲服務(wù)、公司企業(yè)、公交站點(diǎn)、停車場、金融服務(wù)、科研教育、零售行業(yè)、商業(yè)大廈、休閑娛樂、醫(yī)療服務(wù)、住宅小區(qū)等11種用地密度作為基礎(chǔ)用地數(shù)據(jù)。
利用ARCGIS將地圖與處理后的車站輻射范圍在同一坐標(biāo)系下進(jìn)行相交處理,得到每一個車站輻射范圍內(nèi)11類用地的分布情況。統(tǒng)計每一個車站周圍不同用地的數(shù)量,除以車站輻射范圍的面積,即得到每一座車站周圍各類用地的密度,單位為個/m2。
根據(jù)車站分類結(jié)果可知不同站點(diǎn)的客流主要差異為高峰客流,因此選擇早高峰(7:00-9:00)和晚高峰(17:00-19:00)小時客流作為模型因變量。
在空間分析中,不同的個體觀測值在不同的地理位置觀測得到,而傳統(tǒng)的回歸模型假設(shè)觀測值在空間中保持一致性,忽略了其空間差異。地理加權(quán)回歸模型GWR是在普通的線性回歸模型基礎(chǔ)上加入空間因素[11],即
(4)
其中,(ui,vi)表示第i個采樣點(diǎn)的坐標(biāo),βk(ui,vi)表示第i個采樣點(diǎn)上第k個回歸參數(shù),是地理位置的函數(shù),εi∈N(0,σ2),Cov(εi,εj)=0(i≠j),為了表示方便,將上述公式簡寫成:
(5)
將公式寫成矩陣的形式:
y=(X?β′)I+ε
(6)
這里?表示矩陣的邏輯乘運(yùn)算,即將X的元素與β′對應(yīng)的元素相乘,構(gòu)成新的矩陣。設(shè)有n個采樣點(diǎn)和p個自變量,則X與β′都是n×(p+1)維的矩陣,I為(p+1)×1單位向量。β由n組回歸系數(shù)構(gòu)成,形式如下:
(7)
因?yàn)榈乩砑訖?quán)回歸模型中的回歸參數(shù)在每個采樣點(diǎn)上都是不同的,因此未知參數(shù)的個數(shù)為n×(p+1),遠(yuǎn)遠(yuǎn)大于觀察個數(shù)n。在估算采樣點(diǎn)i的回歸參數(shù)時,不同觀測點(diǎn)處的觀測值的重要性不同,距離i點(diǎn)越近的觀測值重要性越大,反之越小。利用加權(quán)最小二乘法,i點(diǎn)回歸參數(shù)可通過使
達(dá)到最小來估計。這里wij為回歸點(diǎn)i與其他觀測點(diǎn)j之間地理距離dij的單調(diào)遞減函數(shù)。令βi=[βi0,βi1,…,βip]′,Wi=diag(wi1,wi2,…,win),則i點(diǎn)的回歸系數(shù)βi為
(8)
利用上述方法逐點(diǎn)進(jìn)行回歸,得到包含各采樣點(diǎn)上回歸參數(shù)估計矩陣β如下:
(9)
在GWR模型中確定距離權(quán)重函數(shù)wij是至關(guān)重要的一步,本次研究采用高斯距離法,這種方法選取連續(xù)單調(diào)遞減函數(shù)高斯函數(shù)來擬合距離與權(quán)重之間的關(guān)系,函數(shù)形式如下:
wij=exp(-(dij/b)2)
(10)
b為描述權(quán)重與距離之間函數(shù)關(guān)系的參數(shù),稱為帶寬,引入CV指數(shù)對帶寬計算如下:
(11)
本次研究提取不同站點(diǎn)早晚高峰進(jìn)出站的高峰小時客流量作為因變量,11種用地密度作為自變量進(jìn)行相關(guān)性分析。首先利用向后排除法進(jìn)行自變量的篩選,結(jié)果如表3所示。工作方向的早高峰出站和晚高峰進(jìn)站客流有相同的影響因素,居住方向的早高峰進(jìn)站和晚高峰出站客流有類似的影響因素。
表3 高峰小時客流量影響因素
在進(jìn)行空間自相關(guān)分析之前,需要計算因變量的空間自相關(guān)系數(shù),以確定是否存在空間自相關(guān)性,計算公式如下:
(12)
(13)
莫蘭I指數(shù)結(jié)果如表4所示,4個參數(shù)的置信度都在99%以上。Moran’sI指數(shù)全部大于0.15,自變量在空間中呈現(xiàn)正相關(guān)性,為進(jìn)一步分析4種客流量的空間相關(guān)性提供了理論基礎(chǔ)。
表4 莫蘭指數(shù)
下面選擇早高峰進(jìn)站客流對擬合結(jié)果進(jìn)行具體的介紹。相關(guān)系數(shù)結(jié)果如表5所示。
從3個影響因素對進(jìn)站早高峰客流量影響系數(shù)的均值可知,住宅區(qū)密度對乘客早高峰乘坐軌道交通的影響程度最大,住宅密度越高乘坐地鐵的乘客越多;停車場密度與進(jìn)站早高峰客流量呈負(fù)相關(guān),說明停車場密度越大選擇軌道交通的乘客越少;公交車站密度與進(jìn)站早高峰客流量呈正相關(guān)。在早高峰時段,公交車與地鐵相互補(bǔ)充,但影響有限,是3種因素中相關(guān)性最小的一種。
表5 相關(guān)系數(shù)結(jié)果
圖6表示住宅密度相關(guān)系數(shù)的空間分布圖,外圍區(qū)域的顏色較深,說明外圍區(qū)域住宅密度對早高峰進(jìn)站客流影響較大。在東北和西南方向的顏色最深,相關(guān)系數(shù)最大。主要是房山線和15號線沿線,這些區(qū)域交通相對落后,軌道交通是主要的出行方式。
圖6 住宅相關(guān)系數(shù)空間分布Fig.6 Spatial distribution of correlation coefficients for residenfial district
本次研究以北京市軌道交通IC卡數(shù)據(jù)為基礎(chǔ),根據(jù)軌道交通站點(diǎn)單日進(jìn)出站客流時間分布分別對進(jìn)站和出站客流利用時間序列聚類方法進(jìn)行聚類,最后交叉分類,將北京市軌道交通車站分成3大類10小類,并分析各類別之間的客流差異,計算客流特征值;利用ARCGIS地圖提取用地密度信息,分析不同類別站點(diǎn)周圍用地密度差異;結(jié)合高峰客流數(shù)據(jù)的特點(diǎn)選取GWR模型分析高峰客流量與用地密度之間的相關(guān)關(guān)系。研究成果可以為軌道交通站點(diǎn)制定客流管理策略提供一定的數(shù)據(jù)支持,同時可以作為軌道交通線路走向和站位規(guī)劃的重要依據(jù)。今后的研究可以針對GWR模型進(jìn)行進(jìn)一步的完善,同時收集更多數(shù)據(jù)資料,分析相關(guān)系數(shù)分布的成因。
[1] AGUILéRA V, ALLIO S, BENEZECH V, et al.Using cell phone data to measure quality of service and passenger flows of Paris transit system[J].Transportation research part c emerging technologies, 2014(43):198-211.
[2] SUN L, LU Y, JIN J G, et al.An integrated Bayesian approach for passenger flow assignment in metro networks[J].Transportation research part c emerging technologies, 2015(52):116-131.
[3] 王靜,劉劍鋒,孫福亮.北京市軌道交通線網(wǎng)客流分布及成長規(guī)律[J].城市交通,2012,10(2):26-32.
WANG Jing, LIU Jianfeng, SUN Fuliang.Passenger demand distribution and increasing trend over Beijing railtransit[J].Urban transport of China, 2012, 10(2):26-32.
[4] 馬小毅, 金安, 劉明敏,等.廣州市軌道交通客流特征分析[J].城市交通, 2013(6):35-42.
MA Xiaoyi, JIN An, LIU Mingmin,et al.Rail transit passenger flow characteristics in Guangzhou[J]. Urban transport of China,2013(6): 35-42.
[5] 徐成永,李剛.北京城市軌道交通網(wǎng)絡(luò)化發(fā)展方向和模式探討[J].都市快軌交通, 2017,30(7):39-44.
XU Chengyong,LI Gang.Development trend and mode of Beijing urban rail transit networking[J].Urban rapid rail transit, 2017, 30(7): 39-44.
[6] 張寧,葉霞飛,劉劍鋒.土地利用對軌道交通車站客流量的影響[J].城市交通, 2010, 8(3):23-27.
ZHANG Ning, YE Xiafei, LIU Jianfeng.The impact of land use on demand of urban rail transit[J]. Urban transport of China, 2010, 8(3):23-27.
[7] 彭沙沙, 吳小萍, 梅盛.基于GIS的城市軌道交通與土地利用協(xié)調(diào)研究[J].鐵道工程學(xué)報, 2011(1):76-79.
PENG Shasha, WU Xiaoping, MEI Sheng.Study on coordination between urban rail transit and land use based on GIS[J].Journal of railway engneering society, 2011(1):76-79.
[8] 李世民,安栓莊,賀臘妮.軌道交通與城市用地開發(fā)互動影響研究[J].都市快軌交通, 2013, 26(5):25-29.
LI Shimin, AN Shuangzhuang, HE Lani.Research on interaction between rail transit and city land development[J].Urban rapid rail transit, 2013, 26(5):25-29.
[9] Genolini C, Alacoque X, Sentenac M, et al.kml and kml3d: R Packages to cluster longitudinal data[J].Journal of statistical software, 2015, 65(4):1-34.
[10] 陶志祥,張寧,杜波.城市軌道交通客流時空分析研究[J].城市公共交通,2004(2):33-35.
TAO Zhixiang, ZHANG Ning, DU Bo.Research on the time & space distribution of passenger flow in urban rail transport[J].Urban public transport, 2004(2):33-35.
[11] 覃文忠.地理加權(quán)回歸基本理論與應(yīng)用研究[D].上海:同濟(jì)大學(xué),2007.
QIN Wenzhong.The basic theoretics and application research on geographically weighted regression[D].Shanghai:Tongji University, 2007.
RelationshipbetweenCharacteristicsofSubwayPassengerFlowandLandUse
MAXiaolei1,ZHANGJiyu1,LIUJianfeng2,WangJiangfeng3,LiJinhai2
(1. School of Transportation Science and Engineering, Beihang University, Beijing 100191;2. Beijing Urban Construction Design & Development Group Co., Ltd., Beijing 100037;3. School of Traffic and Transportation, Beijing Jiaotong University, Beijing 100044)
This paper researches the characteristics of metro station ridership changed with the time. The subway stations are divided by using sequential K-means clustering algorithm based on the temporal distribution of metro station ridership. The distinctions between different categories are compared in this paper. A geographically weighted regression(GWR)model which considers the spatial correlation is built to quantitatively calculate the regression correlation to analyze the relationship between station-level ridership and land density around the station. The paper also provides the visual maps to explore the spatial distribution of the correlation coefficients. This study can provide theoretical basis to make specific operational management strategies and help the design of urban rail transit.
urban rail transportation; subway passenger flow characteristics; land use; geographically weighted regression; sequential clustering
10.3969/j.issn.1672-6073.2017.06.006
U231
A
1672-6073(2017)06-0033-06
2017-04-14
2017-06-05
馬曉磊,男,副教授,博士生導(dǎo)師,主要從事交通大數(shù)據(jù)、公共交通方面的研究,xiaolei@buaa.edu.cn
國家自然科學(xué)基金(51408019;61473028);北京市自然基金項(xiàng)目(8162031);北京市科技新星計劃項(xiàng)目(z151100000315048);中國科協(xié)青年人才托舉工程
(編輯:郝京紅)