袁發(fā)濤,陳通箭,魏劍波
(重慶交通大學(xué)交通運(yùn)輸學(xué)院,重慶 400074)
截至2018年年底,我國共35個(gè)城市建成投運(yùn)城軌線路185條,總運(yùn)營里程5 761.4 km.城市軌道交通運(yùn)營里程的不斷增加和網(wǎng)絡(luò)化的初步形成,使得軌道交通在城市公共交通的骨干作用日益明顯.軌道站點(diǎn)是構(gòu)成軌道交通網(wǎng)絡(luò)的基本單元,是承載城市各種社會(huì)經(jīng)濟(jì)活動(dòng)的聚集場所.軌道站點(diǎn)內(nèi)部設(shè)施布局、功能定位、周邊用地性質(zhì)等都與軌道站點(diǎn)客流息息相關(guān),為充分發(fā)揮軌道交通骨干作用,需要對(duì)軌道站點(diǎn)客流數(shù)據(jù)進(jìn)行挖掘,精細(xì)化研究軌道站點(diǎn)客流特征.
國外對(duì)軌道站點(diǎn)客流特征研究較早,Robert Cervero[1-2]基于我國香港地鐵數(shù)據(jù),結(jié)合地鐵站點(diǎn)周邊房價(jià)波動(dòng)信息,將地鐵網(wǎng)絡(luò)站點(diǎn)分為5類;Wei等[3]提出一種對(duì)客流量評(píng)分的公式,基于指標(biāo)評(píng)分法將地鐵站點(diǎn)分為3類.國外對(duì)于軌道站點(diǎn)研究往往基于成熟的軌道線網(wǎng)和接駁環(huán)境,對(duì)于我國軌道線網(wǎng)不完善的公共交通狀況適應(yīng)性有待考證.
近年來,國內(nèi)對(duì)軌道站點(diǎn)及其客流特征研究逐漸興起.吳嬌蓉等[4]按照站點(diǎn)區(qū)位條件、站點(diǎn)周邊地區(qū)土地利用性質(zhì)、開發(fā)規(guī)模和強(qiáng)度等數(shù)據(jù),將郊區(qū)軌道交通站點(diǎn)劃分為7大類,并結(jié)合客流調(diào)查數(shù)據(jù)分析了客流分布規(guī)律.傅搏峰等[5]在此研究基礎(chǔ)上,運(yùn)用客流聚集效應(yīng)函數(shù)曲線,界定郊區(qū)軌道站點(diǎn)影響范圍,定義并計(jì)算不同類別用地的優(yōu)勢(shì)度指數(shù),構(gòu)建郊區(qū)軌道站點(diǎn)功能分類體系.李向楠等[6-7]綜合軌道交通站點(diǎn)自身特點(diǎn)和站點(diǎn)周邊環(huán)境特征,選取聚類分析變量,通過主成分分析法提取關(guān)鍵因子,對(duì)站點(diǎn)在各因素因子上的相似程度做定量計(jì)算,得到站點(diǎn)分類結(jié)果.戴子文等[8]參考我國相關(guān)規(guī)范,并分析總結(jié)國內(nèi)外關(guān)于城市軌道交通車站等級(jí)劃分研究,將車站分類歸結(jié)于節(jié)點(diǎn)導(dǎo)向性和場所導(dǎo)向性2大類.結(jié)合客流量數(shù)據(jù),提出車站分類及分類指標(biāo)和相應(yīng)的指標(biāo)標(biāo)準(zhǔn),將車站劃分為2類3級(jí).鄧評(píng)心等[9-10]基于AFC數(shù)據(jù),結(jié)合站點(diǎn)周邊用地屬性占比,定性分析與定量分析相結(jié)合,采用聚類算法并運(yùn)用多元線性回歸分析驗(yàn)證,將軌道交通站點(diǎn)分為多類.
已有相關(guān)研究多集中于軌道站點(diǎn)自身特性和周邊環(huán)境對(duì)站點(diǎn)進(jìn)行分類分級(jí)研究.本文基于AFC數(shù)據(jù),多維度選取聚類變量,對(duì)軌道站點(diǎn)客流數(shù)據(jù)進(jìn)行挖掘分析,探討站點(diǎn)客流時(shí)空特性,并分析不同站點(diǎn)客流模式形成機(jī)理.
截至2018-10-30,重慶市主城區(qū)已開通運(yùn)營軌道線路1號(hào)線、2號(hào)線、3號(hào)線、5號(hào)線、6號(hào)線(含6支線)、10號(hào)線,共計(jì)142座軌道站點(diǎn)(換乘站點(diǎn)不重復(fù)計(jì)算).本文分別采集重慶市主城區(qū)軌道線網(wǎng)2018年1月和10月(非節(jié)假日)乘客刷卡數(shù)據(jù),平均每天大約有500多萬條出行記錄,每條出行記錄包含進(jìn)出站時(shí)間、站點(diǎn)編號(hào)、卡種等出行屬性,具體信息如表1所示.
表1 重慶市主城區(qū)軌道刷卡數(shù)據(jù)
利用Python編程對(duì)原始數(shù)據(jù)進(jìn)行清洗、處理,結(jié)合重慶市主城區(qū)軌道交通實(shí)際運(yùn)營情況,得到每日06:00—24:00的乘客進(jìn)出站出行記錄.以軌道站點(diǎn)為基本單元統(tǒng)計(jì)分析單位時(shí)間粒度下的進(jìn)出站客流量,分別得到進(jìn)站客流矩陣A和出站客流矩陣B,完整而準(zhǔn)確的乘客刷卡數(shù)據(jù)有利于對(duì)站點(diǎn)層面客流展開數(shù)據(jù)特征挖掘與客流模式識(shí)別.
依托軌道客流數(shù)據(jù),針對(duì)軌道站點(diǎn)層面客流時(shí)空特征展開研究.分時(shí)段劃分站點(diǎn)客流量,提取變量因子,根據(jù)變量因子選擇合適方法,挖掘軌道客流特征、識(shí)別客流模式.聚類算法可有效挖掘數(shù)據(jù)內(nèi)部特征,根據(jù)數(shù)據(jù)相似性將時(shí)空特性高度一致的站點(diǎn)客流歸類分析.常見的聚類算法有劃分法、層次法、基于密度的方法、基于網(wǎng)格的方法以及基于模型的方法.劃分法基于“距離”對(duì)數(shù)據(jù)集進(jìn)行相似性劃分,使得同一簇中元素盡可能相近或相似,不同的簇中的元素盡可能遠(yuǎn)離或不同.K-means方法計(jì)算速度快,可解釋性強(qiáng),對(duì)大數(shù)據(jù)集的處理效率較高,本文采用K-means算法能對(duì)站點(diǎn)客流模式快速識(shí)別,適用于挖掘站點(diǎn)客流時(shí)空特征.
K-means聚類算法根據(jù)選取的初始聚類中心,將數(shù)據(jù)集中剩余元素,按照規(guī)則劃分至各類別中,通過迭代算法對(duì)各聚類中心不斷轉(zhuǎn)移更新,直到滿足迭代要求,得到最佳的劃分結(jié)果.算法計(jì)算步驟如下.
步驟1對(duì)于給定包含m個(gè)元素的數(shù)據(jù)集,任意從該數(shù)據(jù)集中選取k個(gè)元素,作為初始聚類中心yi,i=1,2,…,k;
步驟2依次計(jì)算每個(gè)元素到初始聚類中心的距離d(xj,yi),j=1,2,…,m,i=1,2,…,k將各個(gè)元素xj按照“歐氏距離”最短原則劃分到相應(yīng)的聚類中心;
步驟4計(jì)算誤差平方和準(zhǔn)則函數(shù)G:
(1)
步驟5判斷前后兩次聚類中心是否滿足迭代要求ε,若滿足要求則迭代結(jié)束,若不滿足要求,則返回步驟2.
K-means聚類算法雖計(jì)算簡單,效率較高,但對(duì)初始聚類中心k值確定鮮有研究,為了判斷聚類有效性,在對(duì)聚類算法結(jié)果的評(píng)估中使用了Dunn指數(shù)(D)、Xie-beli指數(shù)(XB)2個(gè)指標(biāo),計(jì)算式如下:
(2)
(3)
式中,n為數(shù)據(jù)集中元素個(gè)數(shù);Ci為第i個(gè)類別;ci為Ci的聚類中心;d(x,y)為x和y的歐氏距離.D指數(shù)是不同類別中任意2個(gè)元素的最短距離與同一類別中任意2個(gè)元素的最大距離的比值,D值越大,說明類間差別越大,且類內(nèi)差別越小,此時(shí)聚類結(jié)果最佳.XB是每個(gè)元素與其聚類中心均方距離與聚類中心之間最小平方聚類的比值,XB取值越小,聚類效果更好.D指數(shù)、XB指數(shù)旨在評(píng)判聚類中心k值數(shù)目的合理性.
通過采集重慶市主城區(qū)軌道全網(wǎng)2018年10月某1天的刷卡數(shù)據(jù),利用Python 編程得到各站點(diǎn)全日進(jìn)出站客流數(shù)據(jù).分別選取進(jìn)站、出站客流數(shù)據(jù)為聚類變量,將每日06:00—24:00共18 h客流數(shù)據(jù)按0.5 h劃分,則每條站點(diǎn)數(shù)據(jù)包含36個(gè)變量,共獲得5 112個(gè)(142個(gè)站點(diǎn)×36)變量用于聚類,結(jié)合初始聚類中心值評(píng)價(jià)指標(biāo),確定聚類數(shù)k值為6,聚類結(jié)果如表2、表3所示.
表2 進(jìn)站客流聚類結(jié)果
表3 出站客流聚類結(jié)果
以進(jìn)出站客流數(shù)據(jù)為聚類變量,以進(jìn)站數(shù)據(jù)在前,出站數(shù)據(jù)次之的順序排列,得到進(jìn)出站客流矩陣C(A,B)142×72,則每條站點(diǎn)數(shù)據(jù)包含72個(gè)變量,共獲得10 224個(gè)(142個(gè)站點(diǎn)×72)變量用于聚類,結(jié)合初始聚類中心值評(píng)價(jià)指標(biāo),確定聚類數(shù)k值為6,聚類結(jié)果如表4所示.
為探究不同軌道站點(diǎn)類型隨軌道交通建設(shè)規(guī)模的發(fā)展和周邊建筑環(huán)境變化對(duì)聚類結(jié)果的影響,本文利用相同數(shù)據(jù)處理方法對(duì)重慶市主城區(qū)軌道全網(wǎng)2018-01-01乘客進(jìn)出站刷卡數(shù)據(jù)進(jìn)行聚類分析,聚類結(jié)果如表5所示.
由表2~表4不同輸入變量聚類結(jié)果可知:進(jìn)站客流數(shù)據(jù)能較好反映住宅密集區(qū)域軌道站點(diǎn);而出站客流數(shù)據(jù)則較好地刻畫商務(wù)娛樂、工作崗位密
表4 進(jìn)出站客流聚類結(jié)果
表5 2018年1月某日進(jìn)出站客流聚類結(jié)果
集區(qū)域軌道站點(diǎn),進(jìn)出站客流數(shù)據(jù)能更好地挖掘不同軌道站點(diǎn)的客流模式.由聚類結(jié)果可知,進(jìn)站客流與出站客流在聚類結(jié)果上有偏差,但出站客流與進(jìn)出站客流聚類結(jié)果更接近,更能反映基于數(shù)據(jù)的不同類型軌道站點(diǎn)乘客出行特征.
由表4~表5聚類結(jié)果可知,2018年1月與2018年10月刷卡數(shù)據(jù)進(jìn)出站客流聚類結(jié)果有所差異,主要體現(xiàn)在類別Ⅳ、Ⅴ、Ⅵ較小客流站點(diǎn)上,聚類結(jié)果變化站點(diǎn)主要位于重慶軌道5號(hào)線、10號(hào)線,這2條軌道線路于2017年年底開通運(yùn)營.分析該部分站點(diǎn)不同時(shí)期客流量指標(biāo)如圖1、圖2所示,該類站點(diǎn)日進(jìn)站客流總量和各時(shí)段客流量均有所上升,結(jié)合實(shí)際分析可知,隨著軌道交通建設(shè)規(guī)模擴(kuò)大、線網(wǎng)不斷完善、新線接入等都會(huì)對(duì)站點(diǎn)分類結(jié)果造成一定影響.
圖1 站點(diǎn)單日進(jìn)站客流總量
圖2 站點(diǎn)各時(shí)段進(jìn)站客流量
由表4聚類結(jié)果可知,類別Ⅰ唯一代表站點(diǎn)是光電園,進(jìn)出站客流變化如圖3所示,圖中正負(fù)僅代表進(jìn)出站含義,客流量均為正數(shù).全天早高峰以出站客流為主,晚高峰以進(jìn)站客流為主,除早晚高峰其他時(shí)段客流稀少,是一個(gè)典型的工作崗位密集的非商圈區(qū)域.光電園是重慶規(guī)模最大、高精尖領(lǐng)域最為集中的地區(qū),高新科技產(chǎn)業(yè)豐富,且居住人口較少,因此該區(qū)域全天客流量呈現(xiàn)明顯單峰潮汐現(xiàn)象.
類別Ⅱ代表站點(diǎn)為觀音橋,進(jìn)出站客流變化如圖4所示.全天客流有明顯早晚高峰,早晚高峰進(jìn)出站客流量較大,平峰時(shí)間段客流明顯高于其他站點(diǎn),無低谷狀態(tài),且夜晚20:00—22:00客流出現(xiàn)小高峰.這是典型的工作崗位密集商圈地區(qū),與觀音橋、小什字軌道站點(diǎn)連接的重慶最重要的兩大商圈觀音橋步行街和解放碑商圈現(xiàn)狀相吻合.
圖3 類別Ⅰ代表站點(diǎn)
圖4 類別Ⅱ代表站點(diǎn)
圖5 類別Ⅲ代表站點(diǎn)
圖6 類別Ⅳ代表站點(diǎn)
類別Ⅲ代表站點(diǎn)為大坪和南坪,進(jìn)出站客流變化如圖5所示.全天客流有明顯早晚高峰,各時(shí)段進(jìn)出站客流不及類別Ⅱ多.與類別Ⅰ、Ⅱ相比,進(jìn)出站客流潮汐現(xiàn)象較弱,而進(jìn)出站客流呈顯著同步性,是居住人口密集的城市組團(tuán)商圈地區(qū).該類站點(diǎn)主要分布于南坪、沙坪壩、大坪等城市次級(jí)商圈附近.
類別Ⅳ代表站點(diǎn)為長生橋和花卉園,進(jìn)出站客流變化如圖6.客流變化與類別Ⅰ相反,雖不及類別Ⅰ峰值,但仍具有明顯潮汐現(xiàn)象,早高峰以進(jìn)站客流為主,晚高峰以出站客流為主.此類站點(diǎn)為居住人口密集型-換乘便捷型區(qū)域,主要分布于大中型住宅區(qū)以及公交-軌道換乘集中區(qū)域附近.
圖7 類別Ⅴ代表站點(diǎn)
類別Ⅴ代表站點(diǎn)為重慶北站南廣場和江北機(jī)場T2航站樓,進(jìn)出站客流變化如圖7所示.全日各時(shí)段客流較平均,無明顯客流高峰和低谷,但客流相對(duì)較大.此類站點(diǎn)多為軌道站點(diǎn)與城市對(duì)外交通樞紐接駁站點(diǎn),以及軌道站點(diǎn)與大型公交換乘接駁站點(diǎn).
類別Ⅵ代表站點(diǎn)為劉家壩和曹家灣,進(jìn)出站客流變化如圖8所示.全日進(jìn)出站客流量較少,早晚高峰不明顯,此類站點(diǎn)分布于軌道線網(wǎng)兩端城市郊區(qū)地帶,與一般公交途經(jīng)站點(diǎn)接駁,站點(diǎn)輻射區(qū)居住人口稀少,就業(yè)崗位缺乏,為一般性軌道途經(jīng)站點(diǎn).
圖8 類別Ⅵ代表站點(diǎn)
本文提出一種基于AFC數(shù)據(jù)的不同站點(diǎn)分類研究方法,該方法采用K-means算法,按照不同聚類變量,對(duì)軌道站點(diǎn)進(jìn)出站客流數(shù)據(jù)進(jìn)行挖掘,將重慶市主城區(qū)142個(gè)軌道站點(diǎn)分為6種乘客出行特征,并探討隨軌道交通建設(shè)規(guī)模的發(fā)展和新線接入對(duì)聚類結(jié)果的影響,最后分析不同類型站點(diǎn)時(shí)空特性.在今后的研究中,筆者將從更多維度對(duì)客流數(shù)據(jù)進(jìn)行挖掘分析,尋求客流內(nèi)部關(guān)聯(lián),為精細(xì)化研究軌道站點(diǎn)客流提供更為準(zhǔn)確的理論方法與推廣應(yīng)用.