鄭 昭 邱海童
(北京公交有軌電車有限公司,北京 100080)
高速鐵路和地鐵的迅速發(fā)展和不斷完善,對乘客吸引力和吸引范圍不斷擴(kuò)大,兩者之間的銜接必將直接影響城市綜合交通運(yùn)輸?shù)男?。相比普通地鐵換乘站,銜接樞紐地鐵站的車站設(shè)施布置更復(fù)雜,車站空間布置更加多樣,在大客流的影響下,乘客行為復(fù)雜多樣,異質(zhì)性明顯。將乘客視為同質(zhì)個(gè)體進(jìn)行研究顯然已不符合實(shí)際。所以進(jìn)行乘客異質(zhì)性研究有重要的現(xiàn)實(shí)意義。
為更好地研究乘客異質(zhì)性特點(diǎn),本文吸納社會科學(xué)研究相關(guān)經(jīng)驗(yàn),采用更具優(yōu)勢的潛在類別方法對出行乘客進(jìn)行分類,以實(shí)現(xiàn)乘客異質(zhì)性的客觀描述。在進(jìn)行潛在類別分析時(shí),將乘客在樓扶梯處的微觀選擇行為以及乘客的生理和行為特性全部引入盡可能多的外顯變量。
顧兆軍等[1]使用航空旅客訂票數(shù)據(jù)進(jìn)行潛在類別模型分析,實(shí)現(xiàn)民航旅客的合理分類,以研究民航旅客的出行選擇偏好。楊倩倩[2]根據(jù)旅客的訂票行為、登記行為等進(jìn)行聚類,將旅客劃分為不同的客戶群,在分析了不同客戶群的出行特點(diǎn)及偏好后,提供有針對性的旅客服務(wù)。文佳星[3]使用京滬高鐵和滬寧高鐵乘客訂票數(shù)據(jù),運(yùn)用潛在類別理論對高鐵乘客選擇行為進(jìn)行詳細(xì)劃分,為票價(jià)優(yōu)惠設(shè)計(jì)方案。喬珂等[4]運(yùn)用潛在類別模型對高鐵旅客市場進(jìn)行細(xì)分,在完成類別劃分后,進(jìn)一步使用模型進(jìn)行聚類分析,了解不同類型旅客的出行特征。陳建冰[5]利用潛在類別模型進(jìn)行通勤個(gè)體異質(zhì)性研究,對通勤過程中不可預(yù)測因素進(jìn)行研究。楊洋[6]根據(jù)SP 調(diào)查數(shù)據(jù),將受訪者分為四個(gè)潛在類別,并分析每一類別的特征,可以用于輔助交通政策制定目標(biāo)人群,以規(guī)劃停車換乘系統(tǒng)。
選取北京西站地鐵站為調(diào)研車站,通過人工觀測和視頻記錄的方法分別在車站站廳、站臺、樓扶梯及出站閘機(jī)處采集乘客個(gè)體特性和設(shè)備參數(shù),包括乘客性別、年齡、速度、行李、同組伴、熟悉程度和設(shè)施的通過時(shí)間,共采集291 組數(shù)據(jù)(其中樓扶梯處采集數(shù)據(jù)83 組,車站站廳、站臺和出站閘機(jī)位置共采集208 組)。被調(diào)查對象的基本信息調(diào)查結(jié)果及分析如下:
(1)男性占本次調(diào)查對象的54.5%,女性占調(diào)查對象的45.5%。
(2)調(diào)查對象中97%的乘客為成年人,其中年齡主要集中在20-40 歲間,占總?cè)藬?shù)的75.1%。
(3)調(diào)查對象中同組伴乘客占比6%。
(4)調(diào)查對象攜帶行李多樣,對乘客攜帶行李比例進(jìn)行統(tǒng)計(jì),其中未攜帶行李的乘客41%,攜帶行李箱乘客15%,攜帶背包乘客15%,攜帶手提包乘客29%。
在交通研究中,考慮實(shí)際情形下,行人流中包含有具備不同行人個(gè)體屬性而產(chǎn)生不同交通特性和行為偏好的個(gè)體,因此應(yīng)該充分考慮行人異質(zhì)性,對乘客進(jìn)行類別分類,按類別標(biāo)定參數(shù)。
基于行人異質(zhì)性對樞紐車站乘客微觀選擇行為進(jìn)行分析。在既有研究的基礎(chǔ)上,根據(jù)調(diào)研數(shù)據(jù),對行人站臺樓扶梯選擇進(jìn)行分析,確定改進(jìn)模型的回歸系數(shù)和預(yù)測準(zhǔn)確率,本文選擇目前較為常見的二元Logit 模型進(jìn)行分析。參考史芮嘉等[7]和朱昌穩(wěn)[8]的研究,選取排隊(duì)人數(shù)、攜帶行李數(shù)量、年齡和時(shí)間敏感性為主要因素進(jìn)行建模分析。
2.1.1 模型構(gòu)建
基于采集數(shù)據(jù),進(jìn)行二元Logit 回歸分析。
乘客選擇樓梯的效用函數(shù)表示為:
乘客選擇電扶梯的效用函數(shù)表示為:
式中:L表示選擇自動(dòng)扶梯的乘客排隊(duì)長度;G表示乘客攜帶行李情況;N表示樣本乘客的年齡;T表示樣本乘客的時(shí)間敏感程度,速度高于1.5m/s可以認(rèn)為乘客時(shí)間敏感性高[8]。
2.1.2 參數(shù)標(biāo)定
根據(jù)樓扶梯處的實(shí)際采集數(shù)據(jù)(共采集83組),采用數(shù)據(jù)處理軟件對參數(shù)進(jìn)行擬合,參數(shù)擬合結(jié)果如下式所示:
行人的選擇行為與排隊(duì)人數(shù)、攜帶行李數(shù)量、年齡和時(shí)間敏感性都相關(guān),其中時(shí)間敏感性對選擇影響較為明顯。模型預(yù)測準(zhǔn)確率如表1 所示,樓扶梯選擇行為的預(yù)測準(zhǔn)確率為94%。其中選擇扶梯的預(yù)測準(zhǔn)確率為97.1%,即實(shí)際69 人選擇扶梯,預(yù)測67 人選擇扶梯;選擇樓梯的預(yù)測準(zhǔn)確率為78.6%,即實(shí)際14 人選擇樓梯,預(yù)測11 人選擇樓梯。
表1 樓扶梯選擇統(tǒng)計(jì)表
2.2.1 潛在類別模型構(gòu)建
潛在類別模型(LCM)是用于探索分析潛在類別變量的一種模型化技術(shù)。該模型有機(jī)結(jié)合了類別數(shù)據(jù)和潛在變量,提高了類別分析的價(jià)值。建立一個(gè)完整的潛在類別模型分為三個(gè)步驟,首先進(jìn)行概率參數(shù)化,然后完成模型估計(jì),最后進(jìn)行潛在分類(圖1)。
圖1 潛在類別模型建模步驟
Mplus 軟件是一個(gè)統(tǒng)計(jì)建模軟件,為研究者提供了靈活的數(shù)據(jù)分析工具,具有易于使用的圖形界面和展示數(shù)據(jù)分析結(jié)果的模式、估計(jì)和算法。本文借助Mplus 軟件展開潛在類別分析。
2.2.1.1 概率參數(shù)化
概率參數(shù)化是建立潛在類別模型的首要步驟,潛在類別模型中包含有潛在變量和外顯變量,因此對應(yīng)的潛在類別模型參數(shù)包括潛在類別概率和條件概率。
潛在類別概率用來表達(dá)潛在變量X屬于T類別中某一水平t的概率,可以用表示其概率。顯然此概率受到潛在類別變量的相對大小和其水平數(shù)目T所決定,各潛在類別的概率和為1,即:
條件概率表示在潛在類別中隨機(jī)抽取一個(gè)樣本,樣本對外顯變量所顯示的概率。此概率可表示為,A表示外顯變量,i表示對應(yīng)的外顯變量水平值。條件概率的成立需要滿足同一外顯水平間相互獨(dú)立和各外顯變量不同水平間也相互獨(dú)立。此時(shí),外顯變量在各水平下的條件概率和為1,即:
在各潛在類別中,較大的條件概率值表示潛在變量對于該外顯變量比重較大,影響較強(qiáng)。在建立潛在類別模型前,需要進(jìn)行外顯變量的分水平處理,保證分水平處理后的各外顯變量不同維度間相互完全獨(dú)立。在本文中,對乘客的六個(gè)外顯變量進(jìn)行分水平處理,如性別分為男女兩個(gè)水平,速度按大小分為五個(gè)區(qū)間水平,組群行為分為有無兩個(gè)水平等。
2.2.1.2 模型估計(jì)
實(shí)測數(shù)據(jù)的外顯變量在考慮各觀察數(shù)據(jù)潛在屬性后,也應(yīng)當(dāng)滿足局部獨(dú)立性條件,如果把觀察數(shù)據(jù)的類別屬性考慮在內(nèi),外顯變量之間應(yīng)該是完全獨(dú)立無關(guān)的。在潛在類別分析中,模型估計(jì)主要采用極大似然估計(jì)方法。對于一個(gè)具有t個(gè)潛在類別的潛在變量X的潛在類別模型,極大似然估計(jì)函數(shù)可以表示為:
將上述兩式做除法,就可以得到各潛在類別中外顯變量各水平的極大似然概率。
2.2.1.3 概率適配性
在模型構(gòu)建完成后需要對模型進(jìn)行評價(jià),選擇出擬合度高、參數(shù)適當(dāng)?shù)哪P汀3R姷哪P瓦m配方法有極大似然法,Pearsonχ2,AIC 和BIC 四種。
潛在類別模型利用極大似然法,對各單元格的觀察次數(shù)和期望次數(shù)的差異情形利用對數(shù)函數(shù)轉(zhuǎn)化成似然卡方統(tǒng)計(jì)量G2,來反映模型擬合度。另一種檢驗(yàn)方法是直接使用Pearsonχ2來計(jì)算模型擬合度,公式如下:
AIC 指標(biāo)是基于信息理論模型適配指標(biāo),用于不同模型適配優(yōu)劣比較。AIC 指標(biāo)由極大似然算法推導(dǎo)而來。若存在h個(gè)需要比較的模型,則AIC 表示為:
其中:為第h個(gè)模型自由度, 為第h個(gè)模型適配度的卡方值。
BIC 指標(biāo)是用于改善AIC 指標(biāo)在數(shù)據(jù)樣本量大時(shí)漸進(jìn)性不足的問題。定義為:
2.2.1.4 潛在分類
分類是潛在類別分析的最終目的,將所有樣本數(shù)據(jù)分到對應(yīng)的潛在類別中,即通過新的類別變量來解釋觀察值的后驗(yàn)類別屬性。利用貝氏分類法進(jìn)行分類,計(jì)算方法如下。
利用式(15)求出旅客屬于各個(gè)潛在類別的后驗(yàn)概率,根據(jù)后驗(yàn)概率大小判斷乘客所屬潛在類別,進(jìn)而實(shí)現(xiàn)分類。
2.2.2 乘客類別分析案例
對在車站站廳、站臺和出站閘機(jī)處采集的208組調(diào)研數(shù)據(jù)進(jìn)行潛在類別分析。外顯變量選取是潛在類別分析的重要準(zhǔn)備,結(jié)合調(diào)研統(tǒng)計(jì)信息數(shù)據(jù),最終選擇外顯變量為以下六個(gè):性別、年齡、行李量、同伴群行為、速度、對車站舒適程度和樓扶梯選擇行為。其中樓扶梯選擇行為根據(jù)2.1 節(jié)所構(gòu)建的Logit 模型選擇概率進(jìn)行判定。
2.2.2.1 數(shù)據(jù)準(zhǔn)備
在實(shí)際建模過程中,考慮年齡、速度等數(shù)據(jù)取值范圍廣,行李攜帶形式多樣,若直接選擇自然值進(jìn)行分析,會造成過多的參數(shù)估計(jì),影響結(jié)果準(zhǔn)確性。所以對原始數(shù)據(jù)進(jìn)行編排處理,以數(shù)字表示外顯變量的程度水平,遵循規(guī)則和處理結(jié)果見表2。
表2 外顯變量分水平處置表
按照以上規(guī)則對采集的數(shù)據(jù)進(jìn)行處理,將數(shù)據(jù)轉(zhuǎn)化成數(shù)值信息,作為模型輸入。
2.2.2.2 結(jié)果評價(jià)
模型擬合過程中,并不確定將潛在類別分為幾類最合適,所以采用逐次計(jì)算的方法,即設(shè)定潛在類別由1 開始逐一增加,直到找到最好的模型匹配結(jié)果為止。根據(jù)模型擬合結(jié)果,一般選用Pearson卡方(χ2)、似然比卡方(G2)和信息指數(shù)AIC 和BIC、aBIC 來對潛在類別模型的擬合優(yōu)度進(jìn)行評價(jià)比較,這些指數(shù)均越小越好。
表3 列出了M1~M6 模型的擬合結(jié)果。根據(jù)適配指標(biāo)可知,當(dāng)潛在類別為4 時(shí),模型滿足數(shù)值擬合的要求。潛在類別由1 至4 逐次增加,似然比Log (L)絕對值、似然比卡方(G2)和Pearson 卡方(χ2)逐漸減小,BIC 指標(biāo)逐漸增大,但AIC 和aBIC指標(biāo)在M4模型中達(dá)到最小值。綜合上述結(jié)果,可以認(rèn)為潛在類別分為4 類時(shí),更加接近樞紐地鐵車站乘客類別的理想模型。
表3 不同類別模型適配指標(biāo)
2.2.2.3 參數(shù)估計(jì)結(jié)果
對調(diào)研數(shù)據(jù)采用M4 模型進(jìn)行潛在類別分析,表4 表示不同類別人數(shù)及概率,可以看出,第3類別的乘客人數(shù)最多,占比為38.94%,占比最大。第4 類別和第1 類別次之,分別為26.92%和19.71%。第2 類別占比較少,為14.42%。
表4 潛在類別概率統(tǒng)計(jì)
2.2.2.4 不同類別乘客出行特征分析
為更好地區(qū)分樞紐地鐵車站內(nèi)乘客異質(zhì)性,需要對前文所得到的四個(gè)潛在類別進(jìn)行形象化命名。如圖2 所示,將各類別乘客在不同外顯變量維度水平的條件概率進(jìn)行統(tǒng)計(jì),可以明顯看出各類別乘客間的差異。
圖2 各潛在類別條件概率分布圖
綜上,對四個(gè)類別乘客行為特征分析如下:
類別1:不熟悉環(huán)境低速乘客。該類乘客走行速度慢,半數(shù)乘客攜帶單件行李,對車站環(huán)境不夠熟悉,認(rèn)為是首次或少次到達(dá)的鐵路旅客或地鐵乘客。
類別2:遠(yuǎn)途組群乘客。該類乘客以中年和兒童為主,有明顯的組群行為,對車站環(huán)境一般熟悉,且多數(shù)攜帶箱包行李,認(rèn)為是多次乘坐鐵路遠(yuǎn)途出行的組群乘客。
類別3:地鐵通勤乘客。乘客以未攜帶行李和攜帶背包乘客為主,乘客對車站環(huán)境較為熟悉,且有半數(shù)乘客會選擇樓梯,認(rèn)為是地鐵通勤乘客。
類別4:普通鐵路旅客。該類乘客對車站環(huán)境非常熟悉,乘客間存在組群行為,且走行速度高于平均速度,乘客攜帶行李形式豐富,認(rèn)為是經(jīng)常前往車站乘車的普通鐵路旅客。
隨著高速鐵路和地鐵的興起,兩者在乘客出行方式選擇中占比重越來越大,吸引了大量的客流。本文對高鐵-地鐵銜接樞紐站中的地鐵車站乘客行為異質(zhì)性進(jìn)行了深入分析和研究。對北京地鐵北京西站乘客基本參數(shù)(性別、年齡、速度、行李量等)進(jìn)行采集,使用二元Logit 方法和潛在類別模型方法對乘客微觀選擇行為和乘客類別進(jìn)行研究。選擇排隊(duì)人數(shù)、攜帶行李數(shù)量、年齡和時(shí)間敏感性作為主要因素構(gòu)建了乘客樓扶梯選擇的概率模型,并根據(jù)實(shí)際采集數(shù)據(jù)實(shí)現(xiàn)模型參數(shù)標(biāo)定,對采集樣本的選擇概率進(jìn)行計(jì)算。以實(shí)際采集數(shù)據(jù)和行人樓扶梯選擇概率為外顯變量,使用潛在類別模型方法對車站行人異質(zhì)性進(jìn)行研究。借助Mplus 軟件進(jìn)行建模分析,實(shí)現(xiàn)行人類別劃分。根據(jù)乘客在外顯變量各維度水平條件概率和生活實(shí)際經(jīng)驗(yàn),將乘客分為不熟悉環(huán)境低速乘客、遠(yuǎn)途組群乘客、地鐵通勤乘客和普通鐵路旅客四個(gè)潛在類別,結(jié)果良好合理,研究成果能夠?yàn)樾腥宋⒂^仿真研究中乘客的異質(zhì)性描述提供新的思路和方法。