張 歡, 邊 揚, 梁 鯤, 李 玲
(北京工業(yè)大學(xué)城市交通學(xué)院, 北京 100124)
目前,對于評價自行車交通服務(wù)水平有很多方法如:自行車安全指數(shù)等級(BSIR)、自行車風(fēng)險水平、路況指數(shù)體系(RCI)、自行車適應(yīng)性評級、自行車交通服務(wù)水平、自行車適應(yīng)性評分以及自行車兼容性指標(BCI). 自行車交通服務(wù)水平是一項重要的評價方法,廣泛應(yīng)用于自行車交通規(guī)劃、設(shè)計、監(jiān)控、優(yōu)先權(quán)劃定等策略制定方面,大量研究人員利用自行車交通服務(wù)水平來評價道路的舒適性和安全性[1].
國內(nèi)對于自行車交通服務(wù)水平的影響因素研究較少,在《城市道路交通規(guī)劃設(shè)計規(guī)范》(GB50220—95)中采用行車速度、路段(交叉口)飽和度為主要評判指標[2]. 而《城市道路設(shè)計規(guī)范》(CJJ37—2012),將騎行速度、占道面積、負荷度作為路段自行車交通服務(wù)水平的主要影響因素[3]. 趙賢蘭等[5]在分析自行車交通特性與騎行影響因素的基礎(chǔ)上,通過改進自行車兼容性指數(shù)模型建立連接段服務(wù)水平模型,確定服務(wù)水平分級標準. 曹士強等[5]將不同道路斷面隔離形式下的非機動車橫向偏移率作為主要指標.
結(jié)合國內(nèi)外自行車交通服務(wù)水平研究的影響因素和北京市內(nèi)的道路交通特點,確定本文研究主要從道路交通環(huán)境條件、騎行行為特征條件、主觀感受3個方面來選取自行車服務(wù)水平影響因素.
道路環(huán)境因素包括道路等級、非機動車道的有效寬度、隔離形式、出入口數(shù)量、路段的公交站點數(shù)都對騎行者有顯著影響;交通環(huán)境條件主要選?。簷C動車交通量、非機動車逆行交通量、電動自行車與助力車交通量、最外側(cè)車道的機動車流量(分車型)、機動車和非機動車的車速、路側(cè)停車比例、行人占用非機動車道情況在內(nèi)的7項指標;騎行行為特征從速度和加速度2個方面進行選??;主觀感受評價指標指的是騎行者對1個路段的整體騎行感受信息主要從安全感和舒適感2個方面進行評價.
自行車交通服務(wù)水平體現(xiàn)騎行環(huán)境的好壞,通過對上述3種條件的組合可產(chǎn)生出不同的自行車騎行環(huán)境,如:非機動車和有效寬度大、采取物理隔離、出入口數(shù)量和公交站點數(shù)量小、交通環(huán)境簡單、車流量少無機非混行影響的道路,必然會導(dǎo)致個人的騎行速度處于較高水平且速度的變化較小,同時騎行者的整體感受在這種路段往往評分較高.
在明確影響因素的前提下,文章需要獲得3類基礎(chǔ)數(shù)據(jù):道路交通環(huán)境數(shù)據(jù)、騎行行為特征數(shù)據(jù)、主觀感受數(shù)據(jù). 在北京市內(nèi)選取不同影響因素下的組合,設(shè)計騎行行為實驗和道路交通環(huán)境調(diào)查實驗;然后根據(jù)不同數(shù)據(jù)的特點對數(shù)據(jù)進行預(yù)處理工作.
騎行行為實驗共需采集2類數(shù)據(jù),分別是騎行行為特征數(shù)據(jù)、主觀感受數(shù)據(jù). 道路交通環(huán)境調(diào)查實驗主要采集道路交通環(huán)境數(shù)據(jù). 本文對19段典型道路進行道路交通環(huán)境調(diào)查如表1所示.
騎行行為數(shù)據(jù)主要利用手機內(nèi)置傳感器進行數(shù)據(jù)采集,分別采集騎行過程中的GPS數(shù)據(jù)(1個/s)和加速度數(shù)據(jù)(20個/s). 騎行行為實驗分別在早高峰和晚高峰2個時段進行,實驗車輛為共享單車,共選取實驗者30人,15男、15女,并分為青年組和中老年組,即每個路段在1個時段進行實驗30次. 預(yù)計得到樣本2×30×19=1 140條. 道路交通環(huán)境調(diào)查實驗與騎行行為實驗同步進行,主觀感受評分采用李克特5級量表,1為極差,5為極好. 最終共得到有效樣本1 011個,其中5級整體感受在19段道路上的分布如圖1所示. 樣本整體打分較高,但是依舊可看出不同騎行環(huán)境的差別,如:騎行環(huán)境特別差的道路,路段6和13,是無隔離、機非混行且道路交通環(huán)境條件復(fù)雜的路段.
表1 實驗路段基本信息
通過手機GPS模塊采集的速度數(shù)據(jù)與通過加速度計模塊采集的加速度數(shù)據(jù)存在誤差包含很多噪音,需要對兩類數(shù)據(jù)進行相應(yīng)的預(yù)處理工作.
圖1 路段—整體感受水平分布圖
2.2.1 速度數(shù)據(jù)預(yù)處理
速度數(shù)據(jù)主要通過GPS數(shù)據(jù)計算而來,軟件所采集的數(shù)據(jù)為逐秒的GPS點位信息,采集頻率為1 Hz. 包含經(jīng)緯度信息以及UNIX時間戳信息. 設(shè)置7項數(shù)據(jù)清洗原則:
1)字段缺失
指采集過程,GPS字段、加速度字段、歐拉角字段缺失的刪除處理;
2)上一時刻相同點位
研究路段的騎行行為特征不考慮停止,因此速度為零點刪除;
3)時序數(shù)列判斷
GPS數(shù)據(jù)采用逐秒記錄,對于大于1.2 s和小于0.8 s的數(shù)據(jù)刪除;
4)瞬時速度判斷
瞬時速度大于12 m/s的點刪除,實驗用自行車不可能到達該速度;
5)其他類型數(shù)據(jù)、加速度、GPS三者對應(yīng)判斷
與其他類型數(shù)據(jù)(道路交通環(huán)境數(shù)據(jù)等)對應(yīng),其他數(shù)據(jù)缺失導(dǎo)致描述樣本的屬性不全面;
6)利用經(jīng)緯度位置判斷
利用經(jīng)緯度判斷單個路段的騎行實驗的起點和終點;
7)記錄條數(shù)判斷
通過逐秒記錄的單個樣本應(yīng)該保持在100個GPS點以上,設(shè)備原因?qū)е掠涗淈c過少,刪除這類數(shù)據(jù).
通過上述7個步驟的GPS數(shù)據(jù)清洗,對于速度數(shù)據(jù)的處理已經(jīng)有一定效果,但是由于GPS數(shù)據(jù)存在漂移現(xiàn)象,因此利用萊茵塔準則對速度數(shù)據(jù)進行去除粗大誤差處理. 如式(1)所示:
(1)
2.2.2 加速度數(shù)據(jù)預(yù)處理
加速度數(shù)據(jù)的采集頻率為20 Hz,手機內(nèi)置的加速度計是三軸加速度計,所測量的三向加速度是以手機為坐標系的3個方向(x、y、z).同時手機還可通過姿態(tài)傳感器采集手機的姿態(tài)數(shù)據(jù)即歐拉角數(shù)據(jù)(ψ、γ、θ),利用式(2)將2類數(shù)據(jù)融合,將加速度轉(zhuǎn)換到以世界坐標系為基準[6].
(2)
轉(zhuǎn)換完坐標系的加速度3個軸向分別是X軸正東方向、Y軸正北方向、Z軸垂直地面方向3個方向上的加速度(x′、y′、z′).由于所選的實驗道路均為正南正北正東正西的路段,因此再將世界坐標系下的加速度轉(zhuǎn)換到以騎行者本身為坐標系之上,即沿騎行方向,垂直于騎行方向以及垂直于地面方向.經(jīng)過一系列的坐標變換處理,將以手機坐標系下采集的加速度數(shù)據(jù)轉(zhuǎn)換到以騎行者為坐標系上來.由于加速度計在數(shù)據(jù)采集過程中存在白噪音,因此選用滑動均值濾波法對加速度數(shù)據(jù)進行濾波處理,滑動均值濾波的原理見式(3),本文采用MATLAB軟件實現(xiàn)此過程,單個樣本的濾波結(jié)果如圖2所示:
圖2 滑動均值濾波結(jié)果
(3)
式中,y(k)為濾波后的第k個數(shù)值;x(k+i)為濾波前的第k+i個數(shù)值;N為滑動窗口大小(本文取N=10).
在非機動車騎行行為數(shù)據(jù)提取的基礎(chǔ)上,應(yīng)用數(shù)理統(tǒng)計分析方法,研究速度相關(guān)騎行行為特征和加速度相關(guān)騎行行為特征,對比分析不同道路交通環(huán)境條件下的騎行行為.
提出2類騎行行為指標分別是速度相關(guān)騎行行為指標和加速度相關(guān)行為指標,主要分為8種統(tǒng)計學(xué)特征,分別是均值、方差、中位數(shù)、變異系數(shù)、最大值、最小值、85%位數(shù)值、15%位數(shù)值. 因此速度和加速度共提取32項(其中加速度為3個方向)騎行行為特征指標. 這些特征指標可代表不同騎行環(huán)境下的騎行行為,如速度均值、方差等指標代表的是騎行的整體情況,而加速度的最大值、最小值,85%位數(shù)值和15%數(shù)值則是代表騎行的急加速和急減速情況.
結(jié)合道路交通環(huán)境數(shù)據(jù)、主觀感受數(shù)據(jù),最終得到1 011行、45列的樣本集合. 其中19段道路的部分騎行行為特征指標如表2所示:
表2 各路段騎行行為特征分析
通過表2可看出一些騎行特征分布規(guī)律,如:路段5、7、15、19等路段的速度值較高,且速度方差較低,以上路段均為隔離設(shè)施完善且有效非機動車道寬度較寬的路段;如:路段6、13為19條路段中僅有的2條沒有任何隔離形式的支路,在速度均值和方差上則體現(xiàn)出整體速度水平偏低且速度的波動性高,說明在上述路段騎行過程中受干擾程度大.
繪制5級主觀感受與速度相關(guān)騎行行為特征和加速度相關(guān)騎行特征的散點圖,如圖3~6所示:
圖3 主觀感受- 速度均值散點圖
圖4 主觀感受- 速度方差散點圖
圖5 主觀感受-85%位加速度(沿向)散點圖
圖6 主觀感受-85%位加速度(垂向)散點圖
圖7 隨機森林分類器主程序
可得出:①不同騎行感受水平下具有不同的騎行行為特征;②好的騎行體現(xiàn)出速度水平較高且速度的變化小,符合一般實際情況,一般騎行速度處于較高水平且速度變化不大的騎行環(huán)境更受騎行者歡迎;③加速度2個方向上的85%位加速度值在主觀感受不同水平上呈現(xiàn)的趨勢不同,即沿向85%位加速度與主觀感受呈負相關(guān)趨勢,垂向85%位加速度與主觀感受呈正相關(guān)趨勢,說明對于感受不好的騎行而言,容易在行進方向上做出更多的急加減速行為,騎行者沒有其他辦法規(guī)避沿著騎行方向上的沖突,而感受好的騎行則在沿著垂直方向做出的急加減速行為較少,可通過做出垂向的急加減速行為(超越或者繞行)規(guī)避沖突.
隨機森林分類算法是機器學(xué)習(xí)算法的一種,主要采用bootstrap抽取即有抽取放回的方法對樣本進行抽取并將樣本分為樣本集和測試集2個部分,從而達到學(xué)習(xí)和預(yù)測目的的機器學(xué)習(xí)方法. 隨機森林分類算法具有不容易過擬合、抗噪聲能力強、適用于處理高維度即多特征的數(shù)據(jù),不用做特征選擇等優(yōu)點,對于數(shù)據(jù)集中個別數(shù)據(jù)的缺失有很好的適應(yīng)性[7].
本章在數(shù)據(jù)集的基礎(chǔ)上,采用機器學(xué)習(xí)的方法對樣本進行學(xué)習(xí)和預(yù)測,最終構(gòu)建基于隨機森林算法的路段自行車交通服務(wù)水平模型.
為保證分類質(zhì)量,將5級感受分為2個級別,即服務(wù)水平“好”(主觀感受“4~5級”)和服務(wù)水平差(主觀感受“1~3級”). 利用Rapid Miner軟件構(gòu)建隨機森林分類器,采用十折交叉驗證,并利用基尼系數(shù)判斷屬性的重要性程度. 如圖7、圖8所示:
圖8 交叉驗證子程序
隨機森林算法不需要做特征選擇,因此以基于主觀感受所得的2類服務(wù)水平作為“標簽”,以騎行行為特征、道路環(huán)境特征、交通環(huán)境特征為“屬性”帶入模型學(xué)習(xí)并預(yù)測. 樣本為1 011例,屬性特征為45項. 模型預(yù)測結(jié)果和不同特征屬性的重要程度如圖9、圖10所示:
圖9 模型預(yù)測結(jié)果
圖10 特征屬性重要性程度
模型分類精度在二分類情況下為68.25%,與文獻[8]中基于Probit模型的分類精度68.4%和基于SVM分類器的分類精度75.5%相差不大. 對于以主觀感受為標簽來說分類精度比較理想. 同時通過特征屬性重要程度圖可看出,經(jīng)典的自行車交通
服務(wù)水平研究中如:道路等級、隔離形式、出入口數(shù)量、路側(cè)停車、混行機動車交通量等對服務(wù)水平具有較大影響,但是也可看出個人的騎行行為特征如:速度變異系數(shù)、速度15%位數(shù)值、速度方差、垂向加速度最大值等也對模型有不小的貢獻. 說明個人的騎行行為特征可用于劃分自行車交通服務(wù)水平.
構(gòu)建基于隨機分類分類器的自行車服務(wù)水平模型,以個體騎行行為作為樣本進行學(xué)習(xí)和預(yù)測,證明個體的騎行行為特征可用自行車服務(wù)水平的研究,最終兩類預(yù)測的精度達到68.25%,分類模型精度較高,整體模型較為理想. 但采用主觀評價作為自行車交通服務(wù)水平劃分過于主觀,需要進一步加入客觀數(shù)據(jù)使分類模型精度進一步提高.