裴玉龍,李浩然
(東北林業(yè)大學, 哈爾濱 150040)
現(xiàn)今手機GPS定位技術已日臻完善,每一部智能手機都有GPS定位功能,這就會產(chǎn)生海量的軌跡數(shù)據(jù)。通過對軌跡數(shù)據(jù)的分析,可以得到很多與公共交通出行相關的信息。隨著智能化、數(shù)字化生活的不斷發(fā)展,各種手機應用層出不窮?,F(xiàn)在很多手機應用都可以記錄出行軌跡信息,只要能提取出應用中記錄的出行軌跡信息,就能據(jù)此對出行目的、出行方式、出行分布等進行分析,對提高居民出行特征數(shù)據(jù)的準確度、及時性、可信度都有很大的幫助。
能對手機GPS軌跡反映出的出行方式進行判別,就能掌握城市的交通結構,這對于解決城市交通問題至關重要。近年來,國內(nèi)專家學者對GPS軌跡數(shù)據(jù)的研究很多,主要分為以下3個方面:
1) 提高手機GPS精度方面的研究
李傳華、武文等[1-2]通過對GPS差分定位系統(tǒng)進行研究,可將手機GPS定位誤差降低到4 m以下;夏敬潮[3]通過手機GPS定位與Wi-Fi信號的結合,確定了一種GPS輔助定位方法,對室內(nèi)精確定位數(shù)據(jù)的獲取提供了思路;田洋[4]基于手機安卓無線GPS定位系統(tǒng)設計出一套土地測繪系統(tǒng),系統(tǒng)的定位精度可達到米級。隨著定位精度的不斷提高,手機GPS定位完全可以運用于交通信息的采集。
2) GPS軌跡數(shù)據(jù)交通信息提取方法研究
張冶華等[5-7]從軌跡數(shù)據(jù)的預處理出發(fā),將軌跡點轉化為連續(xù)軌跡、出行方式轉換點的獲取,最后對出行方式識別進行了研究,其在出行方式識別過程中多采用決策樹、人工神經(jīng)網(wǎng)絡算法等。
3) GPS軌跡數(shù)據(jù)在交通方面的應用
楊超等[8-9]對手機定位數(shù)據(jù)進行研究,獲取居民出行OD等出行特征信息。韋義明[10]運用手機GPS定位數(shù)據(jù),使用主成分回歸分析對交通流速度進行預測。
國外學者對利用GPS軌跡信息進行出行方式劃分的研究也有較多,不過國外學者大多通過GPS接收器收集出行軌跡。Stopher、Chen和Rasmussen[11-13]均將GPS軌跡數(shù)據(jù)與地理信息相結合,對出行方式進行識別,而Schuessler等[14]則完全依靠對采集到的GPS軌跡數(shù)據(jù)進行清洗、平滑和軌跡段分割,不依靠附加信息對出行方式進行識別。
現(xiàn)有文獻對手機GPS數(shù)據(jù)提取與出行方式選擇進行了較為深入的研究,為解決出行方式判別問題提供了有益的思路,但利用判別分析這一數(shù)學工具對軌跡出行方式的相關研究卻鮮見報道,而判別分析作為一種優(yōu)秀的機器學習分類算法,由于其計算方法簡便、對數(shù)據(jù)要求小而被廣泛地應用在實際研究中。本文擬采用手機對不同出行方式軌跡進行收集,分析不同出行方式軌跡的特點,依據(jù)軌跡特點選出判別變量,分別用Fisher法與Bayes法對軌跡出行方式進行判別,為利用手機GPS軌跡大數(shù)據(jù)分析交通問題提供一定的參考和依據(jù)。
本次出行軌跡數(shù)據(jù)收集采用手機GPS記錄的方法,實驗設備包括某國產(chǎn)品牌手機一部、“分享軌跡”手機APP,如圖1所示。實驗對象采用不同種交通方式出行,分別記錄不同種交通方式出行過程中產(chǎn)生的時間、速度、經(jīng)度、緯度、水平精度等數(shù)據(jù)。
圖1 數(shù)據(jù)收集使用器材
分別使用步行、自行車、常規(guī)公交、小汽車作為交通工具,實驗對象使用APP記錄的所在位置緯度、經(jīng)度、速度、水平精度以及軌跡長度等數(shù)據(jù),通過軟件將數(shù)據(jù)提取出來。本次實驗共收集到52條不同出行方式的軌跡數(shù)據(jù),其中步行出行軌跡12條、自行車出行軌跡12條、常規(guī)公交出行軌跡14條、小汽車交通出行軌跡14條。一條軌跡數(shù)據(jù)中包含上百甚至上千個軌跡點數(shù)據(jù),難以一一列出,因此以下僅列出軌跡數(shù)據(jù)形式,如表1所示。
表1 軌跡數(shù)據(jù)示意
1) 步行出行軌跡特點
步行是最常見的出行方式,大部分城市的短距離出行都以步行交通方式為主。不同種交通方式之間的銜接也主要依靠步行。通過對步行軌跡數(shù)據(jù)的收集,在速度與地圖匹配性方面對其進行分析。
通過12條步行軌跡數(shù)據(jù)計算得出步行軌跡的平均速度在3.69~6.51 km/h之間,軌跡數(shù)據(jù)中最高速度為7.2 km/h,最低速度為0。由于人身體的局限性,步行速度與其他交通方式相比速度較慢,但由于人的能動性,步行與其他方式相比更加靈活。此外由于人的適應性,步行與其他交通方式相比對道路環(huán)境的要求更低。
總結步行出行軌跡特點為:① 速度慢,一般步行速度在0.5~6 km/h之間;② 速度變化小,軌跡連續(xù)性高;③ 軌跡靈活,會出現(xiàn)在機動車不可能到達的地方。
2) 自行車出行軌跡特點
自行車出行是城市主要出行方式之一,方便靈活,是步行與使用車輛出行外的有效補充。近年來隨著共享單車在國內(nèi)的不斷布局、投放,自行車出行的便捷性有了很大的提升,自行車出行率不斷提高。
自行車也是靠人力驅(qū)動,其出行軌跡與步行出行軌跡類似,與機動車出行相比最大的特點是速度較慢,根據(jù)實際軌跡數(shù)據(jù)計算出自行車出行平均速度為8.52 km/h,軌跡數(shù)據(jù)中最高速度為11.23 km/h,最低速度為2.54 km/h。由于人身體的局限性,自行車出行速度與機動化出行相比速度較慢,但由于人的能動性,自行車出行與機動化出行相比更加靈活。此外,由于人的適應性,自行車出行與機動車出行相比對道路環(huán)境的要求更低。
總結自行車出行軌跡特點為:① 速度慢,一般為5~10 km/h;② 速度變化小,軌跡連續(xù)性高;③ 軌跡靈活,會出現(xiàn)在機動車不可能到達的地方。
3) 常規(guī)公交出行軌跡特點
城市常規(guī)公交最大的特點就是定點定線運行,本文主要根據(jù)常規(guī)公交的這個特點,在運行速度和軌跡與地圖匹配性方面進行分析。
8條常規(guī)公交軌跡中平均速度最高為45.6 km/h,最低為17.48 km/h。速度極差最大的為54.7 km/h,最小的為32.2 km/h,平均速度與速度極差均遠大于步行出行與自行車出行。根據(jù)收集的軌跡數(shù)據(jù),常規(guī)公交出行速度變化較大,主要原因是常規(guī)公交到站必停,沿道路行駛會遇到交叉口信號燈變化、堵車等情況,導致速度變化較大。
總結常規(guī)公交出行軌跡特點:① 速度較快,平均速度大于10 km/h;② 速度變化較大,在公交站點會出現(xiàn)明顯的速度低谷;③ 軌跡固定,沿現(xiàn)有道路延伸。
4) 小汽車交通出行軌跡特點
小汽車交通是與公共交通相對的一種出行方式,一般指私家車出行,但出租車、網(wǎng)約車提供的也是點對點的服務,載客后的行駛方式與私家車相同,所以本文在分析其軌跡時統(tǒng)一劃歸為小汽車交通,對其軌跡進行分析。
9條小汽車交通出行軌跡中平均速度最高為39.7 km/h,最低為16.2 km/h,平均速度區(qū)間與常規(guī)公交相比差別不大。軌跡中速度極差最大的為61.2 km/h,最小的為27.7 km/h,速度極差與常規(guī)公交相比差距也不大。小汽車交通出行速度變化較大,主要原因是沿道路行駛會遇到交叉口信號燈、堵車等情況,導致速度變化較大。由于小汽車交通點對點的特性,其軌跡會延伸到不通公交線路的道路,也不會在公交站附近出現(xiàn)明顯的速度降低現(xiàn)象。
總結小汽車交通出行軌跡特點:① 速度較快,平均速度大于15 km/h;② 速度變化大,在道路交叉口處會出現(xiàn)明顯的速度低谷;③ 軌跡較為靈活,可能會在小區(qū)內(nèi)部、偏僻小道或支路上出現(xiàn)。
圖2為不同交通方式速度分布概率,從圖中可以明顯看出不同種交通方式的速度分布區(qū)別:慢行交通(包括步行出行與自行車出行)的軌跡點瞬時速度多在10 km/h以下;步行與自行車出行速度概率峰值也有較為明顯的區(qū)別;機動化出行(包括常規(guī)公交出行與小汽車出行)的軌跡點瞬時速度均勻的分布在2~60 km/h的區(qū)間上。常規(guī)公交出行與小汽車出行速度分布形式類似,僅憑速度難以對這兩者進行區(qū)分??紤]到前述常規(guī)公交與小汽車交通的特點,引入20%分位數(shù)速度以下軌跡點落入公交站區(qū)域概率作為區(qū)分兩者的判別變量。
圖2 速度分布概率
依據(jù)本文對不同出行方式軌跡特點分析的結果選擇以平均速度(X1)、速度極差(X2)、20%分位數(shù)速度以下軌跡點落入公交站區(qū)域概率(X3)作為判別變量。
1) 平均速度(km/h)
平均速度是單一軌跡出行距離與出行耗時的比值,是區(qū)分慢行出行與機動化出行之間最有效的指標,慢行出行速度一般與采用交通工具出行相差一個數(shù)量級,通過軌跡數(shù)據(jù)的分析可以清楚地看出步行軌跡平均速度在5 km/h左右,自行車出行在8 km/h左右,而機動化出行的平均速度達到了15 km/h以上。
2) 速度極差(km/h)
速度極差為軌跡點數(shù)據(jù)中瞬時速度最大值與最小值之差,是描述速度變化幅度的指標。慢行出行與機動化出行速度相差很多,通過速度極差可以很好地分辨慢行出行與機動化出行。此外,公共交通與小汽車交通由于運行方式、運行目的等不同,行駛方式也會有所不同,小汽車交通的速度極差與公共交通相比略大。
3) 20%分位數(shù)速度以下軌跡點落入公交站區(qū)域概率(%)
20%分位數(shù)速度以下軌跡點落入公交站區(qū)域概率是將軌跡點瞬時速度排序,位于20%分位數(shù)速度以下的軌跡點在公交站區(qū)域內(nèi)的概率。公交站區(qū)域指將公交站看做一個長50 m、寬10 m的長方形區(qū)域,根據(jù)公交站點的實際分布情況,確定區(qū)域四角的經(jīng)緯度,即可得到一個公交站的區(qū)域方程,可根據(jù)軌跡點的經(jīng)緯度計算其是否落入公交站區(qū)域內(nèi)。
通過對軌跡特點分析可以得出小汽車交通與常規(guī)公交最大的區(qū)別就是常規(guī)公交在固定的停靠站點會減速停止,而小汽車交通一般不會在這些站點減速停止,所以常規(guī)公交速度20%分位數(shù)速度以下軌跡點落入公交站區(qū)域的概率相較小汽車交通會更高。通過這個區(qū)別可以區(qū)分出常規(guī)公交出行與小汽車交通出行的軌跡。
借助SPSS軟件采用皮爾遜系數(shù)法(Pearson法)進行相關性計算,得到表3判別變量相關性分析結果。
通過相關性分析結果可以看出:平均速度與速度極差的相關性為0.856,顯著性檢驗值為0,遠低于0.05;平均速度與20%分位數(shù)速度以下落入公交站區(qū)域概率相關性為0.691,顯著性檢驗值為0,小于0.05;速度極差與20%分位數(shù)速度以下軌跡落入公交站區(qū)域概率相關性為0.517,顯著性為0,小于0.05。
通過表3的數(shù)據(jù)可以得出平均速度與速度極差高度相關,且相關性顯著。平均速度反映的是軌跡整體的快慢程度,而速度極差則體現(xiàn)速度的變化程度,雖然兩變量高度相關,但因其表現(xiàn)內(nèi)容不同,所以不做刪減,都用來進行判別分析。平均速度與20%分位數(shù)速度以下軌跡落入公交站區(qū)域概率低度相關,對之后的判別分析無明顯影響。
表2 不同出行方式判別變量
表3 判別變量相關性分析結果
注:顯著性水平取值為0.05
本文已對3個判別變量的相關關系進行了分析,3個判別變量都可以用來進行判別函數(shù)的構建,通過SPSS軟件對數(shù)據(jù)的判別分析運算,得出典型判別函數(shù)公式對不同的出行方式進行判別分析。本文將出行方式分為慢行出行與機動化出行,在此使用兩級判別分析,先對慢行出行與機動化出行進行判別,后對步行、自行車出行與常規(guī)公交、小汽車交通出行進行判別。
1) 1級判別
以平均速度(X1)、速度極差(X2)、20%分位數(shù)速度以下軌跡點落入公交站區(qū)域概率(X3)作為判別變量;取慢行出行為1,機動化出行為2,作為因變量(分組變量)取值,利用SPSS軟件根據(jù)表1中的數(shù)據(jù)進行分析,得到Fisher判別模型。
Y=0.046X1+0.143X2+
0.065X3-5.291
(1)
2) 2級判別
① 步行與自行車出行判別
對步行與自行車出行的判別僅采用平均速度(X1)、速度極差(X2)兩個變量,取步行為1、自行車出行為2作為因變量(分組變量)取值。利用SPSS軟件對不同種出行方式樣本數(shù)據(jù)進行分析,得到Fisher判別模型:
Y=1.126X1-0.127X2-6.244
(2)
② 小汽車與常規(guī)公交出行判別
對小汽車與常規(guī)公交進行判別時要將20%分位數(shù)速度以下軌跡點落入公交站區(qū)域概率(X3)這個影響因素代入,這是小汽車與常規(guī)公交最顯著的區(qū)別。取小汽車出行為1、常規(guī)公交出行為2作為因變量(分組變量)取值,借助SPSS軟件對不同種出行方式樣本數(shù)據(jù)矩陣分析,得到Fisher判別模型:
Y=-0.097X1+0.063X2+
0.217X3-3.318
(3)
1) 1級判別
與Fisher判別模型相同,以平均速度(X1)、速度極差(X2)、20%分位數(shù)速度以下軌跡點落入公交站區(qū)域概率(X3)作為預測變量。取慢行出行為1、機動化出行為2作為因變量(分組變量)取值,借助SPSS軟件對不同種出行方式樣本數(shù)據(jù)進行分析,得到Bayes判別模型:
Y1=0.178X1+0.098X2+
0.02X3-1.472
(4)
Y2=0.544X1+1.224X2+
0.535X3-40.795
(5)
2) 2級判別
① 步行與自行車出行判別
借助SPSS軟件對不同出行方式樣本數(shù)據(jù)進行分析,得到Bayes判別模型:
Y1=6.79X1-1.616X2-14.647
(6)
Y2=9.412X1-1.912X2-29.185
(7)
② 小汽車與常規(guī)公交出行判別
借助SPSS軟件對不同出行方式樣本數(shù)據(jù)進行分析,得到Bayes判別模型:
Y1=0.223X1+0.761X2+
0.507X3-23.880
(8)
Y2=-0.062X1+0.947X2+
1.144X3-33.597
(9)
根據(jù)上述判別函數(shù),將步行出行、自行車出行、常規(guī)公交出行、小汽車交通出行樣本各變量值代入以上2種判別函數(shù)進行回判。
1) 1級判別模型檢驗
(10)
式中:n1為慢行出行樣本數(shù)量;n2為機動化出行樣本數(shù)量;n為樣本總數(shù)。
將實際數(shù)據(jù)代入式(10)求得臨界值Y0=-0.005 47,將樣本X1、X2、X3代入式(1)進行計算,得到的值小于臨界值,則為慢行出行;得到值大于臨界值,則為機動化出行。對出行方式樣品判別結果如表4所示。
表4 Fisher判別結果(1級判別模型)
Fisher判別模型對慢行出行與機動化出行方式的準確率為100%。
2) 2級判別模型檢驗
① 步行與自行車判別模型檢驗
依照上述對臨界值的計算方法對臨界值進行計算,得臨界值Y0=-0.000 95,將樣本X1、X2、X3代入式(2)進行計算,得到的值小于臨界值,則為步行出行;得到值大于臨界值,則為自行車出行。對出行方式樣品判別結果如表5所示。
Fisher判別模型對步行出行與自行車出行方式的綜合準確率為91.67%。
表5 Fisher判別結果(2級判別模型1)
② 小汽車交通與常規(guī)公交判別模型檢驗
依照上述對臨界值的計算方法對臨界值進行計算,得臨界值Y0=-0.023 72,將樣本X1、X2、X3代入式(3)進行計算,得到的值小于臨界值Y0,則為小汽車出行;得到值大于臨界值Y0,則為常規(guī)公交出行。對出行方式樣品判別結果如表6所示。
表6 Fisher判別結果(2級判別模型2)
Fisher判別模型對小汽車交通出行與常規(guī)公交出行方式的綜合準確率為96.43%。
1) 1級判別模型檢驗
將樣本X1、X2、X3代入式(4)、(5)分別進行計算,得到Y1、Y2,若Y1>Y2,則判定樣本屬于組1,即樣本屬于慢行出行;若Y1 Bayes判別模型估計慢行出行與機動化出行方式的準確率為100%。 2) 2級判別模型檢驗 ① 步行與自行車判別模型檢驗 將樣本X1、X2、X3代入式(6)、(7)分別進行計算,得到Y1、Y2,若Y1>Y2,則判定樣本屬于組1,即樣本屬于步行出行;若Y1 表7 Bayes判別結果(1級判別模型) 表8 Bayes判別結果(2級判別模型1) Bayes判別模型估計步行出行與自行車出行方式的綜合準確率為91.67%。 ② 小汽車交通與常規(guī)公交判別模型檢驗 將樣本X1、X2、X3代入式(8)、(9)分別進行計算,得到Y1、Y2,若Y1>Y2,則判定樣本屬于組1,即樣本屬于常規(guī)公交出行;若Y1 Bayes判別模型估計小汽車交通出行與常規(guī)公交出行方式的綜合準確率為96.42%。 本文利用手機GPS軌跡數(shù)據(jù),對不同種出行方式軌跡特點進行分析,依據(jù)不同出行方式的軌跡特點提出了平均速度、速度極差、20%分位數(shù)速度以下軌跡點落入公交站區(qū)域概率3個判別變量,分別利用Fisher法與Bayes法構建判別函數(shù),對收集到的38份不同出行方式軌跡數(shù)據(jù)進行了判別,取得了較好的判別結果。雖然本文所判別的軌跡數(shù)據(jù)較少,也可能會出現(xiàn)一定的誤差,且大規(guī)模的手機GPS軌跡數(shù)據(jù)較難收集,但為利用手機GPS軌跡大數(shù)據(jù)分析交通問題提供了一定的參考和依據(jù)。 [1] 李傳華,孫禮軍,陸林濤.GPS手機的差分定位系統(tǒng)研究[J].測繪科學,2012,37(3):50-51,28. [2] 武文,李博峰,李振,等.采用GPS差分改正數(shù)提高手機導航定位精度[J].導航定位學報,2015,3(3):122-125,131. [3] 夏敬潮,葉世榕,劉炎炎,等.Wi-Fi輔助下附有高程信息的GPS定位[J].武漢大學學報(信息科學版),2014,39(1):52-55. [4] 田洋.基于Android的無線GPS定位系統(tǒng)設計[D].南京:東南大學,2016. [5] 張治華.基于GPS軌跡的出行信息提取研究[D].上海:華東師范大學,2010. [6] 鄧中偉.面向交通服務的多源移動軌跡數(shù)據(jù)挖掘與多尺度居民活動的知識發(fā)現(xiàn)[D].上海:華東師范大學,2012. [7] SHEN Y,DONG H,JIA L,et al.A Method of Traffic Travel Status Segmentatioin Based on Position Trajectories[C]//IEEE,International Coference on Intelligent Transportation Systems.USA:IEEE,2015:2877-2882. [8] 楊超,朱榮榮,涂然.基于智能手機調(diào)查數(shù)據(jù)的居民出行活動特征分析[J].交通信息與安全,2015,33(6):25-32. [9] 唐娟.基于手機定位數(shù)據(jù)的居民出行OD矩陣獲取方法研究[D].成都:西南交通大學,2016. [10] 韋義明.應用手機GPS數(shù)據(jù)預測交通流速度[J].電子產(chǎn)品世界,2016,23(7):67-69. [11] STOPHER P R,GREAVES S P.Household travel surveys:Where are we going?[J].Transportation Research Part A Policy & Practice,2007,41(5):367-381. [12] CHEN C,GONG H,LAWSON T,et al.Evaluating the feasibility of a passive travel survey collection in a complex urban environment:Lessons learned from the New York City case study[J].Transportation Research Part A:Policy and Practice,2010,44(10):830-840. [13] RASMUSSEN T K,INGVARDSON J B,NIELSEN O A.Improved methods to deduct trip legs and mode from travel surveys using wearable GPS devices:A case study from the Greater Copenhagen area[J].Computers Environment & Urban Systems,2015,54:301-313. [14] SCHUESSLER N,AXHAUSEN K W.Processing Raw Data from Global Positioning Systems Without Additional Information[J].Transportation Research Record Journal of the Transportation Research Board,2009(5):28-36.6 結束語