楊津達(dá),曹永春,林 強(qiáng),滿(mǎn)正行,劉新帥
(西北民族大學(xué) 數(shù)學(xué)與計(jì)算機(jī)科學(xué)學(xué)院,甘肅 蘭州 730030)
交通擁堵已經(jīng)成為各大城市面臨的共性問(wèn)題之一,嚴(yán)重困擾著交通的各參與方,包括政府管理部門(mén)和駕駛員.為了提供交通出行的參考信息,相關(guān)學(xué)者和企業(yè)從不同角度研究交通狀態(tài)識(shí)別和預(yù)測(cè)問(wèn)題,以期構(gòu)建“智能交通系統(tǒng)”.文獻(xiàn)[1]利用自行安置的攝像頭,采集城市道路交通圖像,通過(guò)SVM對(duì)圖像的分析,實(shí)現(xiàn)對(duì)擁堵和非擁堵兩種交通狀態(tài)的識(shí)別;文獻(xiàn)[2]通過(guò)自駕車(chē)跟蹤公交車(chē)行駛,利用GPS數(shù)據(jù)采集硬件獲取運(yùn)行車(chē)輛的GPS位置和速度,并結(jié)合SVR和SVC研究了短期交通狀態(tài)識(shí)別與預(yù)測(cè).利用浮動(dòng)車(chē)技術(shù),文獻(xiàn)[3]獲取城市出租車(chē)的GPS和道路視頻數(shù)據(jù),并利用SVM二叉樹(shù)多分類(lèi)算法的識(shí)別模型進(jìn)行區(qū)域路網(wǎng)交通流狀態(tài)的識(shí)別.上述方法采用傳統(tǒng)的道路交通檢測(cè)設(shè)備進(jìn)行交通狀態(tài)的檢測(cè)與識(shí)別.由于其安裝和維護(hù)成本高以及覆蓋面積小等缺點(diǎn),在實(shí)際應(yīng)用中存在諸多問(wèn)題.
隨著智能手機(jī)中的傳感器越來(lái)越精密、種類(lèi)越來(lái)越多,利用智能手機(jī)傳感器進(jìn)行模式識(shí)別的研究受到了眾多學(xué)者的關(guān)注.基于智能手機(jī)傳感器數(shù)據(jù),文獻(xiàn)[4]研究了5種交通出行方式及其組合出行方式的識(shí)別;文獻(xiàn)[5]研究了路面平整度的評(píng)價(jià)方法;文獻(xiàn)[6,7]研究了用戶(hù)的日?;顒?dòng)行為的識(shí)別;文獻(xiàn)[8,9]研究并實(shí)現(xiàn)了準(zhǔn)確的空間定位;文獻(xiàn)[10]研究了人體運(yùn)動(dòng)識(shí)別及應(yīng)用;文獻(xiàn)[11]研究了人體跌倒檢測(cè).這些研究成果以智能手機(jī)傳感器數(shù)據(jù)為研究對(duì)象并獲得了較好的識(shí)別效果,表明智能手機(jī)內(nèi)嵌傳感器數(shù)據(jù)可以表征以智能手機(jī)為載體對(duì)象的相關(guān)行為或特征.文獻(xiàn)[12]通過(guò)比較發(fā)現(xiàn),專(zhuān)業(yè)傳感器設(shè)備和智能手機(jī)內(nèi)嵌傳感器在行駛車(chē)輛中的加速度數(shù)據(jù)高度吻合,說(shuō)明目前智能手機(jī)內(nèi)嵌傳感器精度已很高.充分利用越來(lái)越精密的手機(jī)傳感器數(shù)據(jù)進(jìn)行交通狀態(tài)識(shí)別是解決傳統(tǒng)檢測(cè)設(shè)備不足的一個(gè)新思路.雖然目前這方面的研究較少,但已有學(xué)者進(jìn)行了相關(guān)研究工作.文獻(xiàn)[13]利用手機(jī)運(yùn)動(dòng)傳感器數(shù)據(jù)進(jìn)行交通流狀態(tài)識(shí)別,通過(guò)收集手機(jī)各類(lèi)傳感器的數(shù)據(jù),利用網(wǎng)格尋優(yōu)法優(yōu)化參數(shù)后的SVM模型,對(duì)交通流狀態(tài)進(jìn)行識(shí)別,達(dá)到了不錯(cuò)的識(shí)別效果.該研究選用較特殊路段且識(shí)別模型復(fù)雜、模型輸入?yún)?shù)較多.
借助日益普及的智能手機(jī),特別是其內(nèi)嵌的各類(lèi)傳感器,本文研究了基于動(dòng)力學(xué)傳感器數(shù)據(jù)的交通狀態(tài)識(shí)別模型,以支持車(chē)輛運(yùn)行狀態(tài)的實(shí)時(shí)檢測(cè)及交通狀態(tài)信息自動(dòng)推送服務(wù).為了實(shí)現(xiàn)這一目的,本文在選用一般城市道路為實(shí)驗(yàn)路段的基礎(chǔ)上,研究了以手機(jī)加速度傳感器數(shù)據(jù)及其均值、方差為特征輸入的交通狀態(tài)識(shí)別方法.實(shí)驗(yàn)結(jié)果表明,本文提出的方法具有良好的識(shí)別性能,為實(shí)時(shí)檢測(cè)細(xì)粒度交通狀態(tài)墊定了技術(shù)基礎(chǔ),因而能夠?yàn)轳{駛員提供較為準(zhǔn)確的實(shí)時(shí)交通狀態(tài)信息,有助于緩解交通擁堵.同時(shí),實(shí)時(shí)可靠的交通狀態(tài)信息也能為政府管理部門(mén)提供包括道路優(yōu)化和分時(shí)管理的決策依據(jù).
安放在運(yùn)行車(chē)輛內(nèi)的智能手機(jī)加速度傳感器數(shù)據(jù)能夠表征運(yùn)行車(chē)輛所處道路的交通擁擠狀況,但直接以加速度傳感器原始數(shù)據(jù)作為交通狀態(tài)識(shí)別模型的特征輸入,識(shí)別效果往往不理想.為獲得精確的交通狀態(tài)識(shí)別結(jié)果,需要進(jìn)一步對(duì)原始數(shù)據(jù)進(jìn)行統(tǒng)計(jì)分析,獲取能較好表征交通狀態(tài)的模型輸入?yún)?shù).為此,基于手機(jī)傳感器的交通狀態(tài)識(shí)別過(guò)程可分為三個(gè)階段:一是手機(jī)加速度傳感器原始數(shù)據(jù)的采集;二是對(duì)手機(jī)傳感器原始數(shù)據(jù)的預(yù)處理和分類(lèi)模型所需的特征參數(shù)選??;三是構(gòu)建適合于交通狀態(tài)識(shí)別的分類(lèi)模型.
放置在運(yùn)行車(chē)輛中的手機(jī)加速度傳感器的三軸加速度數(shù)據(jù)反映了車(chē)輛在行駛過(guò)程中前后、左右運(yùn)動(dòng)和上下顛簸的趨勢(shì).為減少對(duì)三軸加速度數(shù)據(jù)的坐標(biāo)映射運(yùn)算,數(shù)據(jù)采集過(guò)程中將手機(jī)水平固定放置在行駛車(chē)輛中.如圖1所示,手機(jī)屏幕朝上水平放置于車(chē)輛內(nèi),Y軸正方向與車(chē)輛前進(jìn)方向保持一致,此時(shí)X軸加速度表示車(chē)輛變道的速度變化程度,Y軸加速度表示車(chē)輛行駛方向的速度變化程度,Z軸加速度則表示車(chē)輛的顛簸程度.
圖1 手機(jī)放置及三軸加速度方向
為方便數(shù)據(jù)采集,本文基于JAVA語(yǔ)言開(kāi)發(fā)了一個(gè)Android平臺(tái)數(shù)據(jù)采集軟件.利用Android系統(tǒng)的SensorManager服務(wù)獲得手機(jī)加速度傳感器的三軸加速度數(shù)據(jù).通過(guò)采集軟件的圖形界面,可方便控制數(shù)據(jù)采集的開(kāi)始和結(jié)束、顯示車(chē)輛運(yùn)行速度、設(shè)置加速度數(shù)據(jù)采集頻率并添加道路擁堵?tīng)顟B(tài)的標(biāo)簽.我們將車(chē)輛運(yùn)行速度的采樣頻率設(shè)置為1次/秒,三軸加速度數(shù)據(jù)采集的頻率設(shè)置為5次/秒,每條數(shù)據(jù)包含了時(shí)間、三軸加速度和速度值.
考慮到采集數(shù)據(jù)的真實(shí)性和分類(lèi)模型的可靠性,我們選取老校區(qū)到新校區(qū)的路段采集數(shù)據(jù).該路段既包括市區(qū)擁堵路段,也包括一般路段和車(chē)流量較少的暢通路段,同時(shí)考慮到不同時(shí)段數(shù)據(jù)特征對(duì)模型的影響.我們分別安排三組采集人員在上下班高峰時(shí)段和一般時(shí)段進(jìn)行了多次采集,最終組成三個(gè)數(shù)據(jù)集Dataset_1、Dataset_2、Dataset_3,分別由419、429、402條數(shù)據(jù)組成.每個(gè)數(shù)據(jù)集包含暢通、擁擠和堵塞三種交通狀態(tài)下的加速度傳感器數(shù)據(jù),通過(guò)這三個(gè)數(shù)據(jù)集來(lái)驗(yàn)證本文所構(gòu)建交通狀態(tài)識(shí)別模型的性能.
由于傳感器本身的物理特性以及采集過(guò)程中周?chē)h(huán)境的影響,采集的原始數(shù)據(jù)可能會(huì)有缺失和噪音,對(duì)交通狀態(tài)識(shí)別結(jié)果會(huì)產(chǎn)生較大影響,因此需要對(duì)其進(jìn)行插值和濾波預(yù)處理.對(duì)于缺失的數(shù)據(jù),利用相同屬性數(shù)據(jù)的均值進(jìn)行插補(bǔ);對(duì)于噪音數(shù)據(jù),即異常值數(shù)據(jù),利用其相鄰前后數(shù)據(jù)的平均值修正該異常值.
選取恰當(dāng)?shù)奶卣鲗?duì)交通狀態(tài)識(shí)別模型的識(shí)別準(zhǔn)確率有重要影響.特征組合中的各個(gè)特征量不僅要體現(xiàn)相同類(lèi)別的相似性,還要反映不同類(lèi)別間的差異性.時(shí)間序列特征一般包括時(shí)域特征、頻域特征和時(shí)頻特征.在交通狀態(tài)識(shí)別中,頻域特征和時(shí)頻特征對(duì)模型的識(shí)別效果影響較小且會(huì)帶來(lái)過(guò)多特征參數(shù).本文基于傳感器原始加速度數(shù)據(jù)提取時(shí)域特征均值、方差以及合加速度,其計(jì)算方式如下各式所示.
(1)
(2)
(3)
本文利用采集的三軸加速度原始數(shù)據(jù),設(shè)定時(shí)間窗口大小為1 s,步長(zhǎng)為1,提取每一軸數(shù)據(jù)的均值、方差及三軸的合加速度.通過(guò)python對(duì)數(shù)據(jù)進(jìn)行處理并可視化呈現(xiàn),進(jìn)一步分析各特征向量的波動(dòng)規(guī)律對(duì)不同交通狀態(tài)特征的反映.圖2和圖3分別是三種交通狀態(tài)的原始加速度數(shù)據(jù)和時(shí)域特征方差的對(duì)比分析.
圖2 不同交通狀態(tài)的加速度傳感器原始數(shù)據(jù)對(duì)比圖
由圖2和圖3可以看出,由于在暢通狀態(tài)下車(chē)輛速度很快,左右水平方向和垂直方向的顛簸導(dǎo)致這兩個(gè)方向上的加速度變化較大,因此X軸和Z軸加速度數(shù)據(jù)的波動(dòng)幅度較大.在暢通狀態(tài)下車(chē)輛基本勻速行駛,在前進(jìn)方向的Y軸加速度數(shù)據(jù)的波動(dòng)幅度很?。粨頂D狀態(tài)下,車(chē)輛速度雖然較慢,但仍以一定的速度行駛,因此X軸和Z軸加速度數(shù)據(jù)會(huì)有較小的波動(dòng),且在擁擠狀態(tài)下道路車(chē)輛較多,會(huì)導(dǎo)致目標(biāo)車(chē)輛一定的加減速.與暢通狀態(tài)相比,在Y軸上的加速度相應(yīng)較大.堵塞狀態(tài)下的車(chē)輛大多在停止及加減速狀態(tài)下頻繁轉(zhuǎn)換,引起Y軸和Z軸加速度數(shù)據(jù)波動(dòng)較頻繁且波動(dòng)幅度較擁擠的狀態(tài),但由于堵塞狀態(tài)車(chē)輛速度很低,反映在X軸加速度數(shù)據(jù)的波動(dòng)就相對(duì)很小.
圖3 不同交通狀態(tài)的加速度傳感器數(shù)據(jù)方差對(duì)比圖
如前所述,三軸加速度傳感器數(shù)據(jù)及其時(shí)域特征(均值、方差、合加速度)能反映車(chē)輛所在道路的交通運(yùn)行狀態(tài),說(shuō)明它們與交通狀態(tài)有密切關(guān)系.在構(gòu)建了交通狀態(tài)識(shí)別模型后,我們將以上述10個(gè)特征數(shù)據(jù)的組合作為模型的輸入?yún)?shù),進(jìn)一步驗(yàn)證模型有效性及各特征數(shù)據(jù)對(duì)模型識(shí)別效果的作用.
交通狀態(tài)識(shí)別問(wèn)題屬于分類(lèi)問(wèn)題,常用的分類(lèi)模型有K-近鄰分類(lèi)器、樸素貝葉斯分類(lèi)器、支持向量機(jī)(SVM)、決策樹(shù)算法等.基于SVM模型在解決小樣本、非線(xiàn)性、多分類(lèi)問(wèn)題中的優(yōu)秀表現(xiàn)以及較強(qiáng)的泛化能力,本文選用SVM作為交通狀態(tài)識(shí)別模型.
SVM通過(guò)映射函數(shù)Φ(x)將分類(lèi)樣本從線(xiàn)性不可分的原始空間映射到更高維的特征空間,從而使樣本線(xiàn)性可分,模型描述如式(4)所示.
s.t.yi(wTΦ(xi)+b)≥1,i=1,2,3,…,m.
(4)
其中yi為分類(lèi)類(lèi)別,w為權(quán)值向量,b為偏置量,Φ(x)為非線(xiàn)性映射函數(shù).
引入松弛變量ξ,可得
(5)
其中,C>0,為懲罰系數(shù).
在非線(xiàn)性問(wèn)題的特征空間中,利用拉格朗日方程對(duì)上式對(duì)偶化后,引入核函數(shù),得到最終決策函數(shù)式(6).
(6)
其中αi為拉格朗日乘子,K(xi,xj)為核函數(shù).
構(gòu)造出一個(gè)具有良好性能的SVM分類(lèi)模型,核函數(shù)的選擇是關(guān)鍵.徑向基核函數(shù)(Radial Basis Function,RBF)具有良好性能及對(duì)噪聲較強(qiáng)的抗干擾能力,在先驗(yàn)知識(shí)不足的情況下往往被選用.多項(xiàng)式核函數(shù)(Polynomial)屬于全局核函數(shù),允許相距較遠(yuǎn)的數(shù)據(jù)點(diǎn)對(duì)核函數(shù)的值有一定影響,避免了分類(lèi)結(jié)果陷入局部最優(yōu),且對(duì)于非線(xiàn)性問(wèn)題,分類(lèi)效果較好.因此本文在SVM模型中分別使用這兩種核函數(shù)進(jìn)行交通狀態(tài)識(shí)別,并比較它們的分類(lèi)效果.
核函數(shù)的選擇包括兩部分工作:一是核函數(shù)類(lèi)型的選擇,二是確定核函數(shù)類(lèi)型后相關(guān)參數(shù)的選擇.分類(lèi)模型中相關(guān)參數(shù)的選擇會(huì)對(duì)模型性能起到?jīng)Q定性作用.在SVM分類(lèi)模型中需要確定的兩個(gè)重要參數(shù)是懲罰系數(shù)C和RBF核函數(shù)參數(shù)g.考慮到網(wǎng)格搜索方法較高的精確度和本文模型較少的參數(shù)量,我們采用網(wǎng)格搜索方法確定最優(yōu)模型參數(shù).網(wǎng)格搜索法通過(guò)一定范圍將待搜索參數(shù)劃分為網(wǎng)格,然后遍歷網(wǎng)格中的所有參數(shù)組合來(lái)尋找使模型性能最優(yōu)的參數(shù)組合,結(jié)合K折交叉驗(yàn)證獲得模型最佳參數(shù)組合(C,g),最終將參數(shù)優(yōu)化后的SVM模型作為交通狀態(tài)識(shí)別模型.
在構(gòu)建了交通狀態(tài)識(shí)別模型后,本部分利用在實(shí)際交通環(huán)境中收集到的3個(gè)加速度傳感器數(shù)據(jù)集實(shí)驗(yàn)并驗(yàn)證本文提出方法在交通狀態(tài)識(shí)別應(yīng)用中的有效性.
為分析加速度傳感器數(shù)據(jù)及其時(shí)域特征對(duì)交通狀態(tài)識(shí)別模型分類(lèi)效果的影響,從而確定模型的最優(yōu)特征輸入,我們定義了由加速度傳感器數(shù)據(jù)(ax,ay,az)及其均值(max,may,maz)、方差(vax,vay,vaz)和合加速度a組成的10組特征組合(分別表示為fg1,fg2,…,fg10),具體形式如表1所示.
表1不同特征組合及其組合方式
為簡(jiǎn)單起見(jiàn),本文將交通狀態(tài)分為3類(lèi),即暢通、擁擠、堵塞,類(lèi)別標(biāo)簽分別表示為1、2、3.為避免交通狀態(tài)識(shí)別模型出現(xiàn)過(guò)擬合和欠擬合,在進(jìn)行實(shí)驗(yàn)時(shí)對(duì)所有數(shù)據(jù)集均隨機(jī)選取80%作為訓(xùn)練集,其余20%作為測(cè)試集.最終實(shí)驗(yàn)結(jié)果以每個(gè)數(shù)據(jù)集中以10次實(shí)驗(yàn)結(jié)果評(píng)價(jià)指標(biāo)的平均值表示.
本文采用混淆矩陣評(píng)價(jià)交通狀態(tài)識(shí)別模型的分類(lèi)結(jié)果,如表2所示,混淆矩陣用n行n列的矩陣表示,每一列代表預(yù)測(cè)類(lèi)別的樣本數(shù)目,每一行代表實(shí)際類(lèi)別的樣本數(shù)目,對(duì)角線(xiàn)上的樣本總數(shù)表示正確分類(lèi)的樣本數(shù).因此,各評(píng)價(jià)指標(biāo)表示為:準(zhǔn)確率acc=(TP+TN)/(TP+FN+FP+TN),表示所有預(yù)測(cè)正確的樣本占總樣本的比例.檢測(cè)率TPR=TP/(TP+FN),表示正樣本中正確預(yù)測(cè)為正樣本的樣本數(shù)占所有正樣本的比例;誤報(bào)率FPR=FP/(FP+TN),表示負(fù)樣本中預(yù)測(cè)為正樣本的樣本數(shù)占所有負(fù)樣本的比例.
表2混淆矩陣
基于前述交通狀態(tài)識(shí)別模型構(gòu)建的思路,本文實(shí)驗(yàn)分兩個(gè)階段,在第1階段,本文以表1中各組特征組合分別作為Polynomial核函數(shù)SVM模型和RBF核函數(shù)SVM模型的特征輸入.比較兩種不同核函數(shù)分類(lèi)模型的交通狀態(tài)識(shí)別效果,并進(jìn)一步分析不同特征對(duì)交通狀態(tài)識(shí)別的作用.在第2階段,本文利用網(wǎng)格搜索方法對(duì)RBF核函數(shù)的SVM模型進(jìn)行參數(shù)尋優(yōu),以確定適合交通狀態(tài)識(shí)別模型的最優(yōu)參數(shù)組合.實(shí)驗(yàn)中設(shè)置交叉驗(yàn)證折數(shù)K=10,參數(shù)C、g尋優(yōu)范圍為(2-5,25),搜索步長(zhǎng)為0.03125.具體搜索過(guò)程為:首先在C、g坐標(biāo)系上構(gòu)建二維網(wǎng)格,網(wǎng)格節(jié)點(diǎn)就是C、g的參數(shù)組合;接著對(duì)每一組(C,g),將數(shù)據(jù)集隨機(jī)分成10個(gè)互不相交的子集.每個(gè)子集的數(shù)目大小大致相等,輪流將其中9組作為訓(xùn)練集,剩下的1組作為測(cè)試集驗(yàn)證模型并得到此測(cè)試集下的模型分類(lèi)準(zhǔn)確率.最終得到10組測(cè)試集下的分類(lèi)準(zhǔn)確率并計(jì)算其平均值,以平均準(zhǔn)確率最高的(C,g)參數(shù)值對(duì)作為SVM模型的最佳參數(shù)值.
首先進(jìn)行Polynomial核函數(shù)SVM模型和RBF核函數(shù)SVM模型識(shí)別效果的比較實(shí)驗(yàn),基于3個(gè)數(shù)據(jù)集,用10種特征組合分別訓(xùn)練兩個(gè)核函數(shù)的SVM模型.對(duì)每種核函數(shù)的模型進(jìn)行10組實(shí)驗(yàn),核函數(shù)參數(shù)均為默認(rèn)值,實(shí)驗(yàn)結(jié)果如表3和表4所示.
表3Polynomial核函數(shù)SVM模型的實(shí)驗(yàn)結(jié)果
表4 RBF核函數(shù)SVM模型的實(shí)驗(yàn)結(jié)果
對(duì)比表3和表4中兩種核函數(shù)在不同特征組合輸入下的識(shí)別效果可以看出,雖然兩種核函數(shù)不同特征組合的輸入下的識(shí)別結(jié)果在訓(xùn)練集中近似,甚至Polynomial核函數(shù)在有些特征組合輸入下識(shí)別準(zhǔn)確率更高,但RBF核函數(shù)在測(cè)試集上的識(shí)別準(zhǔn)確率整體上高于Polynomial核函數(shù)的SVM模型,說(shuō)明RBF核函數(shù)的SVM模型泛化程度更好.
進(jìn)一步分析同一種核函數(shù)的SVM模型在不同特征組合輸入下的識(shí)別效果可以看出,以fg3、fg4為輸入特征,相比f(wàn)g1為輸入特征的模型識(shí)別準(zhǔn)確率有明顯提高.說(shuō)明均值、方差這兩個(gè)時(shí)域特征對(duì)于交通狀態(tài)識(shí)別作用非常關(guān)鍵;以fg9為輸入特征比f(wàn)g5為輸入特征的模型識(shí)別準(zhǔn)確率有明顯優(yōu)勢(shì),說(shuō)明原始三軸加速度數(shù)據(jù)對(duì)交通狀態(tài)識(shí)別作用較大.最后分別比較fg1與fg2、fg3與fg6、fg4與fg7、fg5與fg8及fg9、fg10作為輸入特征的識(shí)別準(zhǔn)確率.可以看出,在增加了合加速度特征輸入后識(shí)別準(zhǔn)確率幾乎不變或有所降低,說(shuō)明合加速度對(duì)模型的識(shí)別效果作用不大.
綜合上述情況來(lái)看,以原始數(shù)據(jù)及其均值、方差的組合(即fg9)作為輸入特征,可使模型具有最佳交通狀態(tài)識(shí)別效果.
在第2階段實(shí)驗(yàn)中,本文以原始三軸加速度數(shù)據(jù)及其均值、方差的組合(fg9)作為RBF核函數(shù)SVM模型的特征輸入,分別在3個(gè)數(shù)據(jù)集上根據(jù)預(yù)先設(shè)定好的參數(shù)范圍,利用網(wǎng)格搜索方法優(yōu)化模型參數(shù)C和g,得到(C,g)最優(yōu)參數(shù)值為(23,2-1).分別在3個(gè)數(shù)據(jù)集上用設(shè)置了最優(yōu)參數(shù)的交通狀態(tài)識(shí)別模型進(jìn)行實(shí)驗(yàn),實(shí)驗(yàn)結(jié)果如表5所示.
表5最優(yōu)(C,g)值下的RBF核函數(shù)SVM模型實(shí)驗(yàn)結(jié)果
從表5結(jié)果可以看出,對(duì)模型參數(shù)經(jīng)過(guò)優(yōu)化后,在不同的數(shù)據(jù)集上模型識(shí)別準(zhǔn)確率均有所提高,但在不同數(shù)據(jù)集上的識(shí)別準(zhǔn)確率有一定差異.其差異主要是不同數(shù)據(jù)集采集人員對(duì)交通狀態(tài)的標(biāo)記誤差及車(chē)輛運(yùn)行環(huán)境的差異等因素導(dǎo)致.
根據(jù)3個(gè)數(shù)據(jù)集上測(cè)試結(jié)果的混淆矩陣,分別計(jì)算測(cè)試集每個(gè)樣本的TPR、FPR,得到3組(TPR,F(xiàn)PR),繪制不同數(shù)據(jù)集上ROC曲線(xiàn),如圖4所示.
圖4 3個(gè)數(shù)據(jù)集上模型識(shí)別結(jié)果的ROC曲線(xiàn)
利用上述ROC曲線(xiàn)計(jì)算3個(gè)數(shù)據(jù)集上的AUC值(ROC曲線(xiàn)下的面積),結(jié)果如表6.
表63個(gè)數(shù)據(jù)集下ROC曲線(xiàn)的AUC值
從圖4和表6可以看出,每個(gè)數(shù)據(jù)集的ROC曲線(xiàn)均接近左上角且AUC值在0.9以上,說(shuō)明本文模型擁有良好的識(shí)別性能.不同數(shù)據(jù)集上實(shí)驗(yàn)結(jié)果存在一定差異的原因是由于不同數(shù)據(jù)集采集人員對(duì)交通狀態(tài)的標(biāo)記誤差及車(chē)輛運(yùn)行環(huán)境的差異等因素導(dǎo)致.
本文研究了基于手機(jī)傳感器的車(chē)輛行駛狀態(tài)數(shù)據(jù)收集及交通狀態(tài)識(shí)別方法,首先利用自開(kāi)發(fā)的數(shù)據(jù)采集軟件獲取能夠反映道路交通狀態(tài)的傳感器數(shù)據(jù),并對(duì)其統(tǒng)計(jì)特征進(jìn)行分析,發(fā)現(xiàn)加速度傳感器原始數(shù)據(jù)及其均值、方差與道路交通狀態(tài)有較高的相關(guān)性.接著構(gòu)建了適合于交通狀態(tài)識(shí)別的SVM模型.模型選用Polynomial和RBF核函數(shù)以比較不同核函數(shù)對(duì)交通狀態(tài)識(shí)別效果.最后利用在真實(shí)運(yùn)行環(huán)境中獲取的3個(gè)手機(jī)加速度傳感器數(shù)據(jù)集驗(yàn)證了模型的有效性.實(shí)驗(yàn)結(jié)果表明,RBF核函數(shù)SVM模型識(shí)別效果優(yōu)于Polynomial核函數(shù)的模型,并且發(fā)現(xiàn)加速度傳感器數(shù)據(jù)及其均值、方差對(duì)交通狀態(tài)的識(shí)別有重要作用.在確定了RBF核函數(shù)SVM模型的最佳模型參數(shù)后,最高識(shí)別準(zhǔn)確率達(dá)到了94.05%.這表明本文模型具有有效性和良好性能.
本文未來(lái)需要進(jìn)一步研究的內(nèi)容包括:一是研究能夠反映交通狀態(tài)的手機(jī)傳感器數(shù)據(jù),如陀螺儀、磁力傳感器等傳感器數(shù)據(jù)對(duì)交通狀態(tài)識(shí)別的影響;二是進(jìn)一步研究除均值、方差外的更多時(shí)域特征對(duì)交通狀態(tài)識(shí)別的作用;三是嘗試對(duì)模型參數(shù)優(yōu)化方法進(jìn)行改進(jìn).通過(guò)上述幾方面的進(jìn)一步研究,以期提高交通狀態(tài)識(shí)別模型更高的識(shí)別準(zhǔn)確率.
西北民族大學(xué)學(xué)報(bào)(自然科學(xué)版)2019年4期