李婭 歐青立(湖南科技大學(xué)信息與電氣工程學(xué)院,湖南湘潭 411201)
基于智能手機(jī)的交通方式識(shí)別的研究
李婭 歐青立
(湖南科技大學(xué)信息與電氣工程學(xué)院,湖南湘潭 411201)
隨著移動(dòng)互聯(lián)網(wǎng)的普及,各種有關(guān)移動(dòng)互聯(lián)網(wǎng)的應(yīng)用蘊(yùn)含著巨大的商機(jī),交通方式的自動(dòng)判別顯而易見(jiàn)在交通規(guī)劃領(lǐng)域和LBS(基于位置的服務(wù))領(lǐng)域擁有著廣闊的應(yīng)用價(jià)值?,F(xiàn)階段的智能手機(jī)擁有越來(lái)越強(qiáng)大的功能,通信不再是手機(jī)的唯一功能,智能手機(jī)的強(qiáng)大在于其不僅擁有通信功能,還有強(qiáng)大的感知、運(yùn)算和存儲(chǔ)能力,但是在當(dāng)前有關(guān)基于智能手機(jī)的交通方式識(shí)別研究中,單一的數(shù)據(jù)來(lái)源是難以使交通方式識(shí)別算法有很好的適應(yīng)性的,另外,模式識(shí)別算法本身對(duì)于不同的場(chǎng)景也有著不同的適應(yīng)能力,這些對(duì)交通方式識(shí)別精度的提高是很大的阻礙。
交通方式識(shí)別 智能手機(jī) 隨機(jī)森林算法
隨著移動(dòng)互聯(lián)網(wǎng)的普及,各種有關(guān)移動(dòng)互聯(lián)網(wǎng)的應(yīng)用蘊(yùn)含著巨大的商機(jī),交通方式的自動(dòng)判別顯而易見(jiàn)在交通規(guī)劃領(lǐng)域和LBS(基于位置的服務(wù))領(lǐng)域擁有著廣闊的應(yīng)用價(jià)值。
1.1交通方式識(shí)別概述
模式是客觀事物活動(dòng)的方式,它包括客觀事物本身,也包括有客觀事物在時(shí)間和空間分布的信息。時(shí)間萬(wàn)物都有其獨(dú)特性,這種獨(dú)特性可用三個(gè)方面來(lái)理解,即可觀察性、可區(qū)分性和相似性。
在AI(人工智能)領(lǐng)域,模式識(shí)別已經(jīng)是一個(gè)重要的分支,和人類(lèi)自身的識(shí)別系統(tǒng)相比,計(jì)算機(jī)的模式識(shí)別,其優(yōu)勢(shì)在于計(jì)算機(jī)擁有極強(qiáng)的計(jì)算能力,他可以?xún)?chǔ)存數(shù)量極大的樣本,并通過(guò)對(duì)這些樣本的分析來(lái)提取特征,而完成這些工作,計(jì)算機(jī)是高效的。如圖1所示為計(jì)算機(jī)模式識(shí)別系統(tǒng)的五個(gè)基本組成單元。
如圖1所示,現(xiàn)階段的模式識(shí)別系統(tǒng)一般都是由五個(gè)基本單元來(lái)組成。
(1)數(shù)據(jù)獲取單元;(2)預(yù)處理單元;(3)特征提取和選擇單元;(4)分類(lèi)器設(shè)計(jì)單元;(5)決策單元。
1.2定位技術(shù)研究
圖1 模式識(shí)別系統(tǒng)的五個(gè)組成單元
圖2 COO定位基本原理
1.2.1基站定位技術(shù)
在各種定位技術(shù)中,基站定位技術(shù)是最早開(kāi)始應(yīng)用的,基站定位目前采用的主要技術(shù)是COO(Cell of Origin)技術(shù),COO技術(shù)的基本原理是,在移動(dòng)終端登錄到網(wǎng)絡(luò)以后會(huì)上報(bào)自己的小區(qū)ID,移動(dòng)網(wǎng)絡(luò)會(huì)據(jù)此估算用戶(hù)的當(dāng)前位置,如圖2所示。
1.2.2GPS定位技術(shù)
GPS由衛(wèi)星、地面監(jiān)控系統(tǒng)和移動(dòng)終端三個(gè)部分組成。衛(wèi)星提供精密的時(shí)間標(biāo)準(zhǔn)并提供定位信息,地面監(jiān)控系統(tǒng)主要是對(duì)衛(wèi)星工作狀態(tài)和運(yùn)行軌道的監(jiān)控。
1.2.3A-GPS定位技術(shù)
A-GPS定位技術(shù),即輔助GPS定位技術(shù),它是一種對(duì)GPS定位方法的改進(jìn),A-GPS定位技術(shù)仍然無(wú)法解決數(shù)據(jù)缺失和數(shù)據(jù)漂移問(wèn)題,但由于有A-GPS服務(wù)器的存在,它可以起到很多輔助的作用。
1.3典型識(shí)別算法研究
在數(shù)據(jù)挖掘、機(jī)器學(xué)習(xí)和模式識(shí)別等領(lǐng)域中,都需要分類(lèi)算法,分類(lèi)算法可以分為三個(gè)步驟:(1)對(duì)已知類(lèi)別訓(xùn)練集進(jìn)行分析;(2)生成分類(lèi)規(guī)則;(3)通過(guò)規(guī)則預(yù)測(cè)新數(shù)據(jù)的類(lèi)別。
圖3 陀螺儀有效性驗(yàn)證
圖4 聲音傳感器有效性驗(yàn)證
2.1數(shù)據(jù)采集
按照現(xiàn)階段智能手機(jī)的流行配置,本系統(tǒng)要求智能手機(jī)含有GPS模塊、加速度傳感器、陀螺儀、聲音傳感器和SIM卡。因?yàn)楝F(xiàn)在一般的智能手機(jī)都能夠滿(mǎn)足這個(gè)要求,本文就不再贅述手機(jī)選型。但是采樣頻率還是需要預(yù)先設(shè)定:GPS數(shù)據(jù)每秒采樣1次,加速度傳感器和陀螺儀的采樣頻率為32Hz,聲音傳感器每秒采樣30次。
2.2特征提取
特征量主要包括時(shí)域上的特征量,如均值、過(guò)均值率、標(biāo)準(zhǔn)差、中位數(shù)、最大值與最小值的差、個(gè)數(shù)等,頻域上的特征量包括和、方差兩類(lèi)。
(1)與速度相關(guān)的特征量;(2)與加速度相關(guān)的特征量;(3)與聲音相關(guān)的特征量;(4)與交通站點(diǎn)相關(guān)的特征量。
2.3基于改進(jìn)隨機(jī)森林算法的模式識(shí)別
獲取所有的特征之后,隨機(jī)森林算法過(guò)程可做如下描述:(1)輸入的數(shù)據(jù)即樣本集,每個(gè)樣本包含有若干個(gè)特征屬性和一個(gè)類(lèi)別屬性。(2)訓(xùn)練樣本集由Bagging方法隨機(jī)抽取,最后形成的是由N個(gè)樣本組成的訓(xùn)練樣本集。(3)從樣本的特征屬性中抽取部分屬性作為分裂屬性。(4)以上步驟重復(fù)n次,最后形成由n棵決策樹(shù)構(gòu)成的森林,最后再進(jìn)行匯總排序。
2.4特征量有效性的驗(yàn)證
特征量有效性的驗(yàn)證即比較使用和不使用的情況下F值的大小就可以了。
2.4.1陀螺儀
如圖3所示為陀螺儀有效性驗(yàn)證結(jié)果,驗(yàn)證結(jié)果表明,在不使用陀螺儀的情況下, 8種類(lèi)別的F值均有下降,這也說(shuō)明,陀螺儀的引入對(duì)于交通方式識(shí)別起到了一定的作用。
2.4.2聲音傳感器
如圖4所示為聲音傳感器有效性驗(yàn)證結(jié)果,驗(yàn)證結(jié)果表明,相比較陀螺儀,聲音傳感器的引入對(duì)于交通方式識(shí)別起到的作用更大。
2.5模型簡(jiǎn)化
(1)特征重要性排序;(2)模型簡(jiǎn)化結(jié)果。
模型簡(jiǎn)化包含兩個(gè)部分,一個(gè)是特征集的簡(jiǎn)化,那么在特征集簡(jiǎn)化之后,就可以進(jìn)行模型本身的簡(jiǎn)化。
交通方式識(shí)別最重要的就在于識(shí)別的精度以及易實(shí)施性,在易實(shí)施性方面智能手機(jī)擁有先天的優(yōu)勢(shì),比如利用手機(jī)的GPS模塊和加速度傳感器進(jìn)行交通方式識(shí)別的研究論述就有不少,但是識(shí)別的精度仍然不夠,正是基于此,本文期望能夠在以下兩個(gè)方面對(duì)交通方式識(shí)別進(jìn)行更加深入的研究:(1)引入多種數(shù)據(jù)來(lái)源,解決交通方式識(shí)別中數(shù)據(jù)來(lái)源單一的問(wèn)題,并研究在新的數(shù)據(jù)來(lái)源被引入后,對(duì)識(shí)別準(zhǔn)確率的影響。(2)研究不同交通方式識(shí)別算法對(duì)識(shí)別準(zhǔn)確率的影響,特別是比較隨機(jī)森林算法和支持向量機(jī)算法在性能上的異同。
[1]熊文,陳小鴻.城市交通模式比較與啟示[J].城市規(guī)劃,2009(3):56-66.
[2]扈中偉,鄧小勇,郭繼孕.基于手機(jī)定位數(shù)據(jù)的居民出行需求特征分析[C].第八屆中國(guó)智能交通年會(huì)優(yōu)秀論文集.2013:43-51.
[3]王亮.基于判別模式學(xué)習(xí)的人體行為識(shí)別方法研究[D].黑龍江:哈爾濱哈爾濱工業(yè)大學(xué),2011:15.
[4]李輝,張亞超,劉洋等.基于中國(guó)移動(dòng)網(wǎng)絡(luò)的實(shí)時(shí)交通信息采集技術(shù)[C].第六屆中國(guó)智能交通年會(huì)暨第七屆國(guó)際節(jié)能與新能源汽車(chē)創(chuàng)新發(fā)展論壇優(yōu)秀論文集(上冊(cè)),2011:121-127.
[5]張治華.基于GPS軌跡的出行信息提取研究[D].上海華東師范大學(xué),2010:22-23.