李婭 歐青立(湖南科技大學(xué)信息與電氣工程學(xué)院,湖南湘潭 411201)
基于智能手機(jī)的交通方式識別的研究
李婭 歐青立
(湖南科技大學(xué)信息與電氣工程學(xué)院,湖南湘潭 411201)
隨著移動互聯(lián)網(wǎng)的普及,各種有關(guān)移動互聯(lián)網(wǎng)的應(yīng)用蘊含著巨大的商機(jī),交通方式的自動判別顯而易見在交通規(guī)劃領(lǐng)域和LBS(基于位置的服務(wù))領(lǐng)域擁有著廣闊的應(yīng)用價值?,F(xiàn)階段的智能手機(jī)擁有越來越強(qiáng)大的功能,通信不再是手機(jī)的唯一功能,智能手機(jī)的強(qiáng)大在于其不僅擁有通信功能,還有強(qiáng)大的感知、運算和存儲能力,但是在當(dāng)前有關(guān)基于智能手機(jī)的交通方式識別研究中,單一的數(shù)據(jù)來源是難以使交通方式識別算法有很好的適應(yīng)性的,另外,模式識別算法本身對于不同的場景也有著不同的適應(yīng)能力,這些對交通方式識別精度的提高是很大的阻礙。
交通方式識別 智能手機(jī) 隨機(jī)森林算法
隨著移動互聯(lián)網(wǎng)的普及,各種有關(guān)移動互聯(lián)網(wǎng)的應(yīng)用蘊含著巨大的商機(jī),交通方式的自動判別顯而易見在交通規(guī)劃領(lǐng)域和LBS(基于位置的服務(wù))領(lǐng)域擁有著廣闊的應(yīng)用價值。
1.1交通方式識別概述
模式是客觀事物活動的方式,它包括客觀事物本身,也包括有客觀事物在時間和空間分布的信息。時間萬物都有其獨特性,這種獨特性可用三個方面來理解,即可觀察性、可區(qū)分性和相似性。
在AI(人工智能)領(lǐng)域,模式識別已經(jīng)是一個重要的分支,和人類自身的識別系統(tǒng)相比,計算機(jī)的模式識別,其優(yōu)勢在于計算機(jī)擁有極強(qiáng)的計算能力,他可以儲存數(shù)量極大的樣本,并通過對這些樣本的分析來提取特征,而完成這些工作,計算機(jī)是高效的。如圖1所示為計算機(jī)模式識別系統(tǒng)的五個基本組成單元。
如圖1所示,現(xiàn)階段的模式識別系統(tǒng)一般都是由五個基本單元來組成。
(1)數(shù)據(jù)獲取單元;(2)預(yù)處理單元;(3)特征提取和選擇單元;(4)分類器設(shè)計單元;(5)決策單元。
1.2定位技術(shù)研究
圖1 模式識別系統(tǒng)的五個組成單元
圖2 COO定位基本原理
1.2.1基站定位技術(shù)
在各種定位技術(shù)中,基站定位技術(shù)是最早開始應(yīng)用的,基站定位目前采用的主要技術(shù)是COO(Cell of Origin)技術(shù),COO技術(shù)的基本原理是,在移動終端登錄到網(wǎng)絡(luò)以后會上報自己的小區(qū)ID,移動網(wǎng)絡(luò)會據(jù)此估算用戶的當(dāng)前位置,如圖2所示。
1.2.2GPS定位技術(shù)
GPS由衛(wèi)星、地面監(jiān)控系統(tǒng)和移動終端三個部分組成。衛(wèi)星提供精密的時間標(biāo)準(zhǔn)并提供定位信息,地面監(jiān)控系統(tǒng)主要是對衛(wèi)星工作狀態(tài)和運行軌道的監(jiān)控。
1.2.3A-GPS定位技術(shù)
A-GPS定位技術(shù),即輔助GPS定位技術(shù),它是一種對GPS定位方法的改進(jìn),A-GPS定位技術(shù)仍然無法解決數(shù)據(jù)缺失和數(shù)據(jù)漂移問題,但由于有A-GPS服務(wù)器的存在,它可以起到很多輔助的作用。
1.3典型識別算法研究
在數(shù)據(jù)挖掘、機(jī)器學(xué)習(xí)和模式識別等領(lǐng)域中,都需要分類算法,分類算法可以分為三個步驟:(1)對已知類別訓(xùn)練集進(jìn)行分析;(2)生成分類規(guī)則;(3)通過規(guī)則預(yù)測新數(shù)據(jù)的類別。
圖3 陀螺儀有效性驗證
圖4 聲音傳感器有效性驗證
2.1數(shù)據(jù)采集
按照現(xiàn)階段智能手機(jī)的流行配置,本系統(tǒng)要求智能手機(jī)含有GPS模塊、加速度傳感器、陀螺儀、聲音傳感器和SIM卡。因為現(xiàn)在一般的智能手機(jī)都能夠滿足這個要求,本文就不再贅述手機(jī)選型。但是采樣頻率還是需要預(yù)先設(shè)定:GPS數(shù)據(jù)每秒采樣1次,加速度傳感器和陀螺儀的采樣頻率為32Hz,聲音傳感器每秒采樣30次。
2.2特征提取
特征量主要包括時域上的特征量,如均值、過均值率、標(biāo)準(zhǔn)差、中位數(shù)、最大值與最小值的差、個數(shù)等,頻域上的特征量包括和、方差兩類。
(1)與速度相關(guān)的特征量;(2)與加速度相關(guān)的特征量;(3)與聲音相關(guān)的特征量;(4)與交通站點相關(guān)的特征量。
2.3基于改進(jìn)隨機(jī)森林算法的模式識別
獲取所有的特征之后,隨機(jī)森林算法過程可做如下描述:(1)輸入的數(shù)據(jù)即樣本集,每個樣本包含有若干個特征屬性和一個類別屬性。(2)訓(xùn)練樣本集由Bagging方法隨機(jī)抽取,最后形成的是由N個樣本組成的訓(xùn)練樣本集。(3)從樣本的特征屬性中抽取部分屬性作為分裂屬性。(4)以上步驟重復(fù)n次,最后形成由n棵決策樹構(gòu)成的森林,最后再進(jìn)行匯總排序。
2.4特征量有效性的驗證
特征量有效性的驗證即比較使用和不使用的情況下F值的大小就可以了。
2.4.1陀螺儀
如圖3所示為陀螺儀有效性驗證結(jié)果,驗證結(jié)果表明,在不使用陀螺儀的情況下, 8種類別的F值均有下降,這也說明,陀螺儀的引入對于交通方式識別起到了一定的作用。
2.4.2聲音傳感器
如圖4所示為聲音傳感器有效性驗證結(jié)果,驗證結(jié)果表明,相比較陀螺儀,聲音傳感器的引入對于交通方式識別起到的作用更大。
2.5模型簡化
(1)特征重要性排序;(2)模型簡化結(jié)果。
模型簡化包含兩個部分,一個是特征集的簡化,那么在特征集簡化之后,就可以進(jìn)行模型本身的簡化。
交通方式識別最重要的就在于識別的精度以及易實施性,在易實施性方面智能手機(jī)擁有先天的優(yōu)勢,比如利用手機(jī)的GPS模塊和加速度傳感器進(jìn)行交通方式識別的研究論述就有不少,但是識別的精度仍然不夠,正是基于此,本文期望能夠在以下兩個方面對交通方式識別進(jìn)行更加深入的研究:(1)引入多種數(shù)據(jù)來源,解決交通方式識別中數(shù)據(jù)來源單一的問題,并研究在新的數(shù)據(jù)來源被引入后,對識別準(zhǔn)確率的影響。(2)研究不同交通方式識別算法對識別準(zhǔn)確率的影響,特別是比較隨機(jī)森林算法和支持向量機(jī)算法在性能上的異同。
[1]熊文,陳小鴻.城市交通模式比較與啟示[J].城市規(guī)劃,2009(3):56-66.
[2]扈中偉,鄧小勇,郭繼孕.基于手機(jī)定位數(shù)據(jù)的居民出行需求特征分析[C].第八屆中國智能交通年會優(yōu)秀論文集.2013:43-51.
[3]王亮.基于判別模式學(xué)習(xí)的人體行為識別方法研究[D].黑龍江:哈爾濱哈爾濱工業(yè)大學(xué),2011:15.
[4]李輝,張亞超,劉洋等.基于中國移動網(wǎng)絡(luò)的實時交通信息采集技術(shù)[C].第六屆中國智能交通年會暨第七屆國際節(jié)能與新能源汽車創(chuàng)新發(fā)展論壇優(yōu)秀論文集(上冊),2011:121-127.
[5]張治華.基于GPS軌跡的出行信息提取研究[D].上海華東師范大學(xué),2010:22-23.