李 達(dá),張照生,劉 鵬,王震坡,董昊天
(1.北京理工大學(xué)機(jī)械與車輛學(xué)院,北京 100081; 2.北京理工大學(xué),電動(dòng)車輛國(guó)家工程實(shí)驗(yàn)室,北京 100081;3.北京市電動(dòng)車輛協(xié)同創(chuàng)新中心,北京 100081)
智能交通系統(tǒng)是指將信息通信技術(shù)、電子傳感技術(shù)、控制技術(shù)和計(jì)算機(jī)技術(shù)等有效集成運(yùn)用于整個(gè)地面交通管理系統(tǒng)而建立的一種在大范圍內(nèi)、全方位發(fā)揮作用的,實(shí)時(shí)、準(zhǔn)確、高效的綜合交通運(yùn)輸管理系統(tǒng)[1],已成為未來交通的必然發(fā)展趨勢(shì)[2]。作為智能交通系統(tǒng)不可或缺的組成部分,車輛的特征檢測(cè)和分類已經(jīng)成為現(xiàn)在研究的熱點(diǎn)[3]。車輛檢測(cè)與分類主要有以下應(yīng)用:(1)準(zhǔn)確的車輛分類是實(shí)現(xiàn)交通負(fù)荷分析和預(yù)測(cè)的基礎(chǔ),進(jìn)而可對(duì)未來的交通路線進(jìn)行提前調(diào)度并優(yōu)化;(2)為評(píng)估道路的使用壽命和潛在風(fēng)險(xiǎn)提供依據(jù),進(jìn)而對(duì)道路保養(yǎng)維護(hù)提供依據(jù);(3)通過計(jì)算不同類型車輛的碳排放,進(jìn)而評(píng)估車輛對(duì)某地區(qū)環(huán)境的污染程度;(4)對(duì)警車、救護(hù)車等緊急性和優(yōu)先級(jí)較高的車輛進(jìn)行識(shí)別并優(yōu)先引導(dǎo);(5)通過識(shí)別車輛類型實(shí)現(xiàn)自動(dòng)收費(fèi)。
國(guó)內(nèi)外的一些學(xué)者通過視頻檢測(cè)實(shí)現(xiàn)車輛的分類[4]。Li等提出一種基于卷積神經(jīng)網(wǎng)絡(luò)(convolutional neural networks,CNN)視頻檢測(cè)的車輛分類方法,通過采用雙交叉熵?fù)p失函數(shù)的CNN來對(duì)小樣本細(xì)粒度車輛數(shù)據(jù)達(dá)到較好的分類效果[5];Ma等提出一種基于通道最大池化CNN和視頻檢測(cè)的車輛分類方法,通過在全連接層和卷積層之間插入新層提高細(xì)粒度車輛分類任務(wù)的分類精度[6];Wang等提出一種基于快速區(qū)域—卷積神經(jīng)網(wǎng)絡(luò)和視頻檢測(cè)的車輛分類方法[7]?;谝曨l檢測(cè)的車輛分類方法具有較高的準(zhǔn)確率,但是受天氣、光照等環(huán)境因素影響較大。此外,視頻信號(hào)數(shù)據(jù)量較大,對(duì)數(shù)據(jù)的傳輸和處理要求較高,訓(xùn)練模型所需時(shí)間也較長(zhǎng)。
近年來一些學(xué)者提出基于磁傳感器采集車輛磁場(chǎng)信號(hào)來實(shí)現(xiàn)車輛的分類。Taghvaeeyan等通過決策樹和支持向量機(jī)(support vector machine,SVM)將車輛分為小型、中型、大型和特大型車輛4類,準(zhǔn)確率達(dá)到了83%以上[8];Yang等采用決策樹將車輛分為5類,準(zhǔn)確率達(dá)到90%以上[9]。但決策樹需提取的特征較多,當(dāng)采集的車輛信號(hào)特征較少時(shí),不能獲得較高的準(zhǔn)確率。王卿分別利用最鄰近結(jié)點(diǎn)算法(K-nearest neighbor,KNN)和反向傳播神經(jīng)網(wǎng)絡(luò)算法(back propagation neural networks,BP)實(shí)現(xiàn)車輛分類,平均準(zhǔn)確率分別達(dá)到77.6%和76.3%[10];溫美玲采用分層決策樹算法將被檢測(cè)車輛分為4類,準(zhǔn)確率最高達(dá)到85.3%[11]。上述文獻(xiàn)基于車輛磁場(chǎng)信號(hào)通過機(jī)器學(xué)習(xí)方法實(shí)現(xiàn)車輛分類,但都沒有考慮磁場(chǎng)信號(hào)的時(shí)序特點(diǎn),因此準(zhǔn)確性不高。
隨著人工智能和深度學(xué)習(xí)的發(fā)展,循環(huán)神經(jīng)網(wǎng)絡(luò)(recurrent neural networks,RNN)被廣泛應(yīng)用于情感分類[12]、市場(chǎng)預(yù)測(cè)[13]和語音識(shí)別[14]等領(lǐng)域以生成或預(yù)測(cè)序列[15]。而長(zhǎng)短時(shí)記憶循環(huán)神經(jīng)網(wǎng)絡(luò)(long short-term memory neural networks,LSTM)作為最廣泛應(yīng)用的一種RNN,在避免梯度消失和梯度爆炸方面表現(xiàn)良好,對(duì)較長(zhǎng)的時(shí)間序列訓(xùn)練效果更好[16-17]。本文中將LSTM與自適應(yīng)增強(qiáng)算法(adaptive boosting,AdaBoost)結(jié)合,提出一種基于改進(jìn)LSTM-AdaBoost的多天氣車輛分類方法。對(duì)LSTM的隱藏層進(jìn)行改進(jìn),并提出一種“多層網(wǎng)格法”以準(zhǔn)確確定改進(jìn)LSTM的超參數(shù)。首先建立地磁車輛檢測(cè)系統(tǒng)平臺(tái)和車輛分類方法,然后分析了基于改進(jìn)LSTM-AdaBoost的車輛分類結(jié)果,并對(duì)不同車輛分類方法以及不同天氣下的分類準(zhǔn)確率進(jìn)行了對(duì)比。
車輛地磁檢測(cè)系統(tǒng)平臺(tái)是實(shí)現(xiàn)車輛分類的基礎(chǔ)。本文所設(shè)計(jì)的地磁車輛檢測(cè)系統(tǒng)平臺(tái)包括地磁車輛檢測(cè)器和個(gè)人計(jì)算機(jī)兩部分,其系統(tǒng)框圖如圖1所示。地磁車輛檢測(cè)器主要由電源、微控制器(microcontroller unit,MCU)、磁傳感器和藍(lán)牙通信模塊構(gòu)成。系統(tǒng)運(yùn)行時(shí),地磁車輛檢測(cè)器與計(jì)算機(jī)通過藍(lán)牙進(jìn)行數(shù)據(jù)通信,計(jì)算機(jī)將獲取的數(shù)據(jù)保存在數(shù)據(jù)庫(kù)中。
圖1 地磁車輛檢測(cè)系統(tǒng)
在車輛磁場(chǎng)信號(hào)測(cè)量的相關(guān)研究工作中,磁傳感器布置高度沒有統(tǒng)一的標(biāo)準(zhǔn)[10]。由于不同車型的構(gòu)造也有所區(qū)別,從理論上建立車輛鐵磁性物質(zhì)分布模型的難度較大。因此,設(shè)計(jì)并實(shí)施了在不同傳感器放置高度下的車輛磁場(chǎng)信號(hào)測(cè)量實(shí)驗(yàn),在5~25 cm區(qū)間內(nèi)每隔1 cm進(jìn)行一次實(shí)驗(yàn)。圖2展示了10、15、20、25 cm 4個(gè)不同高度的波形形狀。
車輛信號(hào)越明顯,信號(hào)的波動(dòng)應(yīng)越大,因此用X、Y、Z 3個(gè)方向磁場(chǎng)強(qiáng)度的標(biāo)準(zhǔn)差的平均值λ來定量描述信號(hào)采集效果。λ越大,則采集效果越好。不同布置高度下磁場(chǎng)強(qiáng)度的標(biāo)準(zhǔn)差的平均值如圖3所示。從圖中可以看出,當(dāng)布置高度為20 cm時(shí),λ最大,為12.41×10-7T,因此選用20 cm布置高度,以達(dá)到最高的車輛區(qū)分度。
圖2 傳感器不同布置高度下的波形形狀
圖3 不同布置高度下磁場(chǎng)強(qiáng)度標(biāo)準(zhǔn)差的平均值
綜合考慮美國(guó)聯(lián)邦公路局(federal highway administration,F(xiàn)HWA)車輛分類標(biāo)準(zhǔn)、實(shí)際測(cè)試過程中觀察到的車型、車輛分類準(zhǔn)確度和實(shí)際規(guī)劃需求等因素,根據(jù)車長(zhǎng)、車寬、車高等車輛外形幾何參數(shù)將車輛分為小型、中型和大型車輛3類。各類型車輛劃分標(biāo)準(zhǔn)如表1所示。
表1 車輛類型劃分標(biāo)準(zhǔn)
車輛信號(hào)是指當(dāng)某一車輛經(jīng)過檢測(cè)器附近時(shí),對(duì)地磁場(chǎng)基準(zhǔn)值產(chǎn)生擾動(dòng)的部分。須通過對(duì)無車狀態(tài)下的磁場(chǎng)強(qiáng)度進(jìn)行測(cè)量,進(jìn)而給X、Y、Z三軸的磁場(chǎng)強(qiáng)度做出補(bǔ)償,使無車情況下的三軸磁場(chǎng)強(qiáng)度在0附近波動(dòng)。經(jīng)過磁場(chǎng)補(bǔ)償以后3種類型車輛的典型波形如圖4所示。
LSTM是一種改進(jìn)的RNN,隱藏層結(jié)構(gòu)如圖5所示,其中yt、ht為t時(shí)刻的輸出,ct為t時(shí)刻的狀態(tài),xt為t時(shí)刻的輸入,相比于普通的RNN,LSTM隱含層結(jié)構(gòu)多了遺忘門ft、輸入門it和輸出門ot。這3個(gè)門決定了循環(huán)神經(jīng)網(wǎng)絡(luò)要記憶哪些重要信息和遺忘哪些不重要的信息,因此LSTM在避免梯度消失和梯度爆炸方面表現(xiàn)良好,對(duì)較長(zhǎng)的時(shí)間序列訓(xùn)練效果更好。
圖4 經(jīng)過磁場(chǎng)補(bǔ)償以后3種類型車輛的典型波形
圖5 LSTM的隱藏層結(jié)構(gòu)
根據(jù)Gers等的研究,若將細(xì)胞的狀態(tài)添加到“門”輸入中,LSTM訓(xùn)練效果會(huì)更好[18]。LSTM通過遺忘門ft、輸入門it、輸出門ot決定記憶哪些重要信息和遺忘哪些不重要的信息,如果把隱含層的狀態(tài)也作為門的輸入,那么LSTM也能通過遺忘門ft、輸入門it、輸出門ot決定記憶哪些重要狀態(tài)和遺忘哪些不重要的狀態(tài),從而提高LSTM的效果。本文中將t-1時(shí)刻的狀態(tài)輸入到遺忘門ft、輸入門it、輸出門ot中。改進(jìn)LSTM的隱藏層內(nèi)部結(jié)構(gòu)如圖6所示。
圖6 改進(jìn)LSTM隱藏層結(jié)構(gòu)
改進(jìn)后的LSTM中各參數(shù)滿足如下關(guān)系式:
式中:Wf、Wi、Wo、Wc分別為遺忘門、輸入門、輸出門、輸入單元狀態(tài)權(quán)重矩陣;bf、bi、bo、bc分別為遺忘門、輸入門、輸出門、輸入單元狀態(tài)偏置矩陣。
AdaBoost是由Freund等提出的一種用于解決二分類問題的集成學(xué)習(xí)方法[19]。經(jīng)過改進(jìn)產(chǎn)生的AdaBoost.M1算法將二分類擴(kuò)展到多分類問題,Ada-Boost.M2算法不僅可處理多分類問題,還引入置信度來進(jìn)一步提高分類效果。由于本文中將車輛分為小、中、大3種類型,是一個(gè)多分類問題。因此采用AdaBoost.M2算法對(duì)多個(gè)改進(jìn)LSTM弱分類器進(jìn)行集成,通過迭代更新各樣本的權(quán)重,結(jié)合策略形成改進(jìn)LSTM-AdaBoost強(qiáng)分類器,提高車輛分類的準(zhǔn)確性。改進(jìn)LSTM-AdaBoost方法整體框架如圖7所示。
圖7 改進(jìn)LSTM-AdaBoost方法
當(dāng)車輛經(jīng)過地磁傳感器時(shí),產(chǎn)生的地磁信號(hào)服從時(shí)間序列分布,因此改進(jìn)LSTM模型的輸入為一段時(shí)間內(nèi)X、Y、Z三軸的磁場(chǎng)強(qiáng)度,輸出為車輛的類型,因此選擇“多對(duì)一”架構(gòu)。AdaBoost將10個(gè)改進(jìn)LSTM分類器進(jìn)行集成,通過各LSTM分類器車輛分類的錯(cuò)誤率對(duì)訓(xùn)練樣本的權(quán)重進(jìn)行更新迭代,最后再通過各改進(jìn)LSTM分類器的車輛分類的錯(cuò)誤率確定各改進(jìn)LSTM分類器的權(quán)重。車輛分類流程如圖8所示。
圖8 基于改進(jìn)LSTM-AdaBoost的車輛分類流程
設(shè)樣本訓(xùn)練集為
式中:yi∈Y={1,…,k},i為訓(xùn)練樣本的編號(hào),k為車輛類型數(shù),k=3;N為樣本數(shù)量。
具體步驟如下。
(1)預(yù)處理:提取X、Y、Z三軸的磁場(chǎng)強(qiáng)度數(shù)據(jù),并進(jìn)行磁場(chǎng)強(qiáng)度補(bǔ)償。
(2)設(shè)置初始條件
設(shè)置AdaBoost的初始條件:設(shè)置迭代次數(shù)T為10,初始化分布權(quán)重D1(i)與樣本權(quán)重為
式中:i=1,2,…,N;y∈Y-y。
設(shè)置改進(jìn)LSTM的結(jié)構(gòu)與超參數(shù):定義損失函數(shù)與優(yōu)化方法。本文根據(jù)車輛磁場(chǎng)信號(hào)來識(shí)別車輛類型,實(shí)質(zhì)上是分類問題,因此選用交叉熵函數(shù)作為損失函數(shù)。使用Adam作為優(yōu)化方法,根據(jù)損失函數(shù)的梯度更新權(quán)重和偏置。設(shè)定學(xué)習(xí)速率、時(shí)間步長(zhǎng)、樣本數(shù)量、輸入維度、輸出維度、全連接層神經(jīng)元個(gè)數(shù)、全連接層激勵(lì)函數(shù)和正則項(xiàng)。
(3)更新分布權(quán)重,令
則標(biāo)簽加權(quán)函數(shù)為
則分布權(quán)重為
(4)訓(xùn)練改進(jìn)LSTM網(wǎng)絡(luò)
初始化權(quán)重和偏置,并通過反向傳播算法訓(xùn)練改進(jìn)LSTM網(wǎng)絡(luò)。當(dāng)N>Nmax時(shí)停止訓(xùn)練,保存模型,得到弱分類器ht,ht的輸入為加權(quán)后的X、Y、Z 3個(gè)方向的磁場(chǎng)強(qiáng)度,輸出為車輛分類結(jié)果。否則返回步驟(3)。N為當(dāng)前交叉熵連續(xù)不低于歷史輸出最低交叉熵的次數(shù)。本文中取Nmax=10。
(5)計(jì)算弱分類器的錯(cuò)誤率:
(6)更新樣本權(quán)重:
式中 βt為第t個(gè)弱分類器的修正系數(shù),βt=εt/(1-εt)。
(7)如果 εt>0.5且t≤T,則返回步驟(3)繼續(xù)進(jìn)行迭代,否則迭代結(jié)束,得到強(qiáng)分類器H(x)為
改進(jìn)LSTM的超參數(shù)包括學(xué)習(xí)速率、時(shí)間步長(zhǎng)、樣本數(shù)量、輸入維度、輸出維度、全連接層神經(jīng)元個(gè)數(shù)、全連接層激勵(lì)函數(shù)和正則項(xiàng)系數(shù)。神經(jīng)網(wǎng)絡(luò)各個(gè)超參數(shù)的大小對(duì)模型的準(zhǔn)確性和泛化性有至關(guān)重要的作用[20]。本文中將數(shù)據(jù)劃分為訓(xùn)練集、開發(fā)集和測(cè)試集,在訓(xùn)練集和開發(fā)集上對(duì)不同的超參數(shù)進(jìn)行試錯(cuò),通過比較不同超參數(shù)的交叉驗(yàn)證的準(zhǔn)確率確定最優(yōu)的超參數(shù),然后用測(cè)試集對(duì)模型超參數(shù)確定的效果和模型的訓(xùn)練效果進(jìn)行驗(yàn)證。這樣既充分利用了數(shù)據(jù)集,又增強(qiáng)了模型的泛化性。
共測(cè)試了640輛汽車信號(hào),按60%、20%、20%劃分各數(shù)據(jù)集,訓(xùn)練集、開發(fā)集、測(cè)試集車輛數(shù)分別為384、128、128。
由于LSTM的超參數(shù)有8項(xiàng),如果對(duì)所有超參數(shù)都進(jìn)行試錯(cuò),則計(jì)算量巨大,而一些超參數(shù)可通過模型的輸入、輸出以及數(shù)據(jù)的格式確定。
模型的輸入為車輛X、Y、Z三軸的磁場(chǎng)強(qiáng)度,因此輸入維度為3。模型的輸出為車輛的類別,因此輸出維度為1。測(cè)試的車輛信號(hào)數(shù)據(jù)中,最長(zhǎng)的信號(hào)數(shù)據(jù)長(zhǎng)度為125,因此確定時(shí)間步長(zhǎng)為125。全連接層激勵(lì)函數(shù)最常用的有sigmoid函數(shù)、tanh函數(shù)和relu函數(shù)。relu函數(shù)是修正線性單元,主要作用是將負(fù)數(shù)變?yōu)?,sigmoid函數(shù)的作用是把一個(gè)實(shí)數(shù)通過非線性函數(shù)壓縮至0~1之間,而tanh函數(shù)的作用是把一個(gè)實(shí)數(shù)通過非線性函數(shù)壓縮至-1~1之間,通常,tanh函數(shù)在隱藏層中的效果要優(yōu)于sigmoid函數(shù),因此全連接層激勵(lì)函數(shù)選擇tanh函數(shù)。
如果學(xué)習(xí)速率過大,則會(huì)使代價(jià)函數(shù)產(chǎn)生震蕩,甚至?xí)^局部最小值導(dǎo)致無法收斂。如果學(xué)習(xí)速率較小,則達(dá)到收斂所須迭代的次數(shù)就會(huì)非常多,導(dǎo)致訓(xùn)練時(shí)間增長(zhǎng),學(xué)習(xí)速率取0.000 1。為提高分類的準(zhǔn)確率,LSTM共由6層組成:3層改進(jìn)LSTM隱藏層、輸入層、輸出層和全連接層。
為準(zhǔn)確確定改進(jìn)LSTM的其他超參數(shù),提出一種多層網(wǎng)格法來對(duì)全連接層神經(jīng)元個(gè)數(shù)與正則項(xiàng)系數(shù)在訓(xùn)練集和開發(fā)集上進(jìn)行試錯(cuò),首先將正則項(xiàng)系數(shù)與全連接層神經(jīng)元個(gè)數(shù)劃分為不同的區(qū)間。
正則項(xiàng)系數(shù)取0.000 1、0.001、0.01、0.1和1。全連接層神經(jīng)元個(gè)數(shù)取10,20,…,200,經(jīng)試錯(cuò)發(fā)現(xiàn),當(dāng)正則項(xiàng)系數(shù)為0.001~0.01且全連接層神經(jīng)元個(gè)數(shù)為100~110時(shí),交叉驗(yàn)證的準(zhǔn)確率最高,為79%~81%。再將區(qū)間進(jìn)行10等分,取正則項(xiàng)系數(shù)為0.001,0.002,…,0.01,全連接層神經(jīng)元個(gè)數(shù)為101,102,…,110。發(fā)現(xiàn)正則項(xiàng)系數(shù)為0.005且全連接層神經(jīng)元個(gè)數(shù)為102~104時(shí),交叉驗(yàn)證的準(zhǔn)確率最高,為85%。因此LSTM的超參數(shù)取正則項(xiàng)系數(shù)為0.005,全連接層神經(jīng)元個(gè)數(shù)為103。
采用3.1節(jié)中確定的超參數(shù)對(duì)模型進(jìn)行訓(xùn)練,訓(xùn)練集和測(cè)試集的交叉熵隨迭代次數(shù)的變化規(guī)律如圖9所示。由圖可見,訓(xùn)練集的交叉熵較低,說明模型得到了充分訓(xùn)練,測(cè)試集的交叉熵較低,說明模型未發(fā)生過擬合,超參數(shù)確定較為合理。訓(xùn)練效果較好。
圖9 訓(xùn)練集和測(cè)試集的交叉熵
表2為各車型的分類準(zhǔn)確率。從表中可以看到,類型一、三均有較好的分類效果,而類型二的分類效果較差,準(zhǔn)確率為71.8%。其主要原因是,類型二中的SUV與第一類車型中的轎車由于結(jié)構(gòu)和大小近似,產(chǎn)生的波形也類似,因此難以實(shí)現(xiàn)準(zhǔn)確區(qū)分。
表2 各車型的分類準(zhǔn)確率
為比較不同汽車分類算法的效果,對(duì)改進(jìn)LSTM-AdaBoost、改進(jìn)LSTM、LSTM、KNN、BP神經(jīng)網(wǎng)絡(luò)5種方法的準(zhǔn)確率進(jìn)行對(duì)比。KNN方法參考王卿等[10]的研究進(jìn)行特征提取,改進(jìn)LSTM、LSTM、BP算法采用本文提出的“多層網(wǎng)格法”確定神經(jīng)網(wǎng)絡(luò)隱藏層節(jié)點(diǎn)數(shù)和正則化系數(shù)。最終得到的5種方法的準(zhǔn)確率如表3所示。
表3 5種方法分類準(zhǔn)確率對(duì)比 %
從表中可以看出,5種方法均對(duì)類型一和類型三有較好的分類效果,而對(duì)類型二的分類效果較差。BP神經(jīng)網(wǎng)絡(luò)在類型一的準(zhǔn)確率高于KNN,但在類型二和類型三的準(zhǔn)確率略低于KNN。改進(jìn)LSTMAdaBoost在類型一的準(zhǔn)確率與BP神經(jīng)網(wǎng)絡(luò)相同,但在類型二和類型三的準(zhǔn)確率高于KNN和BP神經(jīng)網(wǎng)絡(luò)。對(duì)比改進(jìn)LSTM-AdaBoost、改進(jìn)LSTM和LSTM的準(zhǔn)確率可以發(fā)現(xiàn),改進(jìn)LSTM-AdaBoost類型二的分類準(zhǔn)確率有明顯提高。改進(jìn)LSTM-AdaBoost在該數(shù)據(jù)集上的效果優(yōu)于其他4種方法。
在車輛分類檢測(cè)的方法中,視頻檢測(cè)器應(yīng)用最廣泛,但視頻檢測(cè)器受惡劣天氣的影響較大,在遇到大風(fēng)、下雪、暴雨和霧霾天氣時(shí)精度較差[21]。磁傳感器在未來的智能交通系統(tǒng)中需大規(guī)模布設(shè)于各路段以進(jìn)行全天候的運(yùn)轉(zhuǎn),為比較不同天氣下改進(jìn)LSTM-AdaBoost的分類效果,在晴朗、暴雨和霧霾天氣3種天氣下各測(cè)得640輛汽車的磁場(chǎng)信號(hào),采用改進(jìn)LSTM-AdaBoost進(jìn)行訓(xùn)練,得到各天氣下的分類準(zhǔn)確率,見表4。從表中可以看到,晴朗天氣和霧霾天氣各類型車輛的準(zhǔn)確率相差不多,這是因?yàn)殪F霾天氣只會(huì)對(duì)視野造成影響,對(duì)磁傳感器的影響不大。暴雨天氣下各類型車輛的分類準(zhǔn)確率均有所下降,但下降幅度不大,最大下降了3.9個(gè)百分點(diǎn)。
表4 3種天氣分別訓(xùn)練時(shí)車輛分類準(zhǔn)確率%
為進(jìn)一步研究采用不同天氣的訓(xùn)練集對(duì)分類準(zhǔn)確性的影響,將晴朗天氣的磁場(chǎng)信號(hào)數(shù)據(jù)作為訓(xùn)練集,將暴雨和霧霾天氣的磁場(chǎng)信號(hào)數(shù)據(jù)作為驗(yàn)證集,得到各天氣下的分類準(zhǔn)確率,見表5。對(duì)比表4和表5可以發(fā)現(xiàn),霧霾天氣各類型車輛的準(zhǔn)確率相差不多,說明霧霾天氣對(duì)磁傳感器幾乎沒有影響;暴雨天氣下(表5)各類型車輛的分類準(zhǔn)確率均低于表4,類型一、二、三車輛分類準(zhǔn)確率分別降低5.4、14和6.3個(gè)百分點(diǎn),這是因?yàn)轭愋投拇艌?chǎng)信號(hào)本來區(qū)分度不大,加上暴雨天氣的影響,準(zhǔn)確率急劇下降。暴雨天氣下的結(jié)果也說明暴雨天氣對(duì)磁傳感器采集的信號(hào)有一定影響。因此如果想要實(shí)現(xiàn)車輛準(zhǔn)確分類,須采集各天氣的車輛磁場(chǎng)信號(hào)數(shù)據(jù)作為訓(xùn)練集。
表5 各天氣車輛分類準(zhǔn)確率對(duì)比 %
為提高車輛分類準(zhǔn)確率和減小天氣對(duì)準(zhǔn)確率的影響,提出一種基于改進(jìn)LSTM-AdaBoost的車輛分類方法。對(duì)LSTM的隱藏層進(jìn)行改進(jìn),并采用“多層網(wǎng)格法”以準(zhǔn)確地確定改進(jìn)LSTM的超參數(shù)。經(jīng)分析與對(duì)比,得出以下結(jié)論。
(1)選擇不同磁傳感器布置高度,對(duì)大量交通車輛的實(shí)測(cè)所得的波形變化程度進(jìn)行對(duì)比,用X、Y、Z 3個(gè)方向磁場(chǎng)強(qiáng)度標(biāo)準(zhǔn)差的平均值來定量描述信號(hào)采集效果,20 cm布置高度可以獲得最好的測(cè)量效果。
(2)相比于KNN、BP神經(jīng)網(wǎng)絡(luò)、改進(jìn)LSTM和LSTM,本文所提出的改進(jìn)LSTM-AdaBoost和多層網(wǎng)格法具有較高的分類準(zhǔn)確率,3種類型車輛分類準(zhǔn)確率分別為90.6%、71.8%和92.2%,平均分類準(zhǔn)確率比KNN高10.1個(gè)百分點(diǎn),比BP神經(jīng)網(wǎng)絡(luò)高8.9個(gè)百分點(diǎn)。
(3)改進(jìn)LSTM-AdaBoost、KNN、BP神經(jīng)網(wǎng)絡(luò)、改進(jìn)LSTM和LSTM 5種方法對(duì)類型二車輛分類準(zhǔn)確率均較低。類型二車輛與其他車輛區(qū)分度較差。
(4)對(duì)晴朗、暴雨、霧霾3種天氣下的磁場(chǎng)信號(hào)數(shù)據(jù)采用改進(jìn)LSTM-AdaBoost進(jìn)行訓(xùn)練時(shí),晴朗和霧霾天氣下各類型車輛的準(zhǔn)確率相差不多,最大相差0.9個(gè)百分點(diǎn);暴雨天氣下各類型車輛的分類準(zhǔn)確率均有所下降,但下降幅度不大,最大下降了3.9個(gè)百分點(diǎn)。
(5)將晴朗天氣的磁場(chǎng)信號(hào)數(shù)據(jù)作為訓(xùn)練集,將暴雨和霧霾天氣的磁場(chǎng)信號(hào)數(shù)據(jù)作為驗(yàn)證集時(shí),霧霾天氣各類型車輛的準(zhǔn)確率與將3種天氣的磁場(chǎng)信號(hào)數(shù)據(jù)作為訓(xùn)練集時(shí)的準(zhǔn)確率相差不大,最大相差2.4個(gè)百分點(diǎn);而暴雨天氣最大相差14個(gè)百分點(diǎn)。因此如果想要實(shí)現(xiàn)更為準(zhǔn)確的車輛分類,須采集各天氣的車輛磁場(chǎng)信號(hào)數(shù)據(jù)作為訓(xùn)練集。