馬國棟,姚善化
(安徽理工大學(xué) 電氣與信息工程學(xué)院,安徽 淮南 232000)
隨著人們生活水平的提高,車輛數(shù)量大幅增加,也致交通事故和違法犯罪增加。車輛識別在智能交通管理中起著重要的作用,而車型識別是車輛識別領(lǐng)域的一個重要方向。目前已經(jīng)出現(xiàn)很多技術(shù)可以解決車輛分類的問題,只是在特定的環(huán)境中需要更適合的方法和技術(shù),這樣才能夠更高效的解決特定的問題。本文提出一種基于卷積神經(jīng)網(wǎng)絡(luò)的車輛類型的區(qū)分檢測識別,目的在于通過深度學(xué)習(xí)實(shí)現(xiàn)監(jiān)控智能化,以此減少車輛事故與保證安全。
文獻(xiàn)[1]利用基于CNN的車型識別方法,建立了一個可以區(qū)分5種車型的模型?;谲囕v的前視圖像,文獻(xiàn)[2]提出了一種基于深度學(xué)習(xí)的車輛模型識別算法。采用圖像預(yù)處理方法進(jìn)行數(shù)據(jù)集處理,有效降低了無關(guān)因素對網(wǎng)絡(luò)訓(xùn)練的影響。本文提出深度學(xué)習(xí)訓(xùn)練卷積神經(jīng)網(wǎng)的高性能識別模型,通過評估卷積層數(shù)、卷積核大小、卷積層與池化層的數(shù)量配比等參數(shù),實(shí)現(xiàn)網(wǎng)絡(luò)性能的比較和優(yōu)化及卷積核的選擇。
CNN的結(jié)構(gòu)由一個或多個連續(xù)的卷積層組成,然后是規(guī)則的完全連接的ANN(人工神經(jīng)網(wǎng)絡(luò))層。在深度學(xué)習(xí)中,卷積神經(jīng)網(wǎng)絡(luò)是一種重要的算法,近年來在圖形的識別檢測,語音的檢測識別,人臉識別等重要領(lǐng)域中有著突出的表現(xiàn)和較高的穩(wěn)定性。
傳統(tǒng)CNN主要由輸入層、卷積層、匯聚層和全連接層組成。卷積神經(jīng)網(wǎng)的結(jié)構(gòu)中卷積層和匯集層是關(guān)鍵部分主要用于提取被檢測圖像的特征。relu激活函數(shù)主要解決各層之間的線性與非線性的聯(lián)系,增強(qiáng)了各個網(wǎng)絡(luò)之間的非線性關(guān)系,以此實(shí)現(xiàn)神經(jīng)網(wǎng)絡(luò)的功能。
卷積層負(fù)責(zé)特征提取。上一層的特征圖經(jīng)過卷積核進(jìn)行卷積然后在函數(shù)的條件下輸出所要的特征圖。公式如下:
X=f(y)
(1)
y=x×k+b
(2)
其中x為上一層的輸出要素圖;k是卷積核矩陣;b是卷積核的特征映射的雙值;因變量y是最后得出的特征圖。激活函數(shù)用f表示。
匯集是卷積神經(jīng)網(wǎng)絡(luò)的一個關(guān)鍵動作。一方面保持被檢測識別圖像的特征值不變,另一方面減少一些不需要的干擾特征。匯集的池操作主要有隨機(jī)、平均,最大。其中,最大池可以表示如下:
Y=Q(y)
(3)
上一層的輸出要素圖用(y)表示;最大采樣函數(shù)為Q。該最大采樣函數(shù)是規(guī)范定義特征圖的矩陣劃分,其中每個矩陣的長度和寬度以及數(shù)量大小。取每個矩陣的最大值,并將其整合到輸出特征圖y中。
激活功能,經(jīng)典relu函數(shù)的圖形(圖1)和公式如下:
(4)
該函數(shù)是分段函數(shù)在y小于等于0時f(0)始終為零,當(dāng)y值為正值時f(0)成正比例函數(shù)。
損失函數(shù)選擇在CNN中起著重要的作用。損失函數(shù)常見的處理有平方誤差、交叉熵、鏈接等舒適的計算公式。下面為交叉熵的便是:
H=(p,q)=-∑p(x)logq(x)
(5)
其中預(yù)期輸出為p;q是實(shí)際輸出;H(p,q)是交叉熵。
圖1 ReLU函數(shù)
是實(shí)為了能夠研究識別精度的影響因素,主要考慮移動平均模型和卷積層。本文的網(wǎng)絡(luò)結(jié)構(gòu)如表1。
表1 三大網(wǎng)絡(luò)概述
第一種網(wǎng)絡(luò)結(jié)構(gòu)由11層組成,包括三個卷積五個匯集三個全連接層。每個卷積層后面是一個匯集層,最后一個匯集層后面是三個完全連接的層。計劃輸入大小為180×200的彩色圖像,并分別從前四卷積層提取4、10、28和48個特征圖。最終選擇521維特征,5×5的卷積核。
第二種網(wǎng)絡(luò)結(jié)構(gòu)由14層組成,包括四個卷積六個匯集四個全連接層。二個卷積層之后一個匯集層。匯集層后面的連接情況跟網(wǎng)絡(luò)一不同,這里最后一個匯集層之后是兩個完全連接的層。
第三種網(wǎng)絡(luò)結(jié)構(gòu)由15層組成包含七個卷積層,六個匯集層,二個全連接層。連接情況同上述第二種網(wǎng)絡(luò)結(jié)構(gòu)。卷積核的大小和全連接層的維數(shù)如表中一樣選擇,最后,移動平均模型將被添加到網(wǎng)絡(luò)中。移動平均模型可以表示如下:
影子變量=衰減×影子變量+(1-影子)變量
(6)
變量是要更新的變量。初始值賦予兩個變量,隨著變量變化時影子變量隨著上面的公式跟著變化。衰變主要是由衰變率支配的模型來控制衰變速度,而變量的更新速度則是由移動平均模型來控制的,以此來控制變量的穩(wěn)定性,保證模型的穩(wěn)定性。
在深度學(xué)習(xí)中卷積神經(jīng)網(wǎng)中各種參數(shù)的設(shè)置都會影響模型精度,本文只要對網(wǎng)絡(luò)三的參數(shù)進(jìn)行調(diào)整。調(diào)整參數(shù)以探索對模型精度的影響。如表2。
表2 參數(shù)設(shè)置對模型精度的影響
從表2看出,當(dāng)學(xué)習(xí)率越高時錯誤率就越低,所以要通過降低學(xué)習(xí)率來提高準(zhǔn)確率,也就是通過提高學(xué)習(xí)的時間提高訓(xùn)練的總數(shù)據(jù)量,而移動平均衰減在0.92時培訓(xùn)的準(zhǔn)確率與測試準(zhǔn)確率整體效率最高。當(dāng)學(xué)習(xí)率基礎(chǔ)以及其他各量為0.02/0.05/0.92是訓(xùn)練總數(shù)最高時準(zhǔn)確率最高,也就是在稍微增加時間時間,提高訓(xùn)練總數(shù)模型的精度達(dá)到該網(wǎng)絡(luò)的最高。且移動平均模型可以增強(qiáng)模型的魯棒性,從而有效提高了識別精度。
卷積層數(shù)對模型精度的影響
網(wǎng)因?yàn)榫矸e層的主要功能是負(fù)責(zé)特征的提取,要通過實(shí)驗(yàn)的數(shù)據(jù)以及結(jié)果來分析卷積層層數(shù)以及卷積核大小對模型精度的影響。所以設(shè)置卷積層的個數(shù)對最終的識別率有著直接的關(guān)系。如表3。
表3 卷積層數(shù)和移動平均模型對精確度的影響
在不變的參數(shù)設(shè)置下,第一種和第二種網(wǎng)絡(luò)分別采用的卷積層是2個5層、3個6層,表中明顯看出第二種網(wǎng)絡(luò)的測試準(zhǔn)確率更高。所以適當(dāng)?shù)脑诓辉黾舆壿嬘嬎汶y度的條件下適當(dāng)?shù)脑黾泳矸e層個數(shù)能夠提升測試的準(zhǔn)確率。
提出了一種基于神經(jīng)網(wǎng)絡(luò)的車輛模型識別方法,首先通過在交通部門獲取大量的數(shù)據(jù)資料方便實(shí)驗(yàn)的卷積神經(jīng)網(wǎng)的訓(xùn)練及測試需求,也是本文第一步充分收集到可靠的數(shù)據(jù)集。接著是介紹了卷積神經(jīng)網(wǎng)的結(jié)構(gòu)及個層的功能,通過對各個層的參數(shù)設(shè)置來探究參數(shù)對模型精度的影響,分析數(shù)據(jù)得到精度最高的參數(shù)配置。結(jié)果表明:卷積神經(jīng)網(wǎng)在這方面優(yōu)勢很大,網(wǎng)絡(luò)調(diào)整和改良后能達(dá)到預(yù)期的效果,為車型的識別打下基礎(chǔ)和提供參考。