田潤 魏志剛 劉明錚
摘要:交通標(biāo)志在日常生活中起著重要作用,如何利用視覺輔助技術(shù)識別交通標(biāo)志已經(jīng)成為當(dāng)前智能交通領(lǐng)域的熱點問題。本文將深度學(xué)習(xí)技術(shù)中的卷積神經(jīng)網(wǎng)絡(luò)算法應(yīng)用于斑馬線的識別研究?;赗esNet34結(jié)構(gòu)[1]構(gòu)建卷積神經(jīng)網(wǎng)絡(luò),并在此基礎(chǔ)上設(shè)計了用于識別斑馬線的二分類器。通過實驗驗證,本文方法的識別精度可達到93%,平均識別速度在0.1s以下。
關(guān)鍵詞:卷積神經(jīng)網(wǎng)絡(luò);智能交通;深度學(xué)習(xí)
中圖分類號:TP391.41 文獻標(biāo)識碼:A 文章編號:1007-9416(2019)02-0081-02
0 引言
隨著公路交通的發(fā)展,路況更加復(fù)雜,交通事故發(fā)生的頻率也在不斷上升,視覺輔助技術(shù)在交通安全領(lǐng)域中得到了廣泛關(guān)注。作為重要的交通標(biāo)志之一,斑馬線的識別是交通視覺輔助設(shè)備研究的重中之重。識別斑馬線的方法有很多種,目前應(yīng)用最多的是雙極系數(shù)法,即對道路圖像進行分塊,再根據(jù)斑馬線的灰度特征進行識別。然而,這種方法受制于其分塊方式,分塊的大小將直接影響識別的準(zhǔn)確度。本文提出了一種基于卷積神經(jīng)網(wǎng)絡(luò)檢測斑馬線的新方法,能夠快速識別斑馬線所在的區(qū)域,從而避免了分塊方式問題。在識別出斑馬線的范圍后,再利用卷積神經(jīng)網(wǎng)絡(luò)不斷提取,縮小圖像特征,從而實現(xiàn)對斑馬線的準(zhǔn)確識別。
1 卷積神經(jīng)網(wǎng)絡(luò)的基本理論
卷積網(wǎng)絡(luò)[2]是是深度學(xué)習(xí)模型中的一種,具有稀疏連接、參數(shù)共享、等變表示等特點,這使參數(shù)更少,存儲空間更小,計算效率更高,同時能夠?qū)D像的平移翻轉(zhuǎn)保持不變性。卷積網(wǎng)絡(luò)的權(quán)值共享結(jié)構(gòu),可以大幅度減少神經(jīng)網(wǎng)絡(luò)的參數(shù)量,防止過擬合的同時,又降低了網(wǎng)絡(luò)模型的復(fù)雜程度,在較深的網(wǎng)絡(luò)模型中,能夠達到很好的泛化能力。
卷積神經(jīng)網(wǎng)絡(luò)是一個多層前饋神經(jīng)網(wǎng)絡(luò),它的基本結(jié)構(gòu)是輸入層、激勵層、卷積層、池化層、全鏈接層以及輸出層。卷積神經(jīng)網(wǎng)絡(luò)能夠構(gòu)建多個提取特征的濾波器,通過對輸入的數(shù)據(jù)進行逐層的卷積和池化來提取數(shù)據(jù)的結(jié)構(gòu)特征,最后將這些特征輸入全鏈接層進行整合,并且通過某種激活函數(shù)來解決分類和回歸問題。
2 卷積神經(jīng)網(wǎng)絡(luò)的構(gòu)建
本文采用卷積神經(jīng)網(wǎng)絡(luò)中的ResNet34結(jié)構(gòu)來檢測圖片中是否含有斑馬線,如圖1所示,包括33個卷積層,1個全連接層。其中,除第一個卷積層中卷積核的尺寸為7×7之外,其余32個卷積層中卷積核的尺寸均為3×3。在每兩個卷積層中插入了一個快捷鏈接,每一層卷積后的圖像參數(shù)通過快捷鏈接后,再與殘差求和即可得到輸入到下一卷積層的參數(shù)。將所有的卷積層分成四組,每經(jīng)過一組,特征矩陣的尺寸就會縮小一倍,同時下一組的每個卷積層中的卷積核的個數(shù)加倍。全連接層中的每一個結(jié)點都與最后一個卷積層的所有結(jié)點相連,將之前提取到的特征綜合起來,其具有1000個輸出參數(shù)。為達到圖像中斑馬線識別的2分類目的,在全連接層后接入一個具有2個輸出的softmax分類器。
3 卷積神經(jīng)網(wǎng)絡(luò)的訓(xùn)練及實驗驗證
3.1 數(shù)據(jù)集準(zhǔn)備及預(yù)處理
在訓(xùn)練及測試網(wǎng)絡(luò)模型過程中,樣本集來源于浙江大學(xué)江凱巍課題組,樣本總量為4100。訓(xùn)練模型過程中將樣本集分為訓(xùn)練集、驗證集和測試集,分別占樣本總量的60%、20%和20%。為了增強模型的健壯性,需要對訓(xùn)練集和驗證集中的數(shù)據(jù)進行數(shù)據(jù)擴充[3]。本文采用的方法為:(1)圖像的豎直翻轉(zhuǎn);(2)按照寬度對圖像伸縮;(3)對圖像進行顏色增強。
在開始訓(xùn)練之前,在訓(xùn)練集中選取一小部分圖片計算每個像素點的平均值和標(biāo)準(zhǔn)差,并對所有的輸入圖片進行標(biāo)準(zhǔn)化處理。另外,ResNet34網(wǎng)絡(luò)輸入的圖像尺寸為224×224,因此在訓(xùn)練過程中,輸入網(wǎng)絡(luò)的樣本均為從原圖片中隨機切割的224×224的區(qū)域。
3.2 模型訓(xùn)練及實驗
訓(xùn)練過程中采用批量梯度下降算法進行參數(shù)更新,批量大小為256。為避免出現(xiàn)損失函數(shù)無法收斂的情況,在梯度下降的基礎(chǔ)上增加了沖量Momentum,取經(jīng)驗值0.9。另外,為防止模型過擬合,在計算損失函數(shù)時依據(jù)權(quán)重值添加了一個懲罰項,即權(quán)重衰減,經(jīng)多次實驗,取值為0.3。模型訓(xùn)練后,通過測試集對本文方法進行實驗,由實驗結(jié)果可知,本文方法對于圖像中斑馬線識別的準(zhǔn)確率達到93.2%,平均檢測速度在0.1s以內(nèi)。部分實驗結(jié)果如圖2所示,其中Predicted:1代表識別圖像中含有斑馬線,Predicted:0代表識別圖像中不含斑馬線。
4 結(jié)語
本文基于深度學(xué)習(xí)算法對斑馬線的識別方法進行研究,采用ResNet34結(jié)構(gòu)卷積神經(jīng)網(wǎng)絡(luò)構(gòu)建了用于識別斑馬線的二分類器。通過實驗驗證,本文方法的識別準(zhǔn)確率可達93.2%。與傳統(tǒng)的機器學(xué)習(xí)方法相比,由于卷積神經(jīng)網(wǎng)絡(luò)能夠自動生成檢測區(qū)域,省去了圖像預(yù)處理過程,大大減少了計算量,使圖像處理的速度較之傳統(tǒng)算法有了明顯的提升。
參考文獻
[1] 徐培超,陳雯柏,陳祥鳳,韓琥.多任務(wù)及Resnet網(wǎng)絡(luò)在人臉多屬性識別中的應(yīng)用[J].小型微型計算機系統(tǒng).2018(12):2720-2724.
[2] 孫旭,李曉光,李嘉鋒,卓力.基于深度學(xué)習(xí)的圖像超分辨率復(fù)原研究進展[J].自動化學(xué)報,2017(05):697-709.
Traffic Sign Recognition Method Based on Deep Learning
TIAN Run,Wei Zhi-gang,LIU Min-zheng
(Civil Aviation University of China,Tianjin? 300300)
Abstract:Traffic signs are vital to our daily life, and how to discriminate them with the help of Visual Aided Technology has came to an hot topic. Thus, in this paper, well use convolutional neural network based on deep learning to recognize the zebra crossing. Weve constructed an convolutional neural network based on the ResNet34 structrue, and designed a binary classifier which relys on this network. After being tested, the accuracy of this paper can reach in 93 percent, and the average speed of recognition is below 0.1 second.
Key words:convolutional neural network;intelligent transportation;deep Learning