王瀚 唐嵐
摘 要:本設(shè)計針對無人駕駛中目標識別問題,設(shè)計了一種基于深度學(xué)習(xí)的車輛識別系統(tǒng)。該系統(tǒng)一共包括三大模塊,分別是圖像采集模塊、圖像預(yù)處理模塊和圖像識別模塊。其中圖像采集模塊以兩百萬像素的工業(yè)攝像頭為核心對圖像進行采集。圖像預(yù)處理模塊包括圖像增強、圖像去噪、模糊圖像復(fù)原。圖像識別模塊以深度學(xué)習(xí)為核心對車輛進行識別。通過相關(guān)算法對質(zhì)量下降的圖片進行有效處理提高圖片質(zhì)量,本文構(gòu)建的基于深度神經(jīng)網(wǎng)絡(luò)的模型可以對圖像中的車輛進行有效識別,具有一定的實際價值。
關(guān)鍵詞:深度學(xué)習(xí);圖像預(yù)處理;圖像識別;試驗驗證
隨著新一輪科技和產(chǎn)業(yè)革命興起,智能技術(shù)已經(jīng)滲透到人們?nèi)粘V?,自動駕駛作為智能化和網(wǎng)聯(lián)化發(fā)展的高級形態(tài),成為汽車行業(yè)競相角逐的陣地,同時人工智能在功能和應(yīng)用方面的突破性進展將推動汽車行業(yè)新一輪發(fā)展。
1 基于深度學(xué)習(xí)的車輛識別系統(tǒng)設(shè)計
基于深度學(xué)習(xí)的車輛識別系統(tǒng)中系統(tǒng)設(shè)計方案如下所示。該系統(tǒng)由圖像采集,圖像與處理,以及圖像識別三個模塊組成。
1.1 圖像采集模塊
本文實驗所涉及到的設(shè)備有實驗相機和實驗車輛。根據(jù)實際情況使用了工業(yè)攝像頭作為本次實驗的圖像采集傳感器。
1.2 圖像預(yù)處理模塊
1.2.1 圖像增強
在對圖像拍攝、傳輸以及顯示的過程中,由于成像設(shè)備、傳輸系統(tǒng)或顯示系統(tǒng)的原因,以及周圍環(huán)境的影響最終造成圖像退化和質(zhì)量下降。由于造成圖像質(zhì)量下降的原因十分復(fù)雜,所以本文基于車輛識別中所遇到的常見現(xiàn)象,采用了基于直方圖均勻化的算法對圖像進行了增強,該方法算法簡單且適用范圍廣,在圖像增強、光照補償、圖像去霧等方面取得很好的效果[1],可以讓圖片達到更加清晰的效果,從而提高車輛識別的準確率。
1.2.2 圖像去噪
本文選定高斯濾波模板大?。?×5,σ2=0.2,u=0;利用二維高斯離散函數(shù)計算高斯模板內(nèi)每個小窗口的高斯濾波權(quán)重值;計算高斯模板窗口內(nèi)每個點的像素值乘以權(quán)重系數(shù)后的和,然后用該值替換中心點像素值,最后輸出圖像。
1.3 圖像運動復(fù)原
在目標與相機在曝光時間內(nèi)產(chǎn)生相對運動引起成像模糊,使圖像中原本銳利的邊緣退化成拖影,運動模糊的圖像會直接影響圖像關(guān)鍵信息的獲取[2]。所以為了準確識別物體,對圖像進行運動復(fù)原是很有必要的。針對車輛識別實際任務(wù),本文采取了以傅里葉變換[3],Radon變換[3]為核心的運動模糊復(fù)原對圖像進行復(fù)原處理。該算法對模糊圖像的處理效果明顯,基本達到了預(yù)期的效果。
2 圖像識別模塊
自動駕駛核心之一就是如何對圖像中車輛的特征進行有效,準確的提取,并讓計算機通過提取的特征來識別目標[4],從而實現(xiàn)對周圍環(huán)境的目標識別,識別和避障,實現(xiàn)無人駕駛目的。本文主要介紹基于卷積神經(jīng)網(wǎng)絡(luò)的特征提取方法。
2.1 深度神經(jīng)網(wǎng)絡(luò)模型的訓(xùn)練
神經(jīng)網(wǎng)絡(luò)的訓(xùn)練。本文采用的是隨機梯度下降算法[5],將神經(jīng)網(wǎng)絡(luò)模型的訓(xùn)練過程則轉(zhuǎn)化成一個尋找最優(yōu)的過程,通過定義模型的損失函數(shù),在一定的約束條件下尋找使得該模型損失函數(shù)達到最小值的參數(shù),本文中設(shè)定交叉熵函數(shù)[6]為該模型的損失函數(shù),找到的這個參數(shù)即為神經(jīng)網(wǎng)絡(luò)中神經(jīng)元的學(xué)習(xí)權(quán)重,其原理及流程如下所示:
在神經(jīng)網(wǎng)絡(luò)模型訓(xùn)練時,采用參數(shù)前饋傳播來尋找損失函數(shù)的極小值來更新模型的參數(shù),當損失函數(shù)達到全局最小值的時候,模型的準確率就到達最大值,接下來就利用有關(guān)算法尋找損失函數(shù)的全局最小值,本文使用了隨機梯度下降算法。
2.2 樣本識別
2.3 深度神經(jīng)網(wǎng)絡(luò)的搭建
在遷移學(xué)習(xí)的基礎(chǔ)上本文采用的是AlexNet網(wǎng)絡(luò)結(jié)構(gòu)根據(jù)本文實際任務(wù)搭建模型及設(shè)置各層參數(shù)如下:
3 實驗工況
為了驗證系統(tǒng)的準確性,本文在一些常見工況下進行實驗,包括視野較好,基本無車輛相互遮擋,單向行駛的高速公路工況(都江堰至郫縣紅光路段);視野較差,車輛相互遮擋情況嚴重以及存在建筑物干擾的城市工況(西華大學(xué)南門至犀浦路段)。采集圖像信息如下:
對實驗中采集到的每張圖片進行人工標注,即標注圖片中所要識別的車輛。該方法借助MATLAB中training Image Labeler工具箱完成。
4 實驗結(jié)果
高速路工況和城市工況下準確率與平均召回率大小如下所示:
5 總結(jié)
根據(jù)以上實驗結(jié)果可以得知,在高速路工況和城市的識別準確率和召回率都大于60%。高速路工況的準確率與召回率皆高于城市工況下的準確率與識別率。進一步分析可以得出,由于高速路工況下的車輛全部為單向行駛,車輛間的相互遮擋現(xiàn)象也比較少,在對車輛進行識別時,被識別的車輛屬于背向試驗車輛,因此特征較為明顯,模型準確率與召回率較高;相反在城市工況下的試驗車輛,由于工況復(fù)雜,在采集圖片時容易受到車輛間的相互遮擋影響,從而造成車輛特征提取較弱,另外在城市工況下存在大量同向行駛的車輛以及停放在路旁靜止的車輛,因此對于被識別車輛而言特征太多導(dǎo)致模型的準確率與召回率低于高速工況。但是整體而言,本實驗所采用的模型依然具有一定的實際運用價值。
參考文獻:
[1]王超,孫玉秋,徐石瑤,余美晨,李祖勝.自適應(yīng)直方圖均衡圖像增強算法研究[J].長江大學(xué)學(xué)報(自科版),2018,15(01):55-59+7.
[2]陳文靜,蘇顯渝,曹益平,向立群.傅里葉變換輪廓術(shù)中抑制零頻的新方法[J].中國激光,2004(06):740-744.
[3]張強,李嘉鋒,卓力.車輛識別技術(shù)綜述[J/OL].北京工業(yè)大學(xué)學(xué)報,1-11.
[4]夏鵬飛.基于HOG的多特征融合行人識別跟蹤系統(tǒng)[D].南昌航空大學(xué),2017.
[5]靳冬歡.基于隨機并行梯度下降算法的波前校正技術(shù)研究[D].國防科學(xué)技術(shù)大學(xué),2006.
[6]Anon.Unsupervised Search-based Structured Prediction[J].Advances in Neural Information Processing Systems,2015.
作者簡介:王瀚(1992-),女,四川成都人,碩士,從事無人駕駛方面的研究。