陳友宣
摘? 要:汽車無(wú)人駕駛技術(shù)在實(shí)際應(yīng)用過(guò)程中會(huì)通過(guò)高精度的感應(yīng)器監(jiān)測(cè)交通環(huán)境,應(yīng)用科學(xué)算法準(zhǔn)確規(guī)劃合理的行車路徑,其中卷積神經(jīng)網(wǎng)絡(luò)在無(wú)人汽車駕駛技術(shù)應(yīng)用當(dāng)中有明顯的研究?jī)r(jià)值。文章對(duì)卷積神經(jīng)網(wǎng)絡(luò)在汽車無(wú)人駕駛中的應(yīng)用進(jìn)行研究,綜合概述卷積神經(jīng)網(wǎng)絡(luò)的發(fā)展情況,研究分析無(wú)人駕駛雙目3D感知模型,無(wú)人駕駛物體檢測(cè)模型,并綜合說(shuō)明3D感知與物體檢測(cè)之間的關(guān)系,以期對(duì)卷積神經(jīng)網(wǎng)絡(luò)能夠在汽車無(wú)人駕駛中得到有效應(yīng)用。
關(guān)鍵詞:卷積神經(jīng)網(wǎng)絡(luò);汽車無(wú)人駕駛;3D感知模型;檢測(cè)模型
中圖分類號(hào):U463 文獻(xiàn)標(biāo)志碼:A 文章編號(hào):2095-2945(2019)05-0013-02
引言
2010年以來(lái),汽車無(wú)人駕駛技術(shù)得到了飛速發(fā)展,在汽車無(wú)人駕駛中重點(diǎn)研究項(xiàng)目就是對(duì)駕駛中交通環(huán)境的檢測(cè),其中包含道路識(shí)別,汽車運(yùn)行檢測(cè),行人檢測(cè)識(shí)別,以及對(duì)交通信號(hào)的檢測(cè),整個(gè)研究項(xiàng)目的內(nèi)容比較多,并且難度比較高。作為重要的視覺(jué)領(lǐng)域感知技術(shù),卷積神經(jīng)網(wǎng)絡(luò)在汽車無(wú)人駕駛中發(fā)揮著重要作用,文章著重研究卷積神經(jīng)網(wǎng)絡(luò)在無(wú)人駕駛中的3D感知與物體檢測(cè)。
1 卷積神經(jīng)網(wǎng)絡(luò)概述
卷積神經(jīng)網(wǎng)絡(luò)(Convolutional Neural Network,CNN)是人工神經(jīng)網(wǎng)絡(luò)中的一個(gè)分支研究,組成卷積神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu)網(wǎng)絡(luò)模型比較多,因此也被稱之為深度卷積神經(jīng)網(wǎng)絡(luò)。在實(shí)際應(yīng)用中卷積神經(jīng)網(wǎng)絡(luò)能夠?qū)崿F(xiàn)信號(hào)的不間斷輸入,能對(duì)不同環(huán)境中的聲音,圖像以及視頻信息進(jìn)行高速傳輸。卷積神經(jīng)網(wǎng)絡(luò)是基于多層感知器上的改進(jìn)與發(fā)展,通過(guò)有效的空間處理技術(shù),能夠降低學(xué)習(xí)參數(shù)的實(shí)際數(shù)量進(jìn)而提升其算法的實(shí)際性能。與傳統(tǒng)人工神經(jīng)網(wǎng)絡(luò)向比較,卷積神經(jīng)網(wǎng)絡(luò)能夠?qū)崿F(xiàn)局部的連接和系統(tǒng)的權(quán)值共享。
在卷積神經(jīng)網(wǎng)絡(luò)中,通過(guò)底層信息感知能夠?qū)崿F(xiàn)對(duì)區(qū)域進(jìn)行深度感知,實(shí)現(xiàn)對(duì)信息數(shù)據(jù)特征的有效獲取。其中的神經(jīng)元可以通過(guò)局部感知迅速捕獲到視覺(jué)影像以及圖像信息的主要特征情況,這也使得其具有明顯的強(qiáng)魯棒性,這種特性的存在讓卷積神經(jīng)網(wǎng)絡(luò)具備了比較強(qiáng)大的詩(shī)句表象能力。
2 無(wú)人駕駛雙目3D感知模型
在汽車無(wú)人駕駛中需要對(duì)駕駛環(huán)境進(jìn)行信息收集完成3D建模,這是保證無(wú)人駕駛技術(shù)得以應(yīng)用的關(guān)鍵性技術(shù)。3D建模需要應(yīng)用激光雷達(dá)技術(shù),實(shí)現(xiàn)高精度的3D云點(diǎn)分布,攝像頭能夠感知到3D云點(diǎn)的存在,能夠達(dá)到人眼的3D感受效果,以此實(shí)現(xiàn)3D建模工作。在模型建立中,將攝像頭之間的距離確定為B,選取建??臻g中的一點(diǎn)確定為P,P到兩個(gè)攝像頭影像的位移距離為d。使用的攝像頭的焦距為f,以此可以計(jì)算得出P到攝像頭的距離為:
雙目攝像頭中的單個(gè)像素值并不穩(wěn)定,因此需要使用附近像素以及應(yīng)用平滑性假設(shè),建設(shè)中α以及β的數(shù)值都比較小,確定假設(shè)為d(x,y)≈d(x+α,y+β),因此就可以對(duì)前面設(shè)定的d進(jìn)行最小化求解分析。
在研究中假設(shè)使用的算法與研究圖像對(duì)其中使用的光流算法比較相似,問(wèn)題差異性較小,在此只是將(Il,Ir)變成了(It,It+1)。根據(jù)無(wú)人駕駛雙目感知3D建模需要,下面一種基于匹配價(jià)格的卷積神經(jīng)網(wǎng)絡(luò)算法,也就是Matching-Cost CNN,也稱為MC-CNN。有關(guān)MC-CNN算法的結(jié)構(gòu)如圖1所示。
在此算法結(jié)構(gòu)中,網(wǎng)絡(luò)的信息收集是兩個(gè)不同影響中的一部分,實(shí)際輸出是關(guān)于這兩個(gè)影響的不匹配概率,整個(gè)計(jì)算分析過(guò)程就是一個(gè)cost函數(shù),在函數(shù)中,如果兩個(gè)影像能夠有效匹配,那么函數(shù)的數(shù)值為0,如果無(wú)法實(shí)現(xiàn)匹配函數(shù)的數(shù)值為1。在信息輸入中可以根據(jù)影像信息圖片確定位置對(duì)偏移位置d進(jìn)行確實(shí),分析d的取值范圍大小,并分析得出最終的CNN最小值,在求得最小值后也就完成了對(duì)影像的偏移距離的估算。在此過(guò)程完成后需要使用MC-CNN算法進(jìn)行以下處理工作:第一,應(yīng)用MC-CNN算法中的Cross-based cost aggregation。MC-CNN算法中的成本聚合是對(duì)雙目攝像頭收集到的影像進(jìn)行像素點(diǎn)的偏移值計(jì)算,并求得最終的平均值,通過(guò)此項(xiàng)工作能夠提高計(jì)算值的精度,提高數(shù)據(jù)的準(zhǔn)確性。第二,應(yīng)用MC-CNN算法中的Semi-global matching。MC-CNN算法中的半全局匹配算法,這種算法比較常用于雙目中對(duì)disparity 的計(jì)算,也就是對(duì)d的計(jì)算。通過(guò)此算法能夠?qū)崿F(xiàn)對(duì)影像中臨近點(diǎn)的平移相似程度,加入平滑約束對(duì)偏移最優(yōu)值進(jìn)行確定。
進(jìn)行插值與圖片邊界修正,以此提高算法計(jì)算的精度,做好空白補(bǔ)充工作。
3 汽車無(wú)人駕駛物體檢測(cè)模型
無(wú)人駕駛物體檢測(cè)技術(shù)是駕駛感知中不可或缺的重要組成部分。相關(guān)物體檢測(cè)技術(shù)的算法的學(xué)術(shù)研究比較多,以下選擇具有較強(qiáng)代表性的Faster R-CNN算法進(jìn)行分析說(shuō)明:CNN算法將汽車無(wú)人駕駛的物體進(jìn)行了有機(jī)分類:一類為物體可能所在區(qū)域的選擇,在系統(tǒng)結(jié)構(gòu)中輸入影像圖片時(shí),無(wú)法對(duì)物體的位置大小進(jìn)行準(zhǔn)確定位,為了提高分辨物體位置大小的效率需要對(duì)區(qū)域內(nèi)的所有物體進(jìn)行收集信息,以此進(jìn)行逐步確定,其中召回率是比較關(guān)鍵的一個(gè)指標(biāo)。另一類是對(duì)候選區(qū)域的識(shí)別判定,在圖片信息確定區(qū)域內(nèi),需要對(duì)物體的大小比例進(jìn)行確定。此項(xiàng)工作中關(guān)鍵指標(biāo)是精度確定。
RPN是Faster R-CNN算法的一個(gè)最新發(fā)展形勢(shì),這種算法結(jié)構(gòu)可以有效的選擇確定一個(gè)候選單位。在RPN中需要應(yīng)用卷積神經(jīng)網(wǎng)絡(luò),對(duì)網(wǎng)絡(luò)中的卷積層進(jìn)行逐層提取,在卷積層中輸出信息影響的結(jié)構(gòu)特征圖,并將其進(jìn)行再次分配,分流到兩個(gè)不同的全連接層中,分別對(duì)檢測(cè)物體的類別以及檢測(cè)物體的大小進(jìn)行確定。通過(guò)卷積神經(jīng)網(wǎng)絡(luò)進(jìn)行計(jì)算可以有效地節(jié)省運(yùn)算時(shí)間。詳細(xì)的RPN算法運(yùn)行結(jié)構(gòu)過(guò)程見(jiàn)圖2。
4 3D感知與物體檢測(cè)的關(guān)系
無(wú)人駕駛的雙目感知是對(duì)汽車駕駛環(huán)境信息確定的關(guān)鍵技術(shù),在3D感知模型中為了實(shí)現(xiàn)端到端模型的建立需要對(duì)CNN的主要特征進(jìn)行提取,實(shí)現(xiàn)模型的有機(jī)匹配和優(yōu)化處理等主要功能。3D感知中的FlowNet通過(guò)運(yùn)用卷積神經(jīng)網(wǎng)絡(luò)實(shí)現(xiàn)了3D感知的兩項(xiàng)構(gòu)建工作,主要為收縮與擴(kuò)張兩個(gè)部分。
汽車無(wú)人駕駛中的物體檢測(cè)需要對(duì)物體的變化情況進(jìn)行及時(shí)確定,做好判別工作,在卷積神經(jīng)網(wǎng)絡(luò)中的層級(jí)結(jié)構(gòu)因?yàn)榕cpooling存在著關(guān)于物體尺度的對(duì)應(yīng)關(guān)系,作為物體檢測(cè)中關(guān)于解決物體范圍變化的主要算法技術(shù)。
二者都是通過(guò)神經(jīng)卷積網(wǎng)絡(luò)算法分析技術(shù)的應(yīng)用為汽車無(wú)人駕駛提供專業(yè)的技術(shù)支持,是無(wú)人駕駛技術(shù)應(yīng)用的核心與關(guān)鍵。
5 結(jié)束語(yǔ)
在研究汽車無(wú)人駕駛中的場(chǎng)景識(shí)別以及物體檢測(cè)的關(guān)鍵技術(shù)當(dāng)中,卷積神經(jīng)網(wǎng)絡(luò)體現(xiàn)了比較明顯的算法優(yōu)勢(shì),實(shí)現(xiàn)了3D感知與物體感知技術(shù)的快速應(yīng)用與迭代。未來(lái)將在MC-CNN與RPN算法應(yīng)用與技術(shù)研究中,提高物體識(shí)別能力,提高技術(shù)的精度,促進(jìn)汽車無(wú)人駕駛技術(shù)的發(fā)展。
參考文獻(xiàn):
[1]張俊元.無(wú)人駕駛系統(tǒng)中的關(guān)鍵技術(shù)淺論[J].時(shí)代汽車,2018(11):31-32.
[2]金凡.基于時(shí)空遞歸神經(jīng)網(wǎng)絡(luò)的智能車端到端決策研究[D].電子科技大學(xué),2018.
[3]宋靈杰.基于卷積神經(jīng)網(wǎng)絡(luò)的交通標(biāo)志分類與識(shí)別研究[D].湖南大學(xué),2018.
[4]蔡詩(shī)威,郭太良,姚劍敏.一種基于卷積神經(jīng)網(wǎng)絡(luò)的性別識(shí)別方法[J].電視技術(shù),2014(19):188-191.
[5]端木慶玲,阮界望,馬鈞.無(wú)人駕駛汽車的先進(jìn)技術(shù)與發(fā)展[J].農(nóng)業(yè)裝備與車輛工程,2014(03):30-33.