基于編碼器—解碼器的高級(jí)駕駛員輔助系統(tǒng)(ADAS)用卷積神經(jīng)網(wǎng)絡(luò)算法
本文提出了一種實(shí)用的卷積神經(jīng)網(wǎng)絡(luò)(CNN)模型,主要用于駕駛員輔助系統(tǒng)(CSSA)的語(yǔ)義分割模塊。它是一種基于概率像素分割的新穎語(yǔ)義分割模型,其能夠準(zhǔn)確地預(yù)測(cè)出給定輸入圖像的像素級(jí)分類標(biāo)簽。目前,場(chǎng)景理解已經(jīng)成為自動(dòng)駕駛汽車的新興研究領(lǐng)域之一,而像素化語(yǔ)義分割是視覺場(chǎng)景理解的關(guān)鍵工具。本文所提出的CNN網(wǎng)絡(luò)模型是一種基于編碼器—解碼器模型,其編碼器是視覺幾何組的VGG-16網(wǎng)絡(luò)采用的卷積編碼器層,而解碼器則依靠分段網(wǎng)絡(luò)(SegNet)。因此,所提出的架構(gòu)減輕了現(xiàn)有的編碼器—解碼器設(shè)計(jì)的局限性。其中編碼器執(zhí)行卷積,而解碼器負(fù)責(zé)去卷積和解卷積。該架構(gòu)的關(guān)鍵思想是應(yīng)用采樣解碼器網(wǎng)絡(luò),并映射出低分辨率編碼器特征圖。該架構(gòu)大大減少了可訓(xùn)練參數(shù)的數(shù)量,并將編碼器的匯總索引重新采樣,其采樣以映射像素分類和分段。本文還嘗試了不同的激活函數(shù)、池化方法來(lái)設(shè)計(jì)出更高效的CNN架構(gòu)。此外,本文還將其與PASCAL VOC-12和CamVid的基準(zhǔn)測(cè)試結(jié)果相比,結(jié)果表明,該架構(gòu)的性能有顯著提高。
本文提出的CNN系統(tǒng)是一個(gè)語(yǔ)義像素分割引擎。它實(shí)現(xiàn)了編碼器—解碼器網(wǎng)絡(luò)的獨(dú)特組合,從而顯示出增強(qiáng)后的性能和改進(jìn)后的結(jié)果。本文研究還將其架構(gòu)層次轉(zhuǎn)移到更大的綜合體系結(jié)構(gòu),從而能夠提供出更多的時(shí)間來(lái)訓(xùn)練和測(cè)試網(wǎng)絡(luò)的效率。此外,超聲波和其他類型的雷達(dá)在智能汽車中的應(yīng)用越來(lái)越廣泛。因此,在汽車中使用基于CNN的道路景觀檢測(cè)系統(tǒng),特別是在奇怪的路況和超聲波信號(hào)無(wú)法識(shí)別物體的盲點(diǎn)方面將會(huì)有所幫助。未來(lái)研究工作還將通過開發(fā)和設(shè)計(jì)出一個(gè)二值化神經(jīng)網(wǎng)絡(luò)來(lái)提高道路場(chǎng)景理解性能,從而提高網(wǎng)絡(luò)的性能。這將是一個(gè)更快速、更有效的架構(gòu),以便于道路現(xiàn)場(chǎng)理解情景的實(shí)時(shí)決策。
刊名:Applied Sciences-Basel(英)
刊期:2017年第4期
作者:Yasrab R et al
編譯:陳少帥