裴漢林
摘要:自動(dòng)駕駛車(chē)輛是由環(huán)境感知、定位導(dǎo)航、路徑規(guī)劃、運(yùn)動(dòng)控制等組成。充分考慮車(chē)路合一,協(xié)調(diào)規(guī)劃的車(chē)輛系統(tǒng)。自動(dòng)駕駛的環(huán)境感知系統(tǒng)融合了超聲波傳感器、紅外線(xiàn)傳感器、激光雷達(dá)、毫米波雷達(dá)等多種傳感器的數(shù)據(jù)來(lái)獲取道路信息。為此,本文首先介紹了激光雷達(dá)在自動(dòng)駕駛感知系統(tǒng)的應(yīng)用。然后對(duì)自動(dòng)駕駛環(huán)境感知系統(tǒng)的關(guān)鍵技術(shù):目標(biāo)檢測(cè)、跟蹤、場(chǎng)景分割分別進(jìn)行研究。
關(guān)鍵詞:自動(dòng)駕駛;環(huán)境感知;深度學(xué)習(xí)
1? 研究背景及意義
近年來(lái),隨著人工智能和深度學(xué)習(xí)技術(shù)的不斷深入研究,自動(dòng)駕駛技術(shù)被認(rèn)為是最具有研發(fā)價(jià)值的領(lǐng)域之一。然而,將自動(dòng)駕駛汽車(chē)應(yīng)用到實(shí)際復(fù)雜的道路交通場(chǎng)景,還存在著一定的差距。因此,環(huán)境感知系統(tǒng)是自動(dòng)駕駛汽車(chē)的重要組成部分。主要的任務(wù)是識(shí)別和分類(lèi)道路障礙、交通標(biāo)志、信號(hào)燈、行人車(chē)輛等,能夠分析判斷出車(chē)輛所處環(huán)境的位置[1]。
環(huán)境感知系統(tǒng)是自動(dòng)駕駛車(chē)輛的關(guān)鍵技術(shù)之一。它對(duì)于交通場(chǎng)景語(yǔ)義的準(zhǔn)確理解以及車(chē)輛做出相應(yīng)的行為決策都是至關(guān)重要,是行車(chē)安全與智能化的一個(gè)重要保障。基于深度學(xué)習(xí)的神經(jīng)網(wǎng)絡(luò)算法在人工智能領(lǐng)域的深入研究,促使了自動(dòng)駕駛的變革。傳統(tǒng)的環(huán)境感知算法對(duì)于處理復(fù)雜的交通場(chǎng)景道路準(zhǔn)確性和實(shí)時(shí)性達(dá)不到預(yù)期的效果。而基于深度學(xué)習(xí)的卷積神經(jīng)網(wǎng)絡(luò)算法可以很好的處理龐大的數(shù)據(jù)集訓(xùn)練出理想的模型,可以很迅速的感知車(chē)輛前方的道路信息,可以及時(shí)的給車(chē)輛感知系統(tǒng)反饋,在實(shí)時(shí)性和準(zhǔn)確率方面都有一定的提升。
2? 環(huán)境感知技術(shù)的國(guó)內(nèi)外研究現(xiàn)狀
許多政府機(jī)構(gòu)、學(xué)術(shù)界和工業(yè)界都在自動(dòng)駕駛系統(tǒng)上投入了大量的資源,如CMU、Stanford、清華大學(xué)、Google、百度、阿里、華為等。在過(guò)去的十年里,人們對(duì)環(huán)境感知模塊進(jìn)行了深入研究。對(duì)于道路信息的信息收集通常由多個(gè)傳感器采集,如相機(jī)、雷達(dá)、激光雷達(dá)和紅外傳感器。預(yù)處理后,提取環(huán)境中物體的各種特征,如道路、車(chē)道、交通標(biāo)志、行人、車(chē)輛等。
在國(guó)內(nèi)主要的科研公司代表是百度阿波羅(Apollo)L4級(jí)別的自動(dòng)駕駛車(chē)輛,2019年研發(fā)了一套完整的L4級(jí)別的視覺(jué)感知系統(tǒng)。該系統(tǒng)可支持對(duì)10路攝像頭,200fps數(shù)據(jù)量的同步處理,最高丟幀率在5%以下,可實(shí)現(xiàn)全方位360的道路場(chǎng)景感知,障礙物最遠(yuǎn)檢測(cè)距離達(dá)240m。這套視覺(jué)感知方案最突出的地方是可不依賴(lài)高速機(jī)械旋轉(zhuǎn)的激光雷達(dá)探測(cè)信息,就可以實(shí)現(xiàn)在城市道路上實(shí)現(xiàn)端到端閉環(huán)的L4級(jí)別的自動(dòng)駕駛。使得在一定程度上降低了自動(dòng)駕駛車(chē)輛的成本費(fèi)用,創(chuàng)造了更多的應(yīng)用價(jià)值。
在國(guó)外的自動(dòng)駕駛環(huán)境感知眾多研究領(lǐng)域,其中美國(guó)的特斯拉(Tesla)公司在自動(dòng)駕駛這一領(lǐng)域的研究有著領(lǐng)先水平,尤其在環(huán)境感知這一方面來(lái)講,其視覺(jué)系統(tǒng)是由超聲波雷達(dá)、攝像頭、GPS定位系統(tǒng)等構(gòu)成,偵測(cè)范圍可達(dá)250m,該系統(tǒng)的觀測(cè)視野遠(yuǎn)比人眼更加廣闊,獲得交通道路信息更多。為解決激光雷達(dá)費(fèi)用昂貴的問(wèn)題,總部位于美國(guó)的Cepton公司研究出一款價(jià)格低于1000美元以下的激光雷達(dá)Vista-X90,檢測(cè)距離最遠(yuǎn)可達(dá)200m,可實(shí)現(xiàn)高分辨率的空間三維成像。
通過(guò)國(guó)內(nèi)外的自動(dòng)駕駛環(huán)境感知研究現(xiàn)狀的分析,車(chē)輛對(duì)周?chē)h(huán)境的實(shí)時(shí)感知和理解是十分關(guān)鍵。其面臨著需要處理來(lái)自多個(gè)傳感器的大量數(shù)據(jù)的挑戰(zhàn),如相機(jī)、無(wú)線(xiàn)電探測(cè)和測(cè)距(雷達(dá))、光探測(cè)和測(cè)距(激光雷達(dá))。因此對(duì)于自動(dòng)駕駛環(huán)境感知系統(tǒng)的目標(biāo)檢測(cè)、目標(biāo)識(shí)別、目標(biāo)跟蹤和駕駛員行為分析以及場(chǎng)景理解等關(guān)鍵技術(shù)的研究十分必要。
3? 環(huán)境感知技術(shù)的應(yīng)用
深度學(xué)習(xí)是機(jī)器學(xué)習(xí)為基礎(chǔ)的更深層次學(xué)習(xí),通俗來(lái)理解為通過(guò)大量的數(shù)據(jù)標(biāo)簽,總結(jié)出規(guī)律訓(xùn)練出想要的模型,然后通過(guò)該規(guī)律將與新的數(shù)據(jù)智能分類(lèi)和預(yù)測(cè)[2]。深度學(xué)習(xí)技術(shù)覆蓋范圍包括醫(yī)學(xué)圖像工程輔助診斷、人臉識(shí)別、自然語(yǔ)言處理、圖像處理等科學(xué)研究領(lǐng)域。
深度學(xué)習(xí)的卷積神經(jīng)網(wǎng)絡(luò)(CNN)的不斷研究,推動(dòng)了自動(dòng)駕駛在環(huán)境感知、運(yùn)動(dòng)控制、行為決策等多項(xiàng)關(guān)鍵技術(shù)的慢慢走向成熟。在自動(dòng)駕駛領(lǐng)域,以卷積神經(jīng)網(wǎng)絡(luò)(CNN)為基礎(chǔ),進(jìn)一步開(kāi)發(fā)的R—CNN、Fast R—CNN. SSD、YOLO等神經(jīng)網(wǎng)絡(luò)[3]。下面將介紹深度學(xué)習(xí)在自動(dòng)駕駛環(huán)境感知技術(shù)應(yīng)用。
3.1 激光雷達(dá)的交通場(chǎng)景識(shí)別
自動(dòng)駕駛的激光雷達(dá)是通過(guò)發(fā)射激光束來(lái)探測(cè)目標(biāo)位置的雷達(dá)系統(tǒng),同時(shí)也可獲得車(chē)輛周?chē)纳疃刃畔?,可以?zhǔn)確的判斷出車(chē)輛周?chē)恼系K。如美國(guó)Velodyne公司的64線(xiàn)中的激光需達(dá),它的機(jī)械式旋轉(zhuǎn)結(jié)構(gòu)能夠?qū)崟r(shí)地建立起周?chē)h(huán)境的3D場(chǎng)景圖。目前,激光雷達(dá)因其測(cè)量的高度可靠性、精確性,仍是自動(dòng)駕駛系統(tǒng)中最重要的視覺(jué)傳感器之一。但是在開(kāi)闊地帶,由于缺乏特征點(diǎn),會(huì)存在點(diǎn)云過(guò)于稀疏,至丟失點(diǎn)的問(wèn)題。最近幾年研究者開(kāi)始使用卷積神經(jīng)網(wǎng)絡(luò)來(lái)對(duì)三維的點(diǎn)云聚類(lèi)進(jìn)行分類(lèi),在實(shí)際工程應(yīng)用中通過(guò)將采用激光雷達(dá)獲取目標(biāo)的深度信息,并且通過(guò)攝像頭采集到的視頻信息,將其兩種數(shù)據(jù)融合基于CNN的各種目標(biāo)檢測(cè)識(shí)別算法,來(lái)獲取交通道路場(chǎng)景獲取的目標(biāo)位置及分類(lèi)[4]。所以在實(shí)踐中通常采用多傳感器融合的方式,來(lái)獲取交通場(chǎng)景的周?chē)畔5]。
3.2 目標(biāo)檢測(cè)
在自動(dòng)駕駛的環(huán)境感知系統(tǒng)中,對(duì)交通信號(hào)燈、行人和車(chē)輛、車(chē)道線(xiàn)以及可行駛區(qū)域、交通標(biāo)志的識(shí)別檢測(cè)是一項(xiàng)關(guān)鍵的技術(shù)內(nèi)容。傳統(tǒng)的目標(biāo)檢測(cè)算法主要是采用多尺度滑動(dòng)窗口來(lái)獲取圖像,計(jì)算的數(shù)據(jù)量龐大,并且會(huì)產(chǎn)生冗余的窗口,魯棒性較差,目標(biāo)信息的特征容易受外界環(huán)境影響,分類(lèi)的精度較低,泛化能力差。
隨著深度學(xué)習(xí)算法的提出,基于卷積神經(jīng)網(wǎng)絡(luò)(CNN)算法的目標(biāo)檢測(cè)技術(shù)慢慢的應(yīng)用到實(shí)際的工程應(yīng)用中。其中在深度學(xué)習(xí)的目標(biāo)檢測(cè)算法又可分為:①基于two stage的車(chē)輛檢測(cè)方法:如R-CNN、FAST-R CNN、FASTER-R CNN等。這種算法主要分兩步進(jìn)行:首先選取候選區(qū)域,再進(jìn)行分類(lèi)和回歸。②基于one stage的車(chē)輛檢測(cè)方法:以SSD、YOLO為基礎(chǔ)衍生的一些列檢測(cè)算法。該算法的特點(diǎn)是一種端到端的網(wǎng)絡(luò)結(jié)構(gòu),直接將目標(biāo)檢測(cè)的問(wèn)題轉(zhuǎn)化成回歸問(wèn)題,不再需要選取候選區(qū)域。這兩者算法的綜合比較后者因?yàn)榫W(wǎng)絡(luò)結(jié)構(gòu)更加簡(jiǎn)單,計(jì)算量以及訓(xùn)練數(shù)據(jù)的相對(duì)減少,使得實(shí)時(shí)性更好,在環(huán)境感知系統(tǒng)中更適應(yīng)實(shí)際的交通道路場(chǎng)景。
為了更好的判斷目標(biāo)檢測(cè)這些算法的優(yōu)劣,我們需要一系列的數(shù)據(jù)集。我們常用的數(shù)據(jù)集包PASCAL VOC數(shù)據(jù)集、COCO數(shù)據(jù)集、ImageNet數(shù)據(jù)集、MIT(行人數(shù)據(jù)集)、KITTI(車(chē)輛數(shù)據(jù)集)、CTSD(中國(guó)交通標(biāo)志數(shù)據(jù)集)等。
3.3 目標(biāo)跟蹤
自動(dòng)駕駛車(chē)輛的感知系統(tǒng)中另外一項(xiàng)關(guān)鍵技術(shù)就是對(duì)車(chē)輛前方障礙物的目標(biāo)跟蹤,其中對(duì)象包括車(chē)輛軌跡跟蹤、非機(jī)動(dòng)車(chē)輛軌跡跟蹤、行人軌跡跟蹤等。目標(biāo)跟蹤技術(shù)對(duì)行車(chē)安全至關(guān)重要,能夠有效的預(yù)測(cè)物體運(yùn)動(dòng)的軌跡,從而控制層可以提前做出碰撞預(yù)警以及變道處理等決策。
目標(biāo)跟蹤的的應(yīng)用從目標(biāo)數(shù)量上可分為單目標(biāo)跟蹤(SOT)和多目標(biāo)跟蹤(MOT),而在實(shí)際的交通場(chǎng)景更多的是MOT,考慮到多個(gè)車(chē)輛目標(biāo)在實(shí)際運(yùn)動(dòng)中上一幀到下一幀的匹配關(guān)系。目標(biāo)跟蹤算法大致可分為兩種:①生成式:均值漂移算法(Meanshift)、卡爾曼(Klaman)濾波算法等;②判別式:相關(guān)濾波算法、基于深度學(xué)習(xí)的跟蹤算法。兩種算法的比較下后者更具有魯棒性,應(yīng)用在自動(dòng)駕駛車(chē)輛感知系統(tǒng)中。
為了評(píng)價(jià)各種目標(biāo)跟蹤算法的實(shí)用性,這里將介紹通用的數(shù)據(jù)集與評(píng)價(jià)指標(biāo)。常用的數(shù)據(jù)集有MOT數(shù)據(jù)集專(zhuān)門(mén)用于行人和車(chē)輛的跟蹤。目標(biāo)跟蹤技術(shù)當(dāng)今面臨的關(guān)鍵問(wèn)題:①光照變化;②物體快速運(yùn)動(dòng)造成的圖像模糊;③視覺(jué)傳感器與周?chē)繕?biāo)距離的變化,也稱(chēng)尺度變化;④背景雜亂,相似的目標(biāo)物體的每一幀的檢測(cè)過(guò)程中會(huì)造成匹配錯(cuò)誤,從而丟失了跟蹤目標(biāo)。
3.4 場(chǎng)景分割
自動(dòng)駕駛系統(tǒng)中另一項(xiàng)核心技術(shù)就是交通道路場(chǎng)景語(yǔ)義分割,影響著車(chē)輛的自主導(dǎo)航與行為決策,它對(duì)于環(huán)境的理解和分析有著重要的意義。語(yǔ)義分割是在像素級(jí)別的標(biāo)準(zhǔn),通過(guò)對(duì)目標(biāo)進(jìn)行分類(lèi),如行人、車(chē)輛、車(chē)道線(xiàn)、草地、建筑物等。場(chǎng)景的分割即是對(duì)圖片的語(yǔ)義分割,幫助自動(dòng)駕駛的感知系統(tǒng),建立交通場(chǎng)景的語(yǔ)義實(shí)體模型以及對(duì)周?chē)h(huán)境理解,判斷出可行駛區(qū)域的重要工具。
將深度學(xué)習(xí)的方法應(yīng)用到場(chǎng)景分割是一項(xiàng)突破性的成果,提高了行車(chē)的安全性以及對(duì)交通場(chǎng)景分割的準(zhǔn)確性和時(shí)效性。深度學(xué)習(xí)的語(yǔ)義分割的方法主要有:①基于空洞卷積的方法;②基于編解碼的方法;③基于特征融合的方法;④基于RNN的方法;⑤基于注意力機(jī)制的方法。
為評(píng)價(jià)場(chǎng)景分割的算法的實(shí)時(shí)性和性能,我們需要在特定的數(shù)據(jù)集上進(jìn)行測(cè)試,常用的大型公共數(shù)據(jù)集按場(chǎng)景類(lèi)可分為以下幾種:①室外場(chǎng)景:Stanford back-ground、siftflow數(shù)據(jù)集,特點(diǎn)是類(lèi)別和分辨率低;②駕駛場(chǎng)景:KITTI-Ros、智能機(jī)器人和自動(dòng)駕駛的常用數(shù)據(jù)集;③城市街道場(chǎng)景:Cityscaps利用車(chē)載攝像頭采集的歐洲街道場(chǎng)景;④復(fù)雜場(chǎng)景:ADE20K、MS COCO數(shù)據(jù)集場(chǎng)景類(lèi)別較多,包含的樣本數(shù)量和類(lèi)別較多。
4? 總結(jié)與展望
本文針對(duì)環(huán)境感知的目標(biāo)檢測(cè)與跟蹤、場(chǎng)景分割三項(xiàng)關(guān)鍵技術(shù)進(jìn)行深入理解,并且給出用來(lái)測(cè)試的數(shù)據(jù)集。但自動(dòng)駕駛的環(huán)境感知技術(shù)的研究還需要在以下幾個(gè)方面進(jìn)行完善:①環(huán)境感知系統(tǒng)應(yīng)適用于更加復(fù)雜的天氣情況包括夜間、霧天雨天;②激光雷達(dá)傳感器費(fèi)用昂貴,可以考慮縮減成本,使用其他的高性能視覺(jué)傳感器;③加大力度投入計(jì)算機(jī)視覺(jué)領(lǐng)域研究,通過(guò)提升算法的性能,對(duì)處理圖像的準(zhǔn)確率和時(shí)效性滿(mǎn)足現(xiàn)在交通場(chǎng)景的要求;④優(yōu)化視覺(jué)傳感器的抗干擾性能和數(shù)據(jù)處理速度。若是能夠充分考慮這些內(nèi)容進(jìn)行改善,這將對(duì)自動(dòng)駕駛汽車(chē)的舒適性、安全性、穩(wěn)定性有著巨大的影響。
參考文獻(xiàn):
[1]高銘.基于深度學(xué)習(xí)的復(fù)雜交通環(huán)境下目標(biāo)跟蹤與軌跡預(yù)測(cè)研究[D].吉林大學(xué),2020.
[2]章軍輝,陳大鵬,李慶.自動(dòng)駕駛技術(shù)研究現(xiàn)狀及發(fā)展趨勢(shì)[J].科學(xué)技術(shù)與工程,2020,20(09):3394-3403.
[3]李健明.基于深度學(xué)習(xí)的無(wú)人駕駛汽車(chē)環(huán)境感知與控制方法研究[D].長(zhǎng)安大學(xué),2019.
[4]陳兆一.基于三維激光點(diǎn)云的復(fù)雜場(chǎng)景人體目標(biāo)識(shí)別[D].北京郵電大學(xué),2019.
[5]宮銘錢(qián),冀杰,種一帆,陳瓊紅.基于激光雷達(dá)和視覺(jué)信息融合的車(chē)輛識(shí)別與跟蹤[J/OL].汽車(chē)技術(shù):1-8[2020-09-28].