張俊元
南寧三中 廣西南寧市 530021
無(wú)人駕駛系統(tǒng)最底層的就是由大量傳感器構(gòu)成的感知層,通過(guò)對(duì)各種復(fù)雜路況的環(huán)境感知轉(zhuǎn)化為數(shù)據(jù)并進(jìn)行處理再傳入到?jīng)Q策層,再進(jìn)行安全合理應(yīng)對(duì)措施。這里的環(huán)境感知主要是包括對(duì)交通標(biāo)識(shí)、路況、車(chē)道線標(biāo)識(shí)以及車(chē)流的感知(高速公路上,城市交通更為復(fù)雜),最常見(jiàn)的是對(duì)獲取到周?chē)h(huán)境的圖片信息,進(jìn)行簡(jiǎn)單的去噪和二值化操作后,通過(guò)對(duì)比數(shù)據(jù)庫(kù)得到交通標(biāo)識(shí)等信息,再傳入到?jīng)Q策層。
無(wú)人駕駛系統(tǒng)的規(guī)劃主要是對(duì)路徑的規(guī)劃,通過(guò)感知層得到的路況和路標(biāo)信息,生成一條安全且可行的路徑。首先是全局路徑規(guī)劃,通過(guò)設(shè)定起始點(diǎn),確定一條最優(yōu)的路徑,再是局部路徑規(guī)劃,比如說(shuō)遇到前方車(chē)輛需要超車(chē)時(shí)的行駛路徑、前方擁堵需要換道時(shí)的換道路徑等,目前最常用的局部路徑規(guī)劃算法主要是隨機(jī)采樣算法,在某時(shí)刻初始位置通過(guò)隨機(jī)采樣尋找到周?chē)鸁o(wú)障礙的點(diǎn),在這些點(diǎn)中尋找一條最短路徑,但是在某些時(shí)刻運(yùn)算量較大,可能達(dá)不到實(shí)時(shí)性。
整個(gè)執(zhí)行層主要包括對(duì)油門(mén)、剎車(chē)、方向盤(pán)等汽車(chē)部件的自動(dòng)控制,在決策層規(guī)劃處路徑后發(fā)送指令到執(zhí)行層來(lái)控制這些部件的統(tǒng)一運(yùn)行來(lái)實(shí)現(xiàn)車(chē)輛的安全行駛。
一輛車(chē)在駕駛的過(guò)程中,最重要的是通過(guò)駕駛員的人眼感知外部環(huán)境傳送到大腦,大腦做出相應(yīng)的反應(yīng)通過(guò)身體控制汽車(chē)來(lái)保證安全的行駛,但是無(wú)人駕駛系統(tǒng)中由于沒(méi)有駕駛員的存在,那么感知外部環(huán)境并做出相應(yīng)的反應(yīng)這一過(guò)程就交由系統(tǒng)自動(dòng)的完成,在高速公路上行駛時(shí),由于交通狀況較為簡(jiǎn)單,只需要感知到明顯的交通指示牌即可,但是在城市道路上,交通狀況極為復(fù)雜,不僅需要注意紅綠燈,還有人行道上的行人以及別的車(chē)的變道指示,那么就需要復(fù)雜的判斷。
一般來(lái)說(shuō)的環(huán)境感知是指對(duì)車(chē)身上的傳感器所識(shí)別的外部環(huán)境的圖像進(jìn)行識(shí)別和處理,一般來(lái)說(shuō),是對(duì)圖像的像素點(diǎn)的分類(lèi),在上個(gè)世紀(jì),圖像識(shí)別主要使用的是一個(gè)隨機(jī)場(chǎng)算法,但是在近年來(lái)卷積神經(jīng)網(wǎng)絡(luò)理論的發(fā)展和GPU的普及,可以很大程度上提高圖像的識(shí)別效率,來(lái)保證無(wú)人駕駛系統(tǒng)反饋的實(shí)時(shí)性。
2.1.1 神經(jīng)元模型
神經(jīng)網(wǎng)絡(luò)組成的最基本單元是神經(jīng)元,也稱(chēng)為感知器,其簡(jiǎn)化模型如圖1:
圖中x1、x2、x3為輸入信號(hào),w1、w2、w3為輸入信號(hào)各自對(duì)應(yīng)的權(quán)值,b值是一個(gè)偏置項(xiàng),對(duì)輸入加權(quán)求和后得到z,g泛指為激活函數(shù),y為輸出[3]??梢钥吹揭粋€(gè)感知器有如下3個(gè)部分:
(1)輸入信號(hào):可以接收多個(gè)輸入,每個(gè)輸入上有一個(gè)權(quán)值;
(2)激活函數(shù):感知器的激活函數(shù)可以有很多選擇,常見(jiàn)的激活函數(shù)有Sigmoid、tanh、ReLU等;
(3)輸出:獲取神經(jīng)網(wǎng)絡(luò)輸出數(shù)據(jù)。
感知器的作用主要是用來(lái)提取圖像的每一個(gè)像素值并將其作為一個(gè)權(quán)值輸入到卷積神經(jīng)網(wǎng)絡(luò)中進(jìn)行下一步處理。
2.1.2 卷積層
二維圖像的卷積操作較一維信號(hào)的卷積操作而言較為復(fù)雜,首先我們將一張二維圖像類(lèi)比于圖2-2的網(wǎng)格圖,其中,每一個(gè)網(wǎng)格代表一個(gè)像素,圖中藍(lán)顏色的網(wǎng)格表示卷積層中的一個(gè)卷積核,可看出卷積核的大小為3*3。卷積操作如下:每一次卷積核延X(jué)軸方向行進(jìn)一個(gè)步長(zhǎng),直至行進(jìn)到圖像邊緣后卷積核又返回至最左端并向下移動(dòng)一個(gè)步長(zhǎng)繼續(xù)如上操作直至遍歷整個(gè)網(wǎng)格。卷積核中每一個(gè)單元均代表一個(gè)權(quán)重,在卷積核遍歷整個(gè)網(wǎng)格過(guò)程中,卷積核中的權(quán)重將會(huì)與對(duì)應(yīng)網(wǎng)格中的權(quán)重相乘相加,如果假設(shè)步長(zhǎng)為1,那么圖1-2經(jīng)過(guò)卷積操作后將會(huì)成為一個(gè)6*4的圖。
圖2 卷積操作
讀取大小為6*4的生成圖中每一個(gè)元素的值,對(duì)每一個(gè)值通過(guò)激勵(lì)函數(shù)進(jìn)行非線性化處理,處理方法有許多種,本文使用ReLU函數(shù)作為激活函數(shù)。ReLU函數(shù)具有許多獨(dú)特的特性,該函數(shù)是扭曲線性函數(shù)且是一種非線性的非飽和函數(shù)。相對(duì)于飽和函數(shù)來(lái)說(shuō),ReLU函數(shù)的訓(xùn)練時(shí)間更快且更具效率,而相對(duì)于線性函數(shù)來(lái)說(shuō),ReLU有更強(qiáng)的表達(dá)能力,且它的扭曲線性的性質(zhì)不但保留了非線性的表達(dá)能力,而且在正值部分具有很好的線性性質(zhì)。除此之外,由于ReLU函數(shù)的非負(fù)區(qū)間的梯度為常數(shù),這就是得它較tanh和sigmoid函數(shù)而言的優(yōu)異性在于不存在梯度的消失問(wèn)題。
2.1.3 池化層
池化層進(jìn)行下采樣操作,目的是減小特征圖、減少特征值、降低運(yùn)算量和降低數(shù)據(jù)維度。常用的方法有三種:最大池化(Max Pooling)、最小池化(Minimal Pooling)和平均池化(Average Pooling),池化規(guī)模一般為2×2。最大池化(Max Pooling)是目前關(guān)于卷積神經(jīng)網(wǎng)絡(luò)處理常用的池化方法,它取四個(gè)點(diǎn)中的最大值。
對(duì)于從傳感器接收到的圖片,我們遇到的最大問(wèn)題是對(duì)單一像素點(diǎn)的分類(lèi)問(wèn)題。對(duì)于一個(gè)單獨(dú)的像素點(diǎn),比如說(shuō)車(chē)身的白色像素點(diǎn)和一個(gè)高光區(qū)域的白色像素點(diǎn),我們是很難具體的判斷出這個(gè)像素點(diǎn)代表的是車(chē)身還是高光區(qū)域,那么我們就需要結(jié)合這個(gè)像素點(diǎn)周?chē)南袼剡M(jìn)行判斷,尤其是邊緣區(qū)域的判斷,那么我們就可以使用卷積神經(jīng)網(wǎng)絡(luò),使用不同的卷積核得到不同的特征圖類(lèi)型經(jīng)過(guò)與訓(xùn)練的數(shù)據(jù)集對(duì)比從而進(jìn)行圖像識(shí)別[3]。
實(shí)際上,障礙物檢測(cè)也可以屬于環(huán)境感知的內(nèi)容,但是比較特殊,可以歸為一個(gè)單獨(dú)的整體,因?yàn)閷?duì)于汽車(chē)的檢障和避障是保證汽車(chē)安全行駛的前提。
一般來(lái)說(shuō),檢測(cè)障礙物分為靜止的障礙物和動(dòng)態(tài)的障礙物,靜止的障礙物的檢測(cè)較為簡(jiǎn)單,運(yùn)動(dòng)的障礙物檢測(cè)較為復(fù)雜,一般是使用激光雷達(dá)作為傳感器,主要有地圖差分法,將運(yùn)動(dòng)的障礙物看成質(zhì)點(diǎn),通過(guò)對(duì)比不同時(shí)刻的地圖信息,所不同的區(qū)域即是障礙物的軌跡。
對(duì)于障礙物的軌跡預(yù)測(cè)是比較困難的,充滿(mǎn)了不確定性,目前的方法效果都不是特別顯著,主要的方法2004年提出來(lái)的假設(shè)原狀法和2007年的概率軌跡法[4]。假設(shè)原狀法主要是通過(guò)傳感器獲得某一時(shí)刻障礙物的運(yùn)動(dòng)狀態(tài)(距離、速度等),然后假設(shè)該障礙物會(huì)以此時(shí)的運(yùn)動(dòng)狀態(tài)保持下去,即以此時(shí)刻的速度為初速度做勻速直線運(yùn)動(dòng),這種方法在高速公路等路況環(huán)境下是有一定效果的,但是對(duì)于城市交通這種復(fù)雜路況的效果是非常不顯著的,而概率軌跡法是在假設(shè)原狀法的基礎(chǔ)上引入了概率分布,對(duì)軌跡的可能性做出概率預(yù)測(cè),再加上一些與路況有關(guān)的基本信息的先驗(yàn)概率,可以較好的獲得更真實(shí)的預(yù)測(cè)結(jié)果,但仍然無(wú)法滿(mǎn)足復(fù)雜路況的障礙物判斷。
在通過(guò)檢測(cè)障礙物以及獲取了障礙物的軌跡預(yù)測(cè)后,決策層會(huì)發(fā)送指令來(lái)避開(kāi)障礙物,常用的方法有勢(shì)場(chǎng)法和區(qū)域劃分法。勢(shì)場(chǎng)法是借鑒了物理中保守力場(chǎng)的形式,比如說(shuō)重力場(chǎng),以地面為0勢(shì)能面,距離地面越遠(yuǎn)則重力勢(shì)能越大,這里是以障礙物為一個(gè)基準(zhǔn)點(diǎn),距離障礙物越遠(yuǎn),勢(shì)能越小,我們對(duì)這個(gè)勢(shì)能經(jīng)過(guò)實(shí)驗(yàn)測(cè)定一定的閾值,如果小于這個(gè)值,那么就屬于安全行駛區(qū)域,從而構(gòu)建一條安全的行駛路徑。
本文主要介紹了無(wú)人駕駛系統(tǒng)的基本結(jié)構(gòu)和無(wú)人駕駛系統(tǒng)的關(guān)鍵技術(shù)。無(wú)人駕駛系統(tǒng)主要由感知層、決策層和執(zhí)行層構(gòu)成的,關(guān)鍵技術(shù)主要是環(huán)境感知技術(shù)和檢障避障技術(shù),環(huán)境感知系統(tǒng)現(xiàn)在主要使用卷積神經(jīng)網(wǎng)絡(luò)對(duì)感知到的圖片信息進(jìn)行特征提取從而獲得信息,這兩種技術(shù)共同保證了無(wú)人駕駛的安全性。
目前的無(wú)人駕駛系統(tǒng)仍處于試驗(yàn)階段,且只能應(yīng)對(duì)高速公路等簡(jiǎn)單路況信息,尚無(wú)法處理城市交通的復(fù)雜情況,但是目前無(wú)人駕駛系統(tǒng)是當(dāng)前世界研究的熱點(diǎn)和難點(diǎn),相信在廣大科研工作者的努力下一定會(huì)變成現(xiàn)實(shí),也希望自己以后可以為無(wú)人駕駛系統(tǒng)中的關(guān)鍵技術(shù)添磚加瓦。