熊明強,譙 杰,王 亮,夏 芹,江 萌
(1.中國汽車工程研究院股份有限公司,重慶 401122;2.汽車噪聲振動和安全技術(shù)國家重點實驗室,重慶 401122;3.中國城市規(guī)劃設(shè)計研究院西部分院,重慶 401122)
近年來,自動駕駛技術(shù)引起了世界各國的廣泛關(guān)注[1-10],被認為是緩解交通擁堵,減少交通事故和環(huán)境污染的重要技術(shù)[1,6,11]。目前一些自動駕駛已經(jīng)進行了大規(guī)模的道路測試,比如谷歌自動駕駛和蘋果自動駕駛。研究表明[12],在如今的交通事故中,有超過30%的道路交通事故是由不合理的換道行為引起的。
目前基于機器學(xué)習(xí)的方法對自動換道軌跡進行的研究還比較少[13-15],利用機器學(xué)習(xí)進行自動駕駛車輛換道軌跡規(guī)劃的模型需要經(jīng)過大量已有的換道數(shù)據(jù)訓(xùn)練來確定。YAO Wen等[13]將k最近鄰算法應(yīng)用到換道軌跡規(guī)劃中,但是該模型所用到的數(shù)據(jù)較為有限且覆蓋場景不足。在此基礎(chǔ)上,DING Chenxi等[14]構(gòu)建了兩層BP神經(jīng)網(wǎng)絡(luò)對NGSIM數(shù)據(jù)[16]進行學(xué)習(xí),從而對車輛換道進行端到端的軌跡預(yù)測,但是k最近鄰算法和BP神經(jīng)網(wǎng)絡(luò)對于換道這類時間序列數(shù)據(jù)處理能力有限,通常是單一地復(fù)制已有的數(shù)據(jù),并未對數(shù)據(jù)前后幀的內(nèi)部邏輯進行判斷和處理[17]。XIE Dongfan等[15]利用經(jīng)典LSTM神經(jīng)網(wǎng)絡(luò)預(yù)測自動駕駛車輛換道軌跡,該模型對換道軌跡曲線的學(xué)習(xí)結(jié)果取得了較高的精度,但是沒有對訓(xùn)練過程中的一些不安全因素進行限制??紤]到現(xiàn)有基于深度學(xué)習(xí)的自動駕駛車輛換道軌跡規(guī)劃算法只是單一地復(fù)制已有的換道軌跡,忽略了換道過程中的動態(tài)變化,這樣的模型對于換道條件過于苛刻,無法用于現(xiàn)實環(huán)境。反觀人類在對于新事物的學(xué)習(xí)過程中,一方面由已有的理論經(jīng)驗對新事物的反應(yīng)進行指導(dǎo),另一方面,面對新事物時,人類也在不斷的實踐過程中形成自己的經(jīng)驗。本文借鑒了人類對于新事物的學(xué)習(xí)過程,將所訓(xùn)練的BP神經(jīng)網(wǎng)絡(luò)進行嵌套,從而建立一種可嵌入的深度學(xué)習(xí)網(wǎng)絡(luò)模型,該模型有效地繼承了以往數(shù)據(jù)的換道行為特征,同時能縮短對新數(shù)據(jù)的學(xué)習(xí)過程。
隨著近年神經(jīng)網(wǎng)絡(luò)的不斷發(fā)展,各種被用于不同領(lǐng)域的神經(jīng)網(wǎng)絡(luò)被不斷地提出和優(yōu)化,但無論是哪種神經(jīng)網(wǎng)絡(luò),其方法大致上都在模仿人的學(xué)習(xí)過程。人在最初對一個事物進行學(xué)習(xí)時,實際上是從兩個方面來進行學(xué)習(xí)的,一個方面是對該事物已經(jīng)形成的知識進行學(xué)習(xí),另一個方面是通過不斷的實踐進行學(xué)習(xí),借鑒這種思路,本文提出了一種新的神經(jīng)網(wǎng)絡(luò)模型,該神經(jīng)網(wǎng)絡(luò)模型旨在更加具體地模仿人的學(xué)習(xí)過程,如圖1所示。
圖1 神經(jīng)網(wǎng)絡(luò)嵌入過程
該神經(jīng)網(wǎng)絡(luò)模型有兩級,第1級橫向上是一個3層的全連接網(wǎng)絡(luò),第2層是嵌入層,嵌入層里面每一個神經(jīng)元都是一個單獨的神經(jīng)網(wǎng)絡(luò),第2級是需要嵌入的神經(jīng)網(wǎng)絡(luò)。本文把這些嵌套的神經(jīng)網(wǎng)絡(luò)暫定為BP神經(jīng)網(wǎng)絡(luò),這些BP神經(jīng)網(wǎng)絡(luò)分為兩種:(1)根據(jù)需要已經(jīng)訓(xùn)練好;(2)尚未進行訓(xùn)練。由此實現(xiàn)在學(xué)習(xí)過程中既能夠?qū)W到已有的知識,又能通過尚未訓(xùn)練的神經(jīng)網(wǎng)絡(luò)進行學(xué)習(xí)的目的。所以神經(jīng)網(wǎng)絡(luò)參數(shù)分為橫向參數(shù)和縱向參數(shù)。
一般而言,本文設(shè)計的神經(jīng)網(wǎng)絡(luò)主要由以下3個部分組成:輸入層、嵌入層和輸出層。
輸入層:根據(jù)不同學(xué)習(xí)對象的實際情況,設(shè)定神經(jīng)元數(shù)量。輸入的數(shù)據(jù)為交通環(huán)境數(shù)據(jù),即上一時刻換道車輛和換道車輛周邊車輛的位置、速度、加速度等數(shù)據(jù)。
嵌入層:由于嵌入層內(nèi)部各個神經(jīng)元可能用到的輸入變量長度不一樣,所以本文設(shè)置了嵌入層,嵌入層神經(jīng)元的數(shù)量根據(jù)實際情況進行尋優(yōu)及測試。
輸出層:根據(jù)實際問題需要設(shè)置數(shù)量,輸出為神經(jīng)網(wǎng)絡(luò)預(yù)測的下一時刻換道車輛位置和速度。
縱向上,各層神經(jīng)元由兩部分構(gòu)成,一部分是已經(jīng)訓(xùn)練好的神經(jīng)網(wǎng)絡(luò)(圖1主神經(jīng)網(wǎng)絡(luò)),以激活函數(shù)的形式嵌入,但這些神經(jīng)網(wǎng)絡(luò)必須針對同樣的問題,利用不同數(shù)據(jù)進行訓(xùn)練后得到的,這些神經(jīng)網(wǎng)絡(luò)在訓(xùn)練的過程中不需要進行參數(shù)調(diào)整,只需要利用輸入,得到輸出結(jié)果即可。如有需要,可嵌入沒有訓(xùn)練過的神經(jīng)網(wǎng)絡(luò),在主神經(jīng)網(wǎng)絡(luò)訓(xùn)練的過程中進行同步訓(xùn)練。
耦合的表現(xiàn)形式為兩個或兩個以上的系統(tǒng)構(gòu)成一個網(wǎng)絡(luò)時,若其中某一子系統(tǒng)中數(shù)據(jù)發(fā)生變化,能影響到其他子系統(tǒng)數(shù)據(jù)也發(fā)生類似的變化。其機理也多種多樣,本節(jié)主要采取數(shù)據(jù)耦合的方式?;谏疃葘W(xué)習(xí)的方式無法規(guī)避換道過程中的危險因素,單一地復(fù)刻已有數(shù)據(jù),且是黑盒模式導(dǎo)致無法控制訓(xùn)練參數(shù)?;谝?guī)則的模型都是對顯性數(shù)據(jù)進行計算,無法研究交通環(huán)境中隱形數(shù)據(jù)對換道過程的影響。本文將二者結(jié)合起來,試圖尋找通過一種機制讓二者互補的方式,如圖2所示。
圖2 神經(jīng)網(wǎng)絡(luò)和規(guī)則的耦合過程
深度學(xué)習(xí)模塊的訓(xùn)練是持續(xù)的,深度學(xué)習(xí)模塊在訓(xùn)練的過程中,運動學(xué)模塊不斷地向深度學(xué)習(xí)模塊傳遞安全性的數(shù)據(jù),讓深度學(xué)習(xí)也不斷對安全性數(shù)據(jù)進行學(xué)習(xí),雖然無法控制訓(xùn)練過程中的參數(shù),但是這種數(shù)據(jù)耦合的方式可以在訓(xùn)練中潛移默化地讓模型更具安全性。
機器學(xué)習(xí)的過程,就是通過數(shù)據(jù)的前向傳播求得預(yù)測值和真實值的誤差,用反向傳播算法縮小誤差的一個過程。在進行前向傳播之前,本文會根據(jù)特定的問題和基于規(guī)則的換道數(shù)據(jù)和基于人類的換道數(shù)據(jù)訓(xùn)練若干個BP神經(jīng)網(wǎng)絡(luò)net1,net2,…netn,本文將這些神經(jīng)網(wǎng)絡(luò)以替換的方式,將經(jīng)典的BP神經(jīng)網(wǎng)絡(luò)中的激活函數(shù)替換,原激活函數(shù)的輸入變?yōu)榍度肷窠?jīng)元的輸入,原激活函數(shù)的輸出變?yōu)榍度肷窠?jīng)元的輸出。
1.3.1 前向傳播
如果一個經(jīng)典BP神經(jīng)網(wǎng)絡(luò)有若干個輸出神經(jīng)元,該網(wǎng)絡(luò)每一次前向傳播后,任意一個神經(jīng)元j的輸入是:
第j個神經(jīng)元的輸出是:
式中:f()是激活函數(shù),在本方法中激活函數(shù)為:
式中:net為嵌入的BP經(jīng)網(wǎng)絡(luò)。
本文令隱藏層任意神經(jīng)元h的輸入為:
式中:wmn是隱藏層與輸入層的連接權(quán)重。
令輸出層任意神經(jīng)元j的輸出為:
式中:Sh為隱層神經(jīng)元h的輸出。
式中:f()為激活函數(shù)。
最終得到嵌入神經(jīng)網(wǎng)絡(luò)的p個輸出=即:
所以主神經(jīng)網(wǎng)絡(luò)神經(jīng)元j的輸入值為:
主神經(jīng)網(wǎng)絡(luò)與真實值相比誤差為:
1.3.2 反向傳播
至此,一次前向傳播結(jié)束,神經(jīng)網(wǎng)絡(luò)的最終目標是要使誤差盡可能地小,所以需要將前向傳播所得到的誤差進行反向傳播,訓(xùn)練得到相應(yīng)的參數(shù)w,設(shè)第一層神經(jīng)網(wǎng)絡(luò)權(quán)值矩陣為Wl=嵌入神經(jīng)網(wǎng)絡(luò)權(quán)重矩陣為Wq=嵌入層神經(jīng)網(wǎng)絡(luò)參數(shù)調(diào)整方式為:
輸出層第j個神經(jīng)元所對應(yīng)的誤差為:
以圖1中權(quán)重矩陣Wpm為例進行說明:
根據(jù)βj的定義,顯然有:
將式(14)和式(15)代入式(13),得到Wpm的更新公式為:
式中:學(xué)習(xí)率η∈(0,1)。
將式(12)具體化為:
式中:fyj'(Sj)為輸出層第j個神經(jīng)元對應(yīng)的Sj的傳播方程導(dǎo)數(shù),得到損失矩陣為:
主神經(jīng)網(wǎng)絡(luò)權(quán)重的更新方式為:
1.3.3 最優(yōu)軌跡模型
自動駕駛車輛在換道過程中,會根據(jù)實時交通環(huán)境進行軌跡規(guī)劃,每個時間步長內(nèi)會為車輛規(guī)劃出最優(yōu)的換道軌跡,由于基于時間多項式的換道軌跡算法計算較為復(fù)雜,可能存在較大延遲,本文選擇形式較為簡單的3次多項式作為基于規(guī)則的軌跡規(guī)劃算法,其表達式為:
式中:a0、a1、a2、a3均為待確定的參數(shù);xn為車輛n的縱向位置;yn為車輛n的橫向位置。確定各項參數(shù)有:
式中:θi為規(guī)劃步長起點的航向角;為終點橫向坐標,均為已知量。
1.3.4 避障算法
在圖3中,換道車輛為主車輛SV,當(dāng)前車道前車為PV,以及目標車道前車LV和目標車道后車FV。其中,穿過車道變化的虛線是車輛SV的換道軌跡,包括換道準備OP和換道執(zhí)行PD兩個階段,車輛SV在O點開始換道準備,在P點完成換道準備開始換道執(zhí)行,在D點完成換道。若定義換道執(zhí)行開始點為坐標原點,那么換道執(zhí)行開始點P的位置坐標為(0,0),換道執(zhí)行結(jié)束點的坐標為(xf,yf)。車輛SV在換道準備過程中受到PV的影響,當(dāng)換道條件滿足的時候進行換道執(zhí)行,車輛從當(dāng)前車道中心線移動到目標車輛中心線,根據(jù)Gipps模型[18]的推演,在執(zhí)行換道過程中受到車輛LV和FV的影響,車輛SV在換道過程中主要受這3輛車的影響。車輛在換道過程中,可能的沖突區(qū)域如圖3所示.
圖3 沖突區(qū)域
Gipps模型是領(lǐng)域內(nèi)經(jīng)典的車輛安全距離模型,可以較好地擬合兩輛跟馳車輛之間的行駛狀態(tài),但沒有考慮車輛車身長度。所以本文在經(jīng)典Gipps模型的基礎(chǔ)上加入車身長度進行改進,作為3次軌跡曲線的約束條件。
車輛換道過程中受到周圍車輛實時的影響,為了保證換道過程的安全性,需要實時檢測周圍車輛的行駛狀態(tài),并對周圍車輛的行駛狀態(tài)進行預(yù)測。
式中:j為編號為n-1的車輛;xj(t0)為t0時刻車輛j的縱向位置;vj為車輛j的速度;xj(t)為t時刻車輛j的縱向位置。
Gipps模型求解的是前車緊急停車時,后車在經(jīng)過反應(yīng)時間τ后也采取緊急停車,恰好不追尾所采取的速度。在經(jīng)典的Gipps模型中,車身的長度沒有被考慮到,也沒有考慮到實際跟馳過程中前后兩車的時變速度,本文對經(jīng)典Gipps模型進行改進,如圖4所示。
圖4 安全距離
后車緊急制動距離為:
式中:xstopn-1為前車從采取制動動作到車輛停止期間行駛過的距離;xstopn為后車從采取制動動作到車輛停止期間行駛過的距離;xn-1(t)為前車在t時刻的位置;x(t)為后車在t時刻的位置;vn-1(t)為前車在t時刻的速度;v(t)為后車在t時刻的速度;bn-1為前車最大制動加速度;b為后車最大制動加速度;a為后車實時加速度;τ為后車的反應(yīng)時間。
式中:ln-1為前車長度;l為后車長度。
由此計算公式,得到SV與其他3輛車的安全距離為:
式中:xp(tstop)、x(tstop)分別為車輛PV和車輛SV緊急制動時的縱向坐標;xp(t)、x(t)分別為緊急制動開始時車輛PV和車輛SV的縱向位置坐標;vP(t)、v(t)分別為車輛PV和車輛SV的速度;bP、b分別為車輛PV和車輛SV的最大減速度;τ為車輛的反應(yīng)時間;xl(t)為車輛LV的縱向位置坐標;vl(t)為車輛LV的速度;bl為車輛LV的最大減速度;ll為車輛LV的車身長度;lf為車輛FV的車身長度;xf(t)為車輛FV的縱向位置坐標;vf(t)為車輛FV的速度;bf為車輛FV的最大減速度。
車輛換道的安全性與車輛速度也有關(guān),本文根據(jù)改進的Gipps安全模型計算車輛的安全速度。由式(37)的最小安全間隙gapn-1safe,推算出車輛n的安全速度范圍。車輛n受到車輛n-1影響的最大安全速度vn-1n(t)為:
本模型使用的是美國聯(lián)邦高速公路公布的NGSIM (Next Generation Simulation)數(shù)據(jù)[19]。NGSIM數(shù)據(jù)依據(jù)其真實性、高可靠性和高精度的特點,廣泛用于自動駕駛的各類應(yīng)用和交通研究領(lǐng)域,是目前行業(yè)內(nèi)較為權(quán)威的車輛行駛數(shù)據(jù)。NGSIM數(shù)據(jù)是使用攝像頭來搜集的交通信息,其中包括車輛的位置、速度、車型、車道等,時間的分辨率為0.1 s。數(shù)據(jù)采集選用的兩段高速公路路段如圖5所示。
圖5 NGSIM數(shù)據(jù)收集場景圖
根據(jù)Kolmogorov[20]定理,本文構(gòu)建的網(wǎng)絡(luò)為3層神經(jīng)網(wǎng)絡(luò),包括一個輸入層、一個隱藏層以及一個輸出層,隱藏層節(jié)點個數(shù)l是根據(jù)輸出層節(jié)點個數(shù)決定的,通過經(jīng)驗公式確定l的值,其中經(jīng)驗公式為:
式中:n為輸入層神經(jīng)元的數(shù)量;m為輸出層神經(jīng)元的數(shù)量。
本文在以上定理的基礎(chǔ)上,擬用典型的非線性函數(shù)—對數(shù)函數(shù)對神經(jīng)網(wǎng)絡(luò)進行參數(shù)調(diào)優(yōu),對在以e為底x的對數(shù)函數(shù),將嵌入神經(jīng)網(wǎng)絡(luò)前后擬合的結(jié)果進行對比。本次試驗使用的傳統(tǒng)BP神經(jīng)網(wǎng)絡(luò)的參數(shù)是3層神經(jīng)網(wǎng)絡(luò),其中輸入神經(jīng)元和輸出神經(jīng)元數(shù)量都是1,隱層神經(jīng)元設(shè)置為90個,而本模型提出的神經(jīng)網(wǎng)絡(luò)第一級的參數(shù)和傳統(tǒng)BP神經(jīng)網(wǎng)絡(luò)完全相同,第2級神經(jīng)網(wǎng)絡(luò)選擇了一個已經(jīng)對目標函數(shù)訓(xùn)練好了之后的4層神經(jīng)網(wǎng)絡(luò),其中輸入層和輸出層神經(jīng)元均為1個,兩個隱層神經(jīng)元均設(shè)置成90個。圖6是傳統(tǒng)BP神經(jīng)網(wǎng)絡(luò)和本文提出的神經(jīng)網(wǎng)絡(luò)對log(x)的學(xué)習(xí)結(jié)果,可以看出,在訓(xùn)練次數(shù)明顯較少的情況下,嵌入神經(jīng)網(wǎng)絡(luò)后在精度方面明顯優(yōu)于傳統(tǒng)神經(jīng)網(wǎng)絡(luò)。
圖6 非線性數(shù)據(jù)擬合結(jié)果
神經(jīng)網(wǎng)絡(luò)參數(shù)調(diào)整好后,對基于耦合深度學(xué)習(xí)-運動學(xué)的自動駕駛一體化換道模型進行訓(xùn)練和測試,本節(jié)共選用了100輛車的換道數(shù)據(jù),其中70組數(shù)據(jù)作為訓(xùn)練集,剩余30組數(shù)據(jù)作為驗證數(shù)據(jù)集。如圖7所示,圖中藍色曲線表示本模型訓(xùn)練誤差隨著訓(xùn)練次數(shù)增加而變化的趨勢,可知訓(xùn)練誤差隨著訓(xùn)練次數(shù)快速下降,訓(xùn)練超過20次時,損失值穩(wěn)定并且趨于收斂??紤]時間成本和梯度下降所需的時間,將搭建的神經(jīng)網(wǎng)絡(luò)訓(xùn)練次數(shù)設(shè)置為25次。
圖7 誤差隨訓(xùn)練次數(shù)的變化
圖8為本模型預(yù)測的自動駕駛換道軌跡規(guī)劃曲線,其中黃色曲線為原始軌跡曲線,藍色曲線為本模型訓(xùn)練之后得到的學(xué)習(xí)結(jié)果。從圖中細節(jié)可知,相較于車輛啟動換道階段,利用本模型可以更快地啟動換道,其原因主要是機器決策所需的反應(yīng)時間比人類決策所需時間縮短了;在換道過程中間階段,車輛穩(wěn)定地發(fā)生橫向和縱向位移,總趨勢同人類換道一致;在換道結(jié)束階段,本模型更早地完成了換道,其原因也是在保證與后車安全性的前提下,及早完成換道,增大與前車的距離。由此可證明本模型可以規(guī)劃出平滑的軌跡曲線,且由于縮短了反應(yīng)時間和人為差異等因素,使換道過程變得更可控、更高效。
圖8 車輛成功換道場景仿真
為了直觀地體現(xiàn)訓(xùn)練數(shù)據(jù)和原始數(shù)據(jù)的區(qū)別,本節(jié)摘抄部分名義值和預(yù)測值數(shù)據(jù),如圖9和表1~3所示。
圖9 NGSIM原始數(shù)據(jù)
表1 32號車橫向位移對比表
表2 32號車縱向位移對比表
表3 32號車速度對比表
本節(jié)使用了70組換道數(shù)據(jù)進行訓(xùn)練和驗證,擬用平均絕對誤差(Mean Absolute Error,MAE)以及平均絕對相對誤差(Root Mean Squared Error,MARE)這兩個統(tǒng)計學(xué)中常用的統(tǒng)計量對模型進行誤差統(tǒng)計。
式中:N為測試數(shù)據(jù)樣本數(shù);dr,i為第i輛車的名義值;ds,i為第i輛車的預(yù)測值。
針對實際情況,做如下定義:MAEreal和MAREreal分別表示預(yù)測值與名義值的平均絕對誤差和平均絕對相對誤差,這兩個統(tǒng)計量可以表征實際值和預(yù)測值的誤差。
本節(jié)對基于嵌入神經(jīng)網(wǎng)絡(luò)訓(xùn)練之后的一萬余條預(yù)測數(shù)據(jù)和原始數(shù)據(jù)進行比較,結(jié)果見表4。
表4 誤差對比表
CarSim是用于車輛動力學(xué)的專用仿真軟件,該軟件可以對駕駛員、路面條件以及空氣動力等方面進行仿真輸入,對車輛制動性、穩(wěn)定性參數(shù)等進行輸出。CarSim可以方便靈活地定義試驗環(huán)境和試驗過程[21]。
將提出的深度學(xué)習(xí)模型輸出的車輛軌跡數(shù)據(jù)作為CarSim輸入,擬用該軟件對模型軌跡進行可跟蹤性、平穩(wěn)性等參數(shù)的評估。
本節(jié)對訓(xùn)練的70組車輛換道軌跡隨機選擇一組輸入到CarSim仿真軟件中進行動力學(xué)仿真,圖10為車輛SV在成功換道場景下本模型預(yù)測模型的仿真結(jié)果。圖10a為車輛SV在成功換道場景下,本模型輸出軌跡的仿真結(jié)果,其中藍色曲線為本模型輸出的軌跡,亦即目標軌跡,紅色軌跡是CarSim仿真條件下的跟蹤軌跡,從圖中可知,本模型輸出的軌跡在動力學(xué)仿真中變化平穩(wěn),可以和目標軌跡保持較小誤差的條件下被跟蹤。圖10b為車輛SV在成功換道場景下,本模型輸出速度的仿真結(jié)果,其中藍色曲線為本模型輸出的速度,即目標跟蹤速度,紅色曲線是CarSim仿真條件下的跟蹤速度,由圖可知,本模型輸出的速度在動力學(xué)仿真中在駐點以及拐點處同目標速度有一定差異,但是同樣較為平滑,在可接受的范圍內(nèi)。圖10c為換道過程中車輛前輪轉(zhuǎn)向角隨時間變化情況,紅色曲線代表了車輛的右前輪轉(zhuǎn)向角變化情況,藍色曲線代表了車輛的左前輪轉(zhuǎn)向角變化情況,車輛在換道準備階段前輪轉(zhuǎn)向角為0,在換道執(zhí)行階段,車輛前輪由0逐漸增大到最大值后,逐漸減小至0,然后向相反方向行駛至較大值后減小至0。此外,車輛左前輪與右前輪的轉(zhuǎn)向角存在差異,與車輛真實換道情況相符合。圖10d顯示了車輛輪胎的側(cè)向滑移角,4個車輪的變化保持一致,變化的數(shù)值較小。
圖10 車輛成功換道場景各參數(shù)圖像
為了對比曲線的平滑程度,本節(jié)將原始數(shù)據(jù)中的加速度值和神經(jīng)網(wǎng)絡(luò)預(yù)測結(jié)果進行對比,可見,本模型預(yù)測加速度較真實平均值結(jié)果較小,結(jié)果見表5。
表5 加速度對比表
本文提出的自動駕駛領(lǐng)域提出一種耦合深度學(xué)習(xí)-運動學(xué)的自動駕駛一體化換道算法,建立了嵌入神經(jīng)網(wǎng)絡(luò)模型,并綜合考慮了目前主流換道模型的不足,從而引入基于規(guī)則的訓(xùn)練模型,對于有限數(shù)據(jù)下神經(jīng)網(wǎng)絡(luò)如何能適應(yīng)和學(xué)習(xí)到更多駕駛技巧的問題提出了解決思路。得到以下主要結(jié)論:
(1)利用本模型可以規(guī)劃出一條合適的自動駕駛車輛換道軌跡,且能保證換道車輛能夠更安全、更舒適地完成換道。
(2)仿真發(fā)現(xiàn),構(gòu)建的換道軌跡規(guī)劃模型可以用于自動駕駛車輛換道的場景。車輛可以在有限的數(shù)據(jù)量條件下對新的交通場景做出合理的反應(yīng)。
(3)CarSim的仿真顯示,本章節(jié)提出的模型所規(guī)劃出的換道的軌跡和速度能夠被自動駕駛車輛跟蹤,車輛行駛穩(wěn)定性良好。