劉 志
(蘇交科集團(tuán)股份有限公司 南京 210017)
近年來無人駕駛系統(tǒng)在乘用車上已得到初步應(yīng)用,但在客運(yùn)公交車上的應(yīng)用較少?,F(xiàn)有研究多針對(duì)單車智能相關(guān)控制技術(shù)展開,未能綜合應(yīng)用車路協(xié)同環(huán)境,缺乏對(duì)車路協(xié)同條件下綜合交通信息的利用,對(duì)多路口、多交通約束條件的考慮不足;此外,所設(shè)計(jì)的控制方法難以直接移植到公交車上。因此,完成智慧公交自動(dòng)駕駛及車路協(xié)同的目標(biāo)還需要更加深化的研究。本文從風(fēng)險(xiǎn)感知、駕駛決策、速度優(yōu)化、公交編隊(duì)的角度出發(fā),對(duì)智慧公交車輛進(jìn)行深入研究,以期實(shí)現(xiàn)安全、節(jié)能、高效的智慧公交自動(dòng)駕駛與編隊(duì)控制系統(tǒng),開展車路協(xié)同自動(dòng)駕駛智慧公交技術(shù)實(shí)踐探索,可促進(jìn)自動(dòng)駕駛技術(shù)在城市公交運(yùn)營場(chǎng)景下的快速落地,為城市交通出行提供便捷、安全、高效的出行服務(wù)。
在公共路權(quán)的復(fù)雜交通環(huán)境下,為實(shí)現(xiàn)公交系統(tǒng)風(fēng)險(xiǎn)識(shí)別,建立智慧公交潛在風(fēng)險(xiǎn)的辨識(shí)提取模型,設(shè)計(jì)智慧公交風(fēng)險(xiǎn)辨識(shí)及預(yù)警子系統(tǒng)。該子系統(tǒng)可實(shí)現(xiàn):①利用深度學(xué)習(xí)算法實(shí)現(xiàn)多源信息(包括車載傳感器信息如,攝像頭、GPS、雷達(dá)等,V2X數(shù)據(jù)信息如,天氣信息、道路狀況、人流量等)的深度融合;②建立行人-車輛多智能體的狀態(tài)空間動(dòng)力學(xué)模型,采用長短期記憶遞歸神經(jīng)網(wǎng)絡(luò)與高階容積卡爾曼濾波結(jié)合實(shí)現(xiàn)對(duì)行人-車輛運(yùn)動(dòng)狀態(tài)的精準(zhǔn)估計(jì),基于貝葉斯網(wǎng)絡(luò)實(shí)現(xiàn)智慧公交潛在風(fēng)險(xiǎn)分類機(jī)制。系統(tǒng)的行人-車輛群集運(yùn)動(dòng)狀態(tài)感知與風(fēng)險(xiǎn)辨識(shí)的技術(shù)路線見圖1。
圖1 行人-車輛群集運(yùn)動(dòng)狀態(tài)感知與風(fēng)險(xiǎn)辨識(shí)技術(shù)路線
為全方位準(zhǔn)確感知智慧公交周圍環(huán)境,考慮車載傳感器提取周圍信息的不完備性,結(jié)合V2X獲取的行人、車輛等道路全局信息,采用分層深度融合算法,將傳統(tǒng)的依賴高成本多傳感器的感知方法轉(zhuǎn)變?yōu)橐蕾嚫哧P(guān)聯(lián)多源信息。采用超像素分割和立體光流法實(shí)時(shí)構(gòu)建行人-車輛的三維形態(tài)與動(dòng)態(tài)特征,提出一種基于Mask R-CNN與多源信息特征融合的深度學(xué)習(xí)模型,構(gòu)建多層卷積層對(duì)車載傳感器信息進(jìn)行特征提取,并構(gòu)建1×1的卷積網(wǎng)絡(luò)用于對(duì)車載傳感器和V2X信息的特征融合,實(shí)現(xiàn)復(fù)雜城市環(huán)境下的多源信息融合。
為精確估計(jì)行人-車輛多智能體的狀態(tài)信息,考慮行人-車輛系統(tǒng)的非線性、不確定性和時(shí)滯性等特性,分析系統(tǒng)在時(shí)間維度上的時(shí)空關(guān)聯(lián)性,利用LSTM的數(shù)據(jù)記憶特征,本文提出長短期記憶遞歸神經(jīng)網(wǎng)絡(luò)與高階容積卡爾曼濾波結(jié)合的運(yùn)動(dòng)狀態(tài)估計(jì)方法,將多源融合信息輸入到深度長短期記憶神經(jīng)網(wǎng)絡(luò),建立行人-車輛非線性系統(tǒng)狀態(tài)空間動(dòng)力學(xué)模型。使用高階容積卡爾曼濾波對(duì)神經(jīng)網(wǎng)絡(luò)的輸出和系統(tǒng)的狀態(tài)變量進(jìn)行實(shí)時(shí)更新,實(shí)現(xiàn)對(duì)行人-車輛多智能體非線性系統(tǒng)模型的真實(shí)逼近,以及對(duì)運(yùn)動(dòng)狀態(tài)值的精確估計(jì)。
針對(duì)智慧公交在公共路權(quán)環(huán)境下的安全運(yùn)行問題,借助融合的多源信息[1],考慮環(huán)境感知與狀態(tài)估計(jì)之間的互聯(lián)關(guān)系,建立智慧公交運(yùn)行潛在風(fēng)險(xiǎn)的辨識(shí)提取模型,提出基于貝葉斯網(wǎng)絡(luò)的智慧公交運(yùn)行潛在風(fēng)險(xiǎn)分類推理機(jī)制,結(jié)合時(shí)空配準(zhǔn)法,設(shè)計(jì)智慧公交的風(fēng)險(xiǎn)辨識(shí)及預(yù)警系統(tǒng),實(shí)時(shí)預(yù)測(cè)智慧公交多維風(fēng)險(xiǎn)態(tài)勢(shì)。
智慧公交安全駕駛決策系統(tǒng),借助單車智能感知與車路協(xié)同技術(shù)獲取動(dòng)態(tài)交通環(huán)境中的行人、車輛異構(gòu)多智能體信息,揭示智慧公交與動(dòng)態(tài)或靜態(tài)障礙物沖突消解機(jī)制,采用強(qiáng)化學(xué)習(xí)方法設(shè)計(jì)多智能體協(xié)同避撞駕駛決策算法,以及人工勢(shì)場(chǎng)法設(shè)計(jì)面向動(dòng)態(tài)交通環(huán)境場(chǎng)景的局部路徑快速規(guī)劃方法,基于強(qiáng)魯棒模型預(yù)測(cè)控制設(shè)計(jì)城區(qū)不確定環(huán)境下智慧公交路徑跟蹤控制器。智慧公交自適應(yīng)路徑規(guī)劃及駕駛決策系統(tǒng)研發(fā)技術(shù)路線見圖2。
圖2 智慧公交自適應(yīng)路徑規(guī)劃及駕駛決策系統(tǒng)技術(shù)路線
根據(jù)統(tǒng)計(jì)分析交通數(shù)據(jù)顯示,大部分的交通事故均是由于車輛避障不及時(shí),車輛碰撞導(dǎo)致的,城市交通環(huán)境中的障礙物主要有行人、車輛等,由于分析行人、駕駛員行為需要考慮心理學(xué)、交通環(huán)境、自我控制能力等[2]。因此,基于強(qiáng)化學(xué)習(xí)的多智能體協(xié)同避撞駕駛決策見圖3。
圖3 基于強(qiáng)化學(xué)習(xí)的多智能體協(xié)同避撞駕駛決策
根據(jù)多智能體一致性控制理論將行人-車輛看作是具有高度智慧與行為能力的智能體,研究異構(gòu)多智能體避撞行為心理與行為機(jī)理,基于計(jì)劃行為理論并采用統(tǒng)計(jì)方法量化環(huán)境因素對(duì)車輛避障行為的影響,構(gòu)建基于強(qiáng)化學(xué)習(xí)的智慧公交駕駛決策模型,使用局部馬爾可夫決策及分布式馬爾可夫決策聯(lián)合優(yōu)化決策的方法使得強(qiáng)化學(xué)習(xí)回報(bào)函數(shù)最大化,分析得出智慧公交避障駕駛決策的最優(yōu)結(jié)構(gòu)路徑圖。
智慧公交在做避障決策時(shí),還要實(shí)時(shí)做出合理高效節(jié)能的局部路徑規(guī)劃??紤]到局部路徑規(guī)劃的實(shí)時(shí)性及車載處理器的計(jì)算能力,本項(xiàng)目基于車載傳感器獲取的局部環(huán)境信息及V2X通信得到全局環(huán)境信息,再對(duì)多源信息進(jìn)行深度融合,提出一種基于人工勢(shì)場(chǎng)的局部路徑規(guī)劃方法,對(duì)智慧公交周圍環(huán)境構(gòu)建包含引力場(chǎng)(車輛向目標(biāo)點(diǎn)運(yùn)動(dòng))和斥力場(chǎng)(車輛能夠避開各種障礙物)的勢(shì)場(chǎng)模型,并對(duì)2種勢(shì)場(chǎng)疊加,規(guī)劃出合理高效的局部路徑,智慧公交由當(dāng)前點(diǎn)逐漸向目標(biāo)點(diǎn)駛?cè)ァ?/p>
智慧公交在得到規(guī)劃路徑后,周圍環(huán)境具有動(dòng)態(tài)變化特性,針對(duì)交通要素、局部期望路徑、周邊實(shí)時(shí)駕駛態(tài)勢(shì)及公交駕駛模式切換的不確定性,本項(xiàng)目基于群集動(dòng)力學(xué)理論設(shè)計(jì)車輛動(dòng)力學(xué)、車聯(lián)網(wǎng)信息交互的強(qiáng)魯棒MPC容錯(cuò)循跡控制策略,使得智慧公交擺脫參數(shù)變化和環(huán)境干擾因子的影響,獲得更快的控制響應(yīng)速度、更高的系統(tǒng)魯棒性和更好的路徑跟蹤性能。
首先,需完成智慧公交縱向動(dòng)力學(xué)建模,主要包括驅(qū)動(dòng)電機(jī)、動(dòng)力電池、液壓制動(dòng)系統(tǒng)等。電機(jī)是動(dòng)力系統(tǒng)核心,驅(qū)動(dòng)時(shí)將電能轉(zhuǎn)化為車輛動(dòng)能,制動(dòng)時(shí)將汽車動(dòng)能轉(zhuǎn)化成電能,基于電機(jī)試驗(yàn)數(shù)據(jù),采用查表法建立包含功率-轉(zhuǎn)矩-效率的驅(qū)動(dòng)電機(jī)模型。動(dòng)力電池模型采用等效電路Rint模型,忽略溫度等對(duì)內(nèi)阻的影響,電池荷電狀態(tài)采用安時(shí)累積法計(jì)算。另外延長電池使用壽命是智慧公交控制的目標(biāo)之一,采用基于實(shí)驗(yàn)數(shù)據(jù)的半經(jīng)驗(yàn)?zāi)P蛠砉烙?jì)電池壽命的衰減情況,利用電池容量損失Qloss表示電池壽命衰減情況。液壓制動(dòng)過程中受油液壓力、摩擦系數(shù)、溫度等影響,所以建立一階慣性環(huán)節(jié)模型,表示液壓制動(dòng)系統(tǒng)延遲特性。
城市道路環(huán)境中智慧公交準(zhǔn)時(shí)高效通行速度優(yōu)化問題需要處理的約束條件較多,如道路附著、交通限速、車輛性能等,上述約束還存在時(shí)變特性。另外需要達(dá)成的優(yōu)化目標(biāo)也較多,如能量最優(yōu)、高效通行、安全行駛等。所以,最優(yōu)運(yùn)動(dòng)速度優(yōu)化屬于復(fù)雜的協(xié)同優(yōu)化問題?;谲囕d傳感器采集的車輛運(yùn)動(dòng)狀態(tài)、V2X獲取的交通和道路環(huán)境信息作為控制參考或約束,并考慮到動(dòng)態(tài)規(guī)劃算法在處理多約束條件和多目標(biāo)優(yōu)化問題方面的優(yōu)勢(shì),以驅(qū)動(dòng)消耗和制動(dòng)回收能量之和Qe為能量優(yōu)化評(píng)價(jià)指標(biāo),以電池容量損失Qloss為電池壽命評(píng)價(jià)指標(biāo),設(shè)計(jì)多約束條件下的,兼顧能耗、電池壽命特性、車輛行駛平順性與通行效率的純電動(dòng)汽車運(yùn)行狀態(tài)下安全節(jié)能最優(yōu)運(yùn)動(dòng)速度多目標(biāo)優(yōu)化方法,采用動(dòng)態(tài)規(guī)劃算法(DP)計(jì)算最優(yōu)的車速軌跡。定義車速、距離和時(shí)間為系統(tǒng)狀態(tài)x={v,d,t},系統(tǒng)控制量定義為驅(qū)動(dòng)/制動(dòng)力u=F將狀態(tài)量偏差(實(shí)際軌跡和參考軌跡之差)Δx、驅(qū)動(dòng)/制動(dòng)力變化量Δu、通行時(shí)間t設(shè)置為軟約束,路面附著系數(shù)、車輛穩(wěn)定性、驅(qū)動(dòng)/制動(dòng)平順性等決定的最大驅(qū)動(dòng)/制動(dòng)力及變化率定義為硬約束,道路限速、電池工作狀態(tài)、電機(jī)工作狀態(tài)等設(shè)置為硬約束。定義的優(yōu)化目標(biāo)函數(shù)為
約束條件為:vmin(k)≤v(k)≤vmax(k)、Fmin(k)≤abs[F(k)]≤Fφ(k)、Fmin(k)≤abs[F(k)]≤Fs(k)、Fmin(k)≤Fd(k)≤Fmax(k)、SOCmin(k)≤SOC(k)≤SOCmax(k)。其中:R、E為能量和電池?fù)p耗權(quán)重因子;vmin和vmax分別為交通限制的最低和最高車速;Fmin為由行駛阻力限制的最小制動(dòng)力/驅(qū)動(dòng)力;Fφ為由道路附著限制產(chǎn)生的最大制動(dòng)力/驅(qū)動(dòng)力;Fd為電動(dòng)汽車驅(qū)動(dòng)力;Fmax為由電機(jī)決定的最大驅(qū)動(dòng)/制動(dòng)力;SOCmin和SOCmax分別電池工作時(shí)最小和最大荷電狀態(tài)約束。
智慧公交在多交叉口處的通行節(jié)能與高效通行問題可轉(zhuǎn)化為單車與多信號(hào)燈協(xié)同優(yōu)化問題。設(shè)計(jì)基于V2X獲取信息、智慧公交模型,多采用Agent智慧公交和信號(hào)燈協(xié)同控制架構(gòu),基于動(dòng)態(tài)博弈算法的車輛-多交通信號(hào)燈協(xié)同控制方法[3],多Agent的智慧公交和信號(hào)燈協(xié)同控制,架構(gòu)見圖4。該系統(tǒng)框架分為外部信息層、決策規(guī)劃層、底層協(xié)調(diào)控制層和執(zhí)行層4個(gè)層級(jí)。依據(jù)網(wǎng)聯(lián)車輛與信號(hào)燈控制特點(diǎn),底層控制層設(shè)計(jì)為網(wǎng)聯(lián)車輛Agent、信號(hào)燈Agent等子系統(tǒng)Agent,利用V2X實(shí)現(xiàn)各Agent主體的信息交互共享。網(wǎng)聯(lián)車輛在道路交叉口行駛時(shí),多Agent框架能夠根據(jù)車輛信息、道路環(huán)境和交通信號(hào)等外部信息,通過上層決策規(guī)劃機(jī)制(智慧公交和信號(hào)燈協(xié)同控制優(yōu)化),提高車輛能量效率和交通效率。動(dòng)態(tài)博弈算法在處理多約束條件、多目標(biāo)優(yōu)化協(xié)調(diào)等方面的優(yōu)勢(shì)顯著,用來協(xié)調(diào)決策滿足控制需求的多路口通行方法。
圖4 多Agent的智慧公交和信號(hào)燈協(xié)同控制架構(gòu)
車路協(xié)同環(huán)境下,異質(zhì)交通要素之間可以通過車-車、車-路及車-云通訊組成多車編隊(duì)系統(tǒng),實(shí)現(xiàn)多車間感知、決策和控制的群智協(xié)同。首先在成員車端搭建車載無線通訊系統(tǒng),將多輛跟馳公交通過物理連接形成智慧公交虛擬編隊(duì);其次擬采用仿真模擬、隊(duì)列微縮平臺(tái)開發(fā)及實(shí)車實(shí)驗(yàn)的方式,建立智慧公交虛擬編隊(duì)的通用型數(shù)學(xué)模型,采用李雅普諾夫-克拉索夫斯基穩(wěn)定理論和魯棒控制研究異質(zhì)隊(duì)列中穩(wěn)定性、魯棒性和可擴(kuò)展性,基于自適應(yīng)動(dòng)態(tài)規(guī)劃和分布式模型預(yù)測(cè)控制,優(yōu)化面向敏捷節(jié)能高效的交叉口異質(zhì)隊(duì)列速度譜,實(shí)現(xiàn)非線性異質(zhì)公交隊(duì)列的分布式協(xié)同優(yōu)化[4],智慧公交虛擬編隊(duì)及群智控制系統(tǒng)研發(fā)技術(shù)路線見圖5。
圖5 智慧公交虛擬編隊(duì)及群智控制系統(tǒng)研發(fā)技術(shù)路線
為了將多輛跟馳公交通過物理連接形成智慧公交虛擬編隊(duì),在每一成員車端搭建車載5G無線通訊系統(tǒng),主要由上位系統(tǒng)、下位系統(tǒng)、傳感系統(tǒng)及無線通訊設(shè)備組成[5]。無線通訊設(shè)備主要負(fù)責(zé)在保證通訊實(shí)時(shí)性和魯棒性的同時(shí),將上位系統(tǒng)提供的感知信息發(fā)送給隊(duì)列中的其他成員車,并接收其他成員車傳遞的狀態(tài)信息。下位系統(tǒng)包括下位控制器和執(zhí)行器,依據(jù)傳來的控制期望實(shí)時(shí)改變行車狀態(tài)。傳感系統(tǒng)主要包括GPS/慣導(dǎo)設(shè)備和自主式傳感器,實(shí)時(shí)感知自車狀態(tài)和周圍環(huán)境信息。
為了實(shí)現(xiàn)隊(duì)列信息拓?fù)浣Y(jié)構(gòu)、隊(duì)列幾何結(jié)構(gòu)對(duì)智慧公交隊(duì)列的影響,首先建立了表征公交隊(duì)列信息交互和動(dòng)力學(xué)特性的分層式協(xié)同控制模型,解析車節(jié)點(diǎn)動(dòng)力學(xué)、隊(duì)列信息拓?fù)浣Y(jié)構(gòu)、隊(duì)列幾何結(jié)構(gòu)耦合機(jī)理。車輛隊(duì)列是由車輛節(jié)點(diǎn)通過信息拓?fù)浣Y(jié)構(gòu)相互連接起來形成的復(fù)雜非線性系統(tǒng),而隊(duì)列的期望幾何結(jié)構(gòu)作為隊(duì)列穩(wěn)定性控制的強(qiáng)約束條件,在系統(tǒng)中起到至關(guān)重要的作用。為此可以將車輛隊(duì)列的信息拓?fù)浣Y(jié)構(gòu)抽象為分層式協(xié)同控制模型的結(jié)構(gòu),采用虛擬編隊(duì)及群智控制系統(tǒng)表示跟隨車輛之間的信息傳遞、鄰接矩陣表示可獲取車輛的狀態(tài)信息、牽引矩陣表述車輛隊(duì)列中跟隨車輛是否能夠獲取領(lǐng)航車輛信息的矩陣,進(jìn)而采用拉普拉斯有向路徑序列集表征多車編隊(duì)行駛軌跡。
為了保證公交隊(duì)列在多時(shí)滯及多干擾下的隊(duì)列穩(wěn)定和內(nèi)穩(wěn)定,基于車輛非線性動(dòng)力學(xué)模型,將車輛的控制分為上、下兩層,下層采用反饋線性化技術(shù)將車輛模型簡化為線性積分器模型,上層控制器基于此線性化車輛模型,采用李雅普諾夫-克拉索夫斯基穩(wěn)定理論和魯棒控制方法,分析多車隊(duì)列系統(tǒng)在多時(shí)滯及多干擾下保持內(nèi)穩(wěn)定的條件判據(jù),設(shè)計(jì)一種弱保守性多車隊(duì)列分布式魯棒控制器;在內(nèi)穩(wěn)定的基礎(chǔ)上,借助多輸入系統(tǒng)H∞范數(shù)(魯棒性控制方法)的幾何含義,提出在多參數(shù)攝動(dòng)及通信時(shí)滯情況下的隊(duì)列穩(wěn)定性條件,進(jìn)而得到控制器魯棒增益的穩(wěn)定性區(qū)域。
針對(duì)車路協(xié)同環(huán)境下智慧公交多交叉口群體通行效率低下的問題,借助多交叉口信號(hào)配時(shí)信息,探究智慧公交隊(duì)列通行速度軌跡與能量消耗的高維耦合互聯(lián)關(guān)系,建立公交隊(duì)列群體通行與能量模型。基于自適應(yīng)動(dòng)態(tài)規(guī)劃和分布式模型預(yù)測(cè)控制,優(yōu)化面向敏捷節(jié)能高效的交叉口隊(duì)列同步起步與高效通行統(tǒng)一速度譜,通過公交隊(duì)列縱、橫耦合動(dòng)力學(xué)模型,將統(tǒng)一速度譜轉(zhuǎn)化為多車隊(duì)列最優(yōu)位置軌線和最優(yōu)車速譜,實(shí)現(xiàn)全局意義上的隊(duì)列閉環(huán)穩(wěn)定性、交通流通行效率和能量消耗率的自平衡最優(yōu)。
車路協(xié)同自動(dòng)駕駛智慧公交系統(tǒng)通過上述4個(gè)子系統(tǒng),在公共路權(quán)環(huán)境下全方位實(shí)施車-車、車-路和人-車動(dòng)態(tài)實(shí)時(shí)信息交互;在全時(shí)空動(dòng)態(tài)交通信息采集與融合的基礎(chǔ)上,實(shí)現(xiàn)智慧公交自動(dòng)駕駛風(fēng)險(xiǎn)感知與編隊(duì)控制系統(tǒng),開展智慧公交安全與高效運(yùn)行控制,充分實(shí)現(xiàn)人車路的有效協(xié)同,實(shí)現(xiàn)自動(dòng)駕駛公交安全、高效和環(huán)保運(yùn)營。本文研究提出的系統(tǒng)方案可提升城市公交系統(tǒng)乘坐體驗(yàn)及行駛安全性,有助于優(yōu)化公交車在復(fù)雜環(huán)境中的適應(yīng)性,提高公交車輛的準(zhǔn)時(shí)到達(dá)率,并最終實(shí)現(xiàn)公共交通安全、效率的大幅提高推動(dòng)我國汽車智能化與網(wǎng)聯(lián)化進(jìn)程。