石蕊 張輝 王霽宇 端帥
摘要 隨著信息技術(shù)及汽車產(chǎn)業(yè)的快速融合,促進了自動駕駛技術(shù)迅猛發(fā)展。目前,許多主流車企陸續(xù)加快L3及以上自動駕駛功能產(chǎn)品的研發(fā)及試驗進程。而多數(shù)L3及以上級別智能汽車的設(shè)計運行范圍中會聲明其具備自主超車及變道功能,因此對L3以上級別的換道行為進行研究、提升自動駕駛功能下?lián)Q道安全性就顯得十分重要。研究通過解析影響高速公路環(huán)境下自動駕駛車輛主動換道決策的多重信息,之后具體解析直接對換道行為產(chǎn)生影響的車輛間的博弈交互機理,建立了基于博弈論的自動駕駛車高速公路換道行為的決策機制,將為自動駕駛車換道行為仿真以及后續(xù)的自動駕駛換道行為評價提供支撐。
關(guān)鍵詞 換道決策;博弈論;高速公路;自動駕駛;主動換道
中圖分類號 U463.6文獻標(biāo)識碼 A文章編號 2096-8949(2022)04-0004-04
0 引言
近年來,我國鼓勵推動汽車網(wǎng)聯(lián)化、智能化與電動化協(xié)同發(fā)展,智能汽車呈現(xiàn)強勁發(fā)展勢頭。隨著關(guān)鍵技術(shù)的不斷突破,車載激光雷達等真值設(shè)備達到國際先進水平,L2級別乘用車新車市場滲透率達到20%。截止2021年9月,我國已有3 500多千米的道路實現(xiàn)智能化升級,搭載聯(lián)網(wǎng)終端車輛超過500萬輛[1]。
然而自動駕駛車的普及率及技術(shù)成熟度逐步提升的同時也給交通管理帶來了新的挑戰(zhàn),尤其是在未來混行環(huán)境下給交通安全帶來的挑戰(zhàn)。跟馳及換道作為車輛在路上行駛的兩種基本形態(tài),L3及以上級別的智能汽車能夠自動化地完成這兩個形態(tài)。相比于跟馳狀態(tài),換道行為涉及與本車道及目標(biāo)車道車輛的復(fù)雜交互。智能汽車相較于完全手動駕駛汽車具有感知時間更短、感知范圍更廣的優(yōu)勢,可以進行交互的信息也有不同,因此不能用傳統(tǒng)的換道理論來解釋自動駕駛車的換道行為。
換道行為的自動化作為自動駕駛車輛行駛過程的關(guān)鍵環(huán)節(jié),對于指導(dǎo)自動駕駛車輛的安全高效行駛有著重要意義。當(dāng)前對于自動駕駛車輛在高速公路上的換道研究尚處于起步階段,相關(guān)的現(xiàn)有研究和基礎(chǔ)理論尚不夠完善,且研究中所述換道情境及驗證中應(yīng)用的場景與實際的高速公路通行環(huán)境存在一定程度的差別。
當(dāng)前研究通常將換道全過程拆解為產(chǎn)生換道意圖、換道決策和換道執(zhí)行三個階段。最原始的換道決策模型是由Gipps提出的Gipps 換道模型[2]。Motohiro[3]等以換道車輛與周圍車輛的速度差、間隙等為參數(shù),建立神經(jīng)網(wǎng)絡(luò)模型,利用大規(guī)模的軌跡數(shù)據(jù)進行標(biāo)定,用于預(yù)測車輛的換道決策。Wang[4]等以駕駛安全性、舒適性和效率為多重目標(biāo),考慮了不同駕駛決策對周圍車輛加速度的影響,從而對駕駛決策機制進行優(yōu)化。近幾年來,國內(nèi)外學(xué)者開始嘗試基于博弈論思想解析車輛的換道行為。Kita[5]提出將博弈論中信息交互博弈的思想策略帶入換道決策中。Talebpour[6]提出混流環(huán)境下的換道行為是非合作博弈行為,并基于此建立換道模型。Be11[7]應(yīng)用博弈論理論對考慮高速公路交通流來研究車輛換道對交通流運行的影響程度。
根據(jù)上述研究,可以看出博弈論為含有多重信息且具備競爭傾向的問題提供了解決方法和分析手段,適用于該研究期望的高速公路自動駕駛車主動換道的場景。因此,研究對高速通行環(huán)境下影響自動駕駛車換道的多重交互信息進行分析,界定博弈類型建立換道決策機制并通過實際通行數(shù)據(jù)完成驗證。
1 基于博弈論的自動駕駛車輛換道策略機制建立
傳統(tǒng)交通流理論中根據(jù)車輛換道的動機將車輛的換道行為劃分為自由換道和強制換道。該文主要研究自動駕駛車的主觀自動換道行為,場景如圖1所示,Lane1上行駛的AV車產(chǎn)生換道至目標(biāo)車道Lane2的意圖,假定AV車為可以自動完成主動換道全過程的L3級別自動駕駛車輛,Lane1的前車RV1及Lane 2的后車RV2均為完全人工駕駛的非網(wǎng)聯(lián)車輛。車輛AV做出從Lane1換道Lane2的決策過程可以視為其與其他車輛交互博弈的過程。AV為了尋求更大的行駛空間產(chǎn)生了換道意圖,而周圍受到影響的其他車輛需考慮自身所處的環(huán)境決定是否進行讓行,周圍車輛采取的策略的不同都會影響AV最終的決策結(jié)果。該文主要研究有換道意圖的自動駕駛車AV與目標(biāo)車道后車RV2間的博弈,下面將確定兩者間的博弈類型及作用機理。
1.1 博弈類型界定及博弈機理解析
每一個博弈的主要構(gòu)成要素包括參與者、每個參與者所采取的策略以及參與者采取相應(yīng)的策略所帶來的收益函數(shù)。根據(jù)博弈雙方的期望收益,通??梢詫⒉┺膭澐譃楹献鞑┺呐c非合作博弈。非合作博弈下根據(jù)參與者行動順序的可見性和參與者信息的完整性又可分為完全信息動態(tài)博弈、完全信息靜態(tài)博弈、不完全信息動態(tài)博弈和不完全信息靜態(tài)博弈四種類型。
上述兩車在博弈過程中知曉對方的坐標(biāo)、所處車道等信息,為完全信息博弈,區(qū)別在于AV作為配備真值測試設(shè)備的自動駕駛車在感應(yīng)時間、感應(yīng)范圍上具備一定優(yōu)勢;研究假定兩車同時采取是否換道/是否讓行的決策,因此為靜態(tài)博弈;在博弈中,兩車的預(yù)期目標(biāo)均為自身的收益達到最佳,因此為非合作博弈。故AV與RV2間的博弈類別界定為完全信息下的非合作靜態(tài)博弈。這個博弈對應(yīng)的基本要素為[8]:
(1)參與者:為AV和RV2;
(2)決策:可供AV選擇的決策有換道/原車道繼續(xù)行駛,可供RV2選擇的決策有減速讓行/加速阻止;
(3)收益函數(shù):兩車不論采取何種決策都會產(chǎn)生一定的收益,將建立兩車的收益函數(shù)對收益程度進行量化表達。
1.2 換道決策機制建立
依據(jù)上述博弈要素分析,可以得到兩車博弈的收益矩陣,如表1所示。其中m1、m2為AV采取的換道、不換道策略,u1為AV的收益函數(shù);n1、n2為RV2采取的讓行、不讓行策略,u2為RV2的收益函數(shù)。
假定此非合作博弈存在策略(mi,ni),滿足納什均衡,即使式(1)成立:
而策略(mi,ni)也將作為該研究對博弈換道的預(yù)測策略。
1.2.1 收益函數(shù)確定
在進行換道過程的收益評估時,學(xué)者們通常從安全(距離)收益[9]或速度收益(時間)的維度[10]來建立效益函數(shù)。研究將結(jié)合兩個維度建立收益函數(shù),AV及RV2采取何種策略所得到的收益計算方式如下:
式中:-AV未決策前的最優(yōu)行駛速度;
-AV采取決策后的穩(wěn)定跟車速度;
-AV采取決策后穩(wěn)定跟車的距離;
-RV2未決策前的最優(yōu)行駛速度;
-RV2采取決策后的穩(wěn)定跟車速度;
-RV2采取決策后穩(wěn)定跟車的距離。
1.2.2 換道決策機制
根據(jù)式(2)提出的博弈收益函數(shù),從AV視角進行博弈決策機制,換道決策流程為:換道意圖產(chǎn)生—信息收集整合—博弈分析—收益計算—執(zhí)行決策(換道、不換道)。
2 實際數(shù)據(jù)驗證
為驗證機制的有效性,選擇使用自動駕駛車進行高速公路測試時的數(shù)據(jù)進行決策預(yù)測。試驗車是蔚來ES6,在高速公路上可以完成自動變道。
該車配備了由GPS定位、慣性測量單元、激光雷達等組成的測試系統(tǒng),能夠準(zhǔn)確識別車輛周圍的車道信息、車輛等目標(biāo)物,計算之間的距離、速度和位置,并在數(shù)采內(nèi),實現(xiàn)數(shù)據(jù)分析與評價。此次道路測試選定的測試路線為天津市某段繞城高速公路,總長248.8 km。于每天不同時間段對此路線進行測試采集。
提取測試過程中發(fā)生的自由變道成功及失敗場景,并對數(shù)據(jù)進行清洗,獲得72個主動換道成功場景、31個失敗場景,本驗證將對這些場景進行換道拆解,根據(jù)換道決策前的跟車間隙、周邊車速、車流密度等信息進行綜合收益評估,對其是否換道展開預(yù)測。后續(xù)將預(yù)測后結(jié)果與實際場景比對計算準(zhǔn)確率。
2.1 自動換道成功場景驗證
提取測試過程中的換道場景,在換道意圖產(chǎn)生后根據(jù)試驗車采集的自車與周邊數(shù)據(jù)進行換道決策預(yù)測,如圖2所示,試驗車根據(jù)環(huán)境,產(chǎn)生換道意圖,此時對試驗車及目標(biāo)車道后車進行收益計算,表2為試驗車與目標(biāo)后車的博弈收益矩陣。
納什均衡后,不論RV2是否讓行,AV的最佳策略都是換道,但該次的最佳策略是RV2讓行,AV換道,這也與實際情況相符。依次測算所有換道成功場景,準(zhǔn)確率達90.2%。
2.2 自動換道失敗場景驗證
提取的自動換道失敗場景是指試驗車在自動駕駛功能開啟的工況下進行換道,但由于自車或周圍的因素請求人工接管,由安全員決定是否繼續(xù)換道,如圖3樣例所示,計算試驗車及目標(biāo)車道后車的收益函數(shù)值,如表3所示。
納什均衡后,該次博弈的最佳策略是RV2不讓行,AV換道。實際情況是AV在選擇換道后,RV2采取加速策略,AV自動駕駛功能退出,人工接管換道,與預(yù)測決策相符。依次測算所有提取的有效場景,預(yù)測準(zhǔn)確率為82.7%。
2.3 驗證結(jié)果分析
研究采用實際自動駕駛數(shù)據(jù)分析了自動換道執(zhí)行成功和失敗兩種工況下的共103個場景進行換道決策預(yù)測。結(jié)果顯示該研究的換道決策機制具備一定程度的可靠性,尤其在成功工況下準(zhǔn)確率較高。
相較于成功工況,自動換道失敗工況預(yù)測準(zhǔn)確率較低,經(jīng)場景回放分析,自動換道失敗原因大部分是由于試驗車沒有充分考慮目標(biāo)車道后車加速的可能性,在后車突然加速后退出了自動駕駛功能,存在決策失誤的可能,也體現(xiàn)了博弈思想在車輛策略決策方面具有一定的積極意義。
3 結(jié)語
該文應(yīng)用博弈論理論從安全及效率維度建立了換道決策機制,通過實際數(shù)據(jù)進行高速自動駕駛換道決策預(yù)測,準(zhǔn)確率證明了機制的有效性,也體現(xiàn)了博弈思想對于自動駕駛汽車決策的積極意義。
參考文獻
[1]北京日報. 全國新能源車保有量超600萬輛!網(wǎng)聯(lián)汽車測試里程突破500萬公里[EB/OL] . (2021-9-25). https://baijiahao.baidu.com/s?id=1711869964531068507&wfr=spider&for=pc.
[2]Gipps P G. A Model for the Structure of Lane-Changing Decision[J]. Transportation Research Part B Methodological, ?1986(5): 403-414.?
[3]Motohiro, Fujita, Koji, et al. Predicting driver's lane-changing decisions using a neural network model. Simulation Modelling Practice & Theory International Journal of the Federation of European Simulation Societies, 2014.
[4]Wang D, Hu M, Wang Y. Model predictive control-based cooperative lane change strategy for improving traffic flow[J]. Advances in Mechanical Engineering, 2016(2): 1-17.
[5]Kita H. A merging–giveway interaction model of cars in a merging section: ?a game theoretic analysis[J]. Transportation Research, Part A (Policy and Practice), 1999(3-4): 305-312.
[6]Talebpour A, Mahmassani H S, Hamdar S H. Modeling lane-changing behavior in a connected environment: A game theory approach[J]. transportation research procedia, 2015(59): 216-232.
[7]Bell M. A game theory approach to measuring the performance reliability of transport networks[J]. Transportation Research Part B, 2000(6): ?533-545.
[8]Mckelvey R, Mclennan A, Turocy T, et al. Gambit: ?Software Tools for Game Theory[J]. Modern Healthcare, 2005(5).
[9] 薛春銘. 基于博弈的車輛協(xié)作換道策略研究[D]. 大連:大連理工大學(xué), 2017.
[10]楊曉芳, 張盛, 付強. ?基于博弈論的完全信息下的駕駛行為研究[J]. 公路交通科技, 2015(7): 105-111.