亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        有人與無人駕駛車輛交叉口駕駛博弈模型

        2019-10-21 08:38:56成英高利陳雪梅趙亞男
        關(guān)鍵詞:沖突點(diǎn)局中人交叉口

        成英, 高利, 陳雪梅, 趙亞男

        (1. 北京理工大學(xué) 機(jī)械與車輛學(xué)院,北京 100081; 2. 天津職業(yè)技術(shù)師范大學(xué) 汽車與交通學(xué)院,天津 300222)

        無信號交叉口的穿越過程是一個(gè)復(fù)雜的交互問題,極易引發(fā)交通事故.本文研究了有人與無人駕駛車輛交叉口的沖突消解問題. 目前無信號交叉口沖突消解算法主要有基于間隙接受模型、基于運(yùn)動學(xué)的矢量圖法和基于資源鎖的沖突表算法等,但是該類模型基本思想是基于交叉口優(yōu)先級建立,然而實(shí)際道路的優(yōu)先級并不清楚,因此模型不適合解決此類實(shí)際問題.

        近年來,有學(xué)者通過行為交互獲取意圖信息開展無人駕駛車輛與其他社會車輛的交互行為研究.熊光明等[1-2]提出一種基于HMM其他車輛駕駛意圖預(yù)測方法,然后通過混合狀態(tài)系統(tǒng)控制智能車輛的運(yùn)動行為,實(shí)現(xiàn)高速公路匝道口車輛匯入交互問題,驗(yàn)證無人駕駛汽車的路口協(xié)作控制. 雖然這類決策模型生成滿足安全需求的行駛軌跡,但是車輛之間通過行為交互獲取意圖信息,然而無人駕駛車輛通過機(jī)器學(xué)習(xí)等方法并不能保證駕駛意圖產(chǎn)生的絕對正確性,只能實(shí)現(xiàn)相對較高的準(zhǔn)確率,所以純粹概率的或證據(jù)的技術(shù)對這類決策并不是充分有效的工具. 對于這類決策任務(wù),博弈論工具能夠?qū)ζ洳淮_定的態(tài)勢演變提供更好的判斷與識別.

        目前,Wang等[3]基于最優(yōu)控制和動態(tài)博弈理論提出了一種將車道變換和車輛跟馳綜合控制的預(yù)測方法. 王曉原等[4]綜合考慮各運(yùn)動實(shí)體特征及其操控者類型,基于混合模糊多人多目標(biāo)非合作博弈方法,建立了駕駛員車道選擇模型. 薛春銘等[5]提出人駕車與無人駕駛車輛的協(xié)同換道模型,從心理學(xué)角度分析了非零和博弈中影響競爭與合作傾向的因素. 然而,使用博弈理論進(jìn)行交叉口有人與無人駕駛車輛協(xié)作駕駛的研究相對較少,本文通過引入博弈論,分析無信號交叉口車輛之間的合作與沖突機(jī)理,建立交叉口駕駛博弈模型來消解沖突.

        1 交叉口沖突判定

        以無信號燈十字交叉口為例,如圖1所示,設(shè)圖中淺色表示有人駕駛車輛(human driver, HD),深色表示無人駕駛車輛IV(intelligent vehicle, IV),通行過程存在車輛軌跡的交匯區(qū)域CABCD,本文研究核心就是實(shí)現(xiàn)無人駕駛車輛交叉口的沖突消解. 為研究方便假設(shè)交叉口通行過程中無行人和非機(jī)動車干擾,車輛間的相互通信V2X通信正常.

        兩車沖突的判斷必須考慮它們在矢量運(yùn)動軌跡上的行駛情況,在車輛HD的車輛坐標(biāo)系中,建立兩車的相對運(yùn)動關(guān)系(圖1). 沖突碰撞時(shí)間tTTC(time to collision)通過兩車間相對距離Ls與相對速度在Ls上的投影vL計(jì)算得到[6].

        圖1 交叉口車輛軌跡交匯區(qū)域Fig.1 Area of vehicle tracks overlapping at the intersection

        tTTC=Ls/vL.

        (1)

        其中相對距離為Ls和相對速度vL計(jì)算表達(dá)式為

        (2)

        系統(tǒng)通過車載設(shè)備實(shí)時(shí)且連續(xù)接收車輛狀態(tài)信息,實(shí)時(shí)計(jì)算車輛發(fā)生碰撞需要的時(shí)間tTTC與安全防撞時(shí)間閾值tth進(jìn)行比較. 當(dāng)tTTC>tth,表示不存在沖突則不需要博弈,正常行駛通過交叉口. 當(dāng)tTTC≤tth,表示存在沖突,即博弈開始,雙方根據(jù)對方的策略不斷地變換自己的對抗策略,實(shí)現(xiàn)博弈均衡,達(dá)到系統(tǒng)的最優(yōu)目的.

        2 交叉口博弈駕駛模型

        2.1 定義局中人及其策略

        人類駕駛員面對交叉口沖突時(shí),決策受到對方?jīng)Q策的影響,二者之間形成競爭關(guān)系,是一個(gè)典型的二人博弈. 車聯(lián)網(wǎng)環(huán)境下車輛間的相互通信,使得每一個(gè)車輛對其它車輛的特征(策略空間、效用函數(shù)等)有完全的了解,這決定了有人與無人駕駛車輛的協(xié)調(diào)過程是基于完全信息的博弈過程[7]. 博弈行為包括4個(gè)基本要素[3-5]:

        ① 局中人Ci指博弈的決策主體,局中人的集合為

        C:C={C1,C2,Ci…Cn},

        其中Ci為局中人i,博弈雙方設(shè)為有人駕駛車輛HD、無人駕駛車輛IV.

        ② 局中人的策略集合為

        S:S={S1,S2,Si…Sn},

        其中策略是指局中人在給定信息集情況下的行為規(guī)則. 局中人的策略形式化為

        Si:Ci→ai,i=1,2,…,n,

        其中ai為局中人Ci采取的行動.

        ③ 收益Ui是指決策主體在特定的策略組合下得到的期望效益水平. 該效用不僅與自身的策略有關(guān),還與其他局中人的策略有關(guān),因此局中人Ci的效用表示為Ui(s1,s2,…,sn),其中si是主體i策略,即si∈Si.

        (3)

        2.2 收益函數(shù)的確定

        由于駕駛收益不僅與車輛所處態(tài)勢有關(guān),還與車輛間沖突程度有關(guān). 因此本文用行車安全收益、行車效率收益和行車舒適性收益來體現(xiàn)決策主體的駕駛收益函數(shù).

        2.2.1行車安全收益

        安全因素主要指會導(dǎo)致兩車沖突嚴(yán)重性增加的因素. 用兩車到達(dá)沖突點(diǎn)的時(shí)間差Δt表示,Δt越小,駕駛收益越小,反之駕駛收益越大. 同時(shí)考慮人類駕駛員個(gè)體決策偏好對駕駛策略選擇的影響,顯然駕駛員策略和λ(β1,β2)有關(guān),設(shè)不同類型駕駛員之間存在相對的勢為λ(β1,β2),因此安全效用函數(shù)設(shè)定為

        Usafe(s1,s2)=-λ(β1,β2)exp(-Δti(t))Li(t)/L,

        (4)

        式中:vi(t),ai(t)分別為兩車t時(shí)刻的速度、加速度;Li(t)為兩車到?jīng)_突點(diǎn)的距離;L為車輛間相互產(chǎn)生影響的最長距離范圍;Δti(t)=|t1-t2|.

        2.2.2行車效率收益

        效率因素指車輛期望較快的時(shí)間通過交叉口而避免減速或等待造成的時(shí)間延誤. 時(shí)間效用函數(shù)設(shè)定為

        (5)

        2.2.3行車舒適性收益

        舒適性效用值主要考慮縱向的加速度變化,|Δa|表示Δt內(nèi)縱向加速度變化差值,舒適性效用函數(shù)設(shè)定為

        (6)

        式中:amax為最大加速度;amin為最大減速度.

        2.2.4駕駛收益計(jì)算

        將行車安全收益Usafe、行車效率收益Ueff和行車舒適性收益Ucom統(tǒng)一換算為駕駛收益U,建立綜合效用函數(shù)

        U=αUsafe(s1,s2)+βUeff(s1,s2)+γUcom(s1,s2),

        (7)

        式中:U(·)為歸一化計(jì)算;α,β,γ分別為安全效用、效率效用和舒適性效用的權(quán)重,α+β+γ=1.

        整個(gè)問題目標(biāo)可表述為,基于式(7),即在不同加速度組合(a1,a2)的情況下,對該模型進(jìn)行納什均衡求解,使得整體駕駛收益達(dá)到最大.

        2.3 約束條件確定

        ① 為保證安全,需要代表兩車的圓不相交,對于任意一組(a1,a2)的速度改變方案則需滿足安全約束條件

        (8)

        式中:x1(t),y1(t)為車輛HD在t時(shí)刻的位置坐標(biāo);x2(t),y2(t)為車輛IV在t時(shí)刻的位置坐標(biāo).

        ② 由于受交叉口車道等影響,車輛HD和IV在任意時(shí)刻的速度都不能超過其限速的最大值,而允許的最小速度為0(即停車),車輛的加速度受車輛性能的限制,不可能過大或者過小,則速度、加速度的約束條件為

        (9)

        式中vmax取決于道路及交叉口的最大速度限制;amin、amax的大小取決于車輛性能及行駛舒適性要求,本文取-2 m/s2

        3 實(shí)驗(yàn)結(jié)果與分析

        3.1 仿真條件

        場景由PreScan軟件搭建,如圖2所示,有人與無人駕駛車輛上均搭載GPS和V2X傳感器系統(tǒng). 車輛HD的初始狀態(tài)信息為X1=(L1,v1,a1)=(40,12.5,0),車輛IV的初始狀態(tài)信息為X2=(L2,v2,a2)=(50,11,0),交叉口允許的最大速度vmax≤15 m/s,收益函數(shù)權(quán)重α,β,γ分別取0.5,0.3,0.2.

        圖2 有人與無人駕駛車輛通過十字路口示意圖Fig.2 Manned and unmanned vehicles crossing the intersection

        3.2 實(shí)驗(yàn)結(jié)果

        此博弈模型符合雙矩陣博弈條件,可以表示為G={S1,S2;U1,U2}. 依據(jù)駕駛員類型(保守型、普通型、沖動型)的不同,將動作空間縱向加速度離散為6個(gè)動作值,即a={±1.5,±1.0,±0.5}m/s2,為了確保安全,無人駕駛車輛不考慮沖動型駕駛策略. 根據(jù)式(7),求得車輛HD與IV下一時(shí)刻各自策略的效用值,如表1所示.

        表1 不同駕駛策略效用值Tab.1 Utility values of different driving strategies

        由表1可知,表中加粗?jǐn)?shù)據(jù)即為博弈雙方的Nash均衡,如車輛HD與IV的駕駛員為(保守型,保守型)時(shí),兩車的均衡效用值分別為(0.488 6,0.200 0),博弈存在Nash均衡,此刻的最優(yōu)策略組合為:車輛HD的行動策略是減速,車輛IV的行動策略是加速.

        以保守型-保守型博弈為例,車輛HD與IV在博弈時(shí)間段內(nèi)一直執(zhí)行加速-加速、加速-減速、減速-加速、減速-減速4種策略組合時(shí),有人與無人駕駛車輛的效用函數(shù)值變化趨勢,如圖3所示.

        圖3 有人與無人駕駛車輛效用函數(shù)值變化趨勢Fig.3 Utility function values of manned and unmanned vehicles

        由圖3可知,整個(gè)博弈時(shí)間區(qū)間內(nèi),時(shí)間步1~6期間,車輛HD與IV選擇的最優(yōu)策略為:車輛HD選擇減速,車輛IV選擇加速. 時(shí)間步6兩車的最優(yōu)策略發(fā)生改變,這是由于在時(shí)刻6,車輛HD先到達(dá)沖突點(diǎn),出于安全因素考慮兩車最優(yōu)策略變化為車輛HD減速、車輛IV減速. 時(shí)刻8之后,車輛HD先通過沖突點(diǎn),表明兩車沖突已消解,已能夠滿足兩車無干擾通過的要求,因此時(shí)刻8~9兩車的最優(yōu)策略變化為車輛HD加速、車輛IV加速,沖突博弈結(jié)束.

        同理可得,車輛IV與HD分別為保守型-保守型、保守型-普通型、保守型-沖動型、普通型-保守型、普通型-普通型、普通型-沖動型車輛時(shí),在整個(gè)博弈時(shí)間段內(nèi)各點(diǎn)的最優(yōu)決策序列如圖4所示.

        圖4 不同駕駛類型博弈過程的最優(yōu)決策序列Fig.4 The optimal decision-making sequence of different driving types in the game process

        由圖4可知,在整個(gè)博弈過程中,無人駕駛車輛IV會根據(jù)對方駕駛員HD的行為調(diào)整自身的行為策略,其行為決策存在很大區(qū)別. 當(dāng)無人駕駛車輛IV分別與保守型、普通型駕駛員交互時(shí),兩車決策策略相似,而當(dāng)無人駕駛車輛IV與沖動型駕駛員交互時(shí),兩車決策策略不同,實(shí)現(xiàn)了與不同類型駕駛員的動態(tài)交互. 此外,就本例設(shè)置的交通條件下,整個(gè)博弈過程中,不同類型駕駛策略組合消解沖突所用時(shí)間也不同.

        為進(jìn)一步驗(yàn)證本文算法的高效性,選擇基于沖突表的路口協(xié)作算法[8]作為對比,對兩種算法進(jìn)行對比分析,實(shí)驗(yàn)結(jié)果如圖5所示.

        圖5給出路口區(qū)域內(nèi)(距沖突點(diǎn)距離在-40~50 m之間)車輛距沖突點(diǎn)距離和速度的變化,在路口區(qū)域外視為車輛距離沖突點(diǎn)始終不變,虛線為交叉口中心基準(zhǔn)線,沖突點(diǎn)直觀地表示出車輛通過路口的時(shí)間. 可見博弈算法時(shí)沖突車輛通過路口所用的時(shí)間為10 s,明顯小于沖突表算法所用的時(shí)間13 s,可見本文算法能夠提高沖突車輛通過路口的效率. 說明本文算法可以通過速度優(yōu)化控制實(shí)現(xiàn)避讓,提高效率,實(shí)現(xiàn)與不同類型駕駛員交叉口沖突消解.

        4 結(jié) 論

        針對有人與無人駕駛車輛在交叉口存在沖突時(shí)的協(xié)調(diào)控制問題,考慮周圍其他車輛的運(yùn)行狀態(tài),分析車輛之間的合作與沖突機(jī)理,建立交叉口駕駛博弈模型來消解沖突. 將交叉口存在交互行為的決策個(gè)體建模為博弈中的參與者,以沖突車輛的速度改變方案為博弈策略,構(gòu)建雙方的收益矩陣,通過求解博弈模型的納什均衡,作為雙方的最優(yōu)駕駛策略組合,實(shí)現(xiàn)參與者決策行為的動態(tài)演化,完成交叉口多車沖突的協(xié)作優(yōu)化. 最后,聯(lián)合Prescan和Matlab/Simlink對提出的算法進(jìn)行驗(yàn)證,結(jié)果表明無人駕駛車輛會根據(jù)對方駕駛員的行為調(diào)整自身的行為策略,與基于沖突表的協(xié)作算法對比,文中算法的沖突消解所用時(shí)間更短,有效提高了沖突車輛通過路口的效率. 但是文中為了便于模型求解,簡化了決策空間,并且忽略交叉口其他交通參與者的干擾,未來可進(jìn)一步探索.

        猜你喜歡
        沖突點(diǎn)局中人交叉口
        “吸煙有害健康”傳播存在的問題及改進(jìn)策略
        立足語文根本,涵泳語言意蘊(yùn)
        淺談環(huán)形交叉口對城市交通的影響
        2×2型博弈決策均衡的歸一化解法
        信號交叉口延誤參數(shù)獲取綜述
        大學(xué)生安全教育的思考與對策
        超對策模型中多形式結(jié)局偏好認(rèn)知信息融合的0—1規(guī)劃方法
        一種Y型交叉口設(shè)計(jì)方案的選取過程
        具有失真認(rèn)知信息的兩層沖突環(huán)境建模與分析
        考慮黃燈駕駛行為的城市交叉口微觀仿真
        国产精品久久久久久久妇| 日韩黄色大片免费网站| 精品一区二区三区久久| 国产69精品久久久久app下载| 日产国产精品亚洲系列| 久久久综合九色合综国产| 久久99久久久精品人妻一区二区| 色熟妇人妻久久中文字幕| 国内精品视频在线播放不卡| 国产黄色免费网站| 久久精品国产亚洲av热九| 日本一二三四高清在线| 国产乱子伦农村xxxx| h国产视频| 国产熟女精品一区二区| 久久精品熟女亚洲av麻| 少妇无码太爽了不卡视频在线看| 亚洲国产99精品国自产拍| 人妻中文字幕av有码在线| 男女射精视频在线观看网站| 乱人妻中文字幕| 91福利视频免费| 精品少妇一区二区三区四区| 欧美xxxxx高潮喷水麻豆| 成人区人妻精品一熟女| 无码在线观看123| 青草草视频在线观看华人免费| 色婷婷综合久久久中文字幕| 一个人在线观看免费视频www| 亚洲AV无码久久久久调教| 久久精品亚洲成在人线av乱码| 亚洲av永久无码精品网址| 欧美日韩国产一区二区三区地区| 大红酸枝极品老料颜色| 国产玉足榨精视频在线观看| 亚洲av无码专区国产乱码不卡 | 日子2020一区二区免费视频| 中文字幕一区二区三区四区久久| 狠狠色欧美亚洲狠狠色www| 欧美性猛交内射兽交老熟妇| 69堂在线无码视频2020|