李平飛,金思雨,胡文浩,高 立,車瑤櫟,譚正平,董小飛
(1.西華大學(xué) 汽車與交通學(xué)院,成都 610039,中國(guó);2.四川西華交通司法鑒定中心,成都 610039,中國(guó);3.國(guó)家市場(chǎng)監(jiān)督管理總局缺陷產(chǎn)品管理中心,北京 100191,中國(guó);4.上海機(jī)動(dòng)車檢測(cè)認(rèn)證技術(shù)研究中心有限公司,上海 201805,中國(guó))
自動(dòng)駕駛汽車需要大量的測(cè)試[1]來(lái)證明其各項(xiàng)功能及其性能可靠性、穩(wěn)定性等。基于場(chǎng)景的測(cè)試方法[2]憑借應(yīng)用方式靈活、針對(duì)性強(qiáng)、可重復(fù)性高等優(yōu)點(diǎn)成為目前自動(dòng)駕駛汽車主要的測(cè)試方法之一。與自然駕駛場(chǎng)景不同,事故場(chǎng)景更易提取危險(xiǎn)工況,以測(cè)試自動(dòng)駕駛汽車應(yīng)對(duì)危險(xiǎn)的能力。目前事故場(chǎng)景的研究多集中于事故場(chǎng)景再現(xiàn)分析[3-5]及典型場(chǎng)景的提取與構(gòu)建[6-9],有關(guān)場(chǎng)景綜合評(píng)價(jià)的研究較少。其中對(duì)場(chǎng)景進(jìn)行復(fù)雜度評(píng)價(jià),可為自動(dòng)駕駛仿真測(cè)試場(chǎng)景提取、篩選等技術(shù)難點(diǎn)提供解決思路,提升測(cè)試效率。
在場(chǎng)景復(fù)雜度理論研究方面,多數(shù)學(xué)者主要結(jié)合駕駛員的生理、心理響應(yīng)展開研究[10-12]。張海潮[10]通過(guò)駕駛員對(duì)交通環(huán)境的認(rèn)知負(fù)擔(dān)定義復(fù)雜度,提出基于引力模型的道路交通環(huán)境復(fù)雜度計(jì)算方法。畢蕊[11]提出了一種基于腦電特征指標(biāo)的交通因素復(fù)雜度的量化方法。張朋[12]利用人工勢(shì)場(chǎng)法量化道路動(dòng)態(tài)交通環(huán)境復(fù)雜度,并研究其與駕駛?cè)说墓ぷ髫?fù)荷、主觀復(fù)雜度和次任務(wù)反應(yīng)時(shí)間之間的關(guān)系。此外,也有學(xué)者從不同工況對(duì)復(fù)雜度展開研究。王宇雷等人[13]提出一種面向復(fù)雜超車場(chǎng)景的行駛?cè)蝿?wù)復(fù)雜度量化評(píng)估方法。董漢等[14]提出了一種對(duì)危險(xiǎn)駕駛工況場(chǎng)景數(shù)據(jù)采集和復(fù)雜度評(píng)估的方法。而面向自動(dòng)駕駛場(chǎng)景的復(fù)雜度研究正處于初步階段,李江坤[15]圍繞自動(dòng)駕駛系統(tǒng)提出一種結(jié)合影響傳遞模型和層次分析法的場(chǎng)景復(fù)雜度評(píng)價(jià)方法,但場(chǎng)景元素對(duì)自動(dòng)駕駛系統(tǒng)的影響還需進(jìn)一步研究;王榮等[16]采用引力模型和信息熵相結(jié)合的方法從靜態(tài)和動(dòng)態(tài)場(chǎng)景兩個(gè)方面綜合評(píng)價(jià)自動(dòng)駕駛場(chǎng)景復(fù)雜度。目前的方法均有不同側(cè)重,少有基于事故場(chǎng)景對(duì)自動(dòng)駕駛場(chǎng)景復(fù)雜度展開研究。
本文利用車-車事故預(yù)碰撞數(shù)據(jù),從場(chǎng)景不同維度出發(fā),建立場(chǎng)景復(fù)雜度評(píng)價(jià)模型,實(shí)現(xiàn)場(chǎng)景的量化分級(jí),有助于篩選復(fù)雜且事故嚴(yán)重程度高的場(chǎng)景,為自動(dòng)駕駛仿真測(cè)試典型場(chǎng)景的選擇提供依據(jù)。
本文的道路交通事故數(shù)據(jù)來(lái)源于(中國(guó))國(guó)家車輛事故深度調(diào)查體系(National Automobile Accident In-Depth Investigation System,NAIS),NAIS 是由國(guó)家市場(chǎng)監(jiān)督管理總局缺陷產(chǎn)品管理中心牽頭建立的道路交通事故深度調(diào)查體系[17]。NAIS 制定了統(tǒng)一的數(shù)據(jù)采集標(biāo)準(zhǔn),在采集點(diǎn)的分布上充分考慮了中國(guó)交通地域分布的特點(diǎn)和差異,2011—2020 年期間,NAIS 數(shù)據(jù)庫(kù)共采集約5 500 起道路交通事故案例。表1 為NAIS 數(shù)據(jù)與《中華人民共和國(guó)道路交通事故統(tǒng)計(jì)年報(bào)(2017 年度)》的對(duì)比,表中數(shù)據(jù)為指標(biāo)水平占全部樣本的百分比及相應(yīng)差值(統(tǒng)計(jì)年報(bào)占比-NAIS 數(shù)據(jù)庫(kù)占比)。
表1 NAIS 數(shù)據(jù)庫(kù)與道路交通事故統(tǒng)計(jì)年報(bào)的對(duì)比
結(jié)果表明:NAIS 數(shù)據(jù)庫(kù)的事故特征與全國(guó)道路交通事故統(tǒng)計(jì)年報(bào)信息較為吻合,整體數(shù)據(jù)具備一定代表性。從5 500 余起事故案例中初步篩選涉及汽車與汽車碰撞的事故1 702 例,進(jìn)一步篩選符合標(biāo)準(zhǔn)的數(shù)據(jù)進(jìn)行分析,篩選標(biāo)準(zhǔn)如下:
1)事故參與方數(shù)目為2;2)參與方類型均為汽車;3)事故信息采集完整,滿足場(chǎng)景構(gòu)建需要。
按照篩選標(biāo)準(zhǔn),最終有670 個(gè)案例符合要求,作為后續(xù)研究的原始數(shù)據(jù)。670 例事故中,死亡案例占比達(dá)30.6%,這與NAIS 的采集條件“人員損傷等級(jí)不低于AIS3”有關(guān)。
在自動(dòng)駕駛領(lǐng)域內(nèi),場(chǎng)景被看作是在特定的時(shí)間和空間范圍內(nèi)周圍環(huán)境對(duì)行駛車輛產(chǎn)生一定影響的綜合反映。駕駛場(chǎng)景的描述包括駕駛?cè)艘蛩?、車輛因素、道路因素、環(huán)境因素4 個(gè)方面[18]。在自動(dòng)駕駛場(chǎng)景中,駕駛?cè)艘蛩乇蝗趸?,結(jié)合NAIS 數(shù)據(jù)庫(kù)車-車事故信息及相關(guān)研究[19],本文將場(chǎng)景信息分為主車信息、目標(biāo)車信息、道路信息與環(huán)境信息4 個(gè)維度。
按照?qǐng)鼍? 個(gè)維度信息,共選取NAIS 數(shù)據(jù)庫(kù)中13 項(xiàng)變量。由于在自動(dòng)駕駛測(cè)試場(chǎng)景中默認(rèn)主車為乘用車(包括轎車、運(yùn)動(dòng)型多用途汽車(sport utility vehicle,SUV)、多用途汽車(multi-purpose-vehicles,MPV)、和面包車),因此在主車信息中未考慮車輛類型,各維度具體變量選取情況如圖1 所示。13 個(gè)變量具體水平如表2 所示,各變量水平來(lái)自670 例事故數(shù)據(jù)。
圖1 場(chǎng)景信息
表2 各變量(V)水平(L)及賦值情況
根據(jù)信息熵思想,自動(dòng)駕駛測(cè)試場(chǎng)景每個(gè)維度蘊(yùn)含不同的信息量。若某類事故場(chǎng)景發(fā)生概率較低,場(chǎng)景庫(kù)中信息量不足,熵值高,自動(dòng)駕駛預(yù)期功能安全系統(tǒng)對(duì)其沒有充分的認(rèn)識(shí)和準(zhǔn)備,就無(wú)法對(duì)此進(jìn)行準(zhǔn)確的把握從而無(wú)法精準(zhǔn)的執(zhí)行相關(guān)避撞措施,事故難以避免,即此類場(chǎng)景對(duì)于自動(dòng)駕駛系統(tǒng)來(lái)說(shuō)可定義為復(fù)雜場(chǎng)景;反之即為簡(jiǎn)單場(chǎng)景。
參考中國(guó)汽車技術(shù)研究中心提出的關(guān)于場(chǎng)景復(fù)雜度的概念,借用信息熵理論計(jì)算變量下各水平的信息量,即場(chǎng)景各水平的復(fù)雜度為[20]
式中:ω為不同場(chǎng)景變量某一水平的權(quán)重,c為某變量單個(gè)水平復(fù)雜度。
場(chǎng)景中每個(gè)變量水平對(duì)應(yīng)一個(gè)熵值,即復(fù)雜度。對(duì)于某一具體場(chǎng)景,一個(gè)變量?jī)H對(duì)應(yīng)一個(gè)具體的水平,即各場(chǎng)景維度下的每個(gè)變量均對(duì)應(yīng)一個(gè)復(fù)雜度,某一維度的復(fù)雜度為該維度下所有變量復(fù)雜度的加權(quán)總和,再對(duì)4 個(gè)維度的復(fù)雜度進(jìn)行加權(quán)求和,得到某一具體場(chǎng)景的整體復(fù)雜度為
式中:Ci為第i個(gè)維度的復(fù)雜度,σi為第i個(gè)維度的權(quán)重系數(shù),i=1,2,3,4;cij為第i個(gè)維度下第j個(gè)變量的復(fù)雜度,μij為第i個(gè)維度下第j個(gè)變量的權(quán)重系數(shù),n為某維度的變量個(gè)數(shù)。
1)邏輯回歸模型及驗(yàn)證。
本文篩選的670 例事故案例中死亡案例為30.6%。由信息熵理論,變量水平權(quán)重與場(chǎng)景中指標(biāo)發(fā)生危險(xiǎn)事故的概率有緊密聯(lián)系,利用邏輯回歸方式[21]可有效計(jì)算事故造成人員死亡的概率,將其概率轉(zhuǎn)換為變量水平權(quán)重。本文采用SPSS 軟件建立二元邏輯回歸模型,將事故是否造成人員死亡作為因變量:1 表示有;2 表示無(wú),自變量為前文從NAIS 數(shù)據(jù)庫(kù)中選取的13 項(xiàng)變量,變量水平以數(shù)字1~7 賦值,如表2 所示。在二元邏輯回歸模型中,造成人員死亡的概率可表示為
式中:x1、x2、…、xm為選擇的影響因素;β0為常數(shù)項(xiàng);β1、β2、…、βm為影響因素x1、x2、…、xm的回歸系數(shù),表示自變量與因變量之間的相關(guān)性。
由此,造成人員死亡的概率與未造成人員死亡概率的比值,即優(yōu)勢(shì)比(odds ratio,OR)為
根據(jù)模型測(cè)試集(由2.2 節(jié)變量數(shù)據(jù)得到)預(yù)測(cè)概率繪制受試者工作特征(receiver operator characteristic,ROC)曲線,如圖2 所示。得到測(cè)試集ROC 曲線下的面積(area under curve,AUC)為0.901,預(yù)測(cè)正確概率為82.8%,模型預(yù)測(cè)能力較好。Omnibus 檢驗(yàn)是模型系數(shù)的綜合檢驗(yàn),根據(jù)表3 顯著性小于0.05,表示邏輯回歸模型總體有意義,即模型有效。Hosmer Lemeshow 檢驗(yàn)是檢驗(yàn)?zāi)P偷臄M合優(yōu)度,顯著性大于0.05,可以認(rèn)為:該邏輯回歸模型擬合度較高。
表3 模型的檢驗(yàn)
圖2 預(yù)測(cè)模型ROC 曲線
2)水平權(quán)重及各水平復(fù)雜度確定。
由上述邏輯回歸分析模型得到每個(gè)變量水平對(duì)應(yīng)的優(yōu)勢(shì)比,即得出以每個(gè)變量最后一個(gè)水平為參考,其余水平發(fā)生致死事故的概率,如當(dāng)主車運(yùn)動(dòng)狀態(tài)為左轉(zhuǎn),相對(duì)于運(yùn)動(dòng)狀態(tài)為停車時(shí)發(fā)生致死事故的概率為0.254;將每個(gè)變量下所有水平的權(quán)重值總和設(shè)為1,根據(jù)OR 值中各水平之間的倍數(shù)關(guān)系計(jì)算每個(gè)變量下各水平的權(quán)重,即歸一化后所得結(jié)果,以衡量每個(gè)變量水平在該變量下對(duì)場(chǎng)景復(fù)雜度影響的重要程度。根據(jù)式(1),計(jì)算得到每個(gè)變量各水平的復(fù)雜度值,按照表2 定義以V=x(x為變量序數(shù))表示變量,以L=y(y為各變量水平序數(shù))表示水平,如表4 所示。
表4 水平權(quán)重及各水平復(fù)雜度
場(chǎng)景中每個(gè)維度因素對(duì)于場(chǎng)景復(fù)雜程度的影響不一致,故不同維度及變量應(yīng)有不同的權(quán)重系數(shù),若僅靠人為決定某個(gè)因素對(duì)場(chǎng)景的復(fù)雜程度的影響程度的大小,忽略了實(shí)際案例的客觀性將造成主觀因素對(duì)結(jié)果影響過(guò)大,故在此需要一種模仿人類思維的深度學(xué)習(xí)方法對(duì)維度權(quán)重系數(shù)進(jìn)行計(jì)算。選擇反向傳播(back propagation,BP)神經(jīng)網(wǎng)絡(luò)算法[22]可以科學(xué)有效地確定每個(gè)維度及變量在場(chǎng)景復(fù)雜程度中的權(quán)重系數(shù)。
對(duì)670 例車-車碰撞數(shù)據(jù)進(jìn)行BP 神經(jīng)網(wǎng)絡(luò)訓(xùn)練,BP 神經(jīng)網(wǎng)絡(luò)的輸入層數(shù)據(jù)為13 項(xiàng)變量的所有數(shù)據(jù),根據(jù)數(shù)據(jù)需要設(shè)置隱藏層層數(shù)為1,隱藏層中神經(jīng)單元設(shè)置為10 個(gè),輸出層為事故是否造成人員死亡的數(shù)據(jù),設(shè)置一個(gè)單元層。選用均方誤差(mean square error,MSE)、平均絕對(duì)誤差(mean absolute error,MAE)和相關(guān)系數(shù)(R)作為評(píng)估模型性能的指標(biāo);若這2 個(gè)誤差值越小、R值越接近于1,則表示模型的準(zhǔn)確性越好[23]。模型訓(xùn)練完成后,所得均方誤差為0.103 9,平均絕對(duì)誤差為0.008 6,相關(guān)系數(shù)R為0.845 6,總體來(lái)看,該模型準(zhǔn)確性較好。其中得到輸入層與隱藏層之間的權(quán)值系數(shù)ωki,以及隱藏層與輸出層之間的權(quán)值系數(shù)ωjk,將各神經(jīng)元之間的權(quán)值系數(shù)轉(zhuǎn)化為各相應(yīng)權(quán)重,再經(jīng)過(guò)權(quán)重影響處理后得到各維度下變量權(quán)重μ和各維度權(quán)重σ,如表5 所示。
根據(jù)得到的場(chǎng)景4 個(gè)維度及變量的權(quán)重和3.1 節(jié)場(chǎng)景復(fù)雜度的計(jì)算公式,最終得到車-車場(chǎng)景復(fù)雜度模型為
由這4 個(gè)權(quán)重系數(shù)可知:主車信息和環(huán)境信息對(duì)場(chǎng)景的復(fù)雜度影響比目標(biāo)車輛信息和道路信息對(duì)場(chǎng)景的復(fù)雜度影響低。主車作為可控因素各方面性能可以進(jìn)行調(diào)節(jié),也能減輕惡劣天氣或照明情況不佳帶來(lái)的影響,故在場(chǎng)景復(fù)雜度中主車信息和環(huán)境信息權(quán)重不高。道路信息對(duì)場(chǎng)景的復(fù)雜度影響較大,道路幾何結(jié)構(gòu)和道路狀況在一定程度上決定了車輛行駛中交通狀況的復(fù)雜度,若道路幾何結(jié)構(gòu)較復(fù)雜便會(huì)加劇車輛的沖突關(guān)系,同理道路行政等級(jí)較低也可能伴隨路況不佳增加車輛行駛復(fù)雜度。而作為場(chǎng)景復(fù)雜度中權(quán)重最高的目標(biāo)車輛因素,同時(shí)也是自動(dòng)駕駛預(yù)期功能安全主要研究的對(duì)象,其不可控也難以精準(zhǔn)預(yù)測(cè),造成的信息變化對(duì)主車產(chǎn)生巨大影響,在場(chǎng)景復(fù)雜度評(píng)價(jià)中起到顯著作用。
根據(jù)式(5)對(duì)本文中670 例車-車事故進(jìn)行場(chǎng)景復(fù)雜度計(jì)算,得到每例事故場(chǎng)景復(fù)雜度指數(shù),分布如圖3所示。
圖3 670 例事故場(chǎng)景復(fù)雜度指數(shù)分布
根據(jù)計(jì)算結(jié)果對(duì)復(fù)雜度等級(jí)進(jìn)行劃分。對(duì)場(chǎng)景復(fù)雜度進(jìn)行等級(jí)劃分時(shí),若使用傳統(tǒng)的等量分割人為影響因素過(guò)大,且容易忽略數(shù)據(jù)的聚集性,故本文采用K-means 聚類方法對(duì)場(chǎng)景復(fù)雜度指數(shù)進(jìn)行聚類分析,將場(chǎng)景復(fù)雜度指數(shù)作為聚類樣本劃分?jǐn)?shù)據(jù)集,將樣本間距離最緊密的數(shù)據(jù)劃分為一個(gè)數(shù)據(jù)集,使多個(gè)數(shù)據(jù)之間形成明顯的閾值界限便可得到場(chǎng)景復(fù)雜度等級(jí)。本文采用常見的“肘部法”來(lái)確定聚類個(gè)數(shù)K,將曲線肘部位置對(duì)應(yīng)的聚類數(shù)K確定為最合適的聚類數(shù)K(見圖4)。由圖4 可知:肘部位置處(紅點(diǎn))對(duì)應(yīng)的聚類數(shù)K為4 時(shí),聚類效果最好。根據(jù)復(fù)雜度指數(shù)大小將場(chǎng)景復(fù)雜等級(jí)劃分為4 個(gè)等級(jí),復(fù)雜程度依次遞增,并界定其取值范圍,如表6 所示。
圖4 聚類數(shù)(K)與誤差平方和(SSE)關(guān)系圖
表6 場(chǎng)景復(fù)雜度等級(jí)劃分
由等級(jí)劃分結(jié)果,場(chǎng)景復(fù)雜度指數(shù)小于等于0.183的復(fù)雜等級(jí)為1 級(jí),場(chǎng)景復(fù)雜度指數(shù)在(0.183,0.227]范圍內(nèi)的復(fù)雜等級(jí)為2 級(jí),3 級(jí)復(fù)雜場(chǎng)景的復(fù)雜度指數(shù)在(0.227,0.290]范圍內(nèi),復(fù)雜等級(jí)最高的4 級(jí)場(chǎng)景復(fù)雜度指數(shù)大于0.290。
結(jié)合場(chǎng)景復(fù)雜度指數(shù)分布圖及等級(jí)劃分可以看出,在670 例事故案例中,場(chǎng)景復(fù)雜程度較低的1 級(jí)和2級(jí)所占比例較大(共計(jì)71.6%),且占比較接近。隨著復(fù)雜程度增加,案例占比依次減小,其中復(fù)雜程度最高的4 級(jí)場(chǎng)景占比最?。?.6%),符合真實(shí)交通事故場(chǎng)景分布規(guī)律。
由場(chǎng)景復(fù)雜程度評(píng)價(jià)結(jié)果,按場(chǎng)景復(fù)雜等級(jí)分別對(duì)670 例車—車場(chǎng)景的13 項(xiàng)變量數(shù)據(jù)進(jìn)行統(tǒng)計(jì),以具有明顯占比優(yōu)勢(shì)的變量水平作為場(chǎng)景特征,各等級(jí)場(chǎng)景主要特征占比如表7 所示,其中“其他”為單個(gè)變量其余水平占比總和。
表7 場(chǎng)景特征提取
從各復(fù)雜等級(jí)場(chǎng)景特征最高占比情況來(lái)看,1 級(jí)復(fù)雜場(chǎng)景以白天城市道路路口的垂向沖突形式為代表,復(fù)雜等級(jí)為2 級(jí)的場(chǎng)景以路口對(duì)向沖突為主,1、2 級(jí)場(chǎng)景的主車行駛速度相對(duì)較低;而3 級(jí)、4 級(jí)復(fù)雜場(chǎng)景主要發(fā)生在夜間高速公路,分別以同向追尾和向右變道為代表,主車行駛速度相對(duì)較高;隨著復(fù)雜度增加,主車碰撞速度主要分布區(qū)間由1 級(jí)的20~40 km/h 增長(zhǎng)到4級(jí)的80~100 km/h,而4 級(jí)復(fù)雜場(chǎng)景中目標(biāo)車碰撞速度降低到0~20 km/h,且目標(biāo)車以重型貨車占比最多,對(duì)于同向行駛車輛發(fā)生的碰撞事故而言,由于相對(duì)速度較大導(dǎo)致事故后果較嚴(yán)重。
從事故后果嚴(yán)重程度方面,統(tǒng)計(jì)不同復(fù)雜度場(chǎng)景的傷亡情況發(fā)現(xiàn),1 級(jí)和2 級(jí)復(fù)雜場(chǎng)景事故死亡率分別為1.6%、28.7%,復(fù)雜等級(jí)為3 級(jí)的場(chǎng)景事故死亡率為69.8%,4 級(jí)復(fù)雜場(chǎng)景事故死亡率為90.9%。4 級(jí)復(fù)雜場(chǎng)景占比最?。?.6%),但死亡率高達(dá)90%以上。結(jié)合相應(yīng)場(chǎng)景特征,這類高復(fù)雜度且事故后果嚴(yán)重程度較高的場(chǎng)景值得重點(diǎn)關(guān)注。
本文基于信息熵理論,從事故場(chǎng)景主車信息、目標(biāo)車信息、道路信息與環(huán)境信息4 個(gè)維度提取變量,通過(guò)邏輯回歸分析模型獲取優(yōu)勢(shì)比確定變量各水平復(fù)雜度,利用BP 神經(jīng)網(wǎng)絡(luò)算法得到各維度及變量權(quán)重,綜合加權(quán)建立車-車事故場(chǎng)景復(fù)雜度模型?;趶?fù)雜度評(píng)價(jià)模型計(jì)算670 例案例的場(chǎng)景復(fù)雜度指數(shù),在此基礎(chǔ)上運(yùn)用K-means 聚類方法聚類得到了4 個(gè)場(chǎng)景復(fù)雜等級(jí),復(fù)雜等級(jí)為1 級(jí)和2 級(jí)的比例較大且較接近,復(fù)雜等級(jí)最高的場(chǎng)景占比最小。對(duì)13 項(xiàng)變量數(shù)據(jù)及傷亡情況進(jìn)行統(tǒng)計(jì),得到各復(fù)雜度場(chǎng)景具有明顯占比優(yōu)勢(shì)的場(chǎng)景特征。4 級(jí)復(fù)雜場(chǎng)景占比1.6%,但死亡率高達(dá)90.9%,此類場(chǎng)景值得重點(diǎn)關(guān)注。本研究結(jié)果可為面向自動(dòng)駕駛的車-車仿真測(cè)試場(chǎng)景的選取提供依據(jù)和方向,具有一定實(shí)際意義。