朱 冰, 張培興, 趙 健
(吉林大學(xué),汽車仿真與控制國家重點(diǎn)實(shí)驗(yàn)室,長春 130022)
自動駕駛汽車是全球汽車產(chǎn)業(yè)發(fā)展的戰(zhàn)略方向,而準(zhǔn)確可靠的安全性測試評價(jià)是自動駕駛汽車推廣應(yīng)用的基礎(chǔ)[1-2]。
目前,自動駕駛汽車大多基于公開道路或封閉試驗(yàn)場地進(jìn)行安全性測試,評價(jià)指標(biāo)主要為平均人工接管次數(shù)或單一場景的測試通過性[3-4]。 其中,平均人工接管次數(shù)指自動駕駛汽車每行駛1 000英里過程中人工接管的平均次數(shù),可反映自動駕駛系統(tǒng)在多維度場景下的表現(xiàn),但其測試過程存在風(fēng)險(xiǎn)且測試效率低下[5];測試通過性是指自動駕駛系統(tǒng)通過一系列具體測試用例的安全性測試,其邏輯場景只能針對離散的單一維度,評價(jià)結(jié)果不夠全面[6]。
自動駕駛汽車行駛環(huán)境復(fù)雜多變,因此,其安全性測試評價(jià)必須是面向多維度邏輯場景的綜合性能評價(jià),傳統(tǒng)方法無法滿足其安全性評價(jià)需求[7-8]。本文中面向多維度邏輯場景,提出一種基于統(tǒng)計(jì)規(guī)律的自動駕駛安全性聚類評價(jià)方法,可通過聚類給定多維度邏輯場景中的危險(xiǎn)參數(shù),對被測算法的整體性能進(jìn)行量化評價(jià)。
首先基于高斯模型對多維度邏輯場景下的遍歷測試危險(xiǎn)參數(shù)結(jié)果進(jìn)行聚類,得到連續(xù)分布的危險(xiǎn)域;在此基礎(chǔ)上,分析不同危險(xiǎn)場景的搜索難度和參數(shù)覆蓋范圍,提出危險(xiǎn)域離散度、危險(xiǎn)域范圍兩個(gè)基本評價(jià)指標(biāo),并將其耦合形成自動駕駛安全性聚類評價(jià)參數(shù)即場景危險(xiǎn)率;最后,應(yīng)用提出的方法對一種黑盒自動駕駛算法進(jìn)行測試評價(jià)。
基于場景的測試是自動駕駛汽車測試的必由之路,按照測試流程,測試場景可分為功能場景、邏輯場景和具體測試用例[9]。 其中,邏輯場景通過參數(shù)空間描述場景中要素的變化范圍、體現(xiàn)要素間的耦合效應(yīng),是承上啟下的測試主體,例如自動駕駛避撞測試時(shí)本車速度、相對速度和相對距離就是構(gòu)成該邏輯場景的3 個(gè)典型測試維度。
本文中首先對多維度邏輯場景進(jìn)行遍歷測試獲取危險(xiǎn)參數(shù),進(jìn)而通過高斯模型對危險(xiǎn)參數(shù)進(jìn)行聚類,形成連續(xù)分布的危險(xiǎn)域,算法流程如圖1 所示。
首先,進(jìn)行危險(xiǎn)參數(shù)預(yù)處理:(1)將多維度邏輯場景參數(shù)離散化形成具體測試用例;(2)對具體測試用例進(jìn)行遍歷測試獲取危險(xiǎn)場景參數(shù)集;(3)對危險(xiǎn)參數(shù)進(jìn)行對稱處理;(4)將對稱處理后的危險(xiǎn)參數(shù)進(jìn)行標(biāo)準(zhǔn)化。
然后,對處理后的危險(xiǎn)參數(shù)進(jìn)行聚類:(1)利用組內(nèi)殘差平方和計(jì)算聚類中心數(shù)量;(2)當(dāng)聚類中心為1 時(shí),直接對危險(xiǎn)參數(shù)進(jìn)行單高斯模型聚類;(3)當(dāng)聚類中心大于1 時(shí),應(yīng)用最大期望值(expectation maximization, EM)算法對危險(xiǎn)參數(shù)進(jìn)行高斯混合模型聚類;(4)獲取均值、標(biāo)準(zhǔn)差等高斯模型參數(shù);(5)刪除因?qū)ΨQ化處理所產(chǎn)生的多余聚類結(jié)果。
圖1 多維度邏輯場景危險(xiǎn)參數(shù)聚類流程
首先將多維度邏輯場景參數(shù)離散化形成具體測試用例,離散過程需要考慮的要素包括傳感器精度、被測算法模型、系統(tǒng)運(yùn)算頻率等,當(dāng)多種要素共同影響時(shí),應(yīng)該選擇最寬松的限制條件作為離散步長。以相對距離為例,毫米波雷達(dá)長距離測距精度為±0.5 m, 中距離測距精度為±0.25 m,因此可以將相對距離以1 m 的步長進(jìn)行離散。
對具體測試用例進(jìn)行遍歷測試,在足夠大的參數(shù)空間范圍內(nèi),必然存在導(dǎo)致危險(xiǎn)發(fā)生的參數(shù)空間,將導(dǎo)致測試結(jié)果發(fā)生碰撞危險(xiǎn)的場景參數(shù)定義為危險(xiǎn)參數(shù)。 遍歷測試后可獲取危險(xiǎn)參數(shù)集。
由于給定多維度邏輯場景邊界的限制,危險(xiǎn)參數(shù)集可能不會是一個(gè)完整的高斯分布范圍。 因此需要將危險(xiǎn)參數(shù)集在給定參數(shù)空間的危險(xiǎn)邊界按照不同的參數(shù)維度坐標(biāo)軸進(jìn)行對稱。 這樣既可以將危險(xiǎn)參數(shù)集構(gòu)建成一個(gè)完整的高斯分布,還可以保證后續(xù)標(biāo)準(zhǔn)化處理后的數(shù)據(jù)均值落在最危險(xiǎn)參數(shù)點(diǎn)位置。
由于多維度邏輯場景參數(shù)類型不同,參數(shù)數(shù)值范圍差異較大,因此需要對參數(shù)進(jìn)行標(biāo)準(zhǔn)化處理。采用Z-score Normalization 方法對危險(xiǎn)參數(shù)進(jìn)行標(biāo)準(zhǔn)化處理[10],如式(1)所示。
式中:xf為危險(xiǎn)參數(shù)集X的第f維危險(xiǎn)參數(shù)列向量;bf為對稱處理后的第f維危險(xiǎn)參數(shù)列向量;bf_mean為對稱處理后第f維危險(xiǎn)參數(shù)的均值;sf為對稱處理后第f維危險(xiǎn)參數(shù)的標(biāo)準(zhǔn)差;下角標(biāo)f代表多維度邏輯場景的第f個(gè)維度;d為多維度邏輯場景的變量維度總數(shù)。
由此,可得預(yù)處理之后的多維度邏輯場景危險(xiǎn)參數(shù)集X,如式(2)所示。X中的每一行向量xj(j=1,2…,m)為每個(gè)危險(xiǎn)測試用例所對應(yīng)的參數(shù)向量。
參數(shù)聚類首先需要確定聚類中心數(shù)量,本文中采用組內(nèi)殘差平方和計(jì)算危險(xiǎn)參數(shù)聚類中心數(shù)量[11]。 組內(nèi)殘差平方和是指所有聚類中每個(gè)類內(nèi)的要素距離其聚類中心的誤差平方的總和,如式(3)所示。
式中:m為所有危險(xiǎn)點(diǎn)的數(shù)量;為使用初步聚類得到的xj對應(yīng)的聚類中心。
當(dāng)組內(nèi)殘差平方和變化速率變慢時(shí),即認(rèn)為增大聚類數(shù)目也不能對聚類結(jié)果進(jìn)行有效的提高,該速率變化的拐點(diǎn)數(shù)即為聚類中心數(shù)目。
當(dāng)聚類中心為1 時(shí),可直接對危險(xiǎn)參數(shù)進(jìn)行單高斯模型聚類,如式(4)所示。
式中:P(x|θs)為單一高斯模型概率密度函數(shù);θs為高斯模型的參數(shù),包括均值和標(biāo)準(zhǔn)差;Σ為用來描述各維變量相關(guān)度的協(xié)方差矩陣;μ為危險(xiǎn)參數(shù)向量的均值。 由于危險(xiǎn)數(shù)據(jù)集經(jīng)過對稱和標(biāo)準(zhǔn)化處理,因此該分布的均值為0,標(biāo)準(zhǔn)差為1。
當(dāng)聚類中心大于1 時(shí),應(yīng)用EM 算法對危險(xiǎn)參數(shù)進(jìn)行高斯混合模型聚類[12],即將危險(xiǎn)參數(shù)分解為多個(gè)高斯概率密度函數(shù)組成的模型:
式中:G(x|θ)為高斯混合模型概率密度函數(shù);θ為高斯混合模型的參數(shù),包括第k個(gè)單高斯模型的權(quán)重αk和模型參數(shù)θk;θk包括均值μk和標(biāo)準(zhǔn)差σk;K為單個(gè)高斯模型的個(gè)數(shù)。
通過極大似然法可對θ進(jìn)行估計(jì):
應(yīng)用EM 迭代算法對上式進(jìn)行求解。 EM 算法的E-step 為計(jì)算Q函數(shù),Q函數(shù)代表給定第p輪迭代的參數(shù)θp之后高斯混合模型G(x|θp)與給定數(shù)據(jù)之間的相似程度。
式中:稱為后概率事件,即表示第j個(gè)觀測數(shù)據(jù)來自第k個(gè)高斯密度函數(shù)的概率。
EM 算法中的 M-step 為最大化Q函數(shù)。 當(dāng)計(jì)算第(p+1)步的參數(shù)θp+1時(shí),只需要對第p步的αk、μk、σk求偏導(dǎo)并使其等于 0,就可以使得Q函數(shù)極大化。
重復(fù)進(jìn)行EM 算法的 E-step 和 M-step 直至模型收斂即可得到高斯混合模型G(x|θ)。
通過上述單高斯模型或高斯混合模型,可以得到模型參數(shù),即均值和標(biāo)準(zhǔn)差。 本文中利用這些聚類參數(shù)建立自動駕駛安全性評價(jià)指標(biāo)。
同時(shí),由于危險(xiǎn)參數(shù)預(yù)處理時(shí)進(jìn)行的對稱處理會導(dǎo)致數(shù)據(jù)擴(kuò)大,因此需要對這部分多余的數(shù)據(jù)進(jìn)行刪除。 坐標(biāo)軸處數(shù)據(jù)分布在對稱處理之后不會增加高斯分布的數(shù)量,但是會造成區(qū)域擴(kuò)大;其他位置的分布在對稱處理之后會導(dǎo)致高斯分布數(shù)量增加。因此在整個(gè)聚類完成之后需要?jiǎng)h除該類多余的分布(多余分布的特點(diǎn)為均值存在對稱性,標(biāo)準(zhǔn)差等同),并對坐標(biāo)軸處因?qū)ΨQ造成的區(qū)域擴(kuò)大進(jìn)行修正。 對于那些刪除數(shù)量少于(2d-1)的高斯分布類型,即位于坐標(biāo)軸處的高斯分布,其標(biāo)準(zhǔn)差的修正過程為
式中:q為未因?qū)ΨQ產(chǎn)生多余高斯分布的對稱軸的數(shù)量;t為該類高斯分布的刪除數(shù)量;σkb為修正前的高斯分布標(biāo)準(zhǔn)差;σk為修正后的高斯分布標(biāo)準(zhǔn)差。
傳統(tǒng)基于場景的自動駕駛安全性評價(jià)大多采用單一場景測試通過性作為評價(jià)指標(biāo),然而,這種指標(biāo)難以反映復(fù)雜邏輯場景多維度要素的耦合關(guān)系,也無法體現(xiàn)不同自動駕駛策略的整體性能。 本文中綜合考慮多維度邏輯場景內(nèi)危險(xiǎn)場景的分布情況和覆蓋范圍,根據(jù)高斯聚類結(jié)果提出危險(xiǎn)域離散度和危險(xiǎn)域范圍兩個(gè)基本評價(jià)指標(biāo),并將其耦合形成可量化的自動駕駛安全性聚類評價(jià)指標(biāo)——場景危險(xiǎn)率。
針對同一多維度邏輯場景,被測算法產(chǎn)生的危險(xiǎn)參數(shù)分布越分散,意味著算法的安全性越差,采用單一場景測試通過性進(jìn)行測試時(shí),發(fā)現(xiàn)其危險(xiǎn)場景的難度也越大。 因此,定義危險(xiǎn)參數(shù)的連續(xù)分布為危險(xiǎn)域,提出危險(xiǎn)域離散度指標(biāo)對自動駕駛安全性進(jìn)行評價(jià)。
顯然,危險(xiǎn)域離散度應(yīng)包括兩部分,一是不同危險(xiǎn)域相對于邏輯場景中最危險(xiǎn)邊界點(diǎn)的距離,二是不同危險(xiǎn)域之間的相對距離。
經(jīng)過對稱及標(biāo)準(zhǔn)化處理后的危險(xiǎn)參數(shù)集,其最危險(xiǎn)邊界點(diǎn)即為坐標(biāo)原點(diǎn),因此,不同聚類中心相對于坐標(biāo)原點(diǎn)的歐氏距離db即為不同危險(xiǎn)域相對于最危險(xiǎn)邊界點(diǎn)的距離,如式(12)所示;其他不同危險(xiǎn)域之間的相對距離可用類間距離ds表示,如式(13)所示。
式中:μk為聚類中心的位置即高斯分布的均值,下標(biāo)k表示不同的聚類;μmean為除原點(diǎn)外的聚類中心的均值。
第k個(gè)危險(xiǎn)域的離散度dh_k為
式中a、c為權(quán)重系數(shù)。
針對同一多維度邏輯場景,被測算法產(chǎn)生的危險(xiǎn)參數(shù)覆蓋范圍越大,意味著算法的安全性越差,因此,提出危險(xiǎn)域范圍作為自動駕駛安全性的另一個(gè)評價(jià)指標(biāo)。
危險(xiǎn)域范圍Sk應(yīng)該綜合考慮危險(xiǎn)參數(shù)的危險(xiǎn)程度及其分布范圍,可采用高斯分布標(biāo)準(zhǔn)差表達(dá),第k個(gè)危險(xiǎn)域的危險(xiǎn)域范圍Sk為
式中:ω=(ω1,ω2,…,ωd)為不同維度危險(xiǎn)參數(shù)的重要程度系數(shù);σk=(σ1,σ2,…,σd)為高斯分布的標(biāo)準(zhǔn)差。
ω可采用層次分析法確定。 首先建立參數(shù)判別矩陣A,如式(16)所示。
式中off為不同場景參數(shù)兩兩比較的相對重要程度。
通過計(jì)算可得到判別矩陣的最大特征值λmax和其對應(yīng)的加權(quán)向量z。 進(jìn)而,計(jì)算判別矩陣的一致性指標(biāo)CI,如式(17)所示,查表獲得隨機(jī)一致性指標(biāo)RI,計(jì)算一致性比率CR,如式(18)所示。
如果CR<0.1,則矩陣通過一致性檢驗(yàn),加權(quán)向量z即可作為不同維度危險(xiǎn)參數(shù)的重要程度系數(shù)ω。 如果CR≥0.1,則矩陣未通過一致性檢驗(yàn),需要重新建立判別矩陣并進(jìn)行層次分析法的后續(xù)步驟。
為綜合評價(jià)被測自動駕駛算法在某一多維度邏輯場景下的安全性,將危險(xiǎn)域離散度和危險(xiǎn)域范圍兩個(gè)指標(biāo)進(jìn)行耦合,建立可量化的聚類評價(jià)指標(biāo)——場景危險(xiǎn)率。
場景危險(xiǎn)率Rd如式(19)所示。
式中:S1為坐標(biāo)原點(diǎn)處的危險(xiǎn)域范圍;Smin為理論最小危險(xiǎn)域范圍,即在給定場景下,假設(shè)自動駕駛汽車以理想狀態(tài)進(jìn)行操作計(jì)算得到的危險(xiǎn)域范圍。 值得注意的是,為保證數(shù)據(jù)的可比性,計(jì)算該值時(shí),參數(shù)標(biāo)準(zhǔn)化過程應(yīng)將理想危險(xiǎn)參數(shù)映射到測試危險(xiǎn)參數(shù)域進(jìn)行標(biāo)準(zhǔn)化。
由式(19)可知,場景危險(xiǎn)率值越小,則表示所測試的自動駕駛算法在給定的多維度邏輯場景下安全性越好,其下限值為1。 如果Rd值超過1.5,算法的安全性就比較差,需要進(jìn)一步優(yōu)化。
為驗(yàn)證所提出的聚類評價(jià)方法的可行性,以Prescan 軟件基礎(chǔ)包自帶的一種黑盒自動駕駛算法為例,進(jìn)行測試應(yīng)用。 算法的輸入包括本車速度、雷達(dá)探測范圍、探測角度相對速度等,輸出包括發(fā)動機(jī)轉(zhuǎn)矩、制動踏板行程。
選擇前車緊急制動多維度邏輯場景進(jìn)行測試,如圖2 所示。 場景參數(shù)為本車初速度v1、前車與本車之間的初始距離e和前車初速度v2,它們的參數(shù)空間分別為[15 m/s,30 m/s]、[30 m,50 m]、[25 m/s,35 m/s]。 測試時(shí),被測車輛以初速度v1在中間車道向前行駛;前車在本車前距離e處以初速度v2向前行駛,并以8 m/s2的減速度進(jìn)行減速,持續(xù)1.5 s;之后,前車以3 m/s2的加速度加速,持續(xù)3 s;最后前車以1 m/s2的加速度緩慢加速直至30 m/s。
首先根據(jù)傳感器模型性能和軟件平臺的仿真頻率,對多維度邏輯場景參數(shù)進(jìn)行離散化以形成具體測試用例,選擇速度的離散步長為1 m/s,距離的離散步長為1 m。
圖2 測試場景示意圖
對具體測試用例進(jìn)行遍歷測試,共測試3 696次,選擇碰撞時(shí)間(time to collision,TTC)的倒數(shù)TTC-1作為危險(xiǎn)參數(shù)選擇條件,獲取危險(xiǎn)場景參數(shù)原始數(shù)據(jù)集,共獲得危險(xiǎn)參數(shù)82 個(gè),如圖3 所示。
圖3 危險(xiǎn)參數(shù)原始數(shù)據(jù)集
對危險(xiǎn)參數(shù)進(jìn)行對稱處理后,計(jì)算得到:危險(xiǎn)參數(shù)的均值為(30,30,25),標(biāo)準(zhǔn)差為(5.236 6,1.298 7, 1.222 3)。將數(shù)據(jù)帶入 Z-score Normalization 標(biāo)準(zhǔn)化處理公式,得到預(yù)處理后的危險(xiǎn)參數(shù)集,如圖4 所示。
圖4 預(yù)處理后的危險(xiǎn)參數(shù)集
經(jīng)過組內(nèi)殘差平方和計(jì)算可得該危險(xiǎn)參數(shù)集的聚類中心為1,可直接對預(yù)處理后的危險(xiǎn)參數(shù)進(jìn)行單高斯模型聚類,該三維高斯模型在所有維度的標(biāo)準(zhǔn)差都為1,均值都為0,修正后的高斯分布標(biāo)準(zhǔn)差都為0.577 4。
將高斯聚類模型參數(shù)帶入安全性評價(jià)指標(biāo)進(jìn)行計(jì)算。
首先需要計(jì)算不同維度危險(xiǎn)參數(shù)的重要程度系數(shù)。 根據(jù)該邏輯場景3 個(gè)參數(shù)的危險(xiǎn)性影響,定義參數(shù)的判別矩陣如式(20)所示。
可計(jì)算得到該矩陣的最大特征值為3.004,對應(yīng)的加權(quán)向量為[0.1220,0.6483,0.2297]。
進(jìn)行一致性檢驗(yàn),CI、RI和CR的值分別為0.002、0.52、0.003 8,顯然,CR小于 0.1,通過一致性檢驗(yàn),危險(xiǎn)參數(shù)的重要程度系數(shù)即為
[0.1220,0.6483,0.2297]
代入式(15),可得S1=0.3333。
下面,計(jì)算理論最小危險(xiǎn)域范圍Smin。 在該測試場景下,被測車輛的理想制動減速度曲線如圖5所示[13],其分為3 個(gè)階段:第1 階段為滯后階段,車輛無制動;第2 階段為建壓階段,制動減速度勻速增加;第3 階段為勻減速階段,勻減速直至停車。 將理想狀況下測試車輛的位置-時(shí)間曲線與前車的位置-時(shí)間曲線做差,并將邏輯場景參數(shù)帶入其中,可得到碰撞試驗(yàn)點(diǎn)如圖6 所示,共發(fā)生碰撞22 次。
將該組數(shù)據(jù)進(jìn)行對稱處理,其均值為(30,30,25)、標(biāo)準(zhǔn)差為(2.2669,0.8660,0.9280)。Smin參數(shù)標(biāo)準(zhǔn)化過程應(yīng)將理想危險(xiǎn)參數(shù)映射到測試危險(xiǎn)參數(shù)域進(jìn)行標(biāo)準(zhǔn)化,其過程如式(21)所示,修正后Smin高斯分布的標(biāo)準(zhǔn)差σ*為(0.4329,0.6668,0.7592)。
圖5 自動駕駛汽車?yán)硐胫苿訙p速度曲線
圖6 理想狀態(tài)的危險(xiǎn)參數(shù)原始數(shù)據(jù)集
式中:sk_v為Smin計(jì)算標(biāo)準(zhǔn)化過程中使用的標(biāo)準(zhǔn)差參數(shù);sk_t為被測算法試驗(yàn)結(jié)果在標(biāo)準(zhǔn)化過程中使用的標(biāo)準(zhǔn)差參數(shù)。
將σ*代入式(10)進(jìn)行修正,并將之前得到的參數(shù)重要指數(shù)ω帶入式(15),得到該邏輯場景中的Smin數(shù)值為 0.147 8。
將上述數(shù)值帶入式(19),可計(jì)算得到被測算法在該多維度邏輯場景下的場景危險(xiǎn)率為3.508 1,該算法的安全性較差。
綜上,應(yīng)用本文中提出的自動駕駛安全性聚類評價(jià)方法對該算法進(jìn)行測試評價(jià),結(jié)果表明,該方法可綜合考慮算法在多維度邏輯場景下的統(tǒng)計(jì)學(xué)規(guī)律,獲得量化指標(biāo),實(shí)現(xiàn)更為全面的科學(xué)評價(jià)。
本文中面向多維度邏輯場景,提出了一種基于統(tǒng)計(jì)規(guī)律的自動駕駛安全性聚類評價(jià)方法。 首先對多維度邏輯場景危險(xiǎn)參數(shù)進(jìn)行了聚類;然后,利用聚類結(jié)果,提出危險(xiǎn)域離散度、危險(xiǎn)域范圍兩個(gè)基本評價(jià)指標(biāo),并將其耦合形成自動駕駛安全性聚類評價(jià)參數(shù)——場景危險(xiǎn)率;最后,應(yīng)用該方法對一種黑盒自動駕駛算法進(jìn)行了測試評價(jià)。 本文中提出的自動駕駛安全性聚類評價(jià)方法可綜合考慮算法在多維度邏輯場景下的統(tǒng)計(jì)學(xué)規(guī)律,獲得量化指標(biāo),實(shí)現(xiàn)更為全面的科學(xué)評價(jià)。
多維度邏輯場景危險(xiǎn)參數(shù)的準(zhǔn)確獲取是自動駕駛安全性聚類評價(jià)的基礎(chǔ),但對于不同測試場景,其定義和指標(biāo)不盡相同,未來將進(jìn)一步深入研究多維度邏輯場景危險(xiǎn)參數(shù)的指標(biāo)定義和篩選方法。