楊姣姣 李嘉輝
1.湖北文理學(xué)院 純電動(dòng)汽車動(dòng)力系統(tǒng)設(shè)計(jì)與測(cè)試湖北省重點(diǎn)實(shí)驗(yàn)室 湖北省襄陽(yáng)市 441053
2.湖北文理學(xué)院 汽車與交通工程學(xué)院 湖北省襄陽(yáng)市 441053
在人-車-道路-環(huán)境系統(tǒng)中,駕駛?cè)耸窃斐山煌ㄊ鹿实闹饕?,而分心駕駛又是影響駕駛?cè)说闹饕蛩豙1]。分心駕駛是對(duì)不同駕駛分心狀態(tài)的總稱,實(shí)際研究中又將其分為聽(tīng)覺(jué)分心、視覺(jué)分心、認(rèn)知分心和動(dòng)作分心四種類型。因此研究駕駛分心識(shí)別對(duì)于減少分心駕駛導(dǎo)致的交通事故具有重要意義。
為了有效減少駕駛分心帶來(lái)的交通事故,近年來(lái)有許多學(xué)者在駕駛分心識(shí)別方面做了大量的研究。通過(guò)采用不同的指標(biāo)、不同的機(jī)器學(xué)習(xí)方法和深度學(xué)習(xí)方法對(duì)分心識(shí)別展開(kāi)了深入研究。目前,缺乏對(duì)駕駛分心識(shí)別方法的全面綜述。本文將主要從駕駛分心類型、影響因素、識(shí)別指標(biāo)、識(shí)別方法進(jìn)行詳細(xì)地闡述。著重對(duì)比分析機(jī)器學(xué)習(xí)和深度學(xué)習(xí)在駕駛分心識(shí)別方面的優(yōu)劣,為開(kāi)展駕駛分心識(shí)別研究提供借鑒。
根據(jù)國(guó)際標(biāo)準(zhǔn)化組織定義(ISO)分心駕駛是指:駕駛時(shí)注意力指向與正常駕駛不相關(guān)的活動(dòng),從而導(dǎo)致駕駛操作能力下降的一種現(xiàn)象[2]。駕駛分心目前基本被分為四種類型:認(rèn)知分心(思緒走神)、視覺(jué)分心(駕駛員眼動(dòng)視線離開(kāi)原本道路)、聽(tīng)覺(jué)分心(聊天、語(yǔ)音)以及操作分心(接打電話、手離開(kāi)方向盤)[3]。張輝等[4]通過(guò)對(duì)實(shí)際駕駛?cè)笋{駛情況的觀察統(tǒng)計(jì)發(fā)現(xiàn)駕駛情況中更多的是兩種以上分心活動(dòng)同時(shí)出現(xiàn)。例如聽(tīng)覺(jué)-視覺(jué)分心(駕駛員與車內(nèi)人員聊天時(shí)不自覺(jué)的視線離開(kāi)當(dāng)前眼動(dòng)區(qū)域),認(rèn)知-操作分心(駕駛疲勞導(dǎo)致操作方向盤失控)等,且不同分心狀態(tài)下檢驗(yàn)駕駛指標(biāo)也存在顯著性偏差。駕駛影響因素可分為三類:駕駛?cè)擞绊懸蛩亍④囕v影響因素和交通環(huán)境影響因素[5]。駕駛?cè)擞绊懸蛩厥欠中闹饕颍瑢?duì)此研究比較多面化。不同年齡、性別、對(duì)駕駛操作的熟練度都可能會(huì)引起不同程度的駕駛分心[1]。車輛影響因素包括車輛的性能、類型、變速箱種類、駕駛輔助系統(tǒng)等。李晨[6]基于貨車駕駛?cè)朔中淖R(shí)別研究一文中,分析了駕駛?cè)朔中膶?duì)車輛運(yùn)行狀態(tài)的影響。交通環(huán)境影響因素包括道路設(shè)計(jì)、道路質(zhì)量、道路綠化、道路交通量、及不同天氣狀況下對(duì)交通道路的影響。這三種影響因素中駕駛?cè)吮旧淼挠绊懸蛩貙?duì)分心駕駛作用最大。
根據(jù)對(duì)不同駕駛分心類別的模擬實(shí)驗(yàn)及實(shí)車實(shí)驗(yàn),用于判斷駕駛員駕駛分心的識(shí)別指標(biāo)可分為六種:駕駛績(jī)效、眼動(dòng)指標(biāo)、生理心理指標(biāo)、面部與頭部指標(biāo)、融合指標(biāo)。
3.1.1 駕駛績(jī)效
駕駛員對(duì)于車輛的操作信息即駕駛績(jī)效,駕駛績(jī)效可具體表現(xiàn)為駕駛員對(duì)車輛的橫向控制與縱向控制[2]。橫向控制指標(biāo)有:橫向加速度、方向盤轉(zhuǎn)向等,縱向控制指標(biāo)有:縱向加速度、油門大小、前后跟車距離等[7]。已知駕駛分心研究大多采用單項(xiàng)指標(biāo)對(duì)某一影響因素進(jìn)行測(cè)量記錄分析,如選取車輛橫擺角速度,駕駛員在分心時(shí)車輛跟車距離等。但一般現(xiàn)實(shí)情況涉及到的單項(xiàng)指標(biāo)較少,且隨機(jī)兩項(xiàng)以上指標(biāo)比較常見(jiàn)。多項(xiàng)指標(biāo)共存出現(xiàn)的情況較多,這就導(dǎo)致駕駛績(jī)效測(cè)量結(jié)果偏差較大。
3.1.2 眼動(dòng)數(shù)據(jù)
眼動(dòng)指標(biāo)是通過(guò)攝像機(jī)捕捉到瞳孔和眼角的距離變化來(lái)判斷駕駛員是否分心,需佩戴眼動(dòng)儀等設(shè)備進(jìn)行收集瞳孔變化圖像。實(shí)施起來(lái)精確程度有限。目前也有基于瞳孔的駕駛分心檢測(cè),采用Viola-jones 算法提取人臉眼睛附近區(qū)域,再通過(guò)匹配得到瞳孔和眼角位置差[8]。
3.1.3 生理數(shù)據(jù)
生理數(shù)據(jù)包括:心電信號(hào),腦電波信號(hào),血壓等,這些數(shù)據(jù)能顯著地反映當(dāng)前駕駛員生理信息[9]。相較其他數(shù)據(jù)也能更科學(xué)地給出駕駛員生理情況變化,對(duì)這些測(cè)量指標(biāo)在醫(yī)學(xué)上也能給出較為嚴(yán)謹(jǐn)?shù)慕忉?。但不得不否認(rèn)測(cè)量周期長(zhǎng),數(shù)據(jù)需得積累到一定數(shù)量才有可靠性。
3.1.4 駕駛?cè)嗣娌?/p>
通過(guò)頭部轉(zhuǎn)向及面部表情變化同樣可以有效測(cè)量駕駛分心程度,隨著機(jī)器學(xué)習(xí)的發(fā)展,不少駕駛分心研究采用圖像識(shí)別對(duì)駕駛員面部各項(xiàng)數(shù)據(jù)進(jìn)行采集,之后進(jìn)行面部圖像處理與特征提取,再與已有標(biāo)準(zhǔn)駕駛員圖像進(jìn)行對(duì)比,得出差異大小[9]。在一定差距值內(nèi)測(cè)定為安全,超過(guò)規(guī)定差距值則判定為分心[10]。
以上四種指標(biāo)都是針對(duì)某種指標(biāo)的單一指標(biāo),可靠性較低。若要體現(xiàn)出更高的準(zhǔn)確率,則需融合以上指標(biāo)兩種至三種[11]。例如將眼動(dòng)數(shù)據(jù)與生理數(shù)據(jù)融合,通過(guò)構(gòu)建相關(guān)模型對(duì)分心情況進(jìn)行檢測(cè);或者將駕駛績(jī)效與眼動(dòng)數(shù)據(jù)進(jìn)行融合,再或是將生理數(shù)據(jù)、眼動(dòng)數(shù)據(jù)及駕駛?cè)嗣娌窟M(jìn)行結(jié)合對(duì)駕駛員分心情況進(jìn)行更精準(zhǔn)的檢測(cè)。這一融合方法體現(xiàn)了多方位的檢測(cè),更能說(shuō)明分心駕駛時(shí)的具體情形及數(shù)據(jù)。
表1 是對(duì)部分機(jī)器學(xué)習(xí)方法的簡(jiǎn)單總結(jié),這些已知的機(jī)器學(xué)習(xí)方法運(yùn)用到分心識(shí)別上大多是通過(guò)建立學(xué)習(xí)模型對(duì)駕駛?cè)朔中男袨檫M(jìn)行識(shí)別并判斷,在這些方法中向量機(jī)(SVM)分心識(shí)別模型在各類機(jī)器學(xué)習(xí)識(shí)別模型中占32.12%,模型通過(guò)遺傳算法優(yōu)化比對(duì)后的結(jié)果能達(dá)到93%以上的準(zhǔn)確率。但不同的數(shù)據(jù)、數(shù)據(jù)特征也會(huì)影響機(jī)器學(xué)習(xí)模型的準(zhǔn)確率,同時(shí)向量機(jī)(SVM)對(duì)樣本數(shù)據(jù)要求較大時(shí)難以訓(xùn)練,因此要根據(jù)實(shí)際數(shù)據(jù)類型及需求去選擇模型。
表1 機(jī)器學(xué)習(xí)方法分析
一些典型的深度學(xué)習(xí)方法見(jiàn)表2,算法上很大程度上依賴于高端機(jī)器,而傳統(tǒng)的機(jī)器學(xué)習(xí)算法允許在低端機(jī)器上面工作,因此深度學(xué)習(xí)對(duì)硬件配置有較高的要求。深度學(xué)習(xí)大多通過(guò)神經(jīng)網(wǎng)絡(luò)實(shí)現(xiàn)分心駕駛的分類識(shí)別,同時(shí)通過(guò)不斷調(diào)整數(shù)據(jù)集,訓(xùn)練大量模型,對(duì)多源駕駛信息進(jìn)行融合,以此提高分心識(shí)別的準(zhǔn)確率。已提出的CNN 模型、MH-SSD 網(wǎng)絡(luò)模型、YOLOv5 模型等在算法基層網(wǎng)絡(luò)上進(jìn)行改進(jìn),引入注意力機(jī)制來(lái)加強(qiáng)對(duì)目標(biāo)物體的檢測(cè)。Video Swin Transformer 用于實(shí)時(shí)抽煙、打電話動(dòng)作識(shí)別,并將局部注意力計(jì)算的范圍從空間擴(kuò)展到時(shí)空域,在FFN 之后添加一層Sparsification Module(SPM) 對(duì)整個(gè)網(wǎng)絡(luò)進(jìn)行分層稀疏化。在公開(kāi)數(shù)據(jù)集Kinetics400 和Moments in time 中進(jìn)行實(shí)驗(yàn),結(jié)果與現(xiàn)有方法相比取得速度與精度最為平衡的結(jié)果。
表2 深度學(xué)習(xí)方法分析
深度學(xué)習(xí)源于機(jī)器學(xué)習(xí),能通過(guò)學(xué)習(xí)、處理、分析大量數(shù)據(jù)動(dòng)態(tài)檢測(cè)分心行為。目前研究深度學(xué)習(xí)的文獻(xiàn)占所有識(shí)別模型的25%,趨于這方面的研究逐漸偏多。
本文基于車輛駕駛指標(biāo),主要分析了駕駛?cè)朔中臓顟B(tài)識(shí)別方法,主要研究結(jié)論如下:
(1)對(duì)駕駛?cè)朔中淖R(shí)別的指標(biāo)可分為兩大類:?jiǎn)雾?xiàng)指標(biāo)和融合指標(biāo)。單項(xiàng)指標(biāo)又包括駕駛績(jī)效、生理指標(biāo)、眼動(dòng)指標(biāo)等,融合指標(biāo)則是融合兩項(xiàng)及兩項(xiàng)以上的單項(xiàng)指標(biāo)。就各項(xiàng)研究數(shù)據(jù)表示,融合指標(biāo)對(duì)實(shí)際駕駛分心判別的準(zhǔn)確率更高,根據(jù)大量學(xué)者研究表示未來(lái)基于融合指標(biāo)數(shù)據(jù)的研究更有效,因此未來(lái)更傾向于參考融合指標(biāo)的數(shù)據(jù)。
(2)機(jī)器學(xué)習(xí)算法有決策樹(shù)、向量機(jī)模型(svm)、貝葉斯網(wǎng)絡(luò)、AdaBoost 算法等,當(dāng)分心特征數(shù)量較多時(shí),向量機(jī)模型(svm)識(shí)別更有優(yōu)勢(shì)一些,能較好地融合各類分心指標(biāo),保留原模型的圖像特征檢測(cè)能力,如機(jī)器學(xué)習(xí)對(duì)駕駛?cè)诵袨?、圖像的檢測(cè)識(shí)別,有利于實(shí)現(xiàn)分心駕駛行為的識(shí)別,但同時(shí)存在檢測(cè)數(shù)據(jù)量偏小,穩(wěn)定性較差等問(wèn)題。具體識(shí)別時(shí)要根據(jù)分心識(shí)別的數(shù)據(jù)類型和特點(diǎn)來(lái)選擇合適的模型。
(3)深度學(xué)習(xí)包括各種網(wǎng)絡(luò)模型,像BP 神經(jīng)網(wǎng)絡(luò)、卷積神經(jīng)網(wǎng)絡(luò)、記憶神經(jīng)網(wǎng)絡(luò)等。深度學(xué)習(xí)的平均準(zhǔn)確率較高,在穩(wěn)定性和對(duì)數(shù)據(jù)的支撐上也高于傳統(tǒng)機(jī)器學(xué)習(xí)。相對(duì)機(jī)器學(xué)習(xí)來(lái)說(shuō)較少,但它有著不可忽略的優(yōu)勢(shì):可處理數(shù)據(jù)量較多的模型、各模型準(zhǔn)確率的標(biāo)準(zhǔn)差小、穩(wěn)定性良好能實(shí)現(xiàn)端到端的解決問(wèn)題。在未來(lái)駕駛分心檢測(cè)模型中需分析大量樣本數(shù)據(jù),從數(shù)據(jù)中學(xué)習(xí)特征,在算法基層網(wǎng)絡(luò)上進(jìn)行改進(jìn),以及引入注意力機(jī)制來(lái)加強(qiáng)對(duì)目標(biāo)物體的檢測(cè)。