黃 晶,彭 揚(yáng),黃 燁,彭曉燕
(湖南大學(xué)機(jī)械與運(yùn)載工程學(xué)院,長(zhǎng)沙 410082)
駕駛車輛是一項(xiàng)復(fù)雜的任務(wù),涉及到視覺、聽覺、記憶和決策等多方面的因素,而這些因素都會(huì)對(duì)駕駛員的精神負(fù)荷產(chǎn)生影響。每位駕駛員能承受的精神負(fù)荷都是有極限的,適當(dāng)?shù)木褙?fù)荷對(duì)駕駛安全十分重要,精神負(fù)荷過高或過低,車輛駕駛績(jī)效指標(biāo)都會(huì)下降。有研究表明,精神負(fù)荷與工作績(jī)效之間的關(guān)系呈“倒U”型。精神負(fù)荷一般可分為低負(fù)荷區(qū)、最佳負(fù)荷區(qū)和高負(fù)荷區(qū)。通常在最佳負(fù)荷區(qū)下,工作績(jī)效表現(xiàn)最為良好,進(jìn)入高精神負(fù)荷區(qū)后,工作績(jī)效則開始下降,并對(duì)安全產(chǎn)生影響。而當(dāng)精神負(fù)荷處于低負(fù)荷區(qū)時(shí),則容易出現(xiàn)注意力不集中、警惕性降低等現(xiàn)象,同樣影響工作績(jī)效。
目前的研究中,常用的駕駛員精神負(fù)荷評(píng)價(jià)方法有主觀評(píng)價(jià)法、駕駛員生理數(shù)據(jù)評(píng)價(jià)法和車輛行駛數(shù)據(jù)評(píng)價(jià)法等。主觀評(píng)價(jià)法常使用主觀工作量評(píng)估技術(shù)表(SWAT)和美國(guó)航空航天局任務(wù)負(fù)荷表(NASA-TLX)。NASA-TLX 表將負(fù)荷劃分為6 個(gè)維度:精神需求、體力需求、時(shí)間需求、自身績(jī)效、努力程度和挫敗感。NASA-TLX 相比于SWAT 更具有優(yōu)勢(shì),一方面是評(píng)價(jià)負(fù)荷的維度更多,另一方面是使用的場(chǎng)景更加廣泛,也是最常用的主觀評(píng)價(jià)方法。已經(jīng)有很多研究使用了NASA-TLX 表,并證實(shí)了其有效性。駕駛員生理數(shù)據(jù)評(píng)價(jià)法是通過生理信號(hào)采集設(shè)備采集駕駛員生理信號(hào),從中提取相關(guān)特征進(jìn)行分析。常用的生理信號(hào)主要有腦電信號(hào)EEG、心電信號(hào)ECG、眼電信號(hào)EOG等,也有研究使用多種生理信號(hào)來進(jìn)行精神負(fù)荷評(píng)價(jià)。車輛行駛數(shù)據(jù)評(píng)價(jià)法則是使用車速、加速度、橫向位置和換道信息等數(shù)據(jù)對(duì)駕駛員的精神負(fù)荷進(jìn)行評(píng)價(jià)。3 種評(píng)價(jià)方法各有其優(yōu)缺點(diǎn)。主觀評(píng)價(jià)法易于測(cè)試,實(shí)現(xiàn)成本較低,但一般需要駕駛員完成駕駛后再填寫問卷,實(shí)時(shí)性較差,且容易受到駕駛員的主觀感受的影響。生理數(shù)據(jù)和車輛行駛數(shù)據(jù)評(píng)價(jià)法可以在駕駛過程中采集數(shù)據(jù),實(shí)時(shí)性好,但因不同駕駛員的生理特性具有差異,故采用生理數(shù)據(jù)評(píng)價(jià)法時(shí),須謹(jǐn)慎設(shè)定精神負(fù)荷的界定閾值,而車輛行駛數(shù)據(jù)評(píng)價(jià)方法則容易受車型和道路狀況的影響。
使用機(jī)器學(xué)習(xí)算法構(gòu)建的駕駛員精神負(fù)荷評(píng)價(jià)模型性能的好壞,不僅與所使用的算法有關(guān),也與制作的數(shù)據(jù)集有關(guān)。一個(gè)高質(zhì)量的數(shù)據(jù)集往往能夠提高模型訓(xùn)練的質(zhì)量和預(yù)測(cè)的準(zhǔn)確率。其中,數(shù)據(jù)集噪聲標(biāo)簽的檢測(cè)與處理對(duì)機(jī)器學(xué)習(xí)模型的訓(xùn)練具有十分重要的工程應(yīng)用價(jià)值。以往的研究通常直接以駕駛場(chǎng)景中有無次任務(wù)來定義精神負(fù)荷的分類標(biāo)簽,但是實(shí)驗(yàn)過程中,志愿者在正常駕駛情景下也可能會(huì)陷入自我思維中而導(dǎo)致自身精神負(fù)荷增加,且同一次任務(wù)對(duì)不同駕駛員精神負(fù)荷的影響也不盡相同。因此,完全根據(jù)駕駛場(chǎng)景來給定數(shù)據(jù)集標(biāo)簽可能會(huì)產(chǎn)生誤差,即存在噪聲標(biāo)簽。
本研究針對(duì)傳統(tǒng)方法所制作的數(shù)據(jù)集可能存在噪聲標(biāo)簽從而影響精神負(fù)荷評(píng)價(jià)模型訓(xùn)練效果的問題,設(shè)計(jì)并開展了駕駛模擬實(shí)驗(yàn),采集駕駛志愿者的多維客觀測(cè)量數(shù)據(jù)(心電信號(hào)、腦電信號(hào)、皮電信號(hào)),基于置信學(xué)習(xí)的方法,對(duì)駕駛員的精神負(fù)荷分類標(biāo)簽進(jìn)行噪聲檢測(cè),并修剪噪聲標(biāo)簽數(shù)據(jù),最后使用支持向量機(jī)、隨機(jī)森林、K 近鄰、多層感知機(jī)、決策樹和邏輯回歸等算法構(gòu)建駕駛員精神負(fù)荷評(píng)價(jià)模型,分析噪聲標(biāo)簽處理對(duì)各駕駛員精神負(fù)荷評(píng)價(jià)模型性能的提升效果。
實(shí)驗(yàn)招募了20 名駕駛志愿者,年齡分布在22~25 歲之間,以減少年齡差異對(duì)實(shí)驗(yàn)結(jié)果的影響。所有駕駛志愿者都持有有效C1 駕駛證,視力正常,身體健康,無疾病史,并且在實(shí)驗(yàn)前一晚休息充分。實(shí)驗(yàn)中,使用的駕駛模擬設(shè)備為羅技G29駕駛模擬器,并通過UC-win/Road 建模軟件生成所設(shè)定的駕駛環(huán)境和交通狀況。通過該模擬器和軟件,可以采集速度、加速度、橫向偏差和轉(zhuǎn)向盤轉(zhuǎn)角等多種車輛運(yùn)行數(shù)據(jù)。駕駛員生理信號(hào)采集設(shè)備選用的是BIOPAC公司的MP150-BioNomadix 型多導(dǎo)無線生理分析記錄系統(tǒng),可采集駕駛志愿者的心電、腦電、呼吸等生理信號(hào),該采集設(shè)備為穿戴式,不會(huì)影響駕駛志愿者的駕駛操作。
本實(shí)驗(yàn)設(shè)置了兩種典型的跟車駕駛場(chǎng)景,一種是直道跟車駕駛場(chǎng)景,另一種是彎道跟車駕駛場(chǎng)景,均為寬度為3.5 m的雙向4車道,交通狀況設(shè)置為自由流,交通密度大約為7 輛/km。前方的車輛速度保持在55 km/h 左右,距前車的初始距離為50 m。在直道和彎道場(chǎng)景下又都分別設(shè)置了有次任務(wù)駕駛場(chǎng)景和無次任務(wù)駕駛場(chǎng)景,因此共有4 種駕駛場(chǎng)景。駕駛過程中的次任務(wù)選擇的是1-back 任務(wù)。選用NASA-TLX 主觀負(fù)荷評(píng)價(jià)表,在每階段實(shí)驗(yàn)結(jié)束后,讓駕駛員填寫評(píng)價(jià)表,對(duì)精神需求、體力需求、時(shí)間需求、自身績(jī)效、努力程度、挫敗感6 個(gè)維度進(jìn)行評(píng)價(jià),并取6 個(gè)維度評(píng)價(jià)的算術(shù)平均值作為最后主觀負(fù)荷評(píng)價(jià)的結(jié)果。駕駛模擬實(shí)驗(yàn)設(shè)計(jì)如圖1所示。
圖1 駕駛模擬實(shí)驗(yàn)設(shè)計(jì)
實(shí)驗(yàn)可分為3 個(gè)主要階段。首先向駕駛志愿者說明實(shí)驗(yàn)的步驟與要求,并讓志愿者佩戴好生理信號(hào)采集設(shè)備,熟悉駕駛模擬器;然后讓駕駛志愿者進(jìn)行5 min 的靜息調(diào)整,開始駕駛模擬實(shí)驗(yàn);在每個(gè)場(chǎng)景下的駕駛結(jié)束后,填寫NASA-TLX 主觀負(fù)荷評(píng)價(jià)表,并保存相關(guān)的實(shí)驗(yàn)數(shù)據(jù)。
駕駛志愿者在直道正常駕駛、彎道正常駕駛、直道有次任務(wù)駕駛、彎道有次任務(wù)駕駛4 個(gè)場(chǎng)景下的NASA-TLX 主觀負(fù)荷評(píng)價(jià)分?jǐn)?shù)如表1 所示。由表可見,直道次任務(wù)駕駛場(chǎng)景下的平均評(píng)分比直道正常駕駛場(chǎng)景下的平均評(píng)分高1.87 倍;彎道次任務(wù)駕駛場(chǎng)景下的平均評(píng)分比彎道正常駕駛場(chǎng)景下的平均評(píng)分高1.99倍。
表1 NASA-TLX主觀負(fù)荷評(píng)分(平均值±標(biāo)準(zhǔn)差)
考慮到主觀負(fù)荷評(píng)分不符合正態(tài)分布,對(duì)不同駕駛場(chǎng)景下的主觀評(píng)分進(jìn)行Kruskal-wallis 非參數(shù)檢驗(yàn),結(jié)果如表2 所示。由表可見,次任務(wù)駕駛場(chǎng)景下的主觀負(fù)荷評(píng)價(jià)分?jǐn)?shù)與正常駕駛場(chǎng)景下的主觀負(fù)荷評(píng)價(jià)分?jǐn)?shù)相比,具有顯著性差異(<0.05),實(shí)驗(yàn)設(shè)計(jì)的次任務(wù)較為合理,能夠有效地誘導(dǎo)駕駛員產(chǎn)生較高的精神負(fù)荷。
表2 不同駕駛場(chǎng)景下主觀負(fù)荷評(píng)分的非參數(shù)檢驗(yàn)
實(shí)驗(yàn)中采集了駕駛員的腦電信號(hào)EEG、心電信號(hào)ECG 和皮電信號(hào)EDA 數(shù)據(jù),由于生理信號(hào)比較微弱,容易受到外界因素的干擾。因此,本研究針對(duì)心電信號(hào)ECG 的基線漂移和工頻噪聲,分別采用帶陷濾波器和零相位數(shù)字濾波器進(jìn)行預(yù)處理:采用頻率為50 Hz 的陷波濾波器對(duì)腦電信號(hào)EEG 進(jìn)行濾波降噪處理,并基于離散小波變換DWT 與經(jīng)驗(yàn)?zāi)B(tài)分解EMD 集合的方法去除腦電信號(hào)中的眼電偽跡;采用低通濾波器對(duì)皮電信號(hào)進(jìn)行濾波處理。
考慮到生理信號(hào)的非線性,利用非線性動(dòng)力學(xué)方法分析生理信號(hào)可以得到更完整的信息。本文在提取各信號(hào)的時(shí)域、頻域特征的同時(shí),使用混沌理論提取生理信號(hào)的非線性特征,包括微分熵、樣本熵、近似熵、Higuchi 分形維數(shù)、L-Z 復(fù)雜度和Poincaré散點(diǎn)圖等,如表3所示。
表3 初始提取的生理信號(hào)特征表
為了消除不同特征之間數(shù)量級(jí)和量綱的影響,對(duì)特征進(jìn)行歸一化處理,其計(jì)算公式為
式中:min()代表特征值的最小值;max()代表特征值的最大值。
為消除冗余特征,降低模型計(jì)算成本,對(duì)初始提取的60 維特征進(jìn)行卡方檢驗(yàn),消除與分類任務(wù)無關(guān)的特征。文中以0.05 作為顯著水平,當(dāng)卡方檢驗(yàn)的值小于0.05 時(shí),表明兩組數(shù)據(jù)具有顯著相關(guān)性。以心電信號(hào)為例,心電特征的卡方檢驗(yàn)結(jié)果如表4所示,通過特征選擇,最終去除了以下19 維不顯著相關(guān)的特征:心電信號(hào)AVNN,RMSSD,SDSD,Mean_HR,Max_HR,LF_HF,SD1,SD1_SD2,CSI;腦電信號(hào)EEG_δ,EEG_mean,EEG_cv,EEG_LZCn;皮電 信 號(hào)EDA_min,EDA_cv,EDA_FD1,EDA_DE,EDA_HFD,EDA_LZCn等。
表4 心電特征的卡方檢驗(yàn)結(jié)果
在有監(jiān)督學(xué)習(xí)中,訓(xùn)練數(shù)據(jù)標(biāo)簽質(zhì)量的好壞對(duì)于模型的訓(xùn)練效果至關(guān)重要,如果用于模型訓(xùn)練的標(biāo)簽數(shù)據(jù)是錯(cuò)誤的,就很難訓(xùn)練出一個(gè)有效的模型。數(shù)據(jù)標(biāo)簽的給定工作很多時(shí)候都需要人工參與,標(biāo)簽質(zhì)量在某種程度上會(huì)受到人為主觀因素的影響,甚至許多廣泛使用的公開數(shù)據(jù)集中都包含有一定數(shù)量的噪聲標(biāo)簽,因此在進(jìn)行機(jī)器學(xué)習(xí)模型訓(xùn)練時(shí),有必要考慮數(shù)據(jù)集噪聲標(biāo)簽的影響。在制作駕駛員精神負(fù)荷數(shù)據(jù)集時(shí),現(xiàn)有研究多以駕駛場(chǎng)景中有無次任務(wù)來給定駕駛員的精神負(fù)荷分類標(biāo)簽,這種方法沒有考慮到駕駛員在正常駕駛情景下也有可能會(huì)陷入自我思維中而導(dǎo)致自身精神負(fù)荷增加的情況;此外,由于個(gè)體差異的影響,駕駛次任務(wù)對(duì)不同駕駛員精神負(fù)荷的影響并不相同,由傳統(tǒng)方法所制作的數(shù)據(jù)集標(biāo)簽并不完全準(zhǔn)確。
本文中置信學(xué)習(xí)(confidence learning,CL)表征、識(shí)別數(shù)據(jù)集中噪聲標(biāo)簽,這種方法屬于弱監(jiān)督學(xué)習(xí),它利用預(yù)測(cè)的概率和噪聲標(biāo)簽來對(duì)未歸一化置信聯(lián)合中的樣本進(jìn)行計(jì)數(shù),進(jìn)而估計(jì)噪聲標(biāo)簽與真實(shí)標(biāo)簽的聯(lián)合分布,并據(jù)此結(jié)合所得類別標(biāo)簽的置信度高低進(jìn)行排序,最終選擇出噪聲標(biāo)簽。
使用置信學(xué)習(xí)處理噪聲標(biāo)簽主要包括以下3 個(gè)步驟:估計(jì)噪聲標(biāo)簽和真實(shí)標(biāo)簽的聯(lián)合分布;找出并過濾掉錯(cuò)誤樣本;重新訓(xùn)練。本文中使用支持向量機(jī)模型來對(duì)各類別進(jìn)行預(yù)測(cè),其噪聲標(biāo)簽處理的工作流程如圖2所示。
圖2 使用置信學(xué)習(xí)處理噪聲標(biāo)簽的工作流程
為了驗(yàn)證噪聲標(biāo)簽處理對(duì)各類駕駛員精神負(fù)荷評(píng)價(jià)模型性能的提升效果,本文中使用了駕駛員精神負(fù)荷研究方面常用的幾種機(jī)器學(xué)習(xí)算法,如:支持向量機(jī)(SVM)、K 近鄰(KNN)、多層感知機(jī)(MLP)、決策樹(DT)、隨機(jī)森林(RF)和邏輯回歸(LR)等來構(gòu)建評(píng)價(jià)模型。使用噪聲標(biāo)簽處理前后的數(shù)據(jù)集分別進(jìn)行模型的訓(xùn)練,對(duì)比各模型的性能表現(xiàn)。將數(shù)據(jù)集隨機(jī)劃分為訓(xùn)練集和測(cè)試集,其中訓(xùn)練集占80%,測(cè)試集占20%,然后再在訓(xùn)練集中劃分出驗(yàn)證集和新的訓(xùn)練集,采用5 折交叉驗(yàn)證來進(jìn)行評(píng)估,模型調(diào)參使用網(wǎng)格搜索和學(xué)習(xí)曲線。
對(duì)于機(jī)器學(xué)習(xí)分類模型,常用的模型評(píng)價(jià)指標(biāo)為:準(zhǔn)確率、查全率、查準(zhǔn)率、分?jǐn)?shù)和特異度等。其中,查準(zhǔn)率表示所有被駕駛員精神負(fù)荷分類模型預(yù)測(cè)為高精神負(fù)荷的樣本中,真正的高精神負(fù)荷樣本所占的比例;查全率表示所有真實(shí)為高精神負(fù)荷的樣本中,被預(yù)測(cè)正確的樣本所占的比例;查準(zhǔn)率和查全率兩者此消彼長(zhǎng)。分?jǐn)?shù)是基于查全率和查準(zhǔn)率的調(diào)和平均定義,可以同時(shí)兼顧查全率和查準(zhǔn)率,分?jǐn)?shù)的計(jì)算公式為
式中:為查準(zhǔn)率;為查全率。分?jǐn)?shù)在[0,1]之間分布,越接近于1,表示模型效果越好。文中使用準(zhǔn)確率和分?jǐn)?shù)作為模型性能的評(píng)價(jià)指標(biāo)。
表5 為不同特征組合下,噪聲標(biāo)簽處理前后駕駛員精神負(fù)荷分類模型的準(zhǔn)確率和分?jǐn)?shù)對(duì)比表,其中all 代表:ECG+EEG+EDA。由于實(shí)驗(yàn)制作的駕駛員精神負(fù)荷數(shù)據(jù)集的樣本分布較為均衡,模型訓(xùn)練任務(wù)為二分類任務(wù),故計(jì)算得到的分?jǐn)?shù)與準(zhǔn)確率較為相近。
對(duì)表5 進(jìn)行橫向?qū)Ρ瓤梢?,以單一類型特征作為模型輸入的情況下,使用腦電信號(hào)時(shí),模型的準(zhǔn)確率和分?jǐn)?shù)最高,其中,又以RF 算法模型的性能最好,噪聲標(biāo)簽處理前其最高準(zhǔn)確率和分?jǐn)?shù)均為83.32%,處理后均為88.06%;使用兩種特征組合作為模型輸入時(shí),模型的性能皆有提高,而將心電、腦電、皮電3 種特征融合所構(gòu)建的駕駛員精神負(fù)荷模型的性能效果最好,其中,又以RF 算法模型的性能最好,噪聲標(biāo)簽處理前其最高準(zhǔn)確率和分?jǐn)?shù)均為88.61%,處理后兩者均為93.80%。可見使用多源信息特征作為模型的輸入,有助于提高駕駛員精神負(fù)荷分類模型的性能。
對(duì)表5 進(jìn)行縱向?qū)Ρ瓤梢?,使用置信學(xué)習(xí)進(jìn)行噪聲標(biāo)簽數(shù)據(jù)處理后,基于多種算法所構(gòu)建的駕駛員精神負(fù)荷模型的準(zhǔn)確率和分?jǐn)?shù)均得到了一定的提高。圖3 以性能最好的心電、腦電、皮電3 種特征融合所構(gòu)建的駕駛員精神負(fù)荷分類模型為例,示出噪聲標(biāo)簽處理后模型的準(zhǔn)確率和分?jǐn)?shù)的提升效果。從圖中可以看出,在各類模型中,支持向量機(jī)模型的提升效果最好,其后依次為:邏輯回歸模型、K近鄰模型、多層感知機(jī)模型、隨機(jī)森林模型、決策樹模型。
表5 不同類型特征組合下噪聲標(biāo)簽處理前后駕駛員精神負(fù)荷分類模型的準(zhǔn)確率和F1分?jǐn)?shù)對(duì)比 %
圖3 心電、腦電、皮電特征組合下噪聲標(biāo)簽處理后模型的準(zhǔn)確率和F1分?jǐn)?shù)提升效果圖
本文中通過實(shí)驗(yàn)設(shè)計(jì)誘導(dǎo)駕駛員在不同駕駛場(chǎng)景下產(chǎn)生不同的精神負(fù)荷,并采集駕駛員的多源生理信號(hào)。在此基礎(chǔ)上構(gòu)建了駕駛員精神負(fù)荷評(píng)價(jià)數(shù)據(jù)集,并使用置信學(xué)習(xí)方法對(duì)駕駛員精神負(fù)荷數(shù)據(jù)集中的噪聲標(biāo)簽進(jìn)行檢測(cè)和修剪。最后采用駕駛員精神負(fù)荷研究領(lǐng)域常用的幾種機(jī)器學(xué)習(xí)算法構(gòu)建評(píng)價(jià)模型,對(duì)比分析噪聲標(biāo)簽處理前后對(duì)提升各類模型性能的效果,得出結(jié)論如下。
(1)與使用單一類型的特征進(jìn)行駕駛員精神負(fù)荷評(píng)價(jià)相比,使用多源信息特征后顯著改善了駕駛員精神負(fù)荷分類模型的性能。
(2)對(duì)駕駛員精神負(fù)荷數(shù)據(jù)集的噪聲標(biāo)簽進(jìn)行處理后,基于各種機(jī)器算法構(gòu)建的模型性能得到明顯提升。其中支持向量機(jī)模型的提升效果最大,最高準(zhǔn)確率和分?jǐn)?shù)皆從87.05%提升到了93.13%,兩者皆升高了6.08個(gè)百分點(diǎn)。
(3)目前駕駛員精神負(fù)荷評(píng)價(jià)實(shí)質(zhì)上是對(duì)駕駛員的精神負(fù)荷狀態(tài)進(jìn)行分類,但是駕駛員的精神負(fù)荷本身并不是離散值,而是連續(xù)值,后續(xù)工作中將嘗試尋找合適的指標(biāo)來實(shí)現(xiàn)對(duì)駕駛員精神負(fù)荷的量化分析。