董長青 丁田妹 黃曉延 趙鵬超
摘要:隨著無人駕駛快速的發(fā)展,用戶對駕駛體驗(yàn)的需求越來越高,良好的人機(jī)交互有助于提升駕駛體驗(yàn),并且加速無人駕駛市場化的進(jìn)程。本文從以人為中心的“人”的角度出發(fā),探討了無人駕駛領(lǐng)域涉及的兩類主要人群駕駛者和行人與汽車的人機(jī)交互,梳理了語音交互與手勢交互在無人駕駛領(lǐng)域的進(jìn)展以及車與車外人的交互方式,分析了各交互現(xiàn)有的問題并提出了相應(yīng)的建議。
關(guān)鍵詞:無人駕駛;人機(jī)交互;語音交互;手勢交互
1引言
隨著新一代信息技術(shù)的發(fā)展,汽車智能化、網(wǎng)聯(lián)化的趨勢豐富了無人駕駛的范疇與深度,極大地推動了無人駕駛商業(yè)化的進(jìn)程。無人駕駛在今天看來不算是一個全新的概念,部分車企巨頭已經(jīng)紛紛完成了無人駕駛的路測,并且各大汽車企業(yè)將無人駕駛初步商用化的時間點(diǎn)預(yù)估在2025年,不出10年,無人駕駛會成為現(xiàn)實(shí)。從無人駕駛理念的提出到發(fā)展至今的智能網(wǎng)聯(lián)化趨勢,無人駕駛本質(zhì)上都是解決人的出行需求。隨著各大汽車、互聯(lián)網(wǎng)及科技巨頭企業(yè)在ADAS(高級輔助駕駛系統(tǒng))、通信等方面的深入研究,無人駕駛作為一種出行方式,其在車輛安全駕駛的技術(shù)上有很大進(jìn)展,但目前各車企關(guān)于汽車與人的交互研究還不夠深入,情緒檢測、自適應(yīng)人機(jī)交互、眼球追蹤、語境語音等提升汽車智能化、差異化的HMI技術(shù)還不夠成熟,需要進(jìn)一步優(yōu)化。人機(jī)交互是無人駕駛市場化的關(guān)鍵,良好的人機(jī)系統(tǒng)有助于推動無人駕駛商用的進(jìn)程,正如清華大學(xué)汽車工程系副教授、智能交通學(xué)者李升波所說“人機(jī)交互是無人駕駛汽車市場化的最后門檻”。
人機(jī)交互是以“人”為核心,無人駕駛涉及到的直接“人”有兩種,車內(nèi)人與車外人,車內(nèi)人主要以駕駛員為核心,車外人主要以行人為核心。本文將從“人”的角度出發(fā),探討不同身份的人與車的交互方式。對于車內(nèi)人,目前各企業(yè)研究的熱點(diǎn)集中在語音識別、手勢控制這兩種交互技術(shù)上;對于車外人,目前與之相關(guān)的研究較少,人為駕駛模式的時候,行人通常會與司機(jī)有目光的交流以增加安全感,而無人駕駛階段,這一互動就尤為困難,那么對行人開發(fā)新的信息反饋方式顯得尤為必要,所以對車外人來說,車與人的交互方式是以信息反饋為目標(biāo)進(jìn)行研究。
2車內(nèi)人與車的交互方式
2.1語音交互
語音交互最基本的目的是輔助行車安全,在安全性保障的基礎(chǔ)上被用于提升車內(nèi)的體驗(yàn)樂趣。根據(jù)車載市場語音調(diào)查報告顯示,40%的車企已將語音交互技術(shù)搭載在自己的產(chǎn)品上、50%的車企正在開發(fā)語音交互系統(tǒng),可見語音交互將逐漸成為車聯(lián)網(wǎng)交互方式的主流,預(yù)計(jì)其將會成為無人駕駛領(lǐng)域排名第一的人機(jī)交互方式。語音交互的模式為語音系統(tǒng)置入智能手機(jī)或語音系統(tǒng)配置在車載終端上兩種方式,車企中采用用智能手機(jī)為語音操作端的解決方案以寶馬、福特、通用、現(xiàn)代等企業(yè)為代表,語音系統(tǒng)搭載車載終端的企業(yè)以奧迪、通用、現(xiàn)代、特斯拉、吉利、長安等為代表,主要的功能以撥打電話、導(dǎo)航、娛樂系統(tǒng)命令下達(dá)等為主。汽車領(lǐng)域現(xiàn)有的代表性的語音交互系統(tǒng)有Nuance通信公司的Dragon Drive語音助手、奇瑞和科大訊飛聯(lián)合開發(fā)的Cloudrive2.0系統(tǒng)。Dragon Drive語音助手可以實(shí)現(xiàn)撥打電話、閱讀信息、智能導(dǎo)航、車輛保養(yǎng)維修預(yù)約等功能,具有自然語音識別及語言語境學(xué)習(xí)的能力,并且能夠與駕駛員進(jìn)行簡單的對話;Cloudrive2.0系統(tǒng)的亮點(diǎn)在于自然語言的識別,可以識別16種方言,以及強(qiáng)大的降噪能力使得語音交互更加智能、精準(zhǔn)。
語音交互在實(shí)際的運(yùn)用過程中其實(shí)并不是很成熟,根據(jù)美國J.D.Power機(jī)構(gòu)發(fā)布2016汽車新車質(zhì)量調(diào)查顯示,在眾多交互的問題中,語音交互故障率高達(dá)23%。語音交互主要的問題有:(1)交互的自然性低,現(xiàn)階段語音命令主要以固定的搭配為主,可以接收的命令有限,而且受到地方口音與專有名詞以及特殊語義的限制,大大降低了語音系統(tǒng)的識別性;(2)靈活性不夠,系統(tǒng)對駕駛者發(fā)出的命令不能做出靈活性的修正,在駕駛?cè)藛T口誤的情況下,即使提高了識別的準(zhǔn)確率,也無法獲得正確的交互;(3)抗噪性,部分情況下車內(nèi)不是單獨(dú)只有駕駛員,還有其它乘客,語音交互系統(tǒng)如何正確區(qū)分駕駛員的命令、乘客之間的交流也是要解決的問題。在無人駕駛車輛中,駕駛員對安全行駛的注意力會減弱,更多精力會投入到其它事情當(dāng)中,對車內(nèi)交互深度與智能度要求會更高,全自然的語音交流將成為用戶真正渴望的交互方式,未來的語音交互不單單是命令式交互,更多的是場景化的應(yīng)用。
2.2手勢交互
正確理解人類的手勢語言,同樣是汽車領(lǐng)域人機(jī)交互的研究熱點(diǎn)。相比較語音控制和觸摸屏,手勢交互的技術(shù)門檻更高,交互形式復(fù)雜,現(xiàn)階段的成熟度較低,手勢控制實(shí)現(xiàn)起來更加困難。手勢交互現(xiàn)階段只能完成一些簡單的交互,比如打電話、調(diào)節(jié)音量等操作。如表1為各巨頭企業(yè)在汽車手勢交互領(lǐng)域的研究。從表可看出,各企業(yè)在交互方式與交互內(nèi)容上各有差異,其中大陸基于減少駕駛員分心的理念將手勢識別集中在方向盤上,不同于其它企業(yè)將識別集中在中央扶手附近。此外,從技術(shù)角度來看,ToF技術(shù)(Time of Flight)、結(jié)構(gòu)光技術(shù)、毫米波雷達(dá)技術(shù)為汽車領(lǐng)域手勢識別的主要技術(shù)。ToF技術(shù)是利用光線傳播的時間來識別手的位置及手的姿勢;結(jié)構(gòu)光技術(shù)采用點(diǎn)、線、面的光獲得圖像,并利用三角原理得到手的位置及姿勢;毫米波雷達(dá)技術(shù)利用雷達(dá)波收發(fā)的時間差確定手的位置及手勢。從技術(shù)難度及計(jì)算效率來說,ToF技術(shù)較為簡單,不需要任何計(jì)算機(jī)視覺方面的計(jì)算,這也是目前大部分公司青睞ToF技術(shù)的原因。
對汽車行業(yè)內(nèi)的手勢交互應(yīng)用進(jìn)行研究,總結(jié)出目前手勢交互存在的問題有:功能單一,缺乏統(tǒng)一的規(guī)劃,人與車的自然交互匱乏,多數(shù)企業(yè)的手勢交互系統(tǒng)識別準(zhǔn)確率不高,識別速度緩慢,這些問題使得人機(jī)體驗(yàn)質(zhì)量下降?,F(xiàn)有的手勢交互難點(diǎn)有:(1)手勢識別技術(shù)的成熟度不夠,難以高質(zhì)量地完成手勢控制;(2)手勢可表達(dá)的內(nèi)容有限,相比較語音交互來說,手勢交互難以表達(dá)清楚具體的任務(wù)內(nèi)容,但在表達(dá)任務(wù)的執(zhí)行對象上來說比語音交互更有優(yōu)勢;(3)不同手勢之間的相似性以及手勢范圍的模糊性造成系統(tǒng)的誤判。未來手勢交互除了要解決上述的難點(diǎn),手勢的設(shè)計(jì)也符合人的習(xí)慣,因?yàn)槭謩莸慕换バ枰度胍欢ǖ膶W(xué)習(xí)成本,未來人們更希望獲得學(xué)習(xí)成本低、交互自然的體驗(yàn),手勢的設(shè)計(jì)也應(yīng)盡可能簡單,接近日常生活中人們自然交流的姿勢,同時也應(yīng)考慮不同人群的文化、習(xí)慣對手勢交互進(jìn)行相應(yīng)的定制。
3車外人與車的交互方式
行人過馬路的安全感往往來自與駕駛員的眼神交流或揮手動作,人為駕駛時,很容易實(shí)現(xiàn)與車外行人的交流,而當(dāng)路面上無人駕駛的比例上升時,駕駛員與行人的交流就顯得尤為困難。無人駕駛階段,駕駛員對路面的注意力不那么高,那么為保障行人安全感,駕駛員與行人的交互轉(zhuǎn)化為車與行人的交互是一種必然趨勢。關(guān)于車與行人的交互方式各研究機(jī)構(gòu)也有不同的解決方案:Semcon研發(fā)出The Smiling car概念汽車,汽車前端布置有一塊顯示屏,顯示屏以顯示微笑的圖案告知行人可以通過馬路;Drive.ai初創(chuàng)公司關(guān)注于無人駕駛車與路上行人、司機(jī)的交流,其解決方案是在車子頂部安裝公告牌發(fā)送信息給行人,或者適當(dāng)?shù)匕l(fā)出聲音提醒行人;google公司致力于打造更安全的汽車,申請了一項(xiàng)“可與行人溝通”的無人駕駛技術(shù)專利,專利描述了利用電子顯示屏向行人顯示交通標(biāo)志信號,同時發(fā)出例如“安全行駛”的聲音提醒,甚至通過安裝電子眼或機(jī)械手臂向行人示意。無人駕駛汽車與行人的交互現(xiàn)階段處于概念性的研發(fā)階段,并沒有實(shí)際地應(yīng)用,對此方面進(jìn)行研究的公司也比較少?,F(xiàn)階段主要的交互以視覺交互和聽覺交互為主,視覺交互除了要考慮各情況下展示的信息內(nèi)容外,還應(yīng)考慮車速對行人視覺的影響。同樣地,聽覺交互除了考慮發(fā)出的信息內(nèi)容外,聲音的大小以及不同道路環(huán)境的干擾也是要研究的方向。未來無人駕駛或許會出現(xiàn)更先進(jìn)的與行人交互方式,但無論是采取什么樣的交互方式,汽車所發(fā)出的信息要保證能為行人所識別及理解。車與行人自然地交互是未來無人駕駛必須要解決的問題,無人駕駛不應(yīng)只考慮駕駛員的需求,對道路上所有人員包括行人、交警的需求考慮在內(nèi)是十分有必要的。
4結(jié)語
由于汽車本身生產(chǎn)的周期性長,目前部分無人駕駛與人交互的實(shí)現(xiàn)仍處于概念階段。從交互的角度來說,人與車最自然的交互方式是沒有交互,縱觀目前市場的發(fā)展,現(xiàn)階段的人機(jī)交互距離自然的交互還有很大的差別,目前人機(jī)交互的主要方式是人下達(dá)命令,由機(jī)器去執(zhí)行,在這個過程中,人的命令是不能有失誤,否則就無法實(shí)現(xiàn)正確的操作,這對于人的安全和體驗(yàn)有一定的隱患。未來自然的人機(jī)交互應(yīng)是以情景識別為主,即機(jī)器通過環(huán)境來預(yù)知人的需求,比如車輛燃料不夠可以自動規(guī)劃路線補(bǔ)充燃料、下雨時自動關(guān)閉窗戶等更加智能地滿足人的需求,以減少人的操作。汽車的人機(jī)交互是無人駕駛最后的門檻,未來汽車的人機(jī)交互系統(tǒng)需要更安全、更穩(wěn)定的技術(shù),以實(shí)現(xiàn)更智能、更人性化的需求,這不是任何單方可以完成的事情,需要集合汽車、人工智能、心理學(xué)等不同領(lǐng)域的知識來完成這這一復(fù)雜的系統(tǒng)。