馮世杰,劉鵬飛,靳 兵
(海馬汽車有限公司,河南 鄭州 450016)
從語(yǔ)音識(shí)別技術(shù)的智能化程度來(lái)講,車載語(yǔ)音發(fā)展可粗略地劃分為3個(gè)階段[1]。第1個(gè)階段為發(fā)展期 (2000~2010年),最早搭載語(yǔ)音交互功能的車是通用的OnStar系統(tǒng),可以通過(guò)駕駛員在車內(nèi)進(jìn)行語(yǔ)音激活,根據(jù)需求提供實(shí)時(shí)交通與路況信息、天氣、新聞等。這時(shí)的語(yǔ)音技術(shù)為條目式語(yǔ)音交互,網(wǎng)絡(luò)狀態(tài)為本地識(shí)別,產(chǎn)品識(shí)別率低,用戶體驗(yàn)比較差;第2個(gè)階段為普及期 (2010~2015年),這個(gè)階段自然語(yǔ)言技術(shù)開(kāi)始應(yīng)用,車聯(lián)網(wǎng)汽車加入了網(wǎng)聯(lián)服務(wù)和云端識(shí)別,產(chǎn)品表現(xiàn)上識(shí)別率得到了較大的提升;第3個(gè)階段為成熟期(2015~至今),自然語(yǔ)言技術(shù)和4G網(wǎng)絡(luò)成為主流,產(chǎn)品的識(shí)別準(zhǔn)確率超過(guò)90%,新車型的搭載也達(dá)到100%。
目前車載語(yǔ)音功能[2]大致可以分為這幾類:語(yǔ)音導(dǎo)航、收音機(jī)及在線音樂(lè)等音頻控制、藍(lán)牙電話及短信控制、車輛狀態(tài)信息查詢、生活服務(wù)信息查詢以及車輛智能語(yǔ)音控制。本文涉及的車載語(yǔ)音功能設(shè)計(jì)為車載智能語(yǔ)音控制,控制的車載功能主要有空調(diào)控制、全景天窗控制、燈光雨刮洗滌控制、座椅加熱控制、外后視鏡及氛圍燈控制、車載智能場(chǎng)景控制等,具體場(chǎng)景功能見(jiàn)表1。
語(yǔ)音功能的實(shí)現(xiàn)路徑見(jiàn)圖1。
圖1 車載語(yǔ)音功能實(shí)現(xiàn)過(guò)程
駕駛員喚醒車載語(yǔ)音系統(tǒng)之后,發(fā)出自然語(yǔ)言指令,車載麥克風(fēng)接收語(yǔ)音進(jìn)行前段信號(hào)處理,并將其傳遞給音響主機(jī),音響主機(jī)對(duì)接收到的語(yǔ)音數(shù)據(jù)進(jìn)行語(yǔ)音識(shí)別和語(yǔ)音理解,將其轉(zhuǎn)換為CAN網(wǎng)絡(luò)報(bào)文信號(hào)傳遞給執(zhí)行控制器,控制器接收到相關(guān)的報(bào)文信號(hào)后驅(qū)動(dòng)執(zhí)行機(jī)構(gòu),實(shí)現(xiàn)語(yǔ)音控制功能,并把功能實(shí)現(xiàn)后的狀態(tài)反饋給音響主機(jī)。
CAN總線[3]為本文項(xiàng)目的基礎(chǔ)車載網(wǎng)絡(luò)通信技術(shù),負(fù)責(zé)各個(gè)CAN控制器節(jié)點(diǎn)功能信號(hào)傳輸,所以基于CAN總線進(jìn)行車載語(yǔ)音功能的設(shè)計(jì),具備傳輸性能可靠成熟、報(bào)文信號(hào)定義簡(jiǎn)便、開(kāi)發(fā)周期短及開(kāi)發(fā)成本低等優(yōu)點(diǎn),詳細(xì)的語(yǔ)音功能總線信號(hào)設(shè)計(jì)見(jiàn)表2。
表1 語(yǔ)音車控功能列表
表2 語(yǔ)音功能網(wǎng)絡(luò)通信設(shè)計(jì)
表2 (續(xù))
表2 (續(xù))
在整車網(wǎng)絡(luò)通信系統(tǒng)中,以ASR(Automatic Speech Recognition)開(kāi)頭命名的信號(hào)為車載語(yǔ)音功能專有信號(hào),信號(hào)名稱中后綴的“X”U為該信號(hào)占用的字節(jié)位數(shù)。
本文中描述的車載語(yǔ)音功能設(shè)計(jì)與實(shí)現(xiàn)已經(jīng)完成了設(shè)計(jì)與測(cè)試工作,并在海馬汽車某車型上量產(chǎn)發(fā)布。在后續(xù)的車載語(yǔ)音控制功能中還可以擴(kuò)展:主副駕座椅調(diào)整、記憶及迎賓功能,外后視鏡打開(kāi)與折疊功能,五門(mén)開(kāi)啟與關(guān)閉功能,360全景界面切換功能等車輛輔助駕駛設(shè)置與控制。
在未來(lái)車載語(yǔ)音[4]數(shù)據(jù)的收集與分析將會(huì)成為車載語(yǔ)音系統(tǒng)競(jìng)爭(zhēng)的關(guān)鍵要素,一方面可以通過(guò)持續(xù)的數(shù)據(jù)積累提升語(yǔ)音識(shí)別準(zhǔn)確率與語(yǔ)義理解能力,另一方面豐富的數(shù)據(jù)將會(huì)為整個(gè)產(chǎn)業(yè)帶來(lái)巨大的變現(xiàn)潛力。
從車載語(yǔ)音技術(shù)上講,被動(dòng)式的語(yǔ)音交互將會(huì)朝向主動(dòng)式語(yǔ)音發(fā)展,車載語(yǔ)音系統(tǒng)將會(huì)根據(jù)當(dāng)前的時(shí)間、外部環(huán)境、車況及交通狀況,結(jié)合用戶的使用習(xí)慣和日常出行等數(shù)據(jù),分析可能存在的需求,主動(dòng)推送和詢問(wèn)。同時(shí),在自動(dòng)駕駛和汽車共享的推動(dòng)下,車載語(yǔ)音系統(tǒng)的個(gè)性化服務(wù)也將迎來(lái)新的發(fā)展機(jī)遇。