張歡
近日,地平線宣布與理想達(dá)成合作。基于領(lǐng)先的語音交互技術(shù),地平線為理想ONE增程式智能電動(dòng)車配備“車載多音區(qū)交互技術(shù)”,支持多達(dá)4路人聲分離和6路音區(qū)檢測(cè),實(shí)現(xiàn)全車多路拾音、人聲定位、降噪、回聲消除和語音喚醒,打造精準(zhǔn)的全車語音交互。在今年年內(nèi)交付的理想ONE車內(nèi),用戶即可體驗(yàn)到地平線AI賦能的車內(nèi)智能交互系統(tǒng)。
地平線多音區(qū)方案利用理想ONE車內(nèi)的四個(gè)高靈敏度麥克風(fēng),加上地平線領(lǐng)先的聲源定位、盲源分離和降噪算法,能夠?qū)崿F(xiàn)對(duì)不同位置乘客的語音指令的精準(zhǔn)區(qū)分和識(shí)別,快速響應(yīng)乘客對(duì)于車輛設(shè)置、導(dǎo)航、音樂、視頻等多種需求,讓車內(nèi)交互更加方便快捷。該方案聲源定位準(zhǔn)確率高達(dá)95%,遠(yuǎn)超市場(chǎng)現(xiàn)有的語音分區(qū)方案。
此外,為提高用戶車內(nèi)語音交互體驗(yàn),地平線的語音方案能夠支持免喚醒命令詞達(dá)30余個(gè),覆蓋導(dǎo)航、娛樂、車控、服務(wù)等大多數(shù)日常用車場(chǎng)景,用戶無需語音喚醒,即可輕松進(jìn)行基本的控制。而近百萬條級(jí)別的語料訓(xùn)練,使得喚醒和控制更加精準(zhǔn)。
為應(yīng)對(duì)未來更多車型車內(nèi)復(fù)雜的環(huán)境,除了采用領(lǐng)先的降噪和語音算法,地平線還創(chuàng)造性地將語音技術(shù)與視覺技術(shù)在算法層面進(jìn)行深度融合,“語音+視覺”雙保障,極大地提升車內(nèi)的語音感知能力,可以在高噪音、強(qiáng)干擾及低聲量情況下保證高喚醒率和高識(shí)別率。