2018年7月18日,由中國(guó)科學(xué)院自動(dòng)化研究所承擔(dān)的國(guó)家863計(jì)劃“多方言的高表現(xiàn)力情感語(yǔ)音交互系統(tǒng)” 課題在北京通過(guò)驗(yàn)收。
課題研發(fā)了具有多種方言口音處理能力的情感語(yǔ)音交互平臺(tái),同時(shí)研制了低運(yùn)算復(fù)雜度嵌入式語(yǔ)音交互引擎,實(shí)現(xiàn)了面向移動(dòng)終端的多種交互方式融合的情感語(yǔ)音交互系統(tǒng)。該系統(tǒng)將高性能的自然口語(yǔ)生成、情感信息處理融入到語(yǔ)音交互中,增強(qiáng)了內(nèi)容理解的準(zhǔn)確性,提高了語(yǔ)音交互的實(shí)用性,在此基礎(chǔ)上實(shí)現(xiàn)了高準(zhǔn)確率的自然口語(yǔ)對(duì)話系統(tǒng)。課題組研發(fā)的高性能、高魯棒性的語(yǔ)音識(shí)別系統(tǒng),針對(duì)方言普通話的連續(xù)語(yǔ)音識(shí)別正確率超過(guò)95%;研發(fā)的高表現(xiàn)力的具有口語(yǔ)表達(dá)能力的語(yǔ)音合成系統(tǒng),實(shí)現(xiàn)細(xì)微可控的情感語(yǔ)音合成,同時(shí)能夠自然合成口語(yǔ)對(duì)話、疑問(wèn)、感嘆等語(yǔ)氣的語(yǔ)音,合成語(yǔ)音的自然度主觀意見(jiàn)平均分(MOS)超過(guò)4.1;建立了融合語(yǔ)音韻律信息和內(nèi)容信息的情感識(shí)別模型,對(duì)愉悅、悲傷等情感狀態(tài)的識(shí)別準(zhǔn)確率超過(guò)85%,能夠支撐較高性能的情感分析,并應(yīng)用于語(yǔ)音交互平臺(tái)、語(yǔ)音客服的質(zhì)檢、醫(yī)學(xué)抑郁癥患者診治、人員情緒監(jiān)控等多種場(chǎng)合。
(來(lái)源:http://www.most.gov.cn/kjbgz/201808/t20180802_141007.htm)