兩年前的經(jīng)歷讓孫濤至今難以忘懷。“有一位抗美援朝的老戰(zhàn)士,很懷念已經(jīng)過(guò)世的老排長(zhǎng)?!?語(yǔ)音合成架構(gòu)師孫濤就和同事錄制了一些老排長(zhǎng)在世時(shí)的聲音,并通過(guò)語(yǔ)音合成技術(shù)把老排長(zhǎng)留給老戰(zhàn)士的信讀給他聽(tīng),老人頓時(shí)淚流滿面。
語(yǔ)音合成廣泛應(yīng)用于播報(bào)、客服、導(dǎo)航、虛擬主播、虛擬主持人等等。語(yǔ)音合成有三大關(guān)鍵因素:文本內(nèi)容、發(fā)音人音色和說(shuō)話的韻律節(jié)奏。發(fā)音人音色的不同在于喉嚨。每個(gè)人的喉嚨結(jié)構(gòu)比較固定,如果把它比喻成一個(gè)樂(lè)器,文本內(nèi)容和韻律節(jié)奏更像是樂(lè)譜。語(yǔ)音合成相當(dāng)于只要掌握了樂(lè)器(喉嚨)的基本結(jié)構(gòu),想要合成什么樣的語(yǔ)句,只要提供樂(lè)譜(文本內(nèi)容和韻律節(jié)奏)就可以了。“只要收集你說(shuō)的9句話,就能復(fù)刻你的聲音”。語(yǔ)音合成架構(gòu)師孫濤自信地對(duì)中工網(wǎng)記者說(shuō)。每天,孫濤要處理大量采集來(lái)的聲音??粗叩筒黄降穆暡?,就像看著即將亮相的樂(lè)譜,人工智能是“演奏家”,而他,就是那個(gè)“作曲家”。
“以前客戶服務(wù)電話的拒接率很高,大家一聽(tīng)就知道這不是真人,從情感上就不想交流?!?人工智能的快速發(fā)展,語(yǔ)音合成也搭上了這趟順風(fēng)車(chē)。“語(yǔ)音合成的效果提升以后,已經(jīng)無(wú)法分辨接客服電話的是真人還是機(jī)器,與客戶溝通的效率也提升了。”孫濤對(duì)記者說(shuō),語(yǔ)音合成發(fā)展到現(xiàn)在已經(jīng)進(jìn)步為個(gè)性化的合成,會(huì)帶上情感表現(xiàn),甚至還有一些人文關(guān)懷的成分?!罢Z(yǔ)音合成發(fā)展的大方向是交互,讓人與人工智能自如地對(duì)話。不僅能傳遞信息,也能傳遞情感?!睂O濤滿懷憧憬地說(shuō)。(據(jù)中工網(wǎng) 10.9訊)