王順利 付嘉銘 洪強(qiáng)
摘 要 目標(biāo)聲音識別逐漸將會在實(shí)際的日常生活中得以應(yīng)用。在實(shí)驗(yàn)室環(huán)境下,對目標(biāo)聲音識別系統(tǒng)大多數(shù)識別性能也達(dá)到了一定的要求,但在實(shí)際噪聲環(huán)境下的識別系統(tǒng)效果將大大降低。因此,在抗噪聲語音識別的研究目標(biāo)是非常重要的。研究發(fā)現(xiàn),人耳具有良好的抗噪聲能力,因此基于語音識別技術(shù)的聽覺系統(tǒng)是一個很有前途的研究課題。
關(guān)鍵詞 語音識別技術(shù) 聽覺系統(tǒng) 仿生學(xué) 智能 機(jī)器人
中圖分類號:TN912.34 文獻(xiàn)標(biāo)識碼:A
1語音識別技術(shù)
1.1語音識別技術(shù)簡介
語音識別技術(shù)主要分為兩類,一是語音意義的識別,一種是目標(biāo)聲識別。第一個被稱為語音識別,它是根據(jù)聲音的成詞特點(diǎn)對聲音進(jìn)一步分析,主要應(yīng)用在人工智能,人機(jī)對話和快速輸入等領(lǐng)域。通過訪問聲音的特征,從目標(biāo)語音中進(jìn)行提取,該項(xiàng)技術(shù)可以區(qū)分多目標(biāo)語音的種類,確定目標(biāo),主要用于戰(zhàn)場目標(biāo)識別領(lǐng)域,海上偵察系統(tǒng),預(yù)警系統(tǒng),軍事聲納識別,車輛聲音識別,火車預(yù)警系統(tǒng),動物個體的語音識別和家庭安全系統(tǒng)等。
科技研究人員通過對語音信號處理技術(shù)進(jìn)行深入的研究,結(jié)果發(fā)現(xiàn):人的聽覺系統(tǒng)的聲音配合具有獨(dú)特的優(yōu)勢,它能準(zhǔn)確地提取目標(biāo)的聲音特征,準(zhǔn)確地辨別聲音的方向和內(nèi)容分類,所以基于仿生聽覺系統(tǒng)的目標(biāo)聲識別技術(shù)備受現(xiàn)代前沿科技的關(guān)注。針對目標(biāo)聲音識別系統(tǒng)的研究工作成為了現(xiàn)代語音識別技術(shù)研究的一個熱門方向,不少科技研究人員正在積極探索先進(jìn)可行的仿生學(xué)理論,特征提取技術(shù)和語音識別技術(shù)。
1.2語音識別技術(shù)的研究現(xiàn)狀
語音識別技術(shù)主要是通過對監(jiān)測數(shù)據(jù)的聲音特性分析,得到聲音特性的樣本文件。語音識別技術(shù)是一種非接觸技術(shù),用戶可以很自然地接受。但語音識別技術(shù)和其他行為識別技術(shù)具有共同的缺點(diǎn),即輸入樣本的變化太大,所以很難完成一些精確的匹配,聲音也會伴隨著速度,音質(zhì)的變化而影響到信號的采集和結(jié)果的比較。
在語音識別中,語音識別是最早也是比較成熟的領(lǐng)域。隨著越來越多的應(yīng)用需求,識別聲音并不局限于語音識別,人們開始深入研究目標(biāo)識別技術(shù)的非語音識別,該項(xiàng)技術(shù)已經(jīng)參照了成熟的語音識別技術(shù)的一部分,但由于各自的應(yīng)用環(huán)境和實(shí)際的音頻特征之間的差異,該技術(shù)還存在一些差異。
1.3語音識別技術(shù)的實(shí)際應(yīng)用
在民用方面,目標(biāo)聲音識別系統(tǒng)可以應(yīng)用于門禁系統(tǒng),網(wǎng)絡(luò)安全,認(rèn)證,智能機(jī)器人,動物語音識別,電子商務(wù)和智能交通等領(lǐng)域。在智能交通領(lǐng)域,利用來自車輛識別模型的運(yùn)動音頻信號,可以實(shí)現(xiàn)交通信息的智能化管理。在智能機(jī)器人領(lǐng)域,機(jī)器人目標(biāo)聲音識別系統(tǒng)可以作為機(jī)器人的耳朵,通過環(huán)境聲音識別并確定聲音的方位,然后再反應(yīng)外界的聲音,因此可以將其當(dāng)作家庭自動化服務(wù)系統(tǒng)和安全系統(tǒng)。在動物的語音識別領(lǐng)域,可以根據(jù)害蟲聲特征來區(qū)分害蟲種類,根據(jù)不同的害蟲采取不同的措施。在網(wǎng)絡(luò)應(yīng)用領(lǐng)域,在關(guān)于各種在線服務(wù)支持的語音識別技術(shù)新項(xiàng)目開發(fā)中,可以提高網(wǎng)絡(luò)的服務(wù)質(zhì)量,給人們的生活帶來方便?,F(xiàn)在,美國,德國和日本都開了電話銀行,語音代替原來的密碼和使用印章,簡化了工作服務(wù)流程,提高工作效率。
在軍事上,目標(biāo)聲音識別技術(shù)來自于第二次世界大戰(zhàn),在探測敵人的炮火和潛艇時,起著重要的識別和定位作用。但由于計(jì)算機(jī)技術(shù),信號處理技術(shù),光電檢測和雷達(dá)檢測技術(shù)快速的發(fā)展,使聲探測技術(shù)發(fā)展得十分緩慢。直到現(xiàn)代的戰(zhàn)爭,研發(fā)了使用于戰(zhàn)爭中的三維信息,全方位定向,反欺詐、欺騙、干擾和反偵察、監(jiān)視,在隱身與反隱身的現(xiàn)代戰(zhàn)爭中為國家的國防事業(yè)做出了不可磨滅的杰出貢獻(xiàn)。通過電,磁,光學(xué)和雷達(dá)探測技術(shù)和主動檢測技術(shù)來完成偵察任務(wù)已經(jīng)不能滿足現(xiàn)代戰(zhàn)爭的需求。在武裝直升機(jī)技術(shù)成熟的當(dāng)代,隱形轟炸機(jī)和其他高科技武器都有了反射功率,抗電磁干擾,反輻射的功能,特別是快速發(fā)展的數(shù)字技術(shù)和計(jì)算機(jī)技術(shù),迫使各國為了實(shí)現(xiàn)對目標(biāo)的定位跟蹤和噪聲識別而重新開始研究被動聲探測技術(shù),關(guān)注聲檢測技術(shù)。在未來戰(zhàn)爭中,武器裝備發(fā)展的一個重要趨勢是智能化、小型化,一個重要的特點(diǎn)是具備目標(biāo)識別的能力,并根據(jù)不同的對象使用不同的攻擊方法。
2聽覺系統(tǒng)
為了設(shè)計(jì)一個更精確的目標(biāo)聲音識別系統(tǒng),越來越多的學(xué)者開始深入研究仿生學(xué)領(lǐng)域。通過研究發(fā)現(xiàn),人類的聽覺系統(tǒng)在聲音的物理方面具有獨(dú)特的優(yōu)勢,聲音特征可以準(zhǔn)確提取目標(biāo)識別中聲音的方向,種類和含量,而且還可以提高抗噪聲能力,所以基于人基于語音識別技術(shù)的聽覺系統(tǒng)已經(jīng)成為目前的研究熱點(diǎn)。
人類聽覺仿生學(xué)是模仿人耳的聽覺系統(tǒng)和生理功能,并通過建立數(shù)學(xué)模型,根據(jù)數(shù)學(xué)分析原理得到的聽覺系統(tǒng)。它涉及聲學(xué),生理學(xué),信號處理,模式識別和人工智能等學(xué)科,是一個跨學(xué)科研究領(lǐng)域的綜合應(yīng)用。該技術(shù)已在軍事,交通,銀行,醫(yī)療治療的許多方面取得了重要應(yīng)用,是人類實(shí)現(xiàn)智能生命的重要研究課題之一。
人類聽覺系統(tǒng)的處理能力大大超過目前的聲音信號處理水平。從人類聽覺系統(tǒng)的心理和生理特點(diǎn)視角,許多研究人員對接聽過程中的語音識別進(jìn)行深入的研究。目前,許多學(xué)者提出了不同的聽覺模型,這些模型大多是一些基于語音識別和語音質(zhì)量評價(jià)系統(tǒng)的聽覺模型,模擬人耳聽覺功能的生理結(jié)構(gòu),這些應(yīng)用處理方法大大提高了系統(tǒng)的性能。
參考文獻(xiàn)
[1] 甄斌,吳璽宏,劉志敏,遲惠生.語音識別和說話人識別中各倒譜分量的相對重要性[J]. 北京大學(xué)學(xué)報(bào)(自然科學(xué)版). 2001(03).
[2] 趙力,鄒采榮,吳鎮(zhèn)揚(yáng).漢語連續(xù)語音識別中語音處理和語言處理統(tǒng)合方法的研究[J]. 聲學(xué)學(xué)報(bào). 2001(01).