王順利 洪強 黃歡
摘 要 目標聲音識別技術(shù)是語音識別的一個重要分支,它極大地提高了人們的工作效率,生活質(zhì)量和服務(wù)質(zhì)量。但由于語音變化范圍大,聲音識別系統(tǒng)精確匹配困難,聲音容易收到音質(zhì),速度和背景噪聲的影響而降低識別能力。隨著語音信號處理技術(shù)的深入研究,結(jié)果發(fā)現(xiàn):人的聽覺系統(tǒng)對聲音配合物具有獨特的優(yōu)勢,它可以準確地提取目標聲特性并辨別聲音的方向和內(nèi)容,基于仿生學的聲源定位技術(shù)越來越受到人們的關(guān)注。
關(guān)鍵詞 仿生學 聲源定位技術(shù) 聽覺系統(tǒng) 聲音信號 目標聲音
中圖分類號:TB51 文獻標識碼:A
1仿生學概覽
1.1仿生學的發(fā)展歷史
通過研究可以得出結(jié)論:一些植物和動物具有類似的功能,實際上超出人們關(guān)于這方面設(shè)計的方案需要。人們通過模仿動物和植物在技術(shù)方面得以借鑒,是一個突破。仿生學是一門交叉學科,如工程仿生技術(shù)和生物科學相結(jié)合,近年來發(fā)展迅速。對于合理應(yīng)用生物學原理,不僅要找到一些長期存在難題的解決方案,而要使這個方案完全適應(yīng)自然的需要。
仿生學研究生物學的系統(tǒng)結(jié)構(gòu),研究功能,信息控制與能量轉(zhuǎn)換等的優(yōu)良特性,而這些特性應(yīng)用于實際系統(tǒng),用于改善現(xiàn)有的技術(shù),并建立一個全面的自動設(shè)備,工藝,技術(shù)架構(gòu)配置系統(tǒng)等。從生物學的角度看,仿生學的一個分支,屬于生物學的應(yīng)用。仿生學作為一門獨立的學科,在1960年9月問世,仿生學在俄亥俄州空軍基地的第一次會議在美國空軍航空局召開了。從第二十世紀50年代以來,人們已經(jīng)認識到,生物系統(tǒng)是一個開發(fā)新技術(shù)的主要途徑。人們通過數(shù)學,化學,物理和數(shù)學模型,對生物系統(tǒng)的研究,并促進生物學快速發(fā)展,而研究生物功能的機制也取得了很大的進步。
1.2仿生學的應(yīng)用背景
仿生學已經(jīng)進入了各行各業(yè)技術(shù)創(chuàng)新和技術(shù)革命的前沿,如在自動控制,航空,航海等軍事領(lǐng)域都獲得了不少的成就??茖W家的靈感來自與旗魚狀突起的長針,開發(fā)超音速飛機在高速飛行時產(chǎn)生刺耳聲的屏障;從鯨魚的形狀發(fā)展?jié)撏?;通過模仿蝙蝠的行為使雷達可以在任何時間根據(jù)脈沖參數(shù)的目標檢測方法和調(diào)整方向,提高雷達的靈敏度和抗干擾的能力。
仿生學的任務(wù)是研究生物系統(tǒng)與生俱來的能力和原則,為這些能力與原則創(chuàng)建相應(yīng)的數(shù)學模型,并設(shè)計嶄新的設(shè)備,開展了一個全新的應(yīng)用空間。聽覺仿生模型應(yīng)該更全面地描述目標聲識別過程?,F(xiàn)在大多數(shù)的研究沒有在本質(zhì)上對聽覺系統(tǒng)創(chuàng)建出一個合理的模型,特征提取不能夠完全體現(xiàn)出聲音的特點。因此,在聽覺系統(tǒng)模型幾何部分中建立一個更精確的語音識別系統(tǒng)是發(fā)展的必然趨勢。
1.3機器人聽覺系統(tǒng)的應(yīng)用
隨著電子技術(shù)和數(shù)字信號處理技術(shù)的發(fā)展,仿人機器人(如圖1所示)的研究有了新的進展,機器人聽覺與視覺系統(tǒng)是智能機器人的重要標志,已成為機器人研究領(lǐng)域的一個重要研究方向,是實現(xiàn)機器人與環(huán)境的相互作用和人機交互的一個重要手段。因為聲音繞過障礙,聽覺可以由機器人多信息采集系統(tǒng)來實現(xiàn)功能,利用機器人的其他感官來彌補其他傳感系統(tǒng)無法通過非透明障礙物的缺點。此外,對于模擬人類聽覺系統(tǒng)的研究,也表明了人類對于聽覺生理能力所掌握的知識程度很高。
2聲源定位技術(shù)的發(fā)展
2.1聲源定位技術(shù)的應(yīng)用背景
聲源定位技術(shù)是對具有聽力功能的耳朵進行仿真,利用聲波傳感裝置接收聲音,聲音信號通過電子設(shè)備進行處理,從而實現(xiàn)并定位聲源識別的檢測,定位和聲源目標跟蹤。利用被動聲來定位,并對多通道信號分析與處理,得出一個或多個在平面或在空間域中的聲源空間坐標,以獲得聲源位置。
聲源定位技術(shù)具有隱蔽性強,適應(yīng)性強的優(yōu)點,成本低,逐漸受到世界各國的重視,在軍事和民用領(lǐng)域具有廣闊的應(yīng)用前景。在水下感知目標,在危險的環(huán)境中應(yīng)用程序來完成戰(zhàn)場掃雷工作。聲探測技術(shù)在許多控制裝置中得到廣泛使用,如聲雷達,被動聲納,語音識別系統(tǒng),視頻會議系統(tǒng)和輔助收聽系統(tǒng)等。它可用于揚聲器麥克風陣列波束的方向控制,視頻會議系統(tǒng)的對準;也可用于語音信號的預(yù)處理,提供高質(zhì)量的聲音信號,提高相關(guān)的系統(tǒng)功能;檢測管道泄漏的位置,管道泄漏后的聲波振動會沿墻傳播,只要在管道泄漏的地方進聲源振動信號的采集,就可以通過兩個信號時延估計確定泄漏的位置;在電話會議中的聲源定位,語音信號接收不同談話的人,根據(jù)不同的傳感器位置接收聲音信息,確定發(fā)言人的立場;對于室內(nèi)監(jiān)控系統(tǒng),安裝拾音器在走廊,房間,采集目標方位角接收到的聲音信號,并進一步記錄聲音和圖像目標的信息。聲源定位技術(shù)具有應(yīng)用價值和廣闊的發(fā)展前景,值得研究。
2.2聲源定位技術(shù)的優(yōu)勢
聲源定位技術(shù)是利用電子裝置來獲知聲音位置的信號處理技術(shù)。聲源定位技術(shù)可以分為被動聲源定位和主動聲源定位兩種。主動定位包括發(fā)送和接收裝置,如雷達發(fā)射信號的使用,根據(jù)目標的接受波形來判斷的位置。被動聲定位是接收裝置,與傳統(tǒng)的主動聲源定位技術(shù)相比,它具有隱蔽性強的優(yōu)點,不易受電磁干擾。
參考文獻
[1] 郭策,戴振東,孫久榮.?生物機器人的研究現(xiàn)狀及其未來發(fā)展[J].機器人,2005(02).
[2] 崔瑋瑋,曹志剛,魏建強.?聲源定位中的時延估計技術(shù)[J].數(shù)據(jù)采集與處理,2007(01).