華北電力大學(xué)電氣與電子工程學(xué)院 蘇欣美
隨著現(xiàn)代通信技術(shù)的發(fā)展,MATLAB對語音信號的處理識別也不斷的發(fā)展。本文基于語音信號時(shí)域和頻域相互轉(zhuǎn)換的傅里葉變換原理,運(yùn)用MATLLAB軟件對不同性別聲音信號進(jìn)行時(shí)域和頻域的信號處理并提取了不同性別聲音信號的特征頻率,對不同聲音的時(shí)域和頻域特性進(jìn)行深度分析和研究。
語言是人類進(jìn)行交流的重要工具,隨著信息技術(shù)的快速發(fā)展,語音通信技術(shù)是信號處理與分析的重要發(fā)展方向之一,而聲音信號的特征提取與檢測是語音信號采集、分析與處理中的一個(gè)重要方面。如何采集聲音信號并對采集后的聲音信號的特征進(jìn)行有效的提取對識別和處理聲音信號有著重要意義。通過對男生、女生不同的音頻信號進(jìn)行采集,利用MATLAB實(shí)現(xiàn)對聲音信號的頻譜分析,得到男女生 性別不同的頻率特征點(diǎn),有效地區(qū)分了男女聲音的不同,并通過實(shí)驗(yàn)驗(yàn)證了該方法的可行性和有效性。
聲音是由物體的機(jī)械振動產(chǎn)生的并以波的形式進(jìn)行傳播。人耳可聽到的聲音頻率在20-10000Hz之間。人類的語言首先是經(jīng)過大腦對對所要表達(dá)的思想信息進(jìn)行語言編碼,這些語言編碼通過大腦的神經(jīng)網(wǎng)絡(luò)控制相應(yīng)的聲帶肌肉產(chǎn)生有節(jié)律的機(jī)械震動從而產(chǎn)生聲音。聲音是一種聲波,具有音質(zhì)、音調(diào)、響度和音長等物理特征。其中音調(diào)和響度主要取決于聲音信號的頻率特征和時(shí)域特征。音調(diào)取決于聲音的頻率即聲音的頻譜特征,聲音信號的頻率數(shù)值越大音調(diào)越高;相反頻率數(shù)值越小音調(diào)越低。響度主要取決于聲音信號的幅值大小即聲音信號的時(shí)域幅值,聲音信號的時(shí)域幅值越大響度就越大,反之則越小。
從前面的分析中可以看出聲音的響度與音調(diào)可以通過聲音信號的時(shí)域特征和頻域特征進(jìn)行分析。這里設(shè)計(jì)了語音信號的采集系統(tǒng)如圖1所示。從圖1可以看出聲音信號通過語音麥克風(fēng)的拾取送到計(jì)算機(jī)的聲卡中,這部分為聲音信號的采集。采集出來的聲音信號的幅值隨時(shí)間發(fā)生變化,即通常所說的信號的時(shí)域采集,可以用來分析信號的響度特征。為了分析信號的音調(diào)特征,必須對采集的信號進(jìn)行頻譜分析。利用傅里葉變換得到聲音信號的頻譜,通過MATLAB軟件實(shí)現(xiàn)聲音信號頻譜的顯示,從而提取男生與女生不同聲音信號的特征。
圖1 聲音信號采集系統(tǒng)簡圖
由麥克風(fēng)采集的聲音信號為模擬時(shí)域信號x(t),該信號經(jīng)過聲卡進(jìn)行抽樣、量化,由模擬時(shí)域信號轉(zhuǎn)換為離散時(shí)域聲音信號x(n)。
根據(jù)離散傅里葉變換公式將時(shí)域離散聲音信號轉(zhuǎn)換為頻域離散聲音信號:
式中:X(k)—時(shí)域離散聲音信號的傅里葉變換
N—聲音信號的采樣序列值
由于DFT運(yùn)算較為復(fù)雜,復(fù)乘運(yùn)算需要進(jìn)行N2次,與N2成正比,因此運(yùn)算時(shí)間過長。所以利用FFT快速傅里葉變換,復(fù)乘運(yùn)算次數(shù)僅為Nlog2N,與N成正比,大大減少DFT的復(fù)乘運(yùn)算,快速有效計(jì)算離散傅里葉變換,得到聲音信號的頻域波形。
聲音信號的獲取是通過麥克風(fēng)和聲卡對男生和女生的聲音進(jìn)行采集。由Windows自帶的錄音系統(tǒng)來存儲,存儲的聲音文件形式為(*.wav),然后利用MATLAB的文件調(diào)用指令和繪圖指令來繪制男生和女生的聲音時(shí)域信號如圖2和圖3所示。
從圖2和圖3男生和女生的時(shí)域音頻信號可以識別出信號幅值的大小,即聲音信號的響度。從聲音信號的幅值隨時(shí)間變化的情況很難區(qū)分男聲和女聲,也就是無法通過聲音信號的響度特征來來提取男聲和女聲的聲音信號特征。
圖2 男生語音信號時(shí)域波形
圖3 女生語音信號時(shí)域波形
圖4 男生語音信號頻譜圖
圖5 女生語音信號頻譜圖
為更好地識別男聲和女聲的聲音信號特征,對采集到的語音信號進(jìn)行頻譜分析。利用matlab編程實(shí)現(xiàn)前述聲音信號的時(shí)域-頻域轉(zhuǎn)換原理,男聲和女聲的語音信號頻譜圖像如圖4和圖5所示。
分析圖4圖5可知,男生和女生的頻譜圖特征區(qū)別較大。男生的聲音頻率主要集中在200Hz-300Hz左右的頻率范圍,而女生的聲音頻率集中在500Hz-700Hz的頻率范圍內(nèi),女生的聲音頻率普遍比男生要高,即可以通過提取不同性別聲音的音調(diào)特征來區(qū)分男生和女生的聲音。因此,可以利用不同聲音所集中的頻率范圍對聲音進(jìn)行性別識別判斷。
結(jié)語:本文介紹了一種男女生性別不同的聲音識別方法,利用MATLAB的強(qiáng)大的編程功能對采集到的語音信號進(jìn)行時(shí)域和頻域的分析處理,并通過仿真實(shí)驗(yàn)驗(yàn)證了該方法的有效性,這一技術(shù)的實(shí)現(xiàn)為特定語言環(huán)境下男女生聲音特征識別提供一種實(shí)用的方法。