馬輝棟,劉振宇
(山西農(nóng)業(yè)大學(xué) 信息科學(xué)與工程學(xué)院,山西 太谷 030801)
?
語音端點(diǎn)檢測(cè)算法在豬咳嗽檢測(cè)中的應(yīng)用研究
馬輝棟*,劉振宇
(山西農(nóng)業(yè)大學(xué) 信息科學(xué)與工程學(xué)院,山西 太谷 030801)
摘要:針對(duì)大型養(yǎng)豬場(chǎng)疫病防治工作中人工診斷效率低下的問題,對(duì)豬患病時(shí)發(fā)出的咳嗽聲音進(jìn)行研究,提出了豬咳嗽聲自動(dòng)化檢測(cè)方案。結(jié)合豬咳嗽聲音信號(hào)的特點(diǎn),借鑒語音識(shí)別中廣泛應(yīng)用的端點(diǎn)檢測(cè)算法,并加以改進(jìn),實(shí)現(xiàn)對(duì)聲音信號(hào)中豬咳嗽聲音的檢測(cè)。該方案為豬咳嗽類疾病的人工診斷和自動(dòng)化診斷提供有效信號(hào)。經(jīng)150段豬咳嗽音驗(yàn)證表明,該檢測(cè)方案檢出率達(dá)96%以上,檢錯(cuò)率低于4%,說明方法具有有效性和實(shí)用性。
關(guān)鍵詞:豬咳嗽音檢測(cè); 端點(diǎn)檢測(cè); 短時(shí)能量; 短時(shí)過零率
隨著數(shù)字時(shí)代的到來,畜牧數(shù)字化成為人們的研究熱點(diǎn)。疫病防治是畜牧養(yǎng)殖的重要組成部分,咳嗽聲是動(dòng)物疫病的重要信號(hào)。動(dòng)物咳嗽是一種非常復(fù)雜的生理表現(xiàn),以豬為例,引起豬咳嗽的原因可能是流行性感冒、肺疫、萎縮性鼻炎、喘氣病、肺絲蟲病、野兔熱、鏈球菌病等等[1],每一種病因都對(duì)應(yīng)不同的臨床表現(xiàn),所發(fā)出的咳嗽聲音也是千差萬別。單純依靠機(jī)器自動(dòng)化準(zhǔn)確識(shí)別病因,開發(fā)難度非常大[2,3]。目前,國內(nèi)外主要依靠人工觀察的方法完成家畜疾病診斷工作。動(dòng)物咳嗽聲音是不連續(xù)的,且不易捕捉,單純依靠人工觀察效率極低。針對(duì)該問題,本文對(duì)豬咳嗽聲音信號(hào)進(jìn)行分析,將語音端點(diǎn)檢測(cè)技術(shù)[4~6]加以改進(jìn),運(yùn)用于豬咳嗽聲音的檢測(cè)中。試驗(yàn)發(fā)現(xiàn),該方案能精準(zhǔn)確定豬咳嗽聲音信號(hào)的起始點(diǎn)和終止點(diǎn),為人工診斷和機(jī)器自動(dòng)化診斷提供有效信號(hào),對(duì)于畜牧養(yǎng)殖中的呼吸道、肺部等疾病的預(yù)警防治具有實(shí)用價(jià)值。
1豬咳嗽聲音信號(hào)特點(diǎn)分析
豬咳嗽聲音診斷的要點(diǎn)在于咳嗽的性質(zhì)、強(qiáng)度、頻率以及時(shí)間。根據(jù)語音檢測(cè)方法,將豬咳嗽聲語音信號(hào)分為無聲、清音和濁音[7,8],如圖1所示。無聲部分指無咳嗽音信號(hào),反映在波形圖上顯示為背景噪聲,能量最低,且在整個(gè)頻譜范圍內(nèi)分布。濁音是指聲帶振動(dòng)發(fā)出的聲音,對(duì)應(yīng)于豬咳嗽時(shí)聲門瞬間張開所爆發(fā)的咳嗽音,表現(xiàn)在波形圖上為能量升高瞬間達(dá)到極大值。清音指空氣在口腔中摩擦或碰撞而引發(fā)的聲音信號(hào),該部分對(duì)應(yīng)豬咳嗽時(shí)聲門持續(xù)張開產(chǎn)生的聲音,在波形圖上具有的能量處于無聲和濁音之間,且隨著聲門的閉合,聲音信號(hào)能量逐漸降低。
本文從150段豬咳嗽錄音樣本中選取4個(gè)樣本(樣本信息如表1所示)進(jìn)行分析,說明語音端點(diǎn)檢測(cè)算法的應(yīng)用。該聲音樣本均采集于山西農(nóng)業(yè)大學(xué)牧站豬養(yǎng)殖實(shí)驗(yàn)基地,錄音設(shè)備為索尼ICD-FX88錄音筆。
圖2所示為豬咳嗽聲音時(shí)域波形圖,由圖可知,豬咳嗽音一般持續(xù)時(shí)間為0.5 s左右,每個(gè)咳嗽音都由響度較高的濁音部分和相對(duì)平穩(wěn)的清音部分組成。圖3所示為頻域波形圖,由圖可見,豬咳嗽聲音的頻域范圍為300~8 000 Hz,相較于人咳嗽音頻域范圍350~4 000 Hz[9],豬咳嗽音頻率較高。
2信號(hào)去噪處理
對(duì)帶噪聲的豬咳嗽原始信號(hào)進(jìn)行去噪處理,提取出相對(duì)干凈的豬咳嗽聲信號(hào)是檢測(cè)豬是否發(fā)生咳嗽的重要前提,根據(jù)大量豬咳嗽聲音樣本的頻譜分析結(jié)果,本文采用頻率范圍為300~8 000 Hz的150階FIR濾波器帶通濾波,對(duì)原信號(hào)進(jìn)行去噪處理。如圖4所示為樣本(a)濾波前、后功率譜密度對(duì)比。通過濾波,有效地去除了豬咳嗽聲音頻帶外的噪聲。
3特征參量提取
語音端點(diǎn)檢測(cè)是指確定信號(hào)中語音信號(hào)的起始點(diǎn)和終止點(diǎn),運(yùn)用到豬咳嗽聲音的檢測(cè)中就是將信號(hào)中的咳嗽音提取出來[5]。由圖1對(duì)豬咳嗽音的特征分析可知:無聲部分,信號(hào)能量最??;清音部分,信號(hào)能量較小,但是語音幅度穿過零電平的次數(shù)最多;濁音部分信號(hào)能量最高。由此,聯(lián)合采用短時(shí)能量和短時(shí)過零率作為豬咳嗽聲音檢測(cè)的特征參量。
3.1分幀
短時(shí)能量和短時(shí)過零率都是建立在信號(hào)短時(shí)平穩(wěn)的基礎(chǔ)上的,即在一定時(shí)間Δt范圍內(nèi),信號(hào)特征值是穩(wěn)定的狀態(tài)。Δt時(shí)間內(nèi)所包含的數(shù)據(jù)稱為“幀”;為了使幀平滑過度,相鄰幀之間數(shù)據(jù)一般有一部分是交疊的,交疊部分稱為“幀移”。
本文所用信號(hào)采樣頻率為44 100 Hz,Δt為5.8 ms,幀移為1/4,即每幀包含256個(gè)數(shù)據(jù),相鄰幀交疊64個(gè)數(shù)據(jù)。
3.2短時(shí)能量
短時(shí)能量即1幀采集到的聲音信號(hào)內(nèi)具有的能量大小。設(shè)第n幀聲音信號(hào)的短時(shí)能量用En表示,則:
(1)
式中,N為聲音信號(hào)的幀數(shù)據(jù)個(gè)數(shù),xn(m)為信號(hào)歸一化幅度。
3.3短時(shí)過零率
短時(shí)過零率是指在單幀聲音信號(hào)中,信號(hào)波形越過零電平位置的次數(shù)。設(shè)第n幀聲音信號(hào)的短時(shí)過零率為Zcrn,則:
(2)
式中,N為聲音信號(hào)的幀數(shù)據(jù)個(gè)數(shù),xn(m)為信號(hào)歸一化幅值,sgn[]是符號(hào)函數(shù),如式(3)所示。
(3)
研究發(fā)現(xiàn)豬咳嗽信號(hào)無聲部分,信號(hào)幅值小,越過零電頻的次數(shù)極高,從而導(dǎo)致無聲部分對(duì)咳嗽信號(hào)的干擾。為了減少這種干擾,本文對(duì)短時(shí)過零率的計(jì)算方法做簡單調(diào)整,規(guī)定相鄰數(shù)據(jù)的差值門限T,如式(4)所示。即信號(hào)中相鄰數(shù)據(jù)需滿足兩個(gè)條件:一是差值須越過差值門限T,本文中差值門限T取0.01;二是分布于零電頻兩側(cè)。
(4)
4雙門限檢測(cè)
本文采用短時(shí)能量和短時(shí)過零率雙門限檢測(cè)豬咳嗽信號(hào)。首先斷定豬咳嗽聲語音是有聲信號(hào)還是無聲信號(hào),若判斷為有聲信號(hào),繼續(xù)判斷是否是清音信號(hào)、濁音信號(hào),從而有效地完成豬咳嗽聲的端點(diǎn)檢測(cè)。
短時(shí)能量的高低兩個(gè)閾值,分別設(shè)為E_lager和E_smaller,短時(shí)過零率的高低閾值設(shè)為Zcr_lager和Zcr_smaller。根據(jù)短時(shí)能量E(n)、短時(shí)過零率Zcr(n)與對(duì)應(yīng)閾值條件比較,判斷該幀信號(hào)處于靜音、疑似咳嗽、咳嗽三種狀態(tài)中的哪種。具體實(shí)現(xiàn)過程如圖5所示。
經(jīng)實(shí)驗(yàn),本方法閾值設(shè)置為:
短時(shí)能量閾值:
E_lager=2;E_smaller=1
(5)
短時(shí)過零率閾值:
Zcr_lager=5;Zcr_smaller=2
(6)
為了準(zhǔn)確地找到咳嗽聲音的起始點(diǎn)和終止點(diǎn),對(duì)多幀信號(hào)狀態(tài)進(jìn)行判斷。將幀狀態(tài)之間的跳轉(zhuǎn)分為A和a兩類(如圖6所示)。連續(xù)發(fā)生a類跳轉(zhuǎn),則發(fā)生“咳嗽”;連續(xù)發(fā)生A類跳轉(zhuǎn),則是向“靜音”狀態(tài)轉(zhuǎn)變。檢測(cè)過程如下:
起始幀判斷:處于“靜音”或“疑似咳嗽”狀態(tài)的第i幀信號(hào),直到跳轉(zhuǎn)到“咳嗽狀態(tài)”,數(shù)據(jù)幀之間發(fā)生a類跳轉(zhuǎn)的次數(shù)多于15,發(fā)生連續(xù)A類跳轉(zhuǎn)的次數(shù)少于6,則i為咳嗽起始幀。終止幀判斷:第j幀信號(hào),位于咳嗽起始幀i之后,且該幀信號(hào)之后連續(xù)發(fā)生6次以上A類跳轉(zhuǎn),則j為咳嗽終止幀。
5豬咳嗽聲檢測(cè)結(jié)果
圖2中4個(gè)豬咳嗽信號(hào)樣本,采用雙門限算法的檢測(cè)結(jié)果如圖7所示。虛線為咳嗽起始點(diǎn),其后的實(shí)線為咳嗽終止點(diǎn)。
本文將語音端點(diǎn)檢測(cè)法用于豬咳嗽聲音的檢測(cè)中,根據(jù)豬咳嗽聲音的特點(diǎn)對(duì)去噪濾波器帶寬范圍、短時(shí)能量及短時(shí)過零率閾值條件等加以調(diào)整。經(jīng)150段豬咳嗽錄音檢測(cè)驗(yàn)證表明,該方法的檢出率達(dá)96%以上,檢錯(cuò)率低于4%,說明方法有效、實(shí)用。
參考文獻(xiàn)
[1]盧建濤.引起豬咳嗽的幾種傳染病的診斷[J].養(yǎng)殖技術(shù)顧問,2014(12):125-125.
[2]Barry S J, Dane A D, Morice A H, et al. The automatic recognition and counting of cough[J]. Cough, 2006, 2(1): 1-9.
[3]劉振宇,赫曉燕,桑靜,等.基于隱馬爾可夫模型的豬咳嗽聲音識(shí)別的研究[C]//中國畜牧獸醫(yī)學(xué)會(huì)信息技術(shù)分會(huì).中國畜牧獸醫(yī)學(xué)會(huì)信息技術(shù)分會(huì)第十屆學(xué)術(shù)研討會(huì)論文集.中國畜牧獸醫(yī)學(xué)會(huì)信息技術(shù)分會(huì),2015:6
[4]路青起, 白燕燕. 基于雙門限兩級(jí)判決的語音端點(diǎn)檢測(cè)方法[J].電子科技, 2012, 25(1): 13-15.
[5]羅雅琴, 吳小培, 呂釗, 等. 滑動(dòng)窗累積量的遞推估計(jì)算法及其在語音端點(diǎn)檢測(cè)中的應(yīng)用[J].聲學(xué)學(xué)報(bào), 2015, 40(5): 730-738.
[6]薛勝堯. 基于改進(jìn)型雙門限語音端點(diǎn)檢測(cè)算法的研究[J].電子設(shè)計(jì)工程, 2015(4): 78-81.
[7]張仁志, 崔慧娟. 基于短時(shí)能量的語音端點(diǎn)檢測(cè)算法研究[J].電聲技術(shù), 2005(7): 52-54.
[8]李寧. 咳嗽音識(shí)別方法的應(yīng)用研究[D]. 重慶:重慶大學(xué), 2010.
[9]石銳, 李寧, 何慶華. 咳嗽識(shí)別中的端點(diǎn)檢測(cè)方法[J]. 重慶理工大學(xué)學(xué)報(bào)(自然科學(xué)版), 2010 (8): 43-48.
(編輯:李曉斌)
Application of end point detection in pig cough signal detection
Ma Huidong*, Liu Zhenyu
(CollegeofInformationScienceandEngineering,ShanxiAgriculturalUniversity,Taigu030801,China)Abstract:Aiming at the low efficiency artificial diagnosis in large pig farms, we had a study on the pig cough sound signal and proposed an automation detection scheme of the pig cough sound. Considering the characteristics of the pig cough sound signal, we made some improvements of the endpoint detection algorithm which is widely used in speech recognition, and applied it in the pig cough sound signal detection. The scheme provides the effective signal for the artificial and automated diagnosis of the pig cough related diseases. We verified the scheme in 150 pig cough recordings, the detection correct rate was above 96%. The error detection rate was lower than 4%, so the detection scheme is effective and practical.
Key words:Pig cough sound detection; End point detection; Short-term energy; Short-term zero crossing rate
收稿日期:2016-02-28 修回日期:2016-03-16
作者簡介:馬輝棟(1986-),女(漢),山西大同人,助教,碩士,研究方向:農(nóng)業(yè)物聯(lián)網(wǎng)
基金項(xiàng)目:國家高技術(shù)研究發(fā)展計(jì)劃(863計(jì)劃)(2013AA102306)、山西農(nóng)業(yè)大學(xué)科技創(chuàng)新基金(20142-17)
中圖分類號(hào):TN912.34; S858.28
文獻(xiàn)標(biāo)識(shí)碼:A
文章編號(hào):1671-8151(2016)06-0445-05