亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        時(shí)頻特征的海豚發(fā)聲端點(diǎn)檢測方法研究*

        2023-09-20 06:50:06楊昱皞何瑞麟戴陽方亮賀劉剛
        應(yīng)用聲學(xué) 2023年5期
        關(guān)鍵詞:信號檢測

        楊昱皞 何瑞麟 戴陽 方亮 賀劉剛

        (1 大連海洋大學(xué)航海與船舶工程學(xué)院 大連 116023)

        (2 中國水產(chǎn)科學(xué)研究院東海水產(chǎn)研究所農(nóng)業(yè)農(nóng)村部漁業(yè)遙感重點(diǎn)實(shí)驗(yàn)室 上海 200090)

        (3 中國水產(chǎn)科學(xué)研究院南海水產(chǎn)研究所 廣州 510300)

        0 引言

        海豚是鯨類哺乳動物,廣泛生活于全球各大海域,在內(nèi)海及入海口附近的咸淡水中也有分布,是我國國家重點(diǎn)保護(hù)野生動物之一。海豚的聲信號主要分為3 類:回聲定位信號(click)、脈沖信號(burst-pulse)、通訊信號(whistle)[1-2],whistle 信號主要集中在8~15 kHz,burst-pulse 信號主要集中在15~30 kHz,click 信號主要集中在100~150 kHz[3]。其中click信號是海豚捕食、定位等主要活動的聲信號,是進(jìn)行海豚生物特征以及種群資源調(diào)查的重要研究對象[4]。

        海洋環(huán)境噪聲場是海洋環(huán)境中普遍存在而又不期望出現(xiàn)的背景聲場。它是由風(fēng)浪、降雨、航船、海洋生物、人類工業(yè)活動等因素產(chǎn)生的,是主被動聲吶的主要聲學(xué)背景干擾[5]。雖然目前有許多研究通過繪制信號聲譜圖,將聲音問題轉(zhuǎn)化為圖像問題,再使用深度學(xué)習(xí)或機(jī)器學(xué)習(xí)等方式進(jìn)行識別[6],但無論是使用哪種方式,都包含大量噪聲的干擾,因此數(shù)據(jù)的預(yù)處理變得尤為重要。除海洋環(huán)境的噪聲干擾外,另一難點(diǎn)是海豚有3 種聲信號,其中click 信號的頻率往往超過人耳聽力范圍,聲音的傳播特性又使得高頻分量衰減得更加迅速,導(dǎo)致人工處理信號制作數(shù)據(jù)集變得困難,使用深度學(xué)習(xí)的方法識別難以進(jìn)行[7]。

        國內(nèi)外對于海洋生物的聲音已經(jīng)有不同程度的研究。在Hildebrand等[8]的海洋哺乳動物信號檢測和分類性能指標(biāo)研究中,發(fā)現(xiàn)用于檢測的數(shù)據(jù)集受到干擾使得分析數(shù)據(jù)時(shí)非常耗時(shí),說明要研究海洋中的目標(biāo)生物聲音,如何降低噪聲及其他生物聲音的干擾是檢測海洋動物聲信號的必要條件。牛富強(qiáng)等[9-10]發(fā)現(xiàn)在不同的聲行為下,印度洋瓶鼻海豚(Tursiops aduncus)發(fā)出的click信號頻譜特性變化趨勢基本一致;黃龍飛等[11]對普里茲灣虎鯨(Orcinus orca) click 信號進(jìn)行了檢測,發(fā)現(xiàn)click 脈沖間隔的范圍為10.5~183.5 ms;周韋崢嶸等[12]對中華白海豚(Sousa chinensis)的whistle信號進(jìn)行了統(tǒng)計(jì)分析,得到了海豚whistle信號的諧波特性。上述研究表明海豚不同聲信號相對于海洋環(huán)境噪聲場都具有持續(xù)時(shí)間短、頻率高的特點(diǎn),這些特征為檢測海豚聲信號提供了重要的基礎(chǔ)。Roch等[13]通過人工制作數(shù)據(jù)集根據(jù)時(shí)域變化訓(xùn)練了回聲定位檢測,得到了良好的效果,說明時(shí)域上的特征可以用于識別海豚聲音;Gillespie等[14]在齒鯨類全自動檢測和物種分類方法中發(fā)現(xiàn),當(dāng)聲音中包含的物種從4 種提高至12 種時(shí),準(zhǔn)確率從94%下降至58.5%;Miller等[15]使用開源軟件PAMguard 對須鯨(Balaenoptera)叫聲進(jìn)行跟蹤并驗(yàn)證其功能,發(fā)現(xiàn)檢測難度隨著聲信號時(shí)間和帶寬的變化而升高。以上兩種研究表明,要更準(zhǔn)確地識別出鯨豚類的聲信號,需要同時(shí)考慮海洋環(huán)境中包含的物種、時(shí)間、帶寬的信息。Frasier[16]在使用深度學(xué)習(xí)識別物種齒鯨信號的研究中,使用了無監(jiān)督聚類的方法得到齒鯨的信號,通過齒鯨click 信號的聲譜形狀和分布間隔識別;王宸等[17]在中華白海豚(Sousa chinensis) click 信號識別的研究中,結(jié)合能源算子方法和濾波器對click信號實(shí)現(xiàn)自動檢測。以上研究表明,研究海豚的聲音需要海豚聲音的數(shù)據(jù)集,海洋環(huán)境中海豚的聲信號具有高頻、寬帶和短時(shí)的特點(diǎn),海洋環(huán)境噪聲場具有物種復(fù)雜、持續(xù)時(shí)間長、頻率分布廣的特點(diǎn)。如果能夠獲得準(zhǔn)確的海豚聲音數(shù)據(jù)集,海洋環(huán)境噪聲場干擾等問題可以相應(yīng)解決。結(jié)合時(shí)域特征、噪聲環(huán)境特征、持續(xù)時(shí)間、頻域特征,本文提出一種基于時(shí)頻特征的海豚發(fā)聲端點(diǎn)檢測方法研究。

        端點(diǎn)檢測是為了找到聲頻信號的開始和結(jié)束位置,對語聲和非語聲的區(qū)域進(jìn)行區(qū)分。端點(diǎn)檢測已經(jīng)廣泛應(yīng)用于語聲識別、語聲增強(qiáng)和聲頻分類技術(shù)的前端,可以簡化語聲識別過程中的冗余數(shù)據(jù),加快識別速度[18]。常用的檢測方法有:(1) 雙門限法端點(diǎn)檢測,利用短時(shí)能量和短時(shí)過零率設(shè)定兩個(gè)門限可以較好地區(qū)分濁音、清音和靜音,但是在海洋環(huán)境中噪聲場和其他生物發(fā)聲同樣會導(dǎo)致過零率產(chǎn)生變化,過零率不能作為海豚聲音檢測的參數(shù);(2) 自相關(guān)法,使用自相關(guān)函數(shù)求出語聲波形序列的基音周期實(shí)現(xiàn)噪聲的區(qū)分,但是海豚的聲音和海洋環(huán)境的噪聲場都沒有規(guī)律,沒有穩(wěn)定的基音周期,不足以分辨海豚聲音;(3) 譜熵法,是根據(jù)熵來表示信號的有序程度,而海洋環(huán)境中的所有聲信號都是無序的,熵不能夠在復(fù)雜環(huán)境中區(qū)分出目標(biāo)生物的聲音;(4) 比例法等其他方法。這些方法在物種信息多、頻率范圍廣、能量大和無序性的海洋環(huán)境中并不適用。

        本文提出的一種基于時(shí)頻特征的海豚發(fā)聲端點(diǎn)檢測方法研究,以海洋環(huán)境噪聲場和海豚叫聲作為研究主體,綜合時(shí)頻特征研究海豚發(fā)聲的端點(diǎn)檢測技術(shù),為研究海豚發(fā)聲習(xí)性、海豚聲音識別及生物保護(hù)奠定基礎(chǔ)。

        1 方法及原理

        1.1 流程設(shè)計(jì)

        首先對獲取的海洋聲音,按照一定長度存儲;再將每段聲頻按照海豚的發(fā)聲特征選擇合適的長度進(jìn)行分幀,并計(jì)算出每一幀的短時(shí)能量;對每一幀信號做離散傅里葉變換,對不同的頻率范圍設(shè)計(jì)不同權(quán)重,求得加權(quán)后的譜質(zhì)心;設(shè)置短時(shí)能量閾值、譜質(zhì)心閾值、譜質(zhì)心二階偏移率;將短時(shí)能量和譜質(zhì)心超過閾值的部分作為備選有效聲段;再分別向備選有效聲段的兩端比較譜質(zhì)心二階偏移率,譜質(zhì)心二階偏移率超過閾值的部分,添加至備選有效聲段生成完整的有效聲段;輸出有效聲段。具體流程圖如圖1所示。

        圖1 端點(diǎn)檢測流程圖Fig.1 Endpoint detection flow chart

        1.2 信號預(yù)處理

        由于數(shù)據(jù)集中聲頻長度不同,處理時(shí)長較長的聲頻需要大量計(jì)算并且輸出的聲譜圖不便于觀察持續(xù)時(shí)間很短的click信號,為了體現(xiàn)每一幀短時(shí)能量、譜質(zhì)心的變化,將所有聲信號切割為時(shí)長1 s 的若干段,切割后不足1 s的樣本舍棄。

        1.3 提取聲頻信號特征

        通過尋找持續(xù)時(shí)間、聲頻能量符合目標(biāo)發(fā)聲特點(diǎn)并且在頻域上符合目標(biāo)發(fā)聲頻率范圍的聲段,即可從聲音文件中區(qū)分出目標(biāo)聲音。由于獲取的聲音能量大小受聲信號種類和距離影響,用能量變化表示發(fā)聲具有不確定性,因此在分析時(shí),更依賴于頻域特征,兩者互相驗(yàn)證,這樣可以減少突發(fā)高頻噪聲和目標(biāo)聲信號能量較弱對結(jié)果的影響。

        1.3.1 信號分幀

        海豚聲信號的特點(diǎn)是持續(xù)時(shí)間短、頻率高。如果每次處理的聲頻時(shí)間過長,在時(shí)域內(nèi)能量變化會被平滑,在頻域內(nèi)傅里葉變換反映出的是信號整體的功率譜特征,會掩蓋短暫發(fā)聲的信息,因此需要對信號進(jìn)行分幀加窗處理。由于不需要對聲音進(jìn)行時(shí)移疊加還原,不需要考慮旁瓣泄漏的問題,因此選擇使用方形窗,步長等于窗長的分析方法。加窗后做短時(shí)傅里葉變換將受到不確定性原理的約束,無法同時(shí)保證時(shí)間分辨率與頻率分辨率達(dá)到最優(yōu),因此窗長應(yīng)根據(jù)實(shí)際情況選擇,加窗計(jì)算公式[19]如下:

        其中,n表示采樣點(diǎn)序號,m表示幀序號,ωn表示分析窗,xn(m)表示第m幀內(nèi)第n采樣點(diǎn)的信號振幅。

        1.3.2 時(shí)域分析

        時(shí)域分析是提取語聲信號的時(shí)域特征,短時(shí)能量、短時(shí)過零率、短時(shí)自相關(guān)系數(shù)和短時(shí)平均幅度差等是最基本的時(shí)域分析參數(shù)。短時(shí)能量是度量聲信號幅值變化的函數(shù),對高電平非常敏感;短時(shí)過零率表示的是信號波穿過橫軸的次數(shù),可以表達(dá)發(fā)生信號的頻次,由于噪聲以及其他生物的聲音也會使短時(shí)過零率增大,因此不適用于海洋環(huán)境中;短時(shí)平均幅度是一幀聲信號的幅度大小的表征,短時(shí)能量通過對信號振幅平方,將振幅的變化擴(kuò)大,因此短時(shí)能量更能夠體現(xiàn)出信號的變化;短時(shí)自相關(guān)系數(shù)是衡量信號自身波形在時(shí)域上變化程度的指標(biāo),但是海洋環(huán)境噪聲場的構(gòu)成很復(fù)雜,由于信號的無序性,短時(shí)自相關(guān)系數(shù)不適用處理海洋環(huán)境聲音。因此選擇短時(shí)能量作為參數(shù),可以增大目標(biāo)聲信號和噪聲之間的區(qū)分度,計(jì)算公式[19]如下:

        式(3)中,Ei是第i幀的短時(shí)能量,N是單幀信號的采樣點(diǎn)數(shù),m是采樣點(diǎn)序號,xn(m)是每一個(gè)采樣點(diǎn)的振幅大小。海洋環(huán)境中的噪聲大多比較平穩(wěn),能量波動范圍不大,當(dāng)出現(xiàn)目標(biāo)聲信號時(shí),該時(shí)刻短時(shí)能量會增大,通過短時(shí)能量和持續(xù)時(shí)間可以一定程度區(qū)分目標(biāo)聲音。

        1.3.3 頻域分析

        對聲音進(jìn)行傅里葉變換,計(jì)算公式[6]如下:

        對于非平穩(wěn)信號來說,傅里葉變換一般是不合適的。傅里葉變換的全局積分導(dǎo)致變換結(jié)果無法提供頻率分量的時(shí)間信息。本文使用短時(shí)傅里葉變換進(jìn)行數(shù)據(jù)處理,加窗后計(jì)算公式[6]如下:

        式(4)~(5)中,X1表示第l幀的傅里葉變換,ωn表示分析窗,xn表示第n采樣點(diǎn)的信號振幅,窗長為N,l表示幀的序號,H表示窗與窗之間的步長,n表示采樣點(diǎn)序號,e-jωt表示復(fù)變函數(shù)。

        利用譜質(zhì)心表征頻譜分布情況,計(jì)算公式[19]如下:

        式(6)中,Ci是第i幀的譜質(zhì)心,N是單幀信號的采樣點(diǎn)數(shù),F(xiàn)k是短時(shí)傅里葉變換后的頻率分量,Xk是對應(yīng)頻率分量的能量大小。

        考慮到海豚聲音的頻率的特征,whistle 信號和burst-pulse 信號主要分布在8000 Hz~30 kHz,click 信號最高可以達(dá)到100~150 kHz,改進(jìn)后的公式為

        式(7)中,Q1是海豚聲音頻率范圍的權(quán)重;Q2是非海豚聲音頻率范圍的權(quán)重;N1是海豚聲音頻率范圍;N2是非海豚聲音頻率范圍。由于海洋環(huán)境噪聲場的低頻能量很大,海豚聲音對譜質(zhì)心的提升不明顯,為了能夠更好地區(qū)分海豚發(fā)聲的聲段,設(shè)定海豚聲音頻率范圍的權(quán)重應(yīng)當(dāng)大于非海豚聲音頻率范圍的權(quán)重。同時(shí)由于海豚的click信號和burst-pulse信號是寬頻信號,所以不能不考慮非海豚聲音頻率范圍的分量。由于本文中使用的實(shí)驗(yàn)數(shù)據(jù)較為純凈,低頻噪聲的能量不大,因此擬定Q1為0.6,Q2為0.4。在不同的環(huán)境或者數(shù)據(jù)中,Q1、Q2的值應(yīng)做適當(dāng)修改。

        為了找到目標(biāo)發(fā)聲的起始點(diǎn)和終止點(diǎn),引入譜質(zhì)心一階偏移率,即每一幀譜質(zhì)心相對于上一幀譜質(zhì)心的變化。譜質(zhì)心二階偏移率,即譜質(zhì)心變化的變化趨勢。圖2 是譜質(zhì)心一階偏移率和二階偏移率的對比圖。

        圖2 譜質(zhì)心一階偏移率和二階偏移率對比圖Fig.2 Comparison diagram of first-order and second-order spectral centroid migration rates

        觀察圖2 中的豎線可得,當(dāng)某一時(shí)刻譜質(zhì)心發(fā)生變化時(shí),譜質(zhì)心一階偏移率尚沒有發(fā)生變化,對于該變化的表達(dá)存在滯后性,而二階偏移率在該點(diǎn)已經(jīng)達(dá)到峰值,可以表現(xiàn)出這一時(shí)刻譜質(zhì)心的變化趨勢,以此可以精確檢測出發(fā)聲的起始點(diǎn)和終止點(diǎn)。

        因?yàn)樾盘柍煞謴?fù)雜、信號中的波形函數(shù)未知,無法建立函數(shù)表達(dá)式,而每一幀之間的時(shí)間間隔很小,所以通過每一幀的譜質(zhì)心進(jìn)行計(jì)算可近似得到二階偏移率,公式如下:

        式(8)~(9)中,i表示幀序號,Ci是譜質(zhì)心,Si是譜質(zhì)心偏移率,Bi是譜質(zhì)心二階偏移率。

        1.3.4 擬定閾值

        圖3 是中華白海豚(Sousa chinensis) click 信號、瓶鼻海豚(Tursiops aduncus) burst-pulse 信號和whistle信號的聲譜圖。

        圖3 不同聲信號的聲譜圖Fig.3 Spectrogram of three kinds of dolphin sound signals

        由圖3(a)可以看到,中華白海豚click 信號持續(xù)時(shí)間約為10 ms 左右,但頻率非常高,可以達(dá)到100 kHz 以上;由圖3(b)可以發(fā)現(xiàn),瓶鼻海豚burst-pulse 信號持續(xù)時(shí)間相對于中華白海豚click信號較長,單次burst-pulse 信號約為0.3 s,頻率在10~20 kHz 之間;由圖3(c)可以發(fā)現(xiàn),瓶鼻海豚whistle 信號持續(xù)時(shí)間約為1 s,頻率在8~20 kHz之間。三幅圖的聲音來自于不同海洋聲音環(huán)境,但是可以發(fā)現(xiàn),噪聲分布均勻,并且噪聲的能量很大,在高頻率上也存在均勻分布的噪聲點(diǎn)。以上信息說明,目標(biāo)聲音一般為短暫的突發(fā)事件,在時(shí)間軸上占比很少,在頻率軸上相對于噪聲的頻譜分布的范圍更高,在部分頻率范圍能量有明顯提升,因此,可根據(jù)噪聲分布的特性確定閾值。對一段2950 s的海洋環(huán)境聲音做散點(diǎn)圖如圖4所示。

        圖4 海洋環(huán)境聲音振幅散點(diǎn)圖Fig.4 Scatter diagram of sound amplitude in marine environment

        通過觀察圖4 可以發(fā)現(xiàn),噪聲在時(shí)間軸上均勻分布,因此當(dāng)出現(xiàn)目標(biāo)聲信號時(shí),該時(shí)刻能量一定大于噪聲能量的均值。圖4 中能量位于0~35000 范圍內(nèi)均勻分布了大量的數(shù)據(jù)點(diǎn),其中最明顯的分界線位于能量15000附近,以此反推能量在0~15000范圍內(nèi)的數(shù)據(jù)占比,得到結(jié)果約為2/3??紤]到聲音的傳播特性,海豚聲音是一種高頻信號,高頻聲音衰減的速度更快,能量相對于低頻更小,能量的閾值應(yīng)當(dāng)?shù)陀谧V質(zhì)心的閾值。因此,擬定短時(shí)能量的閾值為整段信號的能量均值與短時(shí)能量2/3位數(shù)之和的一半,擬定譜質(zhì)心以及譜質(zhì)心二階偏移率的閾值為整段信號譜質(zhì)心的2/3位數(shù)。

        2 實(shí)驗(yàn)與結(jié)果分析

        2.1 實(shí)驗(yàn)數(shù)據(jù)

        實(shí)驗(yàn)數(shù)據(jù)源來自于“Voice in the sea”(https://voicesinthesea.ucsd.edu/)、“Dolphins Underwater Sounds Database” (https://ieee-dataport.org/)、“whoi”(https://cis.whoi.edu/)國外數(shù)據(jù)集。本文實(shí)驗(yàn)平臺為python 和Audition,選取了不同海豚3 種聲信號進(jìn)行實(shí)驗(yàn)??紤]到海豚click 信號為10.5~183.5 ms,將聲頻統(tǒng)一切割為1 s。為了減少計(jì)算機(jī)的計(jì)算量,防止數(shù)據(jù)發(fā)生越界,以輸入的聲信號的最大振幅為1做歸一化處理。

        2.2 實(shí)驗(yàn)設(shè)計(jì)

        (1) 比較不同窗長對檢測結(jié)果的影響。根據(jù)中華白海豚發(fā)聲時(shí)的聲譜圖可以發(fā)現(xiàn)中華白海豚聲音的音節(jié)持續(xù)時(shí)間為10 ms~0.1 s。結(jié)合窗長越長,時(shí)域分辨率越低、頻域分辨率越高的規(guī)律。而本文方法中對時(shí)域分辨率要求高于頻域分辨率要求,所以分別選擇了10 ms、20 ms、50 ms 窗長對比實(shí)驗(yàn),如圖5所示。

        圖5 不同窗長的時(shí)頻特征Fig.5 Time frequency characteristics of different window lengths

        通過對比圖5 可以發(fā)現(xiàn),圖中曲線的平滑度隨著窗長增加而增加。說明窗長越短,短時(shí)能量和譜質(zhì)心對信號的變化越敏感;窗長越長,短時(shí)能量和譜質(zhì)心的變化越平穩(wěn)。檢測海豚click 信號時(shí)需要在很短的時(shí)間內(nèi)檢測出很大的變化,因此需要更高的時(shí)域分辨率、更高的靈敏度,窗長應(yīng)當(dāng)選取較小值;當(dāng)檢測海豚burst-pulse信號和whistle信號時(shí)可以采用稍長的窗長,因?yàn)楹k嗟膚histle 信號和burst-pulse信號的持續(xù)時(shí)間更長,相對click信號頻率變化更小。

        (2) 當(dāng)檢測海豚click 信號時(shí),容易受到突發(fā)高頻噪聲的干擾,因此實(shí)驗(yàn)不同閾值對端點(diǎn)檢測精度的影響。參考1.3.4 節(jié),實(shí)驗(yàn)選取了3 組不同的閾值:①短時(shí)能量的55%分界值、譜質(zhì)心2/3 位數(shù);②短時(shí)能量的均值與2/3 位數(shù)之的均值、譜質(zhì)心2/3 位數(shù);③短時(shí)能量的2/3 位數(shù)、譜質(zhì)心2/3 位數(shù)與譜質(zhì)心3/4 位數(shù)的均值。分別對同一段海洋環(huán)境下中華白海豚click 信號進(jìn)行端點(diǎn)檢測如圖6 所示,圖中每兩條虛線表示一段有效聲頻的起始點(diǎn)和終止點(diǎn)。將不同閾值的檢測結(jié)果進(jìn)行對比如表1、表2所示。

        表1 不同閾值檢測結(jié)果Table 1 Test results of different thresholds

        表2 不同閾值提取出的有效聲段Table 2 Effective segments extracted by different thresholds

        圖6 不同閾值對檢測結(jié)果的影響Fig.6 Influence of different thresholds on detection results

        通過觀察圖6、表1、表2 可以發(fā)現(xiàn),第1 組閾值對信號的變化過于敏感,將信號切割得非常零散,第3 組閾值丟失了部分click 信號,最終選擇第2 組閾值作為檢測閾值,既能夠保證對聲音時(shí)頻變化的靈敏度,也不會丟失click 信號,并且提取的有效聲段包含最少的噪聲。

        (3) 為了測試端點(diǎn)檢測的適應(yīng)性,分別選擇了25 dB、-10 dB、-24 dB 信噪比的環(huán)境下的聲音進(jìn)行實(shí)驗(yàn)。實(shí)驗(yàn)數(shù)據(jù)通過Audition 軟件篩選,分別為“voice in the sea”中的6102500Q、“whoi” 中的61025008、“whoi”中的61025004。為了避免提取出的聲段過短,設(shè)置最大靜音長度為5 幀,當(dāng)有效聲頻之間間隔不超過5 幀時(shí),將其合并為一個(gè)聲段。對信號的提取如圖7 所示,圖中每兩條虛線表示一段有效聲頻的起始點(diǎn)和終止點(diǎn)。檢測結(jié)果如表3所示。

        表3 不同信噪比環(huán)境下檢測結(jié)果Table 3 Test results under different SNR environments

        圖7 不同環(huán)境下端點(diǎn)檢測的結(jié)果Fig.7 Endpoint detection results in different environments

        通過圖7、表3 可以發(fā)現(xiàn),圖7(a)中0 s 和0.2 s附近出現(xiàn)的噪聲、圖7(b)中2.1~3 s 的噪聲和圖7(c)中0.3~0.41 s、0.6~0.75 s出現(xiàn)的突發(fā)噪聲經(jīng)過本方法檢測后沒有加入有效聲段。說明本文使用的基于時(shí)頻特征的海豚發(fā)聲端點(diǎn)檢測方法研究,能夠降低突發(fā)噪聲的干擾。通過觀察表3 可以得出即使在低信噪比的環(huán)境下,檢測存在一定的丟失率,但依然能夠有良好的表現(xiàn)。

        (4) 為了防止環(huán)境聲音突變造成的閾值偏差,程序設(shè)計(jì)了不斷記錄短時(shí)能量和譜質(zhì)心的閾值,每10 幀做一次校核,當(dāng)出現(xiàn)異常波動時(shí),取平均值作為閾值和下一次校核的起始值。

        (5) 與目前比較常用的門限法以及仿照文獻(xiàn)[6,20–21]提出的鳥類端點(diǎn)檢測改進(jìn)的海洋哺乳動物算法進(jìn)行對比,在-24 dB 條件下,采用相同的擬定閾值的方式,對同一段中華白海豚click 信號進(jìn)行端點(diǎn)檢測如圖8 所示。3 種方法的檢測結(jié)果如表4所示。

        表4 不同方法檢測結(jié)果對比Table 4 Comparison of test results by different methods

        圖8 不同方法的端點(diǎn)檢測結(jié)果對比Fig.8 Comparison of endpoint detection results of different methods

        通過表4 可以得到,當(dāng)信噪比條件為-24 dB時(shí),門限法的過零率閾值無法準(zhǔn)確地區(qū)分噪聲和中華白海豚的聲信號,受到噪聲的干擾較大,需要穩(wěn)定的噪聲來確定閾值,閾值確定之后不能夠適應(yīng)噪聲的變化,如圖8(a)所示;仿照文獻(xiàn)[21]鳥類端點(diǎn)檢測法首先通過尋找振幅最大值,在最大值的基礎(chǔ)上向下尋找一定幅度變化的振幅作為檢測閾值,不能夠適應(yīng)海洋中突發(fā)噪聲能量過高的情況,容易遺漏很多中華白海豚的聲信號,如圖8(b)所示;這兩種方法都不能適應(yīng)海洋環(huán)境噪聲場復(fù)雜多變的情況。本文提出的方法在海洋環(huán)境下能夠避開一定程度的突發(fā)高頻噪聲,且準(zhǔn)確地檢測出中華白海豚聲信號,如圖8(c)所示。

        2.3 結(jié)果分析

        實(shí)驗(yàn)中,總共獲得400 個(gè)樣本,12 種海豚的3種聲信號,平均樣本時(shí)長為15 s。識別出的click 信號為2360 個(gè),whistle 信號為1062 個(gè),burst-pulse信號為1361 個(gè),其中將噪聲識別為click 信號的有295個(gè),丟失的click信號為141個(gè),準(zhǔn)確率如表5所示。

        表5 端點(diǎn)檢測準(zhǔn)確率Table 5 Endpoint detection accuracy

        上述結(jié)果表明,本文提出的基于海豚時(shí)頻特性的端點(diǎn)檢測方法能夠滿足時(shí)效性、準(zhǔn)確性、適應(yīng)性的要求。相比于其他應(yīng)用于海豚聲音端點(diǎn)檢測的方法,本方法具有計(jì)算量小、處理速度快的優(yōu)點(diǎn),在低信噪比的條件下對單一海豚依然能夠準(zhǔn)確地提取其某一類聲信號。該方法存在突發(fā)高頻噪聲對檢測結(jié)果的影響這一問題,但是隨著輸入聲信號時(shí)間的增長,噪聲的閾值越來越穩(wěn)定并且貼合噪聲與目標(biāo)聲音的分界線,能夠提高檢測的準(zhǔn)確率。

        3 結(jié)論與討論

        本文提出的基于時(shí)頻特征的海豚發(fā)聲端點(diǎn)檢測方法,結(jié)合聲音的短時(shí)能量、加權(quán)譜質(zhì)心和譜質(zhì)心二階偏移率特征進(jìn)行檢測,通過對比試驗(yàn),發(fā)現(xiàn)可通過調(diào)整窗長和閾值設(shè)定來滿足海豚不同種類聲信號的檢測需求。本方法相比其他常用的端點(diǎn)檢測方法,在只有一種海豚的某一類聲信號的海洋環(huán)境聲場中,能夠減少海洋環(huán)境中的噪聲干擾,并且大幅提高準(zhǔn)確率。但是仍然存在以下問題待解決:

        (1) 完善不同頻率范圍的權(quán)重,目前對海豚聲音的樣本數(shù)量有限,特征了解不足,獲得更加精確的頻率范圍可以降低出現(xiàn)誤判的概率;

        (2) 對于海洋噪聲以及海豚聲音的發(fā)聲機(jī)理認(rèn)識不足,并且人耳聽力范圍有限,無法對超出聽力范圍的聲音人工檢驗(yàn);

        (3) 需要大量不同環(huán)境下的數(shù)據(jù)進(jìn)行實(shí)驗(yàn)測試,目前本次實(shí)驗(yàn)數(shù)據(jù)僅有3類典型的海豚聲信號,3種實(shí)驗(yàn)環(huán)境,具有一定的局限性,而真實(shí)海洋環(huán)境中的數(shù)據(jù)更加復(fù)雜且獲取較為困難。

        未來可以將此方法優(yōu)化后應(yīng)用于海洋環(huán)境中海豚的聲音識別以及聲音特征的研究,通過本方法提取不同海域的海豚聲信號,為海豚不同聲信號制作數(shù)據(jù)集。

        猜你喜歡
        信號檢測
        “不等式”檢測題
        “一元一次不等式”檢測題
        “一元一次不等式組”檢測題
        信號
        鴨綠江(2021年35期)2021-04-19 12:24:18
        “幾何圖形”檢測題
        “角”檢測題
        完形填空二則
        孩子停止長個(gè)的信號
        小波變換在PCB缺陷檢測中的應(yīng)用
        基于LabVIEW的力加載信號采集與PID控制
        chinese国产乱在线观看| 91精品国产一区国产二区久久| 久久99精品久久久大学生| 国产精品夜间视频香蕉| 被黑人做的白浆直流在线播放| 少妇被爽到自拍高潮在线观看| 久久综合久久综合久久| 午夜射精日本三级| 日韩AV不卡六区七区| 亚洲美女性生活一级片| 久久精品不卡一区二区三区| 丰满少妇被粗大的猛烈进出视频| 亚洲熟妇少妇69| 国产偷闻隔壁人妻内裤av| 97超碰国产成人在线| 亚洲综合激情五月丁香六月| 欧美性福利| 亚洲女同av一区二区在线观看| 黄片大全视频在线播放| 国产97色在线 | 亚洲| 亚洲AV无码精品色午夜超碰| 亚洲国产女同在线观看| 暖暖 免费 高清 日本 在线| 久久不见久久见免费视频7| 天天摸天天做天天爽天天舒服| 成人一区二区三区国产| 国产欧美日韩综合精品一区二区| 国产精品密播放国产免费看| 在线免费观看亚洲毛片| 国产一品二品三品精品在线| 纯爱无遮挡h肉动漫在线播放| 免费一级黄色大片久久久| 白嫩少妇高潮喷水av| 国产乱子伦| 夜夜综合网| 国产偷拍自拍在线观看| 亚洲欧美综合精品成人网站| 欧美日韩精品一区二区在线视频| 亚洲女同一区二区久久| 一本色道久久88加勒比一| 国产精品久久久久av福利动漫|