亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        異常聲信號(hào)采集與識(shí)別系統(tǒng)設(shè)計(jì)與實(shí)現(xiàn)

        2022-04-01 11:33:46郭夢(mèng)寒譚景文劉亦凡江富榮趙丹誠(chéng)
        電聲技術(shù) 2022年1期
        關(guān)鍵詞:信號(hào)模型

        郭夢(mèng)寒,譚景文,劉亦凡,江富榮,趙丹誠(chéng)

        (桂林電子科技大學(xué),廣西 桂林 541004)

        0 引言

        在傳統(tǒng)公共安全監(jiān)測(cè)領(lǐng)域,大多數(shù)系統(tǒng)僅通過(guò)攝像頭采集視頻信息來(lái)監(jiān)測(cè)是否有異常情況出現(xiàn)。由于存在光線、角度及位置的限制,視頻監(jiān)控系統(tǒng)只能監(jiān)控特定場(chǎng)景,存在監(jiān)控盲區(qū),而且捕獲的圖像只是被記錄下來(lái),在危險(xiǎn)發(fā)生后進(jìn)行驗(yàn)證,無(wú)法進(jìn)行實(shí)時(shí)報(bào)警[1]。伴隨著社會(huì)經(jīng)濟(jì)的快速增長(zhǎng)和科學(xué)技術(shù)的不斷發(fā)展,人們對(duì)公共安全的監(jiān)測(cè)要求越來(lái)越高,視頻監(jiān)控系統(tǒng)的局限性更加凸顯。因此,與視頻監(jiān)控相比,高效且成本低的異常聲監(jiān)控系統(tǒng)逐漸受到科研人員的廣泛關(guān)注[2]。

        本文研究了異常聲信號(hào)的采集與識(shí)別。采集部分使用Respeaker 開(kāi)發(fā)板,識(shí)別部分應(yīng)用聲音信號(hào)的梅爾頻率倒譜系數(shù)(Mel-Frequency Cepstral Coefficients,MFCC)特征,同時(shí)通過(guò)卷積神經(jīng)網(wǎng)絡(luò)(Convolutional Neural Networks,CNN)對(duì)尖叫聲、鳴笛聲、鞭炮聲三種異常聲的數(shù)據(jù)集進(jìn)行訓(xùn)練,得到異常聲模型,通過(guò)提取異常聲信號(hào)的特征與模型進(jìn)行匹配,輸出識(shí)別結(jié)果。

        1 系統(tǒng)架構(gòu)

        異常聲監(jiān)控系統(tǒng)分為采集與識(shí)別兩部分。當(dāng)拾音器檢測(cè)到環(huán)境中有異常聲時(shí),開(kāi)始執(zhí)行采集程序,錄制音頻。被采集到的異常聲信號(hào)會(huì)通過(guò)采樣、量化及編碼等過(guò)程由模擬信號(hào)轉(zhuǎn)化為數(shù)字信號(hào),并通過(guò)無(wú)線傳輸?shù)男问綄?shí)現(xiàn)服務(wù)器對(duì)異常聲信號(hào)的接收與保存,等待后續(xù)識(shí)別程序的執(zhí)行。本文采用的異常聲識(shí)別方案是對(duì)輸入的異常聲信號(hào)先進(jìn)行預(yù)處理,得到有效聲音片段,然后提取特征參數(shù)并將其與訓(xùn)練好的異常聲分類模型進(jìn)行匹配,輸出識(shí)別結(jié)果,總體流程如圖1 所示。

        圖1 總體方案流程圖

        2 異常聲識(shí)別算法

        2.1 異常聲信號(hào)預(yù)處理

        預(yù)處理部分使用雙門限法對(duì)異常聲信號(hào)進(jìn)行端點(diǎn)檢測(cè),確定異常聲的起始點(diǎn)和終止點(diǎn),將有聲段和無(wú)聲段區(qū)分開(kāi)。雙門限法是一個(gè)基于音頻短時(shí)能量和短時(shí)過(guò)零率這兩個(gè)特征來(lái)完成端點(diǎn)檢測(cè)的方法,共設(shè)有3 個(gè)閾值。前兩個(gè)是音頻短時(shí)能量閾值,第三個(gè)是音頻短時(shí)過(guò)零率閾值。

        2.2 異常聲信號(hào)特征提取

        在異常聲監(jiān)控領(lǐng)域,聲音特征參數(shù)和分類器的選擇直接影響監(jiān)控系統(tǒng)的復(fù)雜度和識(shí)別性能[3],選擇并提取出合適的特征參數(shù),可以減少后續(xù)識(shí)別階段的數(shù)據(jù)計(jì)算量。MFCC 是基于人的聽(tīng)覺(jué)特性、利用人聽(tīng)覺(jué)的臨界帶效應(yīng),在Mel 標(biāo)度頻率域提取出來(lái)的倒譜特征參數(shù),很好地模擬了人的聽(tīng)覺(jué)特性,是使用最為廣泛的特征。在此基礎(chǔ)上,本項(xiàng)目研究了異常聲信號(hào)MFCC 特征的提取方法,具體流程如圖2 所示。

        圖2 特征參數(shù)提取流程圖

        2.3 卷積神經(jīng)網(wǎng)絡(luò)

        常用的分類模型有CNN、高斯混合模型(Gaussian Mixture Model,GMM)、隱馬爾科夫模型(Hidden Markov Model,HMM)和支持向量機(jī)(Support Vector Machine,SVM)等[3-4]。CNN 是一類包含卷積計(jì)算且具有深度結(jié)構(gòu)的前饋神經(jīng)網(wǎng)絡(luò),可以進(jìn)行特征學(xué)習(xí),它提供在時(shí)間和空間上的平移不變性卷積,可以克服異常聲信號(hào)所面臨的多樣性,提高異常聲識(shí)別率,目前已被廣泛應(yīng)用于語(yǔ)音識(shí)別領(lǐng)域,以改進(jìn)傳統(tǒng)聲學(xué)模型的魯棒性弱、實(shí)時(shí)性差、識(shí)別性能低等缺點(diǎn)[5]。

        本項(xiàng)目采用CNN 訓(xùn)練尖叫聲、鳴笛聲、鞭炮聲三種異常聲模型,并將異常聲的特征與異常聲模型進(jìn)行預(yù)測(cè),從而輸出識(shí)別結(jié)果,訓(xùn)練流程如圖3 所示。CNN 整體結(jié)構(gòu)包含了輸入層、卷積層、池化層、拼接層以及全連接層,在提取樣本的MFCC 參數(shù)和LOGMEL 參數(shù)后,通過(guò)CNN 對(duì)特征參數(shù)進(jìn)行訓(xùn)練,同時(shí)進(jìn)行異常聲的識(shí)別。CNN 的結(jié)構(gòu)如圖4 所示。

        圖3 異常聲訓(xùn)練流程圖

        圖4 卷積神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)

        3 實(shí)驗(yàn)結(jié)果

        3.1 實(shí)驗(yàn)數(shù)據(jù)集的特點(diǎn)及評(píng)估指標(biāo)

        本實(shí)驗(yàn)從數(shù)據(jù)集中選取了兩種比較典型的異常聲即尖叫聲和鳴笛聲,每種類別的聲音樣本數(shù)量均為900 余條,然后按照7 ∶3 的比例將聲音樣本隨機(jī)劃分為訓(xùn)練集和測(cè)試集。鞭炮聲通過(guò)團(tuán)隊(duì)采集制作成適合實(shí)驗(yàn)使用的數(shù)據(jù)集。評(píng)估異常聲信號(hào)識(shí)別方法的評(píng)估指標(biāo)為查準(zhǔn)率(Precision),表示正確識(shí)別到的異常聲信號(hào)數(shù)量占識(shí)別到該異常聲信號(hào)數(shù)量的比率,計(jì)算時(shí)采用公式(1):

        式中:TP稱為真正例(Ture Positive),F(xiàn)P稱為假正例(False Positive)。在評(píng)估指標(biāo)中,查準(zhǔn)率越高,說(shuō)明檢測(cè)系統(tǒng)性能越好。

        3.2 實(shí)驗(yàn)內(nèi)容及結(jié)果分析

        實(shí)驗(yàn)時(shí),使用藍(lán)牙音箱播放異常聲,拾音器進(jìn)行異常聲的采集與傳輸。拾音器與藍(lán)牙音箱間無(wú)遮擋物且拾音器、藍(lán)牙音箱距聲音反射物體(墻壁、板、管道等)的最小距離不小于1 m。

        團(tuán)隊(duì)在教室室內(nèi)和校園中幾處不同的地點(diǎn)分別做了多次測(cè)試。先求取每個(gè)室外或室內(nèi)地點(diǎn)5 m范圍內(nèi)的平均識(shí)別率,然后再求出整體的平均識(shí)別率。表1 為在室內(nèi)5 m 范圍內(nèi)對(duì)三種異常聲進(jìn)行采集測(cè)試的平均識(shí)別率,其中系統(tǒng)對(duì)尖叫聲和鞭炮聲的平均識(shí)別率較高,對(duì)鳴笛聲識(shí)別率較低;表2為在室外5 m 范圍內(nèi)對(duì)三種異常聲進(jìn)行采集測(cè)試的平均識(shí)別率,測(cè)試結(jié)果與表1 相似,即系統(tǒng)對(duì)尖叫聲和鞭炮聲較為敏感。

        表1 室內(nèi)5 m 范圍內(nèi)異常聲的平均識(shí)別率

        表2 室外5 m 范圍內(nèi)異常聲的平均識(shí)別率

        4 結(jié)語(yǔ)

        本文設(shè)計(jì)并實(shí)現(xiàn)了一種異常聲信號(hào)采集與識(shí)別系統(tǒng),使用藍(lán)牙音箱和拾音器在室內(nèi)外對(duì)尖叫聲、鳴笛聲及鞭炮聲進(jìn)行測(cè)試。實(shí)驗(yàn)結(jié)果表明,系統(tǒng)對(duì)尖叫聲和鞭炮聲的平均識(shí)別率高于對(duì)鳴笛聲的平均識(shí)別率,但是同一類型的異常聲在室內(nèi)外的識(shí)別率波動(dòng)不大。系統(tǒng)對(duì)部分類型的異常聲識(shí)別率不高,可能是提取的聲音特征過(guò)于單一等原因造成的。如何提高卷積神經(jīng)網(wǎng)絡(luò)對(duì)異常聲的識(shí)別性能是今后的研究重點(diǎn)。

        猜你喜歡
        信號(hào)模型
        一半模型
        信號(hào)
        鴨綠江(2021年35期)2021-04-19 12:24:18
        重要模型『一線三等角』
        完形填空二則
        重尾非線性自回歸模型自加權(quán)M-估計(jì)的漸近分布
        孩子停止長(zhǎng)個(gè)的信號(hào)
        3D打印中的模型分割與打包
        基于LabVIEW的力加載信號(hào)采集與PID控制
        一種基于極大似然估計(jì)的信號(hào)盲抽取算法
        FLUKA幾何模型到CAD幾何模型轉(zhuǎn)換方法初步研究
        2018国产精华国产精品| 国产色第一区不卡高清| 久久精品人搡人妻人少妇| 芒果乱码国色天香| 久久精品国产夜色| 精品丝袜一区二区三区性色| 亚洲中文字幕精品久久吃奶| 欧美69久成人做爰视频| 无码丰满少妇2在线观看| 91久国产在线观看| 野花视频在线观看免费| 天堂中文最新版在线中文| 无码人妻丰满熟妇精品区| 69搡老女人老妇女老熟妇| 91国产精品自拍在线观看| 国产高潮视频在线观看| 久久久久成人亚洲综合精品| 精品国产乱码一区二区三区| 黄片视频免费在线观看国产| 国产伦精品一区二区三区| 亚洲欧美日韩一区二区在线观看| 中文字幕精品人妻丝袜| 久久精品国产字幕高潮| 熟女体下毛荫荫黑森林| a级大胆欧美人体大胆666| 久久99国产亚洲高清| 亚洲综合国产精品一区二区| 97久久国产亚洲精品超碰热| 后入内射欧美99二区视频| 亚洲啪啪AⅤ一区二区三区| 久久99精品国产麻豆| 精品人妻中文无码av在线| 国产高潮精品久久AV无码| 精品国产日产av在线| 欧美不卡一区二区三区| 99这里只有精品| 国产极品嫩模大尺度在线播放| 国99精品无码一区二区三区| 99精品国产综合久久久久五月天| 亚洲国产字幕| 有坂深雪中文字幕亚洲中文|