李貴容 張鳳 周建梅
摘 要:傳統(tǒng)電子助聽器只單純的從外界采集聲音并放大,這會(huì)造成外界的噪音與人說(shuō)話的語(yǔ)音同時(shí)被放大,可能會(huì)對(duì)聽損者聽力造成二次傷害。基于此,本文設(shè)計(jì)了一種基于深度學(xué)習(xí)的可降噪助聽器,主要通過(guò)可深度學(xué)習(xí)的神經(jīng)網(wǎng)絡(luò)本設(shè)計(jì)基于樹莓派單片機(jī)平臺(tái),通過(guò)陣列麥克風(fēng)接收并判斷外界的聲音,采用寬帶MVDR后置維納濾波算法進(jìn)行初步的降噪,之后利用深度學(xué)習(xí)的對(duì)抗神經(jīng)網(wǎng)絡(luò)對(duì)輸入的聲信號(hào)分離出語(yǔ)音信號(hào)和噪音信號(hào),并對(duì)其進(jìn)行有效的降噪處理,實(shí)現(xiàn)了在復(fù)雜噪音環(huán)境下的降噪處理功能,在此性能上可達(dá)到人與人之間正常交流的聲音分貝要求,最終實(shí)現(xiàn)在不影響正常助聽功能的同時(shí)保護(hù)佩戴者的聽力。
關(guān)鍵詞:深度學(xué)習(xí);樹莓派單片機(jī);數(shù)字助聽器;神經(jīng)網(wǎng)絡(luò);麥克風(fēng)陣列;寬帶MVDR后置維納濾波算法
1 作品介紹
1.1 設(shè)計(jì)背景
自二十世紀(jì)初,電子助聽器被啟用以來(lái),電子助聽器一直幫助著聽障者恢復(fù)聽力。作為一種小型的擴(kuò)音器,簡(jiǎn)單的把原本聲音擴(kuò)大,再利用聽障者殘余的聽力,使聲音能傳送大腦中樞而感覺(jué)到聲音。但這無(wú)疑會(huì)導(dǎo)致噪聲與語(yǔ)音同時(shí)被放大,并不能很好的幫助聽障者交流。非平穩(wěn)或多噪聲情形下的語(yǔ)音增強(qiáng)是助聽器等設(shè)備的研究重點(diǎn),雙耳助聽是近年來(lái)復(fù)雜環(huán)境下研究的重要方向之一,其可有效減緩正常耳朵聽力受損,為患者在復(fù)雜環(huán)境下提供更好的助聽體驗(yàn)。
1.2 創(chuàng)作目的
利用噪聲信號(hào)包絡(luò)的噪聲抑制技術(shù)能明顯的抑制噪聲,然而該算法仍有一些不足:(1)預(yù)處理算法經(jīng)常將一些不可預(yù)見的聲學(xué)失真引入信號(hào)中;
(2)一些算法(例如,子空間算法)在計(jì)算量上需求較大并且難以跟現(xiàn)有的助聽器降噪策略進(jìn)行融合;(3)不能針對(duì)所有的用戶使用情況進(jìn)行調(diào)節(jié),在某些噪聲環(huán)境中可能無(wú)法滿足助聽器使用者的降噪需要。
針對(duì)這樣的現(xiàn)狀,提出使用深度學(xué)習(xí)的方法,改善助聽器在噪聲環(huán)境下的助聽效果。通過(guò)深度學(xué)習(xí)算法不僅能夠有效的降低環(huán)境中噪音,使在多數(shù)場(chǎng)景下能夠改善使用效率和舒適度,通過(guò)算法技術(shù)也能夠降低硬件的成本。
2 總體設(shè)計(jì)
可降噪助聽器主要由三個(gè)模塊構(gòu)成:基于麥克風(fēng)矩陣的聲音接收模塊、基于深度學(xué)習(xí)的信號(hào)處理算法模塊、授話器(揚(yáng)聲器)模塊。通過(guò)麥克風(fēng)陣列得到聲音信號(hào)并轉(zhuǎn)化為電信號(hào),首先通過(guò)麥克風(fēng)陣列算法增強(qiáng)語(yǔ)音,然后通過(guò)深度學(xué)習(xí)模塊分離出其中的語(yǔ)音與噪聲信號(hào)。對(duì)噪聲信號(hào)做降噪處理,最后將處理后的信號(hào)放大輸出。通過(guò)授話器傳給聽損者。軟件部分的設(shè)計(jì)主要包括麥克風(fēng)陣列部分的算法,以及神經(jīng)網(wǎng)絡(luò)部分的算法。深度學(xué)習(xí)的神經(jīng)網(wǎng)絡(luò)算法主要包括兩個(gè)部分,對(duì)語(yǔ)音與噪音進(jìn)行分別。以及將分別出的降噪進(jìn)行降噪處理。麥克風(fēng)陣列也通過(guò)算法對(duì)語(yǔ)音與噪音分離起到了增強(qiáng)的作用。
3 硬件設(shè)計(jì)
參考典型的數(shù)字助聽器結(jié)構(gòu),本文設(shè)計(jì)了以單片機(jī)為核心的麥克風(fēng)陣列數(shù)字助聽器,軟件部分結(jié)合了深度學(xué)習(xí)。其硬件結(jié)構(gòu)如圖1所示。
3.1 麥克風(fēng)陣列設(shè)計(jì)
麥克風(fēng)陣列結(jié)構(gòu)拾取實(shí)際環(huán)境下聲音的復(fù)雜度如圖2所示,基本上由三種語(yǔ)音源發(fā)出的聲波在空氣中傳播,傳播過(guò)程中沒(méi)有遇到障礙直接傳達(dá)到拾音器,語(yǔ)音源發(fā)出的聲波在傳播過(guò)程中通過(guò)反射面的反射再傳達(dá)到拾音器及其他無(wú)用生源的環(huán)境背景雜聲。
麥克風(fēng)陣列的排列結(jié)構(gòu)可以分為三種。一維線性陣列,二維平面陣列,三維立體結(jié)構(gòu)陣列。考慮到設(shè)計(jì)難度與實(shí)際需求采用一維陣列排列。
3.2 基于深度學(xué)習(xí)處理的算法模塊
算法模塊主要通過(guò)集成的樹莓派單片機(jī)實(shí)現(xiàn),通過(guò)對(duì)單片機(jī)的編程,實(shí)現(xiàn)軟件所需的各種算法。樹莓派單片機(jī)結(jié)構(gòu)如圖2所示。
3.3 授話器(揚(yáng)聲器)模塊
授話器模塊主要采用了普通常見的授話器模塊,并沒(méi)有做過(guò)多的改變。
4 結(jié)論
基于深度學(xué)習(xí)的可降噪助聽器在解決聽損者交流與使用問(wèn)題上有著重要的意義。通過(guò)對(duì)噪音的去除提高了聽損者的使用感受。本文針對(duì)助聽器硬件部分給出設(shè)計(jì)。估計(jì)了麥克風(fēng)陣列的算法有效性。同樣對(duì)于設(shè)備的實(shí)用性還需要在多場(chǎng)景下進(jìn)行不斷測(cè)試,目前在國(guó)內(nèi)市場(chǎng)有很大的擴(kuò)展空間。
參考文獻(xiàn)
[1]趙力,張昕然,梁瑞宇,等.數(shù)字助聽器若干關(guān)鍵算法研究現(xiàn)狀綜述[J].南京:東南大學(xué)信息科學(xué)與工程學(xué)院,2017.
[2]曲奕澎.麥克風(fēng)陣列數(shù)字助聽器的硬件設(shè)計(jì)與實(shí)現(xiàn)[D]. 哈爾濱工業(yè)大學(xué),2015.