張平,馮海泓,,胡曉城
?
PEAQ在揚聲器異常音檢測中的應(yīng)用
張平1,馮海泓1,2,胡曉城2
(1. 中國科學(xué)院聲學(xué)研究所東海研究站,上海 200032;2. 中國科學(xué)院聲學(xué)研究所嘉興工程中心,浙江嘉興 314006)
揚聲器異常音作為產(chǎn)品音質(zhì)好壞的一種具體表現(xiàn)形式,其檢測問題也屬于音質(zhì)評價的一方面。故本文借鑒國際電信聯(lián)盟推薦的音頻質(zhì)量感知評價算法PEAQ(Perceptual Evaluation of Audio Quality)的實現(xiàn)原理,將其中的人耳聽覺模型應(yīng)用在揚聲器的異常音檢測中。取標準揚聲器樣品的聲信號作為參考信號,待測揚聲器的聲信號作為待測信號,兩個信號通過人耳聽覺模型逐幀處理后,計算得到信號感知差異曲線,用以區(qū)分異常音樣品。人耳聽覺模型包括了中外耳頻率加權(quán)、聽覺濾波器分組、添加內(nèi)部噪聲以及掩蔽效應(yīng)模擬。將本文所述方法與人工聽音以及國際通用的高階諧波檢測揚聲器異常音的方法做了比較,實驗室檢測結(jié)果驗證了該方法的可行性。
音頻質(zhì)量感知評價;揚聲器異常音;人耳聽覺模型;掩蔽效應(yīng)
由于裝配錯誤、材料缺陷和雜質(zhì)混入等多種原因,導(dǎo)致?lián)P聲器發(fā)出有別于合格揚聲器的聲音,稱為揚聲器異常音[1]。揚聲器異常音的客觀檢測,以人耳的評判結(jié)果為最終標準,本身主觀制約因素比較多,另一方面還涉及到揚聲器的輻射模型、聽音環(huán)境、房間因素以及人耳的生理和心理模型等多個方面的相互影響,因此現(xiàn)在還沒有完善的解決方案,是國際電聲行業(yè)中的一個難點。
揚聲器的異常音檢測是一個多維的檢測任務(wù),它不但涉及聲信號的物理參數(shù)(聲壓級、諧波失真等),還涉及到心理聲學(xué)因素(聲音響度、粗糙度、尖銳度等)以及心理因素。
目前國際上通用的揚聲器異常音檢測算法多是通過分析高階諧波失真來做出判斷,未能充分考慮人耳的聽覺特性,僅考慮揚聲器聲響應(yīng)信號的物理參數(shù),其客觀檢測結(jié)果與人耳聽音結(jié)果的一致性還存在誤差。
在揚聲器音質(zhì)評價領(lǐng)域中,音頻質(zhì)量的感知評價(Perceptual Evaluation of Audio Quality, PEAQ)是國際電信聯(lián)盟推薦的音質(zhì)評價算法[2],該算法很好地建立并應(yīng)用了人耳感知模型,在主客觀評價一致性上得到了業(yè)內(nèi)認可。該算法目前多用于評價音頻信號編碼器的性能,在揚聲器檢測領(lǐng)域鮮有應(yīng)用。
揚聲器異常音作為音質(zhì)的一種特殊表現(xiàn)形式,其檢測問題也屬于音質(zhì)評價的一方面。故將PEAQ應(yīng)用于揚聲器異常音檢測,是一項有意義的嘗試。
PEAQ以人耳聽覺模型為基礎(chǔ),通過時頻變換、頻帶分組、掩蔽計算等方法較好地模擬了人耳對聲音產(chǎn)生響應(yīng)到最終感知的全過程,是目前針對音頻質(zhì)量客觀評價算法中與主觀評價結(jié)果相關(guān)度最高的算法[3]。
1.1 PEAQ算法原理
PEAQ算法原理框圖如圖1所示。
參考信號和測試信號分別經(jīng)過心理聲學(xué)模型處理后,各自的輸出經(jīng)由感知模型計算出一系列模型輸出參數(shù)(Model Output Variables, MOV)。最后,由神經(jīng)網(wǎng)絡(luò)模塊把這些模型輸出參數(shù)映射為一個客觀差異等級輸出[4](Objective Difference Grade,ODG)。
心理聲學(xué)模型:將音頻輸入信號通過FFT變換至頻域,模擬中外耳對聲音的頻率特性進行頻譜系數(shù)加權(quán),然后通過聽覺濾波器映射到生理感知域;最后根據(jù)心理聲學(xué)理論,考慮頻域掩蔽效應(yīng)和時域掩蔽效應(yīng)計算掩蔽門限。
感知模型:負責(zé)信號分析和綜合,計算響度值、信號帶寬、噪掩比等,目的是更好地模擬人耳的感覺特性。
神經(jīng)網(wǎng)絡(luò):負責(zé)將以上兩個模塊計算出的模型輸出參數(shù)映射成一個客觀差異等級。PEAQ采用了BP神經(jīng)網(wǎng)絡(luò)模型進行映射。
客觀差異等級在0~-4之間,分別對應(yīng)5個等級的損害程度[3],如表1所示。
表1 5個等級損害程度對應(yīng)的ODG值
針對不同的需求,PEAQ給出了兩種版本的計算模式[2],即更注重實時性的基礎(chǔ)版本(Basic Version, BV)和更注重精度的高級版本(Advanced Version, AV)。兩種版本的區(qū)別在于感知模型中從頻域映射到音調(diào)域的方法不同?;A(chǔ)版本采用了快速傅里葉變換的方法,高級版本同時采用快速傅里葉變換和濾波器組的方法。
揚聲器異常音作為音質(zhì)好壞的極端表現(xiàn),基礎(chǔ)版本的精度完全可滿足其檢測需求,同時揚聲器異常音的檢測又是一個實時性的處理任務(wù),故本文主要采用了PEAQ基礎(chǔ)版本的算法。
1.2 揚聲器異常音檢測實現(xiàn)步驟
將參考信號與測試信號預(yù)處理后按幀截取,輸入至人耳聽覺模型。人耳聽覺模型分為五個模塊逐步實現(xiàn),包括中外耳頻率加權(quán)模塊、聽覺濾波器分組模塊、添加內(nèi)部噪聲模塊、頻域擴展模塊和時域擴展模塊。通過人耳聽覺模型處理后,得到參考信號與測試信號的掩蔽值,最后計算兩個信號掩蔽之后的差異。具體算法流程如圖2所示。
1.2.1 信號預(yù)處理
保留聲信號響應(yīng)的幅度頻率特性,幅度不做調(diào)整,僅對信號做同步處理。同步方法采用添加頭信號后Notch濾波提取的方法[5]。信號同步后,時域樣點值記為[],以幀為單位截取信號進行計算,每一幀的長度為。則第幀信號為
其中,為每一幀內(nèi)的時域樣點數(shù)。實際計算時,取=2048,后一幀信號向后平移1024點。在采樣率=48 kHz時,一幀的時域分辨率約為20 ms。
1.2.2 加窗FFT
為了防止頻譜混疊,需要對每幀信號經(jīng)漢寧窗濾波,離散漢寧窗公式[6]如下:
通過離散傅里葉變換將加窗后的時域信號轉(zhuǎn)換到頻域,即:
(3)
1.2.3 中外耳頻率加權(quán)
模擬人中外耳聽覺特性,按照式(4)進行頻域加權(quán)[7],得到中外耳頻率加權(quán)后的輸出,見式(5)。
(5)
1.2.4 聽覺濾波器分組
聽覺濾波器在20 Hz~20 kHz聽覺范圍內(nèi)分成109組,每組濾波器稱為一個子帶,其上下限頻率及中心頻率均已知[2]。將每個子帶內(nèi)的信號能量值相加得到一個子帶內(nèi)的輸出,其中表示第組聽覺濾波器。
1.2.5 加入內(nèi)部噪聲
給各個濾波器組添加一段內(nèi)部噪聲,噪聲經(jīng)驗公式[7]見式(6),與上一步得到的相加得到,見式(7)。
(7)
1.2.6 頻域擴展
應(yīng)用Terhardt心理聲學(xué)模型中的頻率擴展函數(shù)[7],模擬頻域掩蔽效應(yīng)。將各子帶的能量經(jīng)由擴展函數(shù)分配至整個聽域空間,那么第子帶的能量就是各子帶能量在該帶貢獻的加和。該擴展函數(shù)的上下行斜率如式(8)、式(9)所示。
(9)
1.2.7 時域擴展
利用一階低通濾波器模擬時域掩蔽效應(yīng)[4],計算公式如下:
參數(shù)由時間系數(shù)確定,公式如下:
(11)
1.2.8 計算信號差異值
計算信號的掩蔽值[2]為
其中,=0.25 Bark,表示每組濾波器的臨界頻帶率。
將參考信號和待測信號分別通過上述人耳感知模型模塊,分別計算得到和,然后按式(13)計算兩者的差異[4]。
將每一幀得到信號差異值連接,得到時域上信號的感知差異曲線,該差異曲線即用來判斷揚聲器樣品是否存在異常音現(xiàn)象。
實驗的硬件平臺使用了嘉興中科聲學(xué)科技有限公司的TrueSound檢測系統(tǒng)。實驗對象選用了直徑20 mm的微型揚聲器(見圖3)。激勵信號為連續(xù)對數(shù)掃頻信號,頻率范圍100 Hz~20 kHz,激勵電壓為1 Vrms,掃頻時間為2 s。
實驗分為三部分進行。實驗1比較了不同參考信號下差異曲線的檢測效果。實驗2給出三種典型揚聲器異常音的檢測結(jié)果。實驗3與人耳聽音及高階諧波檢測異常音的方法做比對。
2.1 實驗1:參考信號的選取
第一種方案:采用原始激勵信號作為參考信號,計算揚聲器的聲響應(yīng)信號與激勵信號的差異。
比較了揚聲器合格樣品與不合格樣品的差異曲線,如圖4所示。
第二種方案:采用標準揚聲器樣品的聲響應(yīng)信號作為參考信號,標準樣品由人工聽音后預(yù)先選出。同樣計算1#不合格品與3#不合格品的差異曲線,如圖5所示。
兩種方案相比,3#異常音樣品均可以有效區(qū)分,但是1#異常音樣品方案二的區(qū)分度要大于方案一。分析原因為,當(dāng)以激勵信號作為參考信號時,由于揚聲器非線性響應(yīng)造成其聲響應(yīng)信號與激勵信號的差異值在50~100左右,導(dǎo)致異常音特征帶來的差異5~10被掩蓋所致。
故采用標準揚聲器聲響應(yīng)信號作為參考信號較優(yōu)。
2.2 實驗2:典型的揚聲器異常音檢測效果
典型揚聲器異常音有“擦圈”(音圈運動中接觸到導(dǎo)磁柱)、“異物”(鐵粉或其他異物在揚聲器磁隙內(nèi)部)、“打線”(振膜或振膜在運動中接觸到引線),檢測效果如圖6所示。
(a) “擦圈”揚聲器檢測結(jié)果
(b) “異物”揚聲器檢測結(jié)果
2.3 實驗3:批量驗證
利用本文介紹的方法信號感知差異曲線方法(Perceptual Difference curve Method, PDM)和高階諧波檢測異常音的方法(High Order harmonic Detection, HOD)總計測試405個揚聲器樣品,驗證與人耳聽音的一致性。
首先將所有揚聲器樣品人工聽音檢測,區(qū)分出200個揚聲器良品與205個揚聲器不良品。
然后分別用PDM和HOD方法對上述405個樣品進行檢測。僅對信號差異曲線和高階諧波曲線設(shè)置門限的檢測結(jié)果如表2所示。PDM方法相較于HOD方法,漏檢率1.5%低于HOD檢測的30%。
表2 兩種方法的批量驗證結(jié)果
虛警:指人耳聽音合格的樣品被儀器客觀檢測為不合格。漏檢:指人耳聽音不合格的樣品被儀器客觀檢測為合格。
增加揚聲器頻響曲線、諧波失真以及阻抗曲線等其他測試參數(shù)后,檢測結(jié)果如表3所示。PDM的漏檢率降低至1%左右,HOD方法降低至7.90%。
表3 增加其他測試參數(shù)后兩種方法的批量驗證結(jié)果
在HOD綜合檢測的基礎(chǔ)上,增加PDM判斷,將兩種方法結(jié)合后的檢測結(jié)果如表4所示。綜合檢測結(jié)果中虛警率上升至22%,沒有漏檢。
2.4 實驗分析
相比于HOD方法,PDM方法漏檢率更低,與人耳的判斷一致性更好。
(1) 異常音分析的頻段覆蓋揚聲器整個響應(yīng)頻帶,可有效檢測中高頻段的異常音特征。
如圖7所示,該揚聲器在5.5 kHz處有異常音,但由于高階諧波檢測方法受限于采樣率,無法分析至該頻率處,造成漏檢。
(2) 揚聲器樣品的異常音特征體現(xiàn)在低階次失真上,微型揚聲器中此類樣品較多。針對此類樣品PDM依然可將信號差異提取出,而HOD方法則需要額外借助于測試2~5階諧波等參數(shù)的檢測。
如圖8所示為800 Hz處有異常音的揚聲器樣品檢測曲線。在800 Hz左右,該揚聲器的2-5階諧波失真明顯。
(3) 針對微弱揚聲器異常音樣品,PDM的區(qū)分度要優(yōu)于HOD方法。
如圖9所示,該揚聲器在諧振頻率處存在微弱異常音,高階諧波能量僅高出合格品2~3 dB左右,使用HOD方法無法有效區(qū)分,而使用PDM方法,在經(jīng)過人耳感知模型加強后,可有效判別該異常音特征。
(4) 同人耳聽音的結(jié)果相比,使用感知差異曲線檢測異常音的方法依然存在不足之處。
虛警:虛警樣品多在揚聲器諧振頻率附近和10 kHz以后誤報。在諧振頻率處,此款微型揚聲器的音質(zhì)較差,人耳判別亦存在誤差。此外,檢測曲線的門限由手動調(diào)整,還存在不足。
漏檢:由于信號差異計算以幀為單位進行,當(dāng)某幀信號的頻率分布不同、但總能量相近時,該處的差異不能有效區(qū)分出來。如圖10所示。
(5) 當(dāng)將HOD方法和PDM方法結(jié)合在一起判斷時,其漏檢率低于任一單個方法的判斷結(jié)果,也進一步表明揚聲器異常音檢測是聲信號物理參數(shù)和人耳感知因素的綜合體現(xiàn)。
本文借鑒PEAQ的實現(xiàn)原理,將人耳感知模型應(yīng)用于揚聲器異常音檢測,計算信號通過感知模型后的差異來辨別是否存在異常音,最后與人耳聽音和高階諧波檢測方法的實驗比對分析,驗證了該方法的可行性。
本文所述方法還需要企業(yè)實際應(yīng)用時大批量的驗證,并根據(jù)檢測結(jié)果進一步分析。此外,實際應(yīng)用時,如何建立神經(jīng)學(xué)習(xí)網(wǎng)絡(luò)以設(shè)置合理的判斷門限也是一項非常重要的工作。
[1] 楊益, 韋峻峰, 溫周斌, 等. 揚聲器異常音的快速檢測方法及其實驗研究[J]. 聲學(xué)學(xué)報, 2010, 35(5): 562-570.
YANG Yi, WEI Junfeng, WEN Zhoubin, et al. A fast method with experiment for loudspeaker defects detection[J]. Acta Acustica, 2010, 35(5): 562-570.
[2] Method for objective measurements of perceived audio quality[S/OL] ITU-R BS.1387-1 https://www.itu.int/dms_ pubrec/itu-r/rec/bs/R-REC-BS.1387-1-200111-I!!PDF-E.pdf
[3] 姜甜. 音頻信號質(zhì)量主、客觀評價的計算機模擬[D]. 北京: 清華大學(xué), 2005.
JIANG Tian, Computer simulation of subjective and objective assessment of audio quality[D]. Beijing: Tsinghua University, 2005.
[4] 孫明. PEAQ音頻質(zhì)量評價算法研究與實現(xiàn)[D]. 大連: 大連理工大學(xué), 2009.
SUN Ming, Research and implementation of perceptual evaluation of audio quality[D]. Dalian: Dalian University of Technology, 2009.
[5] 張平, 馮海泓, 溫周斌, 等. 電聲測試中同步信號的設(shè)計與處理[C]//聲學(xué)所第三屆青年學(xué)術(shù)會議論文, 2009.
ZHANG Ping, FENG Haihong, WEN Zhoubin, et al. The design and research of sync signal used in electrical-acoustic detect system[C]// The third IACAS youth conference paper, 2009.
[6] Sanjit K. Mitra Digital Signal Processing: A Computer-Based Approach[M]. 3rd Edition. McGraw-Hill Higher Education, 2000.
[7] Temme S, Brunet P. Practical Measurement of Loudspeaker Distortion Using a Simplified Auditory Perceptual Model[C]// Audio Engineering Society Convention Paper, 2009.
The application of PEAQ to the rub&buzz detection of loudspeaker
ZHANG Ping1, FENG Hai-hong1,2, HU Xiao-cheng2
(1. Shanghai Acoustic Laboratory, Chinese Academy of Sciences, Shanghai 200032, China;2. Jiaxing Engineering Center, Institute of Acoustics, Chinese Academy of Sciences,Jiaxing314006, Zhejiang, China)
As the rub&buzz of loudspeaker is one aspect of audio quality, this paper suggests a new method called PDM to detect the loudspeaker rub&buzz based on the PEAQ algorithm (Perceptual Evaluation of Audio Quality). The differences between the test signals and the
ignal, which are considered by human auditory characteristics, are calculated frame by frame to distinguish tested speakers. The human auditory model contains outer-middle ear frequency weighting, auditory filter groping, internal noise and masking effects in time and frequency domains. Compared with the existing HOD (high order harmonic detection) method, the results of laboratory experiments proved the practicability of the PDM method.
Perceptual Evaluation of Audio Quality(PEAQ); rub&buzz of loudspeaker; human auditory model; mask effect
TB533
A
1000-3630(2015)-06-0529-06
10.16300/j.cnki.1000-3630.2015.06.012
2015-01-18;
2015-05-16
張平(1984-), 男, 山東泰安人, 碩士研究生, 研究方向為電聲檢測技術(shù)。
張平, E-mail: zhangping@mail.ioa.ac.cn