金龍娥,黃澤好,2,陳華語,鄒艾宏,陳 寶
(1.重慶理工大學(xué) 車輛工程學(xué)院, 重慶 400054;2.重慶理工大學(xué) 汽車零部件先進(jìn)制造技術(shù)教育部重點(diǎn)實(shí)驗(yàn)室, 重慶 400054;3.重慶金康賽力斯新能源汽車設(shè)計(jì)院有限公司, 重慶 401120)
汽車關(guān)門聲的聲品質(zhì)是表征汽車品質(zhì)的重要指標(biāo),因此研究其聲品質(zhì)具有重要意義。為快速而高效評(píng)價(jià)汽車關(guān)門聲聲品質(zhì),國(guó)內(nèi)眾多學(xué)者進(jìn)行了研究[1-3],趙麗路[4]基于經(jīng)驗(yàn)?zāi)B(tài)分解和Hilbert-Huang變換提出新的關(guān)門聲聲品質(zhì)評(píng)價(jià)參數(shù),并通過多元線性回歸建立了關(guān)門聲聲品質(zhì)評(píng)價(jià)模型;楊川等[5]基于偽WIGNER-VILLE分布提出一種新的關(guān)門聲聲品質(zhì)評(píng)價(jià)參數(shù),并與主觀績(jī)效值做相關(guān)分析,結(jié)果表明新的評(píng)價(jià)參數(shù)與主觀績(jī)效值的相關(guān)性比傳統(tǒng)心理聲學(xué)參數(shù)更高,更能準(zhǔn)確評(píng)價(jià)關(guān)門聲聲品質(zhì);張福運(yùn)[6]采用集合經(jīng)驗(yàn)?zāi)B(tài)方法處理關(guān)門聲信號(hào),引入能量概念構(gòu)造特征向量作為關(guān)門聲聲品質(zhì)評(píng)價(jià)的輸入,結(jié)果表明以能量特征向量為輸入的聲品質(zhì)評(píng)價(jià)模型的精度高于以心理聲學(xué)客觀參數(shù)為輸入的評(píng)價(jià)模型;王巖松等[7]提出一種將最優(yōu)小波包變換與人工神經(jīng)網(wǎng)絡(luò)相結(jié)合的聲品質(zhì)識(shí)別方法。國(guó)外的汽車聲品質(zhì)研究多側(cè)重于車內(nèi)聲品質(zhì)領(lǐng)域[8-11],而對(duì)汽車關(guān)門聲聲品質(zhì)關(guān)注較少。
汽車關(guān)門聲作為非平穩(wěn)信號(hào)[12],具有較強(qiáng)的時(shí)頻變化特征,文獻(xiàn)[12]針對(duì)平穩(wěn)信號(hào)和非平穩(wěn)信號(hào)的心理客觀參數(shù)進(jìn)行研究,發(fā)現(xiàn)平穩(wěn)信號(hào)的心理聲學(xué)客觀參數(shù)基本維持在一定幅度內(nèi)不會(huì)改變,而非平穩(wěn)信號(hào)的心理聲學(xué)客觀參數(shù)在短短幾秒內(nèi)會(huì)發(fā)生劇烈變化,并且信號(hào)的時(shí)長(zhǎng)會(huì)影響心理聲學(xué)客觀參數(shù)的均值。因此,僅在頻域內(nèi)計(jì)算非平穩(wěn)聲信號(hào)的心理聲學(xué)客觀參數(shù)均值并不能準(zhǔn)確描述人的主觀感受[12]。為準(zhǔn)確分析和描述人對(duì)非平穩(wěn)聲信號(hào)的主觀感受,本文以乘用車關(guān)門聲為研究對(duì)象,采用小波包時(shí)頻分析方法對(duì)其進(jìn)行研究,分別建立基于心理聲學(xué)客的關(guān)門聲聲品質(zhì)評(píng)價(jià)模型和基于頻帶聲能量的關(guān)門聲聲品質(zhì)評(píng)價(jià)模型,并對(duì)2個(gè)模型的評(píng)價(jià)結(jié)果進(jìn)行分析。
聲樣本采集環(huán)境為半消聲室,本底噪聲17 dB,應(yīng)用HEAD人工頭測(cè)量,三腳架支撐人工頭頭頂距離地面、車門把手中心和車門外沿分別為1 715、300、400 mm,試驗(yàn)工況為關(guān)門速度(1.0±0.02)m/s、(1.2±0.02)m/s、(1.4±0.02)m/s。為保證采集到有效信號(hào),對(duì)9款車每個(gè)工況采集3個(gè)聲樣本,從開始關(guān)門前2 s進(jìn)行采集,每個(gè)聲樣本采集時(shí)間為10 s,剔除有噪聲干擾的聲樣本,每款車每個(gè)工況選擇一個(gè)有效聲樣本,得到有效聲樣本27個(gè)??紤]到主觀評(píng)價(jià)試驗(yàn)中,聽音時(shí)間過長(zhǎng)會(huì)使聽音者產(chǎn)生疲勞,而降低主觀評(píng)價(jià)的準(zhǔn)確性,因此在不影響聲樣本完整性的前提下,在Artemis軟件中將聲樣本截取成2.5 s。為保證截取的2.5 s聲信號(hào)能代表原信號(hào),截取時(shí)保留峰值部分,對(duì)截取的2.5 s信號(hào)進(jìn)行時(shí)頻分析,主沖擊時(shí)間、峰值聲壓級(jí)、低頻延續(xù)時(shí)間等所有特征[13]與10 s信號(hào)對(duì)照一致。
汽車關(guān)門聲是汽車關(guān)門撞擊時(shí)產(chǎn)生的非平穩(wěn)信號(hào)[12],其持續(xù)時(shí)間較短,這里僅以其中一個(gè)信號(hào)為例分析,該聲壓曲線如圖1所示,曲線中最高峰值由關(guān)門時(shí)發(fā)生第一次碰撞產(chǎn)生,約7.5 Pa;聲壓曲線經(jīng)過不斷振蕩,后面的峰值大小表征聲音的衰減程度,持續(xù)1 s,聲壓衰減到0 Pa。
圖1 樣本序號(hào)1.6聲樣本聲壓曲線
圖2為該聲樣本時(shí)頻圖,縱軸為頻率,橫軸為時(shí)間,顏色表示聲音的強(qiáng)度,時(shí)頻圖可以表征各個(gè)頻率下的聲音強(qiáng)度與車門部件模態(tài)特征之間的關(guān)系[14]。由圖2可知汽車關(guān)門聲覆蓋的頻率范圍寬,高頻成分主要由門鎖碰撞產(chǎn)生,最高頻率在10 kHz以上,并且隨著時(shí)間推移各頻率成分逐漸衰減;聲音強(qiáng)度以低頻成分為主,低頻成分主要由車門與車身的碰撞及輻射產(chǎn)生,其強(qiáng)度也隨時(shí)間逐漸衰減。汽車關(guān)門聲樣本所包含的頻率成分及聲音強(qiáng)度均表現(xiàn)出較強(qiáng)的時(shí)變特征,說明運(yùn)用時(shí)頻分析方法對(duì)其進(jìn)行研究非常有必要。
圖2 樣本序號(hào)1.6聲樣本時(shí)頻圖
主觀偏好性是用來描述人對(duì)聽到的聲音的喜愛程度,將其作為本試驗(yàn)的主觀評(píng)價(jià)指標(biāo)。成對(duì)比較法因具有操作簡(jiǎn)單、適用于無經(jīng)驗(yàn)聽音者的優(yōu)點(diǎn),被廣泛應(yīng)用于主觀評(píng)價(jià)試驗(yàn)。本試驗(yàn)一共27個(gè)聲樣本,采用成對(duì)比較法進(jìn)行聽音,將聲樣本隨機(jī)兩兩配對(duì)進(jìn)行比較,共有729個(gè)比較組。邀請(qǐng)24位聽音者進(jìn)行主觀評(píng)價(jià)試驗(yàn),試驗(yàn)前為所有聽音者進(jìn)行培訓(xùn),使其了解試驗(yàn)內(nèi)容及規(guī)則。
考慮到聽音時(shí)間過長(zhǎng)會(huì)使聽音者產(chǎn)生疲勞和分心,從而降低評(píng)價(jià)的準(zhǔn)確性和一致性,對(duì)評(píng)價(jià)結(jié)果進(jìn)行誤判分析,結(jié)合3個(gè)類型的誤判(相同聲樣本對(duì)、交換聲樣本對(duì)、三角循環(huán)聲樣本對(duì))計(jì)算計(jì)權(quán)一致性系數(shù),并按照誤判剔除原則[15]對(duì)計(jì)權(quán)一致性系數(shù)低于0.75的聽音者的評(píng)價(jià)數(shù)據(jù)予以剔除,如表1所示,剔除R5、R8、R21、R24。
表1 計(jì)權(quán)一致性系數(shù)
對(duì)余下20位聽音者的評(píng)價(jià)數(shù)據(jù)進(jìn)行處理,經(jīng)過算術(shù)平均得到如表2所示的主觀評(píng)價(jià)結(jié)果。由表2可以看出,隨著關(guān)門速度的提高,主觀偏好值普遍降低。
表2 主觀評(píng)價(jià)結(jié)果
BP神經(jīng)網(wǎng)絡(luò)是一種按照誤差逆向傳播算法訓(xùn)練的多層前饋網(wǎng)絡(luò),是目前應(yīng)用最廣泛的神經(jīng)網(wǎng)絡(luò)之一[16]。該網(wǎng)絡(luò)采用誤差回傳的方式來調(diào)整網(wǎng)絡(luò)的權(quán)值和閾值,但網(wǎng)絡(luò)權(quán)值和閾值初始值的確定會(huì)影響網(wǎng)絡(luò)學(xué)習(xí)的好壞。遺傳算法(genetic algorithms,GA)是一種模擬自然界遺傳機(jī)制和生物進(jìn)化論的并行隨機(jī)搜索最優(yōu)化方法,具有良好的隨機(jī)性、并行性和全局尋優(yōu)能力[16]。鑒于以上優(yōu)良特性,采用遺傳算法對(duì)BP神經(jīng)網(wǎng)絡(luò)權(quán)值和閾值初始值進(jìn)行全局尋優(yōu),提高BP神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)的準(zhǔn)確性。
GA-BP神經(jīng)網(wǎng)絡(luò)模型搭建步驟如下:
第1步:確定網(wǎng)絡(luò)初始結(jié)構(gòu),由此確定GA算法中染色體長(zhǎng)度;
第2步:將BP神經(jīng)網(wǎng)絡(luò)的權(quán)值、閾值編碼為染色體,產(chǎn)生初始種群,并選用合適的適應(yīng)度函數(shù)對(duì)個(gè)體進(jìn)行適應(yīng)度值計(jì)算;
第3步:通過選擇、交叉、變異操作,不斷產(chǎn)生和篩選新的染色體,直到得到滿足條件的個(gè)體;
第4步:對(duì)滿足條件的個(gè)體進(jìn)行解碼,并將解碼后的權(quán)值、閾值賦予BP神經(jīng)網(wǎng)絡(luò);
第5步:對(duì)經(jīng)GA算法優(yōu)化后的BP神經(jīng)網(wǎng)絡(luò)進(jìn)行訓(xùn)練,直至滿足條件。
GA-BP神經(jīng)網(wǎng)絡(luò)模型流程如圖3所示。
圖3 GA-BP神經(jīng)網(wǎng)絡(luò)模型流程框圖
響度、尖銳度、粗糙度、波動(dòng)度等心理聲學(xué)參數(shù)是汽車聲品質(zhì)評(píng)價(jià)的常用客觀參數(shù),用以描述聲音特征,目前僅響度與尖銳度有國(guó)家計(jì)算標(biāo)準(zhǔn),在Artemis軟件中,導(dǎo)入聲樣本進(jìn)行心理聲學(xué)客觀參數(shù)的計(jì)算,提取關(guān)注較多的6個(gè)參數(shù)[1,4,6,12,16]:響度、尖銳度、A計(jì)權(quán)聲壓級(jí)、粗糙度、語言清晰度、波動(dòng)度,如表3所示。
表3 心理聲學(xué)客觀參數(shù)
將表3中的6個(gè)心理聲學(xué)客觀參數(shù)作為輸入,主觀偏好值作為輸出,基于Matlab環(huán)境建立GA-BP關(guān)門聲聲品質(zhì)評(píng)價(jià)模型,將27個(gè)聲樣本導(dǎo)入模型后,劃分為訓(xùn)練集(22個(gè)聲樣本)和測(cè)試集(5個(gè)聲樣本)。
基于心理聲學(xué)客觀參數(shù)的關(guān)門聲聲品質(zhì)評(píng)價(jià)模型(evaluation model of door closing sound quality based on psychoacoustic objective parameters,EMDCSQ-POP)采用三層神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu),如圖4所示,輸入層(input)、隱含層(hidden layer)與輸出層(output layer)節(jié)點(diǎn)數(shù)分別為:6、10、1,隱含層選用logsig傳遞函數(shù),輸出層選用purelin傳遞函數(shù),W代表各層之間的權(quán)值矩陣,b代表各層之間的閾值向量。
圖4 基于心理聲學(xué)客觀參數(shù)的神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)示意圖
如圖5所示,訓(xùn)練集與測(cè)試集的均方誤差分別為1.685 6、0.694 96,擬合系數(shù)R2分別為0.939 9、0.789 7,雖然模型整體預(yù)測(cè)精度較高,預(yù)測(cè)值與真實(shí)值之間表現(xiàn)出較好的相關(guān)性,但由圖5可以看出針對(duì)部分樣本仍存在較大誤差。
圖5 基于心理聲學(xué)客觀參數(shù)的關(guān)門聲聲品質(zhì)評(píng)價(jià)模型結(jié)果曲線
小波變換又稱多分辨率分析,在時(shí)域和頻域都具有良好的局部化特性,適宜于分析任意尺度的信號(hào)。小波包變換作為小波變換的推廣,能夠?qū)π盘?hào)的低頻部分和高頻部分進(jìn)行分解,具有更強(qiáng)的時(shí)頻局部化分析能力,其理論與方法在信號(hào)處理、語音分析等領(lǐng)域已廣泛應(yīng)用[17-18],但在聲品質(zhì)領(lǐng)域應(yīng)用較少。
根據(jù)人耳的聽覺多頻帶濾波特性,將頻域進(jìn)行重新劃分,形成24Bark域,每個(gè)Bark域形成一個(gè)臨界頻帶,在一個(gè)帶寬內(nèi)人耳的聽覺感知是相同的,臨界頻帶能很好地反映人腦對(duì)聽力的特征[14]。借鑒24 Bark域的頻率劃分方式,應(yīng)用小波包變換構(gòu)造濾波器組模擬人耳聽覺特征頻帶濾波功能[19],選擇db35小波作為基函數(shù),在Matlab環(huán)境下對(duì)聲樣本進(jìn)行分解,并對(duì)小波包樹中的節(jié)點(diǎn)進(jìn)行再分解和合并,在Matlab中進(jìn)行小波包變換存在高頻翻轉(zhuǎn)的現(xiàn)象[20],考慮到此原因其頻帶分布如表4所示。
表4 小波包變換下的頻帶分布
小波包變換將原本的非平穩(wěn)信號(hào)分解為多個(gè)頻帶的信號(hào)分量,每個(gè)信號(hào)分量表征該頻帶內(nèi)的頻率成分隨時(shí)間的變化。小波包變換從全頻域、全時(shí)域?qū)π盘?hào)進(jìn)行分解,更有利于非平穩(wěn)信號(hào)的分析。
為評(píng)價(jià)關(guān)門聲聲品質(zhì),需構(gòu)造聲樣本的特征向量,引入能量概念來表征各個(gè)頻帶在全時(shí)域范圍內(nèi)的聲音強(qiáng)度,計(jì)算每個(gè)頻帶內(nèi)的聲能量(如表5所示),從而構(gòu)造聲樣本能量特征向量。
表5 各頻帶聲能量
將聲樣本能量特征向量作為聲品質(zhì)評(píng)價(jià)模型的輸入,主觀偏好值作為輸出,構(gòu)建基于頻帶聲能量的GA-BP關(guān)門聲聲品質(zhì)評(píng)價(jià)模型(evaluation model of door closing sound quality of frequency band sound energy,EMDCSQ-FBSE),其訓(xùn)練集和測(cè)試集的劃分與3.1節(jié)一樣。
基于頻帶聲能量的關(guān)門聲聲品質(zhì)評(píng)價(jià)模型采用三層神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu),如圖6所示,輸入層(input)、隱含層(hidden layer)與輸出層(output layer)節(jié)點(diǎn)數(shù)分別為:24、12、1,隱含層選用logsig傳遞函數(shù),輸出層選用purelin傳遞函數(shù),W代表各層之間的權(quán)值矩陣,b代表各層之間的閾值向量。
圖6 基于小波包變換的神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)示意圖
如圖7所示,訓(xùn)練集與測(cè)試集的均方誤差分別為0.065 9、0.002 8,擬合系數(shù)R2分別為0.998 1、0.999 4,表明模型預(yù)測(cè)精度高,預(yù)測(cè)值與真實(shí)值之間表現(xiàn)出更好的相關(guān)性,預(yù)測(cè)值能夠較好地反映真實(shí)值的變化趨勢(shì),說明小波包變換下的頻帶聲能量與主觀偏好性之間呈現(xiàn)較好的映射關(guān)系,使模型在學(xué)習(xí)后能夠呈現(xiàn)更好的預(yù)測(cè)效果。
圖7 基于小波包變換的關(guān)門聲聲品質(zhì)評(píng)價(jià)模型結(jié)果曲線
對(duì)模型性能評(píng)價(jià)通常采用平均絕對(duì)誤差、均方誤差、擬合系數(shù)等來指標(biāo)進(jìn)行評(píng)價(jià)[6,12,15],平均絕對(duì)誤差能夠避免誤差間相互抵消,可以準(zhǔn)確反映預(yù)測(cè)數(shù)據(jù)與原始數(shù)據(jù)之間的誤差大??;均方誤差常用來表征數(shù)據(jù)的變化程度,均方誤差值越小,表明模型對(duì)原始數(shù)據(jù)的描述精確度更好;擬合系數(shù)是表征回歸時(shí)擬合程度的指標(biāo),其值越大說明擬合得越好。對(duì)3.1節(jié)、3.2節(jié)2個(gè)模型的評(píng)價(jià)數(shù)據(jù)如表6所示??芍陬l帶聲能量的關(guān)門聲聲品質(zhì)評(píng)價(jià)模型其誤差絕對(duì)值均值、均方誤差、擬合系數(shù)分別為0.046 6、0.002 8和0.999 5,與基于客觀參數(shù)的模型相比,分別降低0.553 1,降低0.692 2,提高0.209 8。
表6 測(cè)試集誤差分析
由圖5、圖7可知,相比基于客觀參數(shù)的關(guān)門聲聲品質(zhì)評(píng)價(jià)模型,基于頻帶聲能量的關(guān)門聲聲品質(zhì)評(píng)價(jià)模型在訓(xùn)練集、測(cè)試集上的表現(xiàn)都更好。由于汽車關(guān)門聲信號(hào)是非平穩(wěn)信號(hào),傳統(tǒng)心理聲學(xué)的參數(shù)曲線會(huì)隨時(shí)間推移產(chǎn)生較大變化,當(dāng)取值方式不同時(shí)會(huì)對(duì)聲品質(zhì)評(píng)價(jià)結(jié)果產(chǎn)生影響。而運(yùn)用小波包變換將關(guān)門聲樣本基于24Bark域分解為24個(gè)信號(hào)分量,完全覆蓋圖2所示的頻率范圍,并且基于小波包變換構(gòu)造的能量特征向量將圖2中涵蓋的能量分布信息進(jìn)行量化,表征了聲信號(hào)各頻帶在全時(shí)域上的能量分布情況,可基于關(guān)門聲樣本自身的信息對(duì)其進(jìn)行評(píng)價(jià),更適合汽車非平穩(wěn)聲信號(hào)的聲品質(zhì)評(píng)價(jià)。
考慮到關(guān)門聲的非平穩(wěn)特性,應(yīng)用小波包時(shí)頻分析方法構(gòu)建了符合人耳聽覺特征的濾波器組;借鑒24Bark域劃分頻帶,并計(jì)算各頻帶內(nèi)的聲能量,構(gòu)造了聲樣本能量特征向量;建立了基于頻帶聲能量的GA-BP神經(jīng)網(wǎng)絡(luò)關(guān)門聲聲品質(zhì)評(píng)價(jià)模型。模型性能指標(biāo)表明,基于頻帶聲能量的關(guān)門聲聲品質(zhì)評(píng)價(jià)模型在誤差絕對(duì)值均值、均方誤差、擬合系數(shù)方面均優(yōu)于以傳統(tǒng)心理聲學(xué)客觀參數(shù)為輸入的聲品質(zhì)評(píng)價(jià)模型,以頻帶聲能量為輸入的聲品質(zhì)評(píng)價(jià)模型在預(yù)測(cè)精度上有明顯提高。因此,基于頻帶聲能量的聲品質(zhì)評(píng)價(jià)方法更適合于汽車非平穩(wěn)聲信號(hào)的聲品質(zhì)評(píng)價(jià),可運(yùn)用于汽車關(guān)門聲聲品質(zhì)評(píng)價(jià)工作中。