亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        一種基于感知語音質(zhì)量評價的列車顯示器語音自動檢測方法

        2021-03-22 06:26:12張宏偉
        控制與信息技術(shù) 2021年1期
        關(guān)鍵詞:自動測試顯示器音頻

        高 峰,張宏偉

        (株洲中車時代電氣股份有限公司,湖南 株洲 412001)

        0 引言

        隨著復(fù)興號電力動車組的大量投入應(yīng)用,建立一套針對復(fù)興號電力動車組列車顯示器(以下簡稱“列車顯示器”)的全自動測試系統(tǒng)非常重要。語音是列車顯示器與駕駛員間傳遞信息的重要載體之一,但駕駛員對語音的判斷會受駕駛室內(nèi)噪聲的影響;同時列車顯示器在裝配過程中受喇叭公差、殼體公差、電路板輸入信號誤差及背景噪聲等因素的影響,會導(dǎo)致部分喇叭播放的語音存在能被感知到的異音,因此有必要建立一套全自動的語音質(zhì)量評價系統(tǒng)來評價顯示器語音的清晰度、可懂度和自然度[1]。

        列車顯示器測試的一個重要評價指標(biāo)是語音質(zhì)量。探索和研究穩(wěn)定、可靠的語音體驗(yàn)質(zhì)量(quality of experience,QoE) 評價模型/方法成為國內(nèi)外眾多研究者共同的目標(biāo)。目前業(yè)界已有語音質(zhì)量評價技術(shù)包括信噪比(signal noise ratio, SNR)、線性預(yù)測編碼(LPC)、Bark譜失真和聽覺模型等,各評價方法均是基于一個參考音頻來模擬人耳的感知原理,對獲得的音頻進(jìn)行打分。列車顯示器的語音由芯片內(nèi)部的數(shù)字量轉(zhuǎn)換成模擬量并通過喇叭播放出來,類似于移動電話接收信號并轉(zhuǎn)變成語音播放的過程?;谝陨峡紤],一般采用國際電信聯(lián)盟標(biāo)準(zhǔn)ITU-T P.862.1《評估寬帶電話網(wǎng)絡(luò)和語音編碼器的端到端語音質(zhì)量的客觀方法》中推薦的感知語音質(zhì)量評價(perceptual evaluation of speech quality,PESQ)算法作為檢測列車顯示器語音的解決方案。PESQ算法得到的評分結(jié)果與平均意見得分(mean opinion score,MOS)相關(guān),比如,MOS分?jǐn)?shù)為4.0 的語音與PESQ分?jǐn)?shù)為3.7~3.9的語音質(zhì)量相當(dāng)。PESQ是國際電信聯(lián)盟公布的語音質(zhì)量客觀評價算法中與主觀評價相關(guān)度最高的一種[2]。

        語音質(zhì)量評價一般都是通過測試系統(tǒng)來比較原始語音和輸出語音之間的某種差異[3]。本文主要在列車顯示器自動測試臺上,通過對喇叭的語音質(zhì)量作評價來有效檢驗(yàn)出有異音的產(chǎn)品,從而保證列車顯示器的語音質(zhì)量。首先通過人耳對聲音的感受和認(rèn)知過程的抽象得到一個數(shù)據(jù)模型,然后將同一設(shè)備錄制的標(biāo)準(zhǔn)語音音頻(無噪音的音頻)和被測列車顯示器輸出后錄制的語音音頻一起輸入該模型,比較兩者的差異并給出列車顯示器語音質(zhì)量的客觀評價。該軟件評價模型的優(yōu)點(diǎn)是能夠滿足大腦對語音質(zhì)量的感知和評價,不足之處是受人的主觀行為影響比較大,并且需要花費(fèi)較多的時間和精力去獲取樣本評價結(jié)果。為此,文獻(xiàn)[4]優(yōu)化了對語音質(zhì)量評價的客觀方法,研究了用軟件模型自動判別語音質(zhì)量的可行性??v觀語音評價方法,只要評價中考慮了人對語音信號的感知特性,就會大幅提高整個評價方法的性能[5]。本文借鑒了此優(yōu)化方法,在優(yōu)化后的條件下(測試環(huán)境為隔音環(huán)境)進(jìn)行列車顯示器的語音測試。

        1 PESQ評價模型

        PESQ的軟件評價模型如圖1所示。其將語音信號的特征(如頻率、響度等參數(shù))與人耳對語音質(zhì)量的感知及大腦的主觀評價通過建立模擬人的聽覺模型與認(rèn)知模型相結(jié)合,實(shí)現(xiàn)了語音質(zhì)量評價。PESQ的電平對齊功能對列車顯示器語音播放延時、環(huán)境噪聲引起的差異等具有較好的抑制作用,從而保證了列車顯示器語音評價的一致性。

        圖1 感知語音質(zhì)量評價模型框圖Fig.1 Block diagram of PESQ model

        PESQ算法流程如圖2所示。

        圖2 感知語音質(zhì)量算法流程Fig.2 Flow chart of PESQ algorithm

        PESQ軟件評價模型在處理語音信號時,首先將標(biāo)準(zhǔn)語音X(t)和列車顯示器播放的語音Y(t)進(jìn)行電平對齊,得到標(biāo)準(zhǔn)音頻Xs(t)和被測語音信號Ys(t),再將被測語音信號和列車顯示器發(fā)出的語音信號調(diào)整到指定的聲壓級(如79 dB)的標(biāo)準(zhǔn)聽覺電平;然后將對齊后的標(biāo)準(zhǔn)音頻Xs(t) 通過中間參考系統(tǒng)(intermediate reference system,IRS)濾波得到XIRSS(t),將語音信號Ys(t)通過IRS濾波得到Y(jié)IRSS(t)并經(jīng)過延時補(bǔ)償?shù)玫結(jié)′IRSS(t);對通過時間對準(zhǔn)后的兩路信號XIRSS(t)和Y′IRSS(t),以指定間隔(如32 ms)為一幀,相鄰的前后幀之間有一定的重疊(如50%),依次進(jìn)行Hanning 窗和快速傅里葉變換,得到標(biāo)準(zhǔn)音頻的功率譜PXWIRSS(f)n和列車顯示器發(fā)出的語音信號的標(biāo)準(zhǔn)功率譜PYWIRSS(f)n;最后將兩者的功率譜通過頻率尺度映射分別獲得Bark譜(也稱音調(diào)功率譜)PPX′WIRSS(f)n和PPYWIRSS(f)n,再對兩路信號的Bark 譜進(jìn)行比較。被測語音是被評價的對象,因此線性頻率補(bǔ)償只針對參考語音,首先計算兩路語音信號Bark值,將被測語音與參考語音的平均Bark值進(jìn)行比較并補(bǔ)償參考語音(如最大不超過20 dB),得到標(biāo)準(zhǔn)音頻的響度值LX(f)n和列車顯示器語音的響度值LY(f)n。將LX(f)n和LY(f)n相減并對得到的差值做歸零處理,得到一個相對于標(biāo)準(zhǔn)音頻的擾動值Da(f)n。分析擾動曲面提取出兩個失真參數(shù)DAn和Dn,并在頻率和時間上累積起來,映射到PESQ評分預(yù)測值[6]。

        2 列車顯示器自動測試臺

        2.1 列車顯示器自動測試臺簡介

        列車顯示器自動測試臺(圖3)主要由上位機(jī)、視覺模塊、顯示器、電源模塊、音頻分析模塊、通信測試模塊及機(jī)器人模塊等組成。

        圖3 列車顯示器自動測試臺三維圖Fig.3 3D image of the automatic test equipment for HMI

        圖4示出列車顯示器自動測試臺功能框圖。其中上位機(jī)集成各種采集卡,用于數(shù)據(jù)采集和控制;電源模塊用于給顯示器供電;4軸機(jī)器人模塊用于測試列車顯示器的按鍵和觸摸屏;視覺模塊用于視覺檢測及視覺校準(zhǔn);通信模塊負(fù)責(zé)列車顯示器數(shù)據(jù)交換;機(jī)器視覺模塊負(fù)責(zé)列車顯示器屏幕顯示狀態(tài)的監(jiān)測;音頻分析模塊負(fù)責(zé)列車顯示器播放語音采集。本文主要介紹音頻分析模塊。

        圖4 列車顯示器自動測試臺功能框圖Fig.4 Block Diagram of the automatic test equipment for HMI

        2.2 音頻分析模塊

        列車顯示器自動測試臺上的音頻分析模塊主要負(fù)責(zé)列車顯示器語音測試的啟動控制、語音數(shù)據(jù)的采集及處理、PESQ評價模型計算、數(shù)據(jù)庫記錄及分析,其軟件功能如圖5所示。

        圖5 音頻檢測模塊功能框圖Fig.5 Block diagram of sound test module

        語音啟動控制主要是由4軸機(jī)器人模塊通過機(jī)械臂上的按壓筆按壓列車顯示器的按鍵或觸摸屏,利用壓力傳感器監(jiān)測按鍵或觸摸屏的壓力并記錄相應(yīng)數(shù)據(jù)(圖6)。

        圖6 壓力測試示意圖Fig.6 Schematic diagram of pressure test

        語音數(shù)據(jù)采集部分主要根據(jù)列車顯示器揚(yáng)聲器位置,由音頻卡控制其中1個麥克風(fēng)來采集顯示器播放的語音信息,再將采集到的語音信號變成“wav”格式的文件并保存到本地。

        語音數(shù)據(jù)處理部分主要是使錄制的語音文件滿足感知語音質(zhì)量的要求,將音頻文件對齊,以避免因?yàn)樯衔粰C(jī)、機(jī)器人模塊和列車顯示器之間的累積時間差產(chǎn)生的空白區(qū)域超過PESQ規(guī)定的0.2 s的要求[7],并將語音文件前面過長的空白部分刪除,以便生成符合要求的測試文件。包含空白區(qū)域的語音文件示例如圖7所示。

        圖7 包含空白區(qū)域的語音文件Fig.7 Voice file with blank area

        感知語音質(zhì)量軟件評價模型計算是將所測得的語音信號與標(biāo)準(zhǔn)語音信號進(jìn)行對比,采用PESQ系統(tǒng)得到各個音頻文件的評價分?jǐn)?shù)。根據(jù)標(biāo)準(zhǔn)ITU-T P.830《電話頻段和寬帶數(shù)字編解碼器的主觀性能評定》中的要求,收集列車顯示器發(fā)出的語音與預(yù)先設(shè)定的標(biāo)準(zhǔn)語音并在特定的環(huán)境下提供給測試者,通過收集測試者對上述語音的主觀感受,包括聲音的失真及聲音中所含噪聲等。MOS得分采用五分制,相關(guān)標(biāo)準(zhǔn)如表1所示。

        表1 平均意見得分(MOS)標(biāo)準(zhǔn)Tab.1 Standard of MOS

        數(shù)據(jù)庫記錄及分析模塊主要是將語音信號的結(jié)果記錄至數(shù)據(jù)庫并進(jìn)行定期的分析,生成對應(yīng)的分析報告。

        3 語音客觀評價系統(tǒng)訓(xùn)練及應(yīng)用

        基于LabVIEW開發(fā)的語音檢測系統(tǒng)在處理語音文件中將聲音數(shù)據(jù)存儲為波形數(shù)組。數(shù)組中的一個波形即代表一個特定的通道。波形Y方向的數(shù)值表示幅值(該幅值由脈沖代碼調(diào)制數(shù)據(jù)獲得),0表示靜音。例如14號樣本語音文件,其與標(biāo)準(zhǔn)文件的差異如圖8中紅色線框所示,此差異是由外界轉(zhuǎn)運(yùn)車?yán)嚷曀鸬摹R驑颖局邪死嚷?,從而?dǎo)致樣本文件評價分?jǐn)?shù)較低,為3.076分,遠(yuǎn)遠(yuǎn)低于預(yù)期的3.3分。

        采集到的語音樣本用于PESQ模型訓(xùn)練。通過少量的樣本數(shù)據(jù)對結(jié)構(gòu)成熟的模型進(jìn)行訓(xùn)練,訓(xùn)練過程中將列車顯示器測試臺的采樣參數(shù)固定,微調(diào)延時參數(shù)獲得最佳結(jié)果。調(diào)整過程中,采用無監(jiān)督的方式進(jìn)行訓(xùn)練,根據(jù)輸出的結(jié)果與估算結(jié)果的誤差反向自動調(diào)節(jié)模型中的部分參數(shù),從而得到一個最優(yōu)解。當(dāng)樣本量比較大時,迭代速度會很慢,但是獲得的結(jié)果更貼近實(shí)際情況。

        圖8 14號樣本與標(biāo)準(zhǔn)語音文件波形對比Fig.8 Waveforms comparison between NO.14 file and standard file

        為了將PESQ的閾值與人工主觀判斷的接受標(biāo)準(zhǔn)建立聯(lián)系,現(xiàn)場質(zhì)量檢查人員對所獲得的列車顯示器語音樣本進(jìn)行人工主觀評價(將不同PESQ得分的顯示器混在一起),獲取平均意見得分(MOS)。結(jié)果顯示,MOS得分在3.0分以上的,能感受到語音質(zhì)量有所下降但不影響通話,滿足使用要求[8]。經(jīng)過測試發(fā)現(xiàn),可接受的PESQ得分閾值為3.3,即客戶認(rèn)為語音質(zhì)量評價高于3.3分的均可接受。表2示出樣本得分情況。

        語音經(jīng)過PESQ軟件評價模型處理之后,上位機(jī)對被測列車顯示器語音進(jìn)行平均意見得分(MOS) 測試和PESQ 算法打分。查詢基于兩種算法獲取到的評分結(jié)果資料,發(fā)現(xiàn)客觀評價PESQ與主觀評價的MOS 得分的平均相關(guān)度可以達(dá)到0.935[9],由此可見,PESQ評分方法是現(xiàn)有的基于聽覺模型評價算法中效果最好的。通過表2可以發(fā)現(xiàn),PESQ評分與MOS評分二者趨勢保持一致,兩者偏離最大值為0.14(樣本14),能夠滿足我們對列車顯示語音自動檢測質(zhì)量的要求。

        表2 樣本的得分Tab.2 Scores of samples

        PESQ評分完成后,列車顯示器測試臺通過機(jī)械手調(diào)整顯示器上的音量控制按鈕,通過上位機(jī)軟件結(jié)合視覺拍照分析,使得列車顯示器發(fā)出聲音的響度一致,列車顯示器在該檔位發(fā)出語音的音量大小既不能低于50 dB也不能高于60 dB,如此即可完成列車顯示器完整的語音質(zhì)量檢測。

        4 結(jié)語

        當(dāng)前基于PESQ的評價應(yīng)用越來越普遍,其將人的視覺、聽覺等感知進(jìn)行模型化、代碼化、工具化,通過共享數(shù)據(jù)以全新的應(yīng)用模式,構(gòu)建測試模型,解決了人工評估語音質(zhì)量帶來的效率低、成本高和一致性差的問題,提升了測試效率,保證了測試質(zhì)量。本文提出一種采用PESQ算法對列車顯示器語音進(jìn)行自動檢測和評價的方法。該語音質(zhì)量評估方法可靠性高,一致性好,但仍有以下問題需要解決:

        (1)標(biāo)準(zhǔn)語音獲取成本較高,語音內(nèi)容發(fā)生改變時,需要重新建立標(biāo)準(zhǔn)語音和PESQ閾值,適應(yīng)性較差;

        (2)列車顯示器語音自動檢測過程數(shù)據(jù)記錄不完整,只能獲取最終的結(jié)果,無法有效支撐PESQ模型中底層參數(shù)的優(yōu)化與調(diào)整,參數(shù)的訓(xùn)練和改進(jìn)都要在后續(xù)的工作中持續(xù)研究。

        猜你喜歡
        自動測試顯示器音頻
        把顯示器“穿”在身上
        一種新型點(diǎn)陣顯示器的設(shè)計
        電子制作(2019年24期)2019-02-23 13:22:32
        必須了解的音頻基礎(chǔ)知識 家庭影院入門攻略:音頻認(rèn)證與推薦標(biāo)準(zhǔn)篇
        基于Daubechies(dbN)的飛行器音頻特征提取
        電子制作(2018年19期)2018-11-14 02:37:08
        JXG-50S型相敏軌道電路接收器自動測試臺
        感應(yīng)式帶電顯示器抗干擾處理
        電子測試(2018年13期)2018-09-26 03:29:36
        可并行測試的電磁兼容自動測試系統(tǒng)的實(shí)現(xiàn)
        電子測試(2018年13期)2018-09-26 03:29:14
        關(guān)于某型雷達(dá)自動測試系統(tǒng)的幾點(diǎn)認(rèn)識和建議
        電子制作(2018年11期)2018-08-04 03:26:00
        音頻分析儀中低失真音頻信號的發(fā)生方法
        電子制作(2017年9期)2017-04-17 03:00:46
        Pro Tools音頻剪輯及修正
        人間(2015年8期)2016-01-09 13:12:42
        国精品无码一区二区三区在线| 国产精品久久av高潮呻吟| 亚洲精品中文字幕视频色| av国产传媒精品免费| 精品国产乱码久久久软件下载| 亚洲三区二区一区视频| 亚洲一区二区三区自拍麻豆| 老熟女的中文字幕欲望| 国产国拍精品av在线观看按摩| 亚洲综合免费| 久久蜜臀av一区三区| 亚洲一区毛片在线观看| 无码人妻久久一区二区三区不卡| 久久中文字幕无码一区二区| 都市激情亚洲综合一区| 视频在线观看一区二区三区| 国精品无码一区二区三区在线蜜臀| 少妇无套裸按摩呻吟无呜| 日韩精品久久久肉伦网站| 国产人成无码中文字幕| av天堂手机在线免费| 五月天中文字幕日韩在线| 免费1级做爰片1000部视频 | 91短视频在线观看免费 | 国产精品国产自产自拍高清av| 国产成人精品午夜二三区波多野| 亚洲欧美偷拍视频| 亚洲色图在线视频观看| 99久久免费视频色老| 丁香花在线影院观看在线播放| 国产高清在线精品一区αpp| 男女啪啪啪的高清视频| 亚洲人交乣女bbw| 久久精品国产日本波多麻结衣| 国产一区二区三区免费主播| 国产一区二区视频免费在| 97久久人人超碰超碰窝窝| 亚洲专区一区二区在线观看| 毛片在线视频成人亚洲| 狠狠躁夜夜躁人人躁婷婷视频| 另类一区二区三区|