(中興通訊股份有限公司,江蘇 南京 210012)
聽覺質(zhì)量客觀感知評(píng)估算法及其應(yīng)用
吳東梅
(中興通訊股份有限公司,江蘇 南京 210012)
ITU P.863是下一代語(yǔ)音質(zhì)量測(cè)試技術(shù),適用于固話、手機(jī)和IP網(wǎng)絡(luò)。通過(guò)比較已知的參考信號(hào)和經(jīng)過(guò)待測(cè)系統(tǒng)后的退化信號(hào),得到MOS分。應(yīng)用POLQA算法對(duì)手機(jī)的通話語(yǔ)音質(zhì)量進(jìn)行客觀評(píng)估,分析影響手機(jī)通話性能的各種因素。
P.863 POLQA 聽覺質(zhì)量 MOS
P.863是下一代語(yǔ)音質(zhì)量測(cè)試技術(shù),適用于固話、手機(jī)和IP網(wǎng)絡(luò)。P.863的目標(biāo)是預(yù)測(cè)用戶感知,從窄帶到超寬帶的所有通信系統(tǒng)的聆聽語(yǔ)音質(zhì)量。正因?yàn)镻.863的應(yīng)用帶寬得到了擴(kuò)展,POLQA算法可用于VoLTE的語(yǔ)音質(zhì)量評(píng)估。
POLQA算法既能用于電信號(hào)的測(cè)試(這和P.862、P.861是兼容的),同時(shí)也能用于聲信號(hào)的測(cè)試,即評(píng)估通過(guò)仿真耳記錄的信號(hào)。
POLQA算法原理和PESQ算法類似,通過(guò)比較參考信號(hào)和待評(píng)估的劣化信號(hào),輸出感知質(zhì)量的預(yù)估值,劣化信號(hào)是參考信號(hào)經(jīng)過(guò)通信系統(tǒng)后的信號(hào)。具體如圖1所示。
對(duì)信號(hào)的處理步驟包括幀分割、時(shí)間對(duì)齊、延遲計(jì)算,然后通過(guò)感知模型把參考信號(hào)和劣化信號(hào)轉(zhuǎn)換成內(nèi)部表征。把這些表征指標(biāo)綜合起來(lái)給出客觀聆聽質(zhì)量MOS分。
幀分割是指把參考信號(hào)和劣化信號(hào)分割成一小段的等長(zhǎng)的時(shí)間片,即幀信號(hào)。
由于經(jīng)過(guò)通信系統(tǒng)后,劣化信號(hào)存在延時(shí)、電平變化、數(shù)據(jù)包錯(cuò)位或丟失等情況,因此非常重要的一步是要把參考信號(hào)幀和劣化信號(hào)幀一對(duì)一地進(jìn)行匹配,這樣才能對(duì)每一對(duì)幀進(jìn)行比較分析。POLQA算法是在參考信號(hào)中尋找和劣化信號(hào)幀的匹配幀,分別計(jì)算參考信號(hào)幀和匹配的劣化信號(hào)幀的延時(shí)。
圖1 POLQA算法基本原理
圖2 POLQA應(yīng)用測(cè)試系統(tǒng)
POLQA算法使用了6個(gè)表征指標(biāo),即頻率響應(yīng)指標(biāo)(FREQ)、噪聲指標(biāo)(NOISE)、混響指標(biāo)(REVERB)以及3個(gè)描述內(nèi)部差異的指標(biāo),即時(shí)間、音調(diào)、響度域。
在POLQA算法中,MOS-LQO分在窄帶模式下最高為4.5分,超寬帶模式下為4.75分。
利用POLQA算法的MOS分,能夠直觀地反應(yīng)語(yǔ)音質(zhì)量的好壞。因此在實(shí)驗(yàn)室環(huán)境下分析手機(jī)在手持通話模式時(shí),不同因素對(duì)通話質(zhì)量的影響。
3.1 測(cè)試系統(tǒng)組成
如圖2所示,測(cè)試系統(tǒng)主要包括:
(1)消音室,包含頭肩模型器HATS,4個(gè)喇叭和1個(gè)低音炮,用于播放噪聲;
(2)基站模擬系統(tǒng)用于實(shí)現(xiàn)和手機(jī)的通信;
(3)語(yǔ)音質(zhì)量分析儀,用來(lái)實(shí)現(xiàn)對(duì)語(yǔ)音通話進(jìn)行POLQA算法的打分;
(4)多徑信號(hào)模擬發(fā)生器,用于模擬多徑信號(hào)。
3.2 通信制式的影響
對(duì)一款WCDMA制式的手機(jī)進(jìn)行測(cè)試,結(jié)果如表1所示(取20組MOS分的平均值,以下相同)。由表1可知,對(duì)于正常的手機(jī),制式對(duì)通話質(zhì)量沒有影響。
表1 通信制式對(duì)MOS分的影響
3.3 發(fā)射功率的影響
GSM制式能夠通過(guò)模擬基站準(zhǔn)確地控制手機(jī)發(fā)射功率,因此選擇GSM頻段進(jìn)行測(cè)試。可見,對(duì)于正常的手機(jī)(手機(jī)A),發(fā)射功率對(duì)通話質(zhì)量沒有影響。然而,如果手機(jī)設(shè)計(jì)存在問(wèn)題(手機(jī)B),比如天線干擾了麥克,導(dǎo)致通話存在電流音,那么通過(guò)POLQA算法也是能反映出來(lái)的。發(fā)射功率對(duì)MOS分的影響如表2所示:
表2 發(fā)射功率對(duì)MOS分的影響
3.4 編碼方式的影響
根據(jù)網(wǎng)絡(luò)環(huán)境的優(yōu)劣,手機(jī)會(huì)選擇合適的編碼方式以確保通話質(zhì)量。那么不同的編碼方式對(duì)通話質(zhì)量的影響有多大?選擇GSM制式下不同AMR方式進(jìn)行測(cè)試。由表3可知,隨著碼速率的下降,MOS分也是下降的。這和實(shí)際表現(xiàn)是一致的,在差的網(wǎng)絡(luò)環(huán)境下,手機(jī)的碼速率下降,語(yǔ)音質(zhì)量也會(huì)下降。
表3 編碼方式對(duì)MOS分的影響
3.5 信道衰落的影響
實(shí)際網(wǎng)絡(luò)環(huán)境下,不可能保證手機(jī)接收到的基站信號(hào)只有直射信號(hào),即信道衰落是不可避免的。通過(guò)多徑信號(hào)模擬發(fā)生器,選擇國(guó)際規(guī)范規(guī)定的衰落模型,對(duì)模擬基站發(fā)出的基帶信號(hào)進(jìn)行衰落,評(píng)估不同的信噪比對(duì)語(yǔ)音質(zhì)量的影響。由于衰落是加在接收信號(hào)上的,因此只影響接收MOS分。從表4可知,信噪比對(duì)語(yǔ)音質(zhì)量的影響很大。
表4 信道衰落對(duì)MOS分的影響
3.6 噪聲環(huán)境的影響
噪聲環(huán)境是常常會(huì)遇到的,商場(chǎng)、鬧市區(qū)都充滿了各種噪聲。選擇ETSI規(guī)定的“ETSI schoolyard_480sec+ 9_5dB.wav”作為噪聲源,評(píng)估不同噪聲音量下的MOS分變化。從表5可知,待測(cè)手機(jī)的發(fā)送MOS分受噪聲影響較大,這是因?yàn)樵撌謾C(jī)是單麥克的,其噪聲抑制的能力有限。
表5 噪聲對(duì)MOS分的影響
由上述內(nèi)容可知,POLQA算法是語(yǔ)音質(zhì)量評(píng)估的有效手段。VoLTE語(yǔ)音性能要求使用POLQA算法進(jìn)行語(yǔ)音質(zhì)量測(cè)試。借助POLQA算法,本文分析了影響語(yǔ)音質(zhì)量的幾個(gè)因素,其中編碼方式、信道衰落和噪聲都對(duì)語(yǔ)音質(zhì)量有比較大的影響。而通信制式、發(fā)射功率基本對(duì)語(yǔ)音質(zhì)量沒有影響。如果手機(jī)的通話質(zhì)量有問(wèn)題,也是能夠通過(guò)MOS分直接反映出來(lái)的。
[1] International Telecommunication Union. Perceptual objective listening quality assessment[S]. 2011.
[2] 朱曉峰. 客觀聽音質(zhì)量模型的開發(fā)[J]. 通信技術(shù)與標(biāo)準(zhǔn), 2011(4): 63-67.
[3] 林建鋒,朱猛. 有關(guān)在移動(dòng)通信中語(yǔ)音質(zhì)量評(píng)估體系—MOS值的探討[J]. 赤峰學(xué)院學(xué)報(bào): 自然科學(xué)版, 2009,25(8): 148-150.
[4] 梁民,葉劍民. 聲音信號(hào)質(zhì)量評(píng)價(jià)技術(shù)[J]. 數(shù)字技術(shù)與應(yīng)用, 2011(6): 139-144.
[5] 陳國(guó),胡修林,張?zhí)N玉,等. 語(yǔ)音質(zhì)量客觀評(píng)價(jià)方法研究進(jìn)展[J]. 電子學(xué)報(bào), 2001,29(4): 548-552.★
Perceptual Objective Listening Quality Assessment Algorithm and its Application
WU Dong-mei
(ZTE Corporation, Nanjing 210012, China)
ITU-T P.863 is the next generation voice quality testing technique suitable for fi xed, mobile and IP-based networks. A known reference signal is compared with the degraded signal to obtain P.863 mean opinion score (MOS). The voice quality of handset with perceptual objective listening quality assessment (POLQA) algorithm was objectively assessed and the different factors affecting voice quality of handset were analyzed.
P.863 perceptual objective listening quality assessment listening quality mean opinion score
10.3969/j.issn.1006-1010.2015.08.018
TN929.5
A
1006-1010(2015)08-0084-03
吳東梅. 聽覺質(zhì)量客觀感知評(píng)估算法及其應(yīng)用[J]. 移動(dòng)通信, 2015,39(8): 84-86.
2014-12-25
責(zé)任編輯:劉妙 liumiao@mbcom.cn
吳東梅:通信工程師,碩士畢業(yè)于北京航空航天大學(xué),現(xiàn)任職于中興通訊股份有限公司終端事業(yè)部,主要負(fù)責(zé)測(cè)試標(biāo)準(zhǔn)和新技術(shù)的研究。