王俊濤
【摘要】廣播是當(dāng)前以音頻為媒介傳遞信息的最重要的方式,音頻質(zhì)量是用戶(hù)體驗(yàn)評(píng)價(jià)的最關(guān)鍵因素,所以對(duì)于廣播音頻質(zhì)量的監(jiān)測(cè)是廣播業(yè)者最關(guān)心的領(lǐng)域。本文就上述問(wèn)題介紹了音頻質(zhì)量的評(píng)價(jià)方法,特別描述了基于PEAQ算法的音頻質(zhì)量客觀評(píng)價(jià)方法及其在廣播節(jié)目質(zhì)量監(jiān)測(cè)中的應(yīng)用。
【關(guān)鍵詞】音頻質(zhì)量主觀評(píng)價(jià)客觀評(píng)價(jià)語(yǔ)音質(zhì)量感知評(píng)價(jià)音頻質(zhì)量感知評(píng)價(jià)。
一.音頻質(zhì)量的主、客觀評(píng)價(jià)
隨著廣電行業(yè)對(duì)播出節(jié)目質(zhì)量的要求不斷提高,現(xiàn)有的監(jiān)測(cè)體系已經(jīng)能夠采集實(shí)時(shí)廣播節(jié)目并對(duì)節(jié)目技術(shù)指標(biāo)如節(jié)目完整性、節(jié)目正確性以及場(chǎng)強(qiáng)、調(diào)幅度等進(jìn)行實(shí)時(shí)監(jiān)測(cè),但對(duì)于節(jié)目音頻質(zhì)量的評(píng)價(jià)還主要依賴(lài)于主觀評(píng)價(jià),如何能將這一過(guò)程盡量客觀評(píng)價(jià)處理對(duì)于廣播技術(shù)人員來(lái)講是一項(xiàng)很有必要的工作。
對(duì)于音頻質(zhì)量的評(píng)價(jià)方法主要分為主觀評(píng)價(jià)和客觀評(píng)價(jià)兩大類(lèi)。音頻質(zhì)量主觀評(píng)價(jià)方法就是通過(guò)人聽(tīng)取被測(cè)音頻材料,將聽(tīng)音時(shí)的主觀感受從清晰度、豐滿(mǎn)度、圓潤(rùn)度、明亮度、柔和度、真實(shí)度和平衡度幾個(gè)方面,以打分的形式記錄下來(lái)。人對(duì)聲音的主觀感受雖然可能因人而異,但經(jīng)過(guò)相對(duì)專(zhuān)業(yè)訓(xùn)練且考慮到年齡段、男女等因素多人主觀試聽(tīng),并經(jīng)過(guò)統(tǒng)計(jì)分析后得到的被測(cè)音頻材料的主觀評(píng)價(jià)分?jǐn)?shù),依然是目前認(rèn)為最有效和最準(zhǔn)確的音頻質(zhì)量的度量方式。但是,主觀評(píng)價(jià)的缺點(diǎn)也顯而易見(jiàn):成本高昂且實(shí)時(shí)性差,由于存在人的主觀因素和測(cè)試環(huán)境的客觀因素,測(cè)試結(jié)果具有一定的不確定性,無(wú)法作為全時(shí)監(jiān)測(cè)的手段,因此運(yùn)用此方法進(jìn)行廣播電臺(tái)的音頻質(zhì)量實(shí)時(shí)監(jiān)測(cè)可能性極低。
音頻質(zhì)量客觀評(píng)價(jià)方法是通過(guò)技術(shù)手段提取音頻節(jié)目中的技術(shù)指標(biāo),將其量化形成類(lèi)似于主觀評(píng)價(jià)的分?jǐn)?shù)來(lái)表征音頻質(zhì)量的好壞。目前對(duì)音頻質(zhì)量客觀評(píng)價(jià)方法是否可行的評(píng)估,是將其結(jié)果與主觀評(píng)價(jià)結(jié)果進(jìn)行對(duì)比,擬合度越好的客觀評(píng)價(jià)方法就被認(rèn)為越有效。因此,客觀評(píng)價(jià)方法一般都是通過(guò)模擬人對(duì)聲音的感知、處理過(guò)程,對(duì)音頻的各種音頻特征進(jìn)行分析,給出一個(gè)音頻質(zhì)量評(píng)價(jià)分值。客觀評(píng)價(jià)方法正好彌補(bǔ)了主觀評(píng)價(jià)方法的不足,即不耗費(fèi)人力、實(shí)時(shí)性好,而且相對(duì)而言有了統(tǒng)一的標(biāo)準(zhǔn),測(cè)試結(jié)果穩(wěn)定、可全時(shí)監(jiān)測(cè)。
音頻信號(hào)可以簡(jiǎn)單分為語(yǔ)音和寬帶音頻兩類(lèi),語(yǔ)音信號(hào)專(zhuān)指人說(shuō)話(huà)時(shí)的聲音,而寬帶音頻則可能包含了人聲、樂(lè)器、人造聲音和自然界的聲音等。由于語(yǔ)音和寬帶音頻信號(hào)的不同特點(diǎn),國(guó)內(nèi)外學(xué)者對(duì)于語(yǔ)音和寬帶音頻分別給出了不同的客觀評(píng)價(jià)方法。
二.音頻質(zhì)量評(píng)價(jià)方法介紹
1.主觀評(píng)價(jià)方法
語(yǔ)音信號(hào)主要包括可懂度、自然度和可識(shí)別度等主觀評(píng)價(jià)指標(biāo)。比較常見(jiàn)的語(yǔ)音質(zhì)量主觀評(píng)價(jià)方法包括DRT(音韻字測(cè)試:DiagnosticRhymeTest)、MOS(平均意見(jiàn)分:M eanOptionScore)和DAM(滿(mǎn)意度測(cè)試:DiagnosticAcceptabilityMeasure)等方法。
對(duì)于寬帶音頻信號(hào)的一般不采取直接評(píng)價(jià)方式,因?yàn)閷拵б纛l的“高保真”,也即高度保持原有音頻信號(hào)的樣子,會(huì)導(dǎo)致參考信號(hào)和被測(cè)信號(hào)的聽(tīng)覺(jué)差異很小,在沒(méi)有參考信號(hào)的情況下很難直接判斷被測(cè)信號(hào)究竟處于哪個(gè)質(zhì)量等級(jí)上。所以寬帶音頻信號(hào)一般采用三激勵(lì)——隱含參考雙盲聽(tīng)(3Stimulate-Hidenreference2Blind:3SHR2B)方法。
對(duì)于編碼音頻質(zhì)量的主觀評(píng)價(jià)方法,國(guó)際電信聯(lián)盟IT U針對(duì)寬帶音頻給出了兩種主觀評(píng)價(jià)標(biāo)準(zhǔn):ITU-RBS.1116和ITU-RBS.1534。前者主要是對(duì)小損傷、高質(zhì)量音頻信號(hào);后者則針對(duì)中等損傷的音頻信號(hào)。
2.客觀評(píng)價(jià)方法
在國(guó)際上,測(cè)試諸如電話(huà)、對(duì)講、會(huì)議系統(tǒng)等窄帶語(yǔ)音信號(hào)處理設(shè)備的客觀評(píng)價(jià)方法一般采用國(guó)際電信聯(lián)盟(ITU)針對(duì)窄帶語(yǔ)音信號(hào)客觀評(píng)價(jià)制定的感知語(yǔ)音質(zhì)量評(píng)價(jià)標(biāo)準(zhǔn)(PESQ),該標(biāo)準(zhǔn)的主客觀相關(guān)系數(shù)可達(dá)到0.95,其測(cè)試方法已經(jīng)可以完全替代主觀測(cè)試,基于此算法的測(cè)試儀器也已經(jīng)面市。
隨著對(duì)音頻質(zhì)量客觀評(píng)價(jià)算法研究的深入,對(duì)寬帶音頻信號(hào)的質(zhì)量評(píng)價(jià)很多研究機(jī)構(gòu)從不同的角度提出了不同的算法,但沒(méi)有哪一種算法具有絕對(duì)技術(shù)優(yōu)勢(shì),或者在行業(yè)中占主導(dǎo)地位。于是在1994年,ITU-R公開(kāi)提出了干擾指數(shù)、噪聲掩蔽比、感知音頻質(zhì)量測(cè)量、感知評(píng)價(jià)、感知客觀測(cè)量等數(shù)個(gè)候選方法并開(kāi)始征集意見(jiàn)。
1998年,ITU綜合以上方案以及其他一些具有競(jìng)爭(zhēng)力的評(píng)價(jià)方法,針對(duì)寬帶編、解碼音頻的質(zhì)量評(píng)價(jià)提出了ITU-RBS.1387建議書(shū),即感知音頻評(píng)價(jià)(PEAQ)算法。2001年,ITU又公布了PEAQ算法的改進(jìn)版本ITU-RBS.1387-1。
PEAQ的主要結(jié)構(gòu)如圖1所示,可分為3個(gè)主要部分:心理聲學(xué)模型、感知模型和神經(jīng)網(wǎng)絡(luò)。
心理聲學(xué)模型通過(guò)對(duì)參考信號(hào)和測(cè)試信號(hào)(在Bs.1387中即指編、解碼信號(hào))的分別進(jìn)行一系列的時(shí)域、頻域變換來(lái)模仿人類(lèi)聽(tīng)覺(jué)系統(tǒng)對(duì)聲音的處理;經(jīng)處理后的信號(hào)輸出進(jìn)入感知模型,對(duì)音頻進(jìn)行綜合分析處理和特征提取后計(jì)算出多個(gè)模型輸出變量(ModelOutputVariables,MOV);最后由神經(jīng)網(wǎng)絡(luò)將多個(gè)MOV參數(shù)融合為一個(gè)客觀評(píng)價(jià)分?jǐn)?shù)ODG。
PEAQ在小損傷編碼音頻的評(píng)價(jià)中有較好的表現(xiàn),根據(jù)ITU-RBS.1387-1提供的數(shù)據(jù),在大多數(shù)情況下可以達(dá)到主客觀評(píng)價(jià)結(jié)果誤差絕對(duì)值在0.02左右,主客觀符合度在0.7左右的要求。
3.PEAQ在廣播音頻質(zhì)量監(jiān)測(cè)中的應(yīng)用
我國(guó)于1996年7月發(fā)布了《廣播節(jié)目聲音質(zhì)量主觀評(píng)價(jià)方法和技術(shù)指標(biāo)要求(GB/T164631996)》,規(guī)定了對(duì)廣播節(jié)目聲音質(zhì)量進(jìn)行主觀評(píng)價(jià)的方法。然而,目前對(duì)于廣播音頻質(zhì)量的客觀評(píng)價(jià)并沒(méi)有直接的研究成果,在對(duì)廣播節(jié)目音頻質(zhì)量的評(píng)價(jià)時(shí)依然使用人工主觀方式進(jìn)行判定。
在廣播音頻質(zhì)量監(jiān)測(cè)的實(shí)際應(yīng)用中,面臨以下問(wèn)題:
(1)由于發(fā)射端、接收端的音量調(diào)整及信道衰落等情況使接收端音頻信號(hào)電平發(fā)生較大改變,經(jīng)過(guò)多級(jí)設(shè)備以及受遠(yuǎn)距離傳輸影響,接收端收到信號(hào)與源信號(hào)的信噪比有較大差異,會(huì)對(duì)音頻質(zhì)量客觀評(píng)價(jià)造成影響;
(2)廣播電臺(tái)存在臨時(shí)插播或者錯(cuò)播等情況,這時(shí)接收音頻和源音頻完全不同,需對(duì)音頻先進(jìn)行同源判斷,因?yàn)閷?duì)于非同源音頻的質(zhì)量評(píng)價(jià)沒(méi)有意義;
我們?cè)谑褂肞EAQ算法對(duì)18組實(shí)際廣播信號(hào)進(jìn)行客觀評(píng)價(jià)的實(shí)驗(yàn)中,主客觀評(píng)價(jià)符合度僅在0.4左右??梢?jiàn)PEAQ不能直接應(yīng)用于廣播信號(hào)的評(píng)價(jià)。
對(duì)于上述第一種情況,在實(shí)際處理過(guò)程中,必須對(duì)參考信號(hào)和測(cè)試信號(hào)進(jìn)行信號(hào)的電平進(jìn)行歸一化處理。為此我們先將ITU推薦的樣本信號(hào)作為標(biāo)準(zhǔn)信號(hào)源,將其平均電平值作為參照電平,然后分別計(jì)算相同長(zhǎng)度參考信號(hào)和測(cè)試信號(hào)的電平,將其與參照電平比較確定壓縮或擴(kuò)張的比例,最后在進(jìn)行質(zhì)量客觀評(píng)價(jià)算法之前,通過(guò)該比例參數(shù)求得歸一化之后的信號(hào)。
對(duì)于第二種情況則需要進(jìn)行同源判斷,即將測(cè)試信號(hào)與參考信號(hào)進(jìn)行相關(guān)性計(jì)算,并根據(jù)統(tǒng)計(jì)分析設(shè)定相關(guān)系數(shù)門(mén)限值,當(dāng)相關(guān)系數(shù)降低到門(mén)限值以下時(shí)即判定被測(cè)信號(hào)與參考信號(hào)是非同源信號(hào),此時(shí)就不進(jìn)行音頻質(zhì)量評(píng)價(jià)的計(jì)算了。
三.總結(jié)
1.客觀評(píng)價(jià)方法設(shè)計(jì)考慮因素
由于廣播電臺(tái)節(jié)目播出全流程涉及播出源、切換分配、編解碼傳輸、調(diào)制發(fā)射,信號(hào)路由范圍廣、經(jīng)過(guò)環(huán)節(jié)多,因此對(duì)于廣播音頻的實(shí)時(shí)質(zhì)量客觀評(píng)價(jià)系統(tǒng)的實(shí)現(xiàn)需要考慮如下因素:
(1)受發(fā)射端和接收端設(shè)備不一致、算法差異和開(kāi)路傳輸過(guò)程等影響,在發(fā)射端、接收端的音量調(diào)整及信道衰落可能會(huì)使接收端信號(hào)電平發(fā)生較大改變;
(2)一般接收端遠(yuǎn)離播出源,考慮到成本以及未來(lái)發(fā)展,測(cè)試數(shù)據(jù)在接收端以數(shù)據(jù)流形式通過(guò)網(wǎng)絡(luò)傳回,受網(wǎng)絡(luò)條件影響會(huì)引入不確定延時(shí);
(3)廣播發(fā)射臺(tái)源信號(hào)經(jīng)過(guò)放大、調(diào)制、無(wú)線(xiàn)傳播、解調(diào)等一系列過(guò)程后得到的接收信號(hào)音頻特性會(huì)發(fā)生較大改變,PEAQ標(biāo)準(zhǔn)的音頻質(zhì)量客觀評(píng)價(jià)算法不能完全適用;
(4)廣播節(jié)目播出安全性和節(jié)目信號(hào)網(wǎng)絡(luò)傳輸?shù)陌踩詥?wèn)題。
以上因素均會(huì)對(duì)節(jié)目音頻質(zhì)量的客觀評(píng)價(jià)產(chǎn)生極大影響,在評(píng)價(jià)方法設(shè)計(jì)和關(guān)鍵算法設(shè)計(jì)上,都需要有比較切合實(shí)際的解決辦法,建立客觀標(biāo)準(zhǔn)和數(shù)據(jù)處理前歸一化操作,盡可能使接收端節(jié)目信號(hào)與播出源保持相似特性。
2.客觀評(píng)價(jià)方法設(shè)計(jì)
結(jié)合上述問(wèn)題,本文提出如下相應(yīng)解決方法,以進(jìn)一步設(shè)計(jì)出可實(shí)用化的廣播接收音頻質(zhì)量的客觀評(píng)價(jià)系統(tǒng)。
(1)考慮網(wǎng)絡(luò)傳輸對(duì)帶寬的限制,將收測(cè)廣播音頻數(shù)據(jù)經(jīng)壓縮編碼傳輸,并結(jié)合網(wǎng)絡(luò)狀態(tài)可調(diào)整編碼速率。針對(duì)特定編碼格式以及編碼速率,提前計(jì)算出差量范圍,并歸入擬合度分析誤差。
(2)考慮信號(hào)電平改變對(duì)質(zhì)量評(píng)價(jià)結(jié)果的影響,對(duì)接收信號(hào)和節(jié)目源信號(hào)進(jìn)行電平歸一化處理,在一般性技術(shù)指標(biāo)上進(jìn)行對(duì)齊,減少誤差。
(3)對(duì)于接收信號(hào)傳輸延時(shí)問(wèn)題,采用信號(hào)時(shí)域和頻域相關(guān)性匹配查找,實(shí)現(xiàn)參考信號(hào)和測(cè)試信號(hào)的同源判定以及時(shí)間對(duì)齊,提前進(jìn)行篩選分析以避免無(wú)意義分析。
(4)通過(guò)對(duì)實(shí)際調(diào)頻廣播信號(hào)特征參數(shù)的統(tǒng)計(jì)、分析,采用對(duì)神經(jīng)網(wǎng)絡(luò)輸入系數(shù)進(jìn)行訓(xùn)練的方法,提高PEAQ算法對(duì)于廣播音頻質(zhì)量客觀評(píng)價(jià)的主客觀符合度。
(5)考慮到網(wǎng)絡(luò)傳輸?shù)陌踩詥?wèn)題,對(duì)于收測(cè)設(shè)備與服務(wù)器間的通信命令數(shù)據(jù)采用加密算法。
經(jīng)過(guò)上述考量,我們重新改進(jìn)了客觀評(píng)價(jià)方法,并對(duì)方案進(jìn)行了分析和測(cè)試,在擬合度等方面基本能夠滿(mǎn)足廣播音頻客觀質(zhì)量客觀監(jiān)測(cè)的需求,但目前受算法和處理能力限制,分析結(jié)果還有較大的延時(shí),還需優(yōu)化算法進(jìn)一步提高實(shí)時(shí)性。