梁民
摘 要: 為了解決目前4G通信網(wǎng)絡(luò)中語音質(zhì)量評價問題, 該研究基于PESQ算法,設(shè)計開發(fā)了語音質(zhì)量評價系統(tǒng)。該系統(tǒng)主要由語音采樣和語音質(zhì)量評價兩個部分組成,語音采樣部分由具有錄音功能的手機進行樣本采集,語音質(zhì)量評價系統(tǒng)則調(diào)用PESQ算法對語音樣本文件給出MOS平均意見分。該系統(tǒng)個性化和模塊化的設(shè)計特點保證它能對不同的4G網(wǎng)絡(luò)類型進行語音質(zhì)量評價。系統(tǒng)運行實踐證明該系統(tǒng)能有效對4G網(wǎng)絡(luò)通信語音質(zhì)量做出客觀評價,因而具有一定推廣價值。
關(guān)鍵詞: 語音質(zhì)量感知評價; 第四代移動通信; 語音質(zhì)量評價; 網(wǎng)絡(luò)優(yōu)化
中圖分類號: TN926?34; TP311 文獻標(biāo)識碼: A 文章編號: 1004?373X(2016)08?0006?03
Research on application of PESQ algorithm in 4G network
LIANG Min
(Information Technology Center, Renmin University of China, Beijing 100872, China)
Abstract: With the popularization of 4G communication network in modern society, some new problems in the application process have occurred naturally. A speech quality evaluation system designed and developed on the basis of PESQ algorithm to solve the problem in evaluation of speech quality during the process of communication. The system is composed of two parts in which the first part is devoted to speech sampling and the second part is used to evaluate the speech quality. The speech sampling is conducted by the mobile phones which have the record function. The speech quality evaluation system gives a MOS average mark based on PESQ algorithm. The characteristics of individualization and modular design guaranteed the successful application of this system to evaluate different kinds of 4G communication networks. The operation practice of this system has proved this system can objectively evaluate speech quality of 4G network communication.
Keywords: perceptual evaluation of speech quality; 4G mobile communication; speech quality evaluation; network optimization
0 引 言
在移動4G通信網(wǎng)絡(luò)中,語音通信是一個核心業(yè)務(wù),隨著移動網(wǎng)絡(luò)技術(shù)的不斷發(fā)展,客戶對網(wǎng)絡(luò)通話質(zhì)量要求日漸提高,語音質(zhì)量的好壞直接影響用戶對于運營商的選擇。根據(jù)移動通信網(wǎng)絡(luò)服務(wù)質(zhì)量要求,建立一套語音質(zhì)量評價系統(tǒng),更好地對4G網(wǎng)絡(luò)的語音服務(wù)質(zhì)量進行定量測量、分析、評估,就成為移動運營商的迫切需要。本研究采用PESQ算法作為語音質(zhì)量評價參數(shù),應(yīng)用于4G通信網(wǎng)絡(luò)的語音質(zhì)量評價中,設(shè)計了一套比較完善的語音質(zhì)量評價系統(tǒng),解決了4G通信網(wǎng)絡(luò)中語音的檢測與評價問題。
1 PESQ算法原理
PESQ(Perceptual Evaluation of Speech Quality),即主觀語音質(zhì)量評價。PESQ算法是將語音信號的頻率、響度等物理特性與人類心理感知特性的關(guān)系通過數(shù)學(xué)模型對應(yīng)起來,用客觀模型來模擬主觀感覺的評價的算法。該模型采用時頻映射、頻率彎折和響度彎折等方法,盡可能地以數(shù)學(xué)方式表達語音中“可感知”的特性。PESQ算法的思路是:對參考信號和被測試信號先進行電平調(diào)整,調(diào)整到標(biāo)準(zhǔn)聽覺電平,然后用輸入濾波器模擬標(biāo)準(zhǔn)電話聽筒進行濾波。接著對通過電平調(diào)整和濾波后的兩個信號在時間上對準(zhǔn),并進行聽覺變換,這個變換包括對系統(tǒng)中線性濾波和增益變化的補償和均衡。兩個聽覺變換后的信號之間的不同作為擾動(即差值),分析擾動曲面提取出兩個失真參數(shù),在頻率和時間上累積起來,最終得到PESQ分?jǐn)?shù),并將這個分?jǐn)?shù)映像到對主觀平均意見分的預(yù)測值。PESQ算法模型如圖1所示。
2 語音質(zhì)量評價系統(tǒng)的設(shè)計與實現(xiàn)
語音質(zhì)量評價系統(tǒng)主要由語音采樣和質(zhì)量評價兩個子系統(tǒng)組成,兩個系統(tǒng)是操作獨立又相互聯(lián)系的。
2.1 語音采樣系統(tǒng)
語音采樣系統(tǒng)主要實現(xiàn)待測評4G網(wǎng)絡(luò)的語音樣本文件的采集。語音采樣系統(tǒng)硬件包括語音發(fā)送端手機和語音接收端手機,兩個手機必須均支持通話錄音功能。手機終端1通過4G通信網(wǎng)絡(luò)和手機終端2通話,同時兩個手機分別把語音內(nèi)容錄制到本地手機 ,分別保存為參考音頻文件和采樣音頻文件。語音采樣系統(tǒng)硬件拓?fù)鋱D如圖2所示。
2.2 語音評價系統(tǒng)
語音評價系統(tǒng)主要完成采樣語音的檢測與評價功能。
2.2.1 語音評價系統(tǒng)設(shè)計
語音評價系統(tǒng)包含模塊為:采集模塊、解碼模塊、業(yè)務(wù)處理模塊、顯示模塊、日志模塊。系統(tǒng)框架圖見圖3。
(1) 采集模塊:對手機錄制的音頻文件的采集及格式轉(zhuǎn)換。
(2) 解碼模塊:根據(jù)采集模塊的采集結(jié)果,每收到一幀數(shù)據(jù),調(diào)用解碼模塊對這幀數(shù)據(jù)進行分析,并不斷根據(jù)消息體類型按照4GPP、LTE相關(guān)協(xié)議嵌套分析并解碼每一層數(shù)據(jù),直到獲得PESQ算法需要的接收端語音消息。
(3) 業(yè)務(wù)處理模塊:主要根據(jù)不同的解碼模塊處理后的數(shù)據(jù)幀,作出相應(yīng)的數(shù)據(jù)計算以及多個相關(guān)數(shù)據(jù)幀的數(shù)據(jù)整合,把分散在不同幀的數(shù)據(jù)作為一個整體,通過相應(yīng)業(yè)務(wù)處理,得出相關(guān)數(shù)據(jù)。
(4) 顯示模塊:作用是把業(yè)務(wù)處理模塊的處理結(jié)果,顯示在電腦端或者手機端,方便使用者能直觀地看到相關(guān)參數(shù)。
(5) 日志模塊:主要完成數(shù)據(jù)采集的記錄,解碼關(guān)鍵步驟的記錄,業(yè)務(wù)模塊的業(yè)務(wù)流的記錄以及錯誤信息的記錄。
2.2.2 語音評價系統(tǒng)的實現(xiàn)
采樣系統(tǒng)采集到的參考音頻文件和采樣音頻文件均保存在計算機特定目錄下,調(diào)用系統(tǒng)PESQ算法,最終給出采樣音頻文件的MOS得分。分?jǐn)?shù)越高說明失真越?。徽Z音評估質(zhì)量越高,移動網(wǎng)絡(luò)系統(tǒng)語音通話效果也就越好。PESQ算法的使用如圖4所示。
調(diào)用PESQ算法進行MOS得分計算模塊的實現(xiàn)如下:
由于PESQ算法的輸入語音信號是 16 位線性 PCM信號, 所以選擇WAV文件作為測試語音信號。WAV文件有一個長度為 44 字節(jié)的頭部信息, 在使用 PESQ 算法對音頻文件進行語音質(zhì)量評估的時候, 需要顯式地指定文件后綴名為“ .wav”或者“ .WAV” , 以便通知PESQ算法跳過頭部的 44個字節(jié),從第44個字節(jié)后面讀入有效音頻數(shù)據(jù)。
PESQ軟件系統(tǒng)中調(diào)用PESQ算法部分代碼如下:
voidMosValues()
{
//沒有正常啟動播放,擇停止語音評估
if (!this.startPlay || this.testSoundLevel) return;
//語音評估
this.NotifyMosEvent(EventFSMSDK.DataOperationEvent.DataOperationTypeEnum.MosEvaluate);
stringsrcFileAddress = SystemPropetiesSingle.Instance().WaveFileAddress;
floatpesqScore = 0;
floatpesqLqScore = 0;
WaveFormatwaveFormat = GetWaveFormat(srcFileAddress);
int rate = waveFormat.SamplesPerSecond == 8000 ? 1 : 0;
floatvoiceAdjLevel = 0.03F;
if (GetPesqResult(0, rate, srcFileAddress, sRecordWaveFileName, out pesqLqScore, voiceAdjLevel))
{
//發(fā)送通知
LogFrame frame = new LogFrame();
frame.frameType = 0xFFDD;
frame.timeStamp = DateTime.Now.ToFileTime();
frame.AddData(pesqScore);
frame.AddData(pesqLqScore);
if (OnReceivedOneFrame != null)
OnReceivedOneFrame(this, frame);
}
//評估完成后,刪除語音文件
this.DeleteWaveFile(pesqLqScore);
}
GetPesqResult是PESQ算法模塊的動態(tài)連接庫,在C#中通過如下代碼實現(xiàn)了函數(shù)的導(dǎo)入:
[DllImport(@"PESQModule.dll", EntryPoint = "PesqGetResult")]
static extern boolGetPesqResult(int swap, int rate, string refpathname, string degpathname, out float refmos, float voiceAdj);
PESQ得分界面分成左右兩部分,左邊部分的上方顯示的是樣本語音的波形,左邊部分的下方顯示采樣語音的波形。右邊部分的上方顯示當(dāng)前接收語音的MOS得分,右邊部分的下方顯示更多接收語音的MOS得分,它反映了4G LTE移動網(wǎng)路的語音質(zhì)量的變化。系統(tǒng)的PESQ得分界面如圖5所示。
3 結(jié) 語
本系統(tǒng)將PESQ算法應(yīng)用于4G通信網(wǎng)絡(luò)語音評價中,能針對不同類型的網(wǎng)絡(luò)和測試要求進行個性化設(shè)置。由于采用了模塊化設(shè)計,能隨著網(wǎng)絡(luò)和容量變化輕松升級。運行實踐證明該系統(tǒng)有效解決了4G網(wǎng)絡(luò)中語音質(zhì)量評價問題,具有一定的推廣價值。
參考文獻
[1] 陳曉翔,路保本,林嘉宇.PESQ算法在軍事語音評估中的性能分析[J].微處理機,2014,35(1):35?40.
[2] 周璐,邱小軍,林志斌.PESQ測量語音增強算法性能不確定性的研究[J].電聲技術(shù),2010,34(1):71?73.
[3] 陳明義,何孝月.基于 PESQ的VOIP系統(tǒng)語音質(zhì)量評估應(yīng)用研究[J].微計算機信息,2008,24(27):171?173.
[4] 盧衛(wèi),陸希玉.4G時代移動互聯(lián)網(wǎng)的發(fā)展趨勢[J].電信科學(xué),2014,30(5):50?54.
[5] 凌渝.基于PESQ算法的語音質(zhì)量客觀評價方法研究[J].警察技術(shù),2011(5):30?32.
[6] 倪萍,魏芳.基于PESQ算法的彩鈴鈴音質(zhì)量評估系統(tǒng)[J].計算機應(yīng)用與軟件,2012(10):145?147.
[7] 陳新.基于PESQ算法的MOS測試解決方案[J].移動通信,2008,32(13):56?59.
[8] 李野,吳亞鋒,劉雪飛.基于PESQ的空乘人員語音質(zhì)量評價系統(tǒng)設(shè)計與實現(xiàn)[J].測控技術(shù),2009,28(1):31?34.