■ 王曉東 王惠生 謝保鋒
自有通信技術開始,特別是移動通信的發(fā)展,語音信息傳輸一直具有舉足輕重的地位。隨著移動網(wǎng)絡發(fā)展的日趨成熟,客戶對網(wǎng)絡的性能質量要求逐漸提高。因此,為了更好地定量分析和測量網(wǎng)絡的語音服務質量,要根據(jù)電信網(wǎng)絡服務質量(QoS)的要求,建立一套客觀評估標準。
語音質量評價從主體上可分為主觀評價和客觀評價兩大類。主觀評價以人為主體,在某種預設原則基礎上對語音質量作出主觀的等級意見或比較結果,反映聽評者對語音質量好壞的主觀印象,常見的主觀評價方法有平均意見分方法、判斷韻字測試方法、失真平均意見分方法、判斷滿意度測試方法和漢語清晰度測試方法??陀^評價方法是為了彌補主觀評價的缺陷、適應技術發(fā)展及運營服務的要求,是指用機器自動判斷語音質量?;谳斎?輸出的客觀評價比較輸出和輸入語音之間的差異(失真)程度,將差異量值作為語音質量的衡量依據(jù)。在應用中,輸入語音稱為參考語音,通過系統(tǒng)的輸出語音稱為失真語音??陀^評價方法具有不受人為主觀因素影響、成本低廉、靈活性好、效率高,具有可重復性且可實時使用等優(yōu)點。
為了評價語音的清晰度,ITU-TP.800和P.830定義了MOS(Mean Opinion Score)的主觀測試方法:具體實現(xiàn)方法和評判標準在ITU-TP.800有相應規(guī)定,在ITU P.830中提供了更詳細的操作方法。由不同的人(不同性別、年齡、階層)分別對原始語音和經過系統(tǒng)處理后有衰退的語音材料進行主觀感覺對比,得出MOS分(見表1)。
ITU組織在2001年2月發(fā)布了新的語音傳輸質量測量標準:P.862 — PESQ(Perceptual Evaluation of Speech Quality)。PESQ是評價各類端對端網(wǎng)絡條件和語音編碼與解碼的最新標準。PESQ可以根據(jù)一些感知標準客觀評價語音信號質量,從而提供可以完全量化的語音質量衡量方法,這些衡量標準又與人類對語音質量的感受完全吻合(見圖1)。
表1 MOS值對應的語音性能
通過PESQ算法可以客觀地評價語音質量,以此為基礎,構建語音質量測試系統(tǒng),系統(tǒng)測試界面見圖2。語音質量測試中,主叫模塊撥通被叫模塊后,通過語音盒播放計算機中的標準語音文件,再通過語音盒將錄制文件返回給計算機。測試軟件根據(jù)PESQ算法對原始語音和錄制語音進行比較計算,得出MOS值。測試界面中可以看到接收和發(fā)送的語音波形、失真值、衰減值等參數(shù)。為了分析,所有原始語音信息和其他行車信息都進行記錄。
高速鐵路GSM-R移動通信系統(tǒng)與公共移動通信網(wǎng)絡的應用特性相差很大,因此語音評價標準不能完全適用鐵路。根據(jù)高速鐵路應用特點,對不同速度等級的數(shù)據(jù),采用相關性分析方法,確定影響語音質量MOS的主要因素。
可能對MOS值產生影響的每個參數(shù)都計算相關系數(shù)并求出其于MOS一一對應的值,然后可以將其以散點的形式做圖并分析其分布規(guī)律。
在采集大量測試數(shù)據(jù)的基礎上,通過分析已繪散點圖(見圖3),嘗試尋找參數(shù)與MOS的回歸模型,選擇合適的擬合模型,計算估計回歸系數(shù),畫出擬合后的回歸曲線,從而試證明參數(shù)與MOS值的關系。單參數(shù)擬合曲線見圖4。
為了更好地分析預測數(shù)據(jù)及其分布趨勢,尋找合適的數(shù)學模型,對經過處理的數(shù)據(jù)進行曲線擬合。經過初步分析原始數(shù)據(jù),擬采用最小二乘法實現(xiàn)對測試數(shù)據(jù)的曲線擬合。
制定語音分析測試方案,通過對比不同線路或不同速度等級下測得的數(shù)據(jù),分析速度等因素對MOS值的影響。在同一線路,不同速度等級下測試得到參數(shù)值的變化趨勢,MOS值的上下浮動;對不同線路,在相同運行速度下同樣比較參數(shù)和MOS值的變化。通過對比能夠確定或排除某些參數(shù)在特定條件下和語音質量的關系及其對MOS影響的大小。
根據(jù)已知信息,頻偏變化越大對無線質量的影響越大,因此,當列車高速通過基站,經過與基站垂直距離最近點時,頻偏變化最大,多普勒效應最顯著(見圖5)。
圖1 PESQ評估算法框圖
圖2 GSM-R系統(tǒng)語音測試界面
圖3 ReQual、FER與MOS的分布
圖4 單參數(shù)擬合曲線
圖5 多普勒效應
由里程信息得到此位置所測的實際參數(shù)數(shù)據(jù),通過求其均值或范數(shù),與區(qū)間覆蓋中心點所測數(shù)據(jù)進行比較,從而判斷多普勒頻移的影響。如圖6所示,分別測得x1、x2、…、xi、xi+1時各參數(shù)值,將頻率鎖定在基站A、B、C等時測得的y1、y2、…、yi、yi+1各參數(shù)值進行比較,得出多普勒頻移在高速情況下對通信的影響。
移動通信系統(tǒng)引入小區(qū)切換方式保持通話狀態(tài)下的語音連續(xù)性,切換時信令消息需要以FACCH偷幀方式在TCH上傳送。由于擠占了TCH信道,對語音質量有所影響。MOS下降幅度與完成切換的時間有關,過程越長,MOS值下降越大。
通過以上對語音檢測數(shù)據(jù)的分析,一次MOS值的計算時間(≈12 s)中存在切換會導致語音質量急劇惡化,MOS值平均降低0.5左右,且速度越高,MOS值下降越快。如圖7所示,速度小于200 km/h的線路切換導致MOS值下降小于7%,速度為200 km/h的線路切換導致MOS值下降占10%左右,而列車速度在350~380 km/h之間切換導致MOS值下降的比率增長到20%左右??梢?,在速度影響下,切換對語音質量的影響急速增大。
圖6 測試多普勒效應方法
圖7 切換導致MOS下降
通過對不同運行速度的高速鐵路GSM-R系統(tǒng)語音MOS值的測試和分析,可知運行速度對MOS值的影響較大,主要是切換中斷對語音計算的影響。因此,評價線路GSM-R語音的MOS值還要與檢測的載體速度相關聯(lián),高速運行測試MOS值比低速運行測試時的MOS值低。對語音質量的研究還需采集大量的測試數(shù)據(jù),通過對數(shù)據(jù)的統(tǒng)計分析,研究高速鐵路語音質量評價標準。