徐琨然 王 娟 聶 鵬
近年來(lái),數(shù)字電視中AVS+、H.265編碼技術(shù)的高速發(fā)展,極大提升了視頻質(zhì)量,同時(shí)降低了運(yùn)營(yíng)帶寬。現(xiàn)在隨著科技的發(fā)展,媒體已經(jīng)進(jìn)入飛速變革和發(fā)展階段,信息傳播正從圖文向視頻過(guò)渡,呈現(xiàn)出大量的視頻網(wǎng)站,我們已進(jìn)入大視頻時(shí)代。
視頻是媒體的核心,視頻信息相對(duì)于其他信息來(lái)說(shuō),有著直觀、確定、高效等獨(dú)一無(wú)二的優(yōu)點(diǎn)。因此對(duì)視頻質(zhì)量的評(píng)價(jià)估量就成為了一個(gè)關(guān)鍵。在視頻采集、視頻編碼、視頻壓縮、視頻的傳輸和記錄過(guò)程中,由于采集系統(tǒng)、編碼方法、壓縮損失、傳輸介質(zhì)和記錄設(shè)備不完備的情況,再加上各種噪聲污染,不可避免地帶來(lái)不定的視頻的失真和質(zhì)量下降,這給大家的視頻體驗(yàn)帶來(lái)嚴(yán)重的障礙。
當(dāng)下視頻質(zhì)量評(píng)價(jià)有主觀和客觀兩種。主觀評(píng)價(jià)力圖追求真實(shí)的人眼視覺(jué)感知,以個(gè)人角度對(duì)視頻進(jìn)行評(píng)價(jià),其中又分為絕對(duì)主觀評(píng)價(jià)方法和相對(duì)主觀評(píng)價(jià)方法兩類(lèi)??陀^評(píng)價(jià)是靠測(cè)試系統(tǒng)依據(jù)特定算法,對(duì)源視頻和測(cè)量視頻相比,給出基于數(shù)字計(jì)算的結(jié)果,最后評(píng)定視頻品質(zhì)的方法,根本目的是儀器代替人眼去觀看和評(píng)價(jià)視頻。
主觀評(píng)價(jià)是以人作為觀察者,對(duì)視頻的優(yōu)劣得出定性評(píng)價(jià),為保證視頻主觀評(píng)價(jià)在統(tǒng)計(jì)上有意義,參加評(píng)價(jià)的觀察者應(yīng)該足夠多。一般來(lái)說(shuō),主觀評(píng)價(jià)的觀察者要么都會(huì)挑選訓(xùn)練有素的“內(nèi)行”,要么就挑選未受過(guò)培訓(xùn)的“外行”。但是測(cè)試視頻的質(zhì)量、觀看距離、觀看亮度、觀看位置、顯示尺寸、對(duì)比度以及測(cè)試人員的經(jīng)驗(yàn)都決定了主觀評(píng)價(jià)的結(jié)果,因此評(píng)價(jià)結(jié)果差異大、重復(fù)性差、還存在一定的隨機(jī)性。
客觀評(píng)價(jià)中,系統(tǒng)廣泛用1個(gè)用于參考的源視頻,和1個(gè)經(jīng)過(guò)設(shè)備或系統(tǒng)的測(cè)量視頻,用于對(duì)比評(píng)價(jià)。它考慮到了人眼的視覺(jué)特性是一個(gè)受神經(jīng)系統(tǒng)調(diào)節(jié)的模型,建立了特殊的算法策略,把源視頻和測(cè)量視頻中人眼敏感的特性提取出來(lái)經(jīng)過(guò)上述算法,在時(shí)間域以及空間域中對(duì)這兩種不同的視頻序列進(jìn)行校準(zhǔn),展開(kāi)視頻質(zhì)量分析,一般情況下,質(zhì)量測(cè)試的結(jié)果會(huì)正比于主觀評(píng)測(cè)。
對(duì)于數(shù)字電視信號(hào)的特點(diǎn),TR 101 290標(biāo)準(zhǔn)中將錯(cuò)誤分為3種級(jí)別錯(cuò)誤。前兩級(jí)會(huì)出現(xiàn)黑屏和馬賽克等現(xiàn)象,人眼很容易發(fā)現(xiàn),但第三級(jí)錯(cuò)誤難以用人眼識(shí)別,且在數(shù)字電視系統(tǒng)中,視頻采集、視頻編碼、視頻壓縮等設(shè)備都是專(zhuān)業(yè)級(jí)別的,靠人眼對(duì)視頻品質(zhì)很難作出細(xì)致準(zhǔn)確的評(píng)價(jià)。由于隨機(jī)性大這個(gè)客觀原因?qū)χ饔^評(píng)價(jià)的影響,所以當(dāng)前評(píng)價(jià)數(shù)字電視視頻質(zhì)量基本是采用客觀評(píng)價(jià),這樣不止消除了個(gè)人差異和其余條件對(duì)主觀評(píng)價(jià)的影響,還可以極大減少時(shí)間和費(fèi)用的浪費(fèi)。目前的儀器系統(tǒng)基本上可以客觀評(píng)測(cè)視頻的整體質(zhì)量。這種視頻質(zhì)量測(cè)分析系統(tǒng)提供的客觀視頻質(zhì)量測(cè)服務(wù)不僅可以重復(fù),更可以做到與人眼主觀視覺(jué)評(píng)估非常的相近。類(lèi)似系統(tǒng)不僅可以在高清下變換的質(zhì)量評(píng)估中應(yīng)用,還能夠應(yīng)用在不同分辨率視頻的質(zhì)量測(cè)量中進(jìn)行。
一般數(shù)字電視視頻質(zhì)量客觀測(cè)試有以下三個(gè)常用的算法指標(biāo)。
PQR(視頻質(zhì)量測(cè)計(jì)分),基于視覺(jué)差模型研發(fā),測(cè)量校準(zhǔn)數(shù)據(jù)是從和視覺(jué)敏感性試驗(yàn)匹配的主觀評(píng)價(jià)中收集而來(lái)的,保證測(cè)量結(jié)果1 PQR=1 JND。(JND,是最小可覺(jué)差。)
參考分值:計(jì)分值從0至無(wú)窮大*。
0=理想質(zhì)量(不能察覺(jué)與源間的差異)
1=幾乎不能察覺(jué)損傷
3-4=可以看出損傷,但不明顯(類(lèi)似于復(fù)合視頻)
5=類(lèi)似于10 Mb/s SD MPEG-2
7-8=類(lèi)似于4 Mb/s SD MPEG-2
10=可明顯觀察到的損傷(類(lèi)似于2 Mb/s SD MPEG-2)
>10=與人眼測(cè)試的相關(guān)性很弱
DMOS(差異平均主觀評(píng)分)是在ITU-R BT.500 條件下,參考人眼視覺(jué)特性顯示源視頻和測(cè)量視頻之間的差異。此算法模擬了人眼發(fā)現(xiàn)的源視頻和測(cè)量視頻之間差異。
參考分值:評(píng)分在0–100間(相對(duì)于質(zhì)量最差的視頻片斷)。
0=理想質(zhì)量(與源幾乎無(wú)差異)
0-20=好
20-40=中間值
40-100=差
100+ =非常差(如同質(zhì)量最差的參考視頻片斷一樣甚至更差)
PSNR即峰值信噪比,PSNR 表示信號(hào)幅度峰值與信號(hào)中雜波之間的RMS比值,它是源和測(cè)量序列之間的均方誤差相對(duì)于(2^n-1)^2的對(duì)數(shù)值,是一種客觀標(biāo)準(zhǔn)。PSNR僅為最大值信號(hào)和背景噪音之間的對(duì)比,局限性較大,但是又是最廣泛使用的客觀量測(cè)法。PSNR值無(wú)法正比于人眼視覺(jué)系統(tǒng)的主觀評(píng)價(jià)已經(jīng)得到了大量的實(shí)驗(yàn)證明,因?yàn)槿搜鄣囊曈X(jué)特性是一個(gè)多信道模型,人眼的其感知結(jié)果會(huì)受到許多因素的影響而產(chǎn)生變化(例如:給一個(gè)較長(zhǎng)時(shí)間的光刺激后,人眼對(duì)同樣的刺激就降低,但對(duì)其它不同頻率段的刺激靈敏變卻不受影響,頻率越低,人眼的分辨能力就越高,人眼對(duì)于高亮度的區(qū)域所附加的噪聲其敏感性較小,人類(lèi)視覺(jué)系統(tǒng)對(duì)于平滑區(qū)域的敏感性要遠(yuǎn)高于紋理密集區(qū)域)。
參考分值:PSNR值一般在30~40 dB,視頻峰值信噪比越高,PSNR值越高。如果源視頻和測(cè)試視頻是相同的,PSNR測(cè)量結(jié)果等于80分貝。
通過(guò)視頻質(zhì)量評(píng)價(jià),能對(duì)視頻設(shè)備、系統(tǒng)的研發(fā)提供方向;通過(guò)科學(xué)合理的測(cè)試,能反饋?zhàn)罡咝Ь珳?zhǔn)的參考;視頻質(zhì)量評(píng)價(jià)盡可能驗(yàn)證在不同觀看距離、不同觀看亮度、不同觀看位置、不同顯示尺寸、不同對(duì)比度下的表現(xiàn),力求讓視頻設(shè)備、系統(tǒng)在各種情況下都表現(xiàn)優(yōu)異,極大保障用戶(hù)體驗(yàn),滿(mǎn)足我們對(duì)高質(zhì)量視頻的需要。
目前,客觀評(píng)價(jià)方法應(yīng)用日趨廣泛。但是一種評(píng)價(jià)算法只是對(duì)少數(shù)幾類(lèi)失真比較敏感,而對(duì)其他類(lèi)型的失真反應(yīng)效果并不好。因此在視頻質(zhì)量測(cè)試中,盡量采取準(zhǔn)確刻畫(huà)視頻狀態(tài)的,又符合人眼特征的算法尤其重要,此類(lèi)算法的開(kāi)發(fā)仍舊是此后研發(fā)的主要方向。