賀甜甜,劉彥凱,宋利
(1. 上海交通大學圖像通信與網(wǎng)絡工程研究所,上海 200240;2. 未來媒體網(wǎng)絡協(xié)同創(chuàng)新中心,上海 200240)
視頻用戶體驗理論與實踐
賀甜甜1,2,劉彥凱1,2,宋利1,2
(1. 上海交通大學圖像通信與網(wǎng)絡工程研究所,上海 200240;2. 未來媒體網(wǎng)絡協(xié)同創(chuàng)新中心,上海 200240)
隨著視頻服務逐漸成為人們獲取信息的主要途徑之一,消費者對觀看體驗的要求不斷提高,視頻用戶體驗質量已經(jīng)成為視頻服務的主要競爭因素。首先對用戶體驗質量理論進行了系統(tǒng)的闡述,指出了用戶體驗質量與服務質量之間的差別和聯(lián)系,同時給出了用戶體驗評價方法的主要步驟和視頻質量評價的具體方法。進一步地,對我國現(xiàn)階段視頻用戶體驗評價研究及標準化的進展進行詳細介紹,概括了目前我國視頻服務的用戶體驗現(xiàn)狀并給出了相關的改進方向意見。
用戶體驗質量;視頻服務;客觀質量評價
ITU-T P.10/G.100 (Amd5) 標準[1]將用戶體驗質量(quality of experience,QoE)定義為“用戶對某項應用或者服務的滿意程度,該滿意程度來自于用戶對于此項應用或服務功能或質量的期望的實現(xiàn)程度,與該用戶的個人喜好和感受相關”。簡單來說,就是終端用戶對應用或者服務整體的主觀可接受程度,其影響因素主要可以分為3個層面:服務層面、環(huán)境層面和用戶層面,如圖 1所示。服務層面的影響因素又包括應用層、傳輸層和服務層的參數(shù);環(huán)境層面的影響因素包括自然環(huán)境(如光照條件、噪聲條件、環(huán)境的固定和移動)、社會與人文環(huán)境(如社會觀念、文化規(guī)范)以及服務運行環(huán)境(包括軟硬件環(huán)境等);用戶層面的因素包括用戶的期望、體驗經(jīng)歷、身心狀態(tài)和自身背景(如年齡、性別和受教育程度等)。
圖1 QoE的影響因素
QoE概念是在用戶服務質量(quality of service,QoS)的基礎上發(fā)展起來的。ITU-T Rec E.800標準[2]將QoS定義為“某項服務滿足使用該服務的用戶的明示或暗示需求的綜合能力”,指一個網(wǎng)絡能夠利用各種基礎技術,為指定的網(wǎng)絡通信提供更好的服務能力。從定義上來看,QoE和QoS的概念較為抽象,具體到網(wǎng)絡服務質量層面來說,QoS可以狹義地理解為基于底層分組數(shù)據(jù)傳輸?shù)年P鍵性能指標(key performance indicator, KPI),而QoE是建立在由KPI生成的關鍵質量指標(key quality indicator,KQI)之上的,并且引入了與用戶行為相關的數(shù)據(jù)。具體的QoE與QoS體系關系如圖2所示。
圖2 QoE與QoS體系關系
視頻服務QoE評價體系如圖3所示,視頻服務KPI一般指基于網(wǎng)元設備的關鍵指標,主要包括終端性能、網(wǎng)絡傳輸質量、視頻傳輸質量、音頻體驗質量、媒體的封裝質量和視頻的編碼參數(shù)。KQI從業(yè)務和應用層面出發(fā)反映業(yè)務使用體驗,例如視頻源質量,包括視頻源本身的編碼格式、視頻清晰度和媒體封裝等;觀看體驗質量,即視頻在播放過程中是否有出現(xiàn)緩沖卡頓、花屏和馬賽克的情況;交互體驗質量,是指視頻在觀看過程中業(yè)務交互的情況,包括直播業(yè)務的交互成功率以及交互時延等。KQI一般通過KPI處理得到。QoE指標從用戶層面出發(fā),可以定義為終端用戶對視頻業(yè)務的總體主觀感知??陀^評估QoE通常通過一組 KQI/KPI進行映射[3],通過可靠性和舒適性兩個主要的方面對視頻業(yè)務的用戶體驗進行評價,并得到用戶觀看視頻過程中體驗的綜合評分。
圖3 視頻服務QoE評價體系
值得注意的是,QoE引入的用戶主觀感受本質上需要通過主觀評價方法加以測定,然而因為主觀評價方法對于時間和參與測試人數(shù)有著一定的要求,較為耗時耗力,目前主觀測試結果主要用于對客觀模型輸出進行校驗和訓練,QoE問題的研究方向在于如何設計一套有效的客觀評價辦法,使得評價系統(tǒng)輸出盡量接近人的主觀感受,這樣的客觀評價算法在實際應用中才具有廣泛的使用價值,而視頻服務即目前對于客觀評價算法有迫切需求的領域之一。
隨著視頻編碼、顯示技術的發(fā)展,國內外視頻服務都進入了高速發(fā)展期,對寬帶建設和網(wǎng)絡提速起到顯著的拉動作用,帶動了視頻通信、視頻消費和視頻監(jiān)控等業(yè)務的發(fā)展,共同構建了大視頻業(yè)務體系并成為支撐智慧城市、先進制造等工作的重要基礎。隨著技術的進步和帶寬的提升,市場提供的視頻服務的主流分辨率從過去以標清為主演變到目前以高清為主,并將進一步過渡到以超高清4K 為主,未來還會向 8K、AR/VR等更高水平發(fā)展。視頻服務供應商紛紛采取各類措施來提升視頻服務的用戶體驗。因此用戶體驗質量與視頻服務各環(huán)節(jié)之間關系和實際檢測方法具有十分重要的研究意義。本文將從用戶體驗質量理論出發(fā),介紹視頻質量評價的具體方法,并結合我國目前視頻用戶體驗標準化工作對視頻用戶體驗理論與實踐做出詳細介紹。
2.1 視頻服務體驗主觀評價方法
如上文所述,QoE模型的最終輸出是對用戶的主觀感受進行評價,因此主觀評價方法是 QoE研究不可缺少的一環(huán)。ITU對于不同的應用場景設計了不同的主觀測試標準,對于視頻服務應用最廣泛的有ITU-T P.910[4]以及ITU-R BT.500[5]標準,其中前者側重視頻會議、視頻通話場景,后者側重家庭電視環(huán)境,在基本方法上二者有交疊,主要差異在于應用場景不同。兩個標準被包含的主要測試方法有:單刺激絕對分級(absolute category rating, ACR)法、成對比較(pair comparison, PC)法、雙刺激損傷分級(double stimulus impairment scale, DSIS)法、雙刺激損傷連續(xù)評價(double stimulus continuous quality scale, DSCQS)法。每類測試方法在開始前均需要對被測試者講解流程,BT.500標準建每次測試至少需要15名被測人員以達到統(tǒng)計有效。在獲得每個被測者的打分后,需要對其有效性進行篩查,其根本原理是檢查一個測試者的數(shù)據(jù)能否落在由其余所有測試者的數(shù)據(jù)計算出的置信區(qū)間內,詳細篩選算法請參見BT.500標準[4]。通過數(shù)據(jù)篩查后的打分平均處理即可得到每個測試序列的主觀得分。下面對不同的主觀打分方法進行簡要介紹。
ACR方法中被測者每次只觀看一段視頻并對觀看的每段視頻分別打分,每一位測試者采用不同的隨機播放順序觀看不同的視頻。通常打分采用五級離散質量量表,該量表中分值為 MOS(mean opinion score)分值,表示是對“視頻質量”進行打分,認為該視頻質量越高,則分數(shù)越高。即優(yōu)秀=5,良好=4,一般=3,較差=2 ,極差=1。有時該方法也會采用九級、十一級離散量表(最高分值為9分或11分)或100級連續(xù)量表(為后續(xù)數(shù)據(jù)處理方便)等。
PC方法中一對視頻同時呈現(xiàn)給被測者且組合排序隨機,被測者須使用七級離散量表判別第二段視頻與第一段相比的質量優(yōu)劣,即極好=3,好=2,較好=1,無差別=0,較差=1,差=-2,極差=-2,也可以采用兩級量表,判定第二段視頻好或差于第一段視頻。
DSIS方法類似PC方法,但強調測試素材既包含測試序列,也包含相應的原始序列。測試時,測試者先觀看源參考視頻,再觀看測試視頻。測試者評分的對象,是后一個視頻相較于前一個視頻的差別,即測試視頻相對源參考視頻的損傷度,即損傷不可察覺=5,輕微可察覺但可接受=4,輕微不可接受=3,不可接受=2,極端不可接受=1。
DSCQS方法用于比較一個視頻源與它的一個損傷版本之間的質量關系,二者隨機排列并且呈現(xiàn)給被測者兩次,觀看完兩輪后被試者使用ACR方法的評價量表分別對兩個視頻獨立打分。DSCQS方法的優(yōu)點是可以比較出測試視頻與源參考視頻的細微差別,它的缺點在于測試時間幾乎是單刺激法的兩倍。
2.2 KPI與視頻服務體驗
飛速發(fā)展的網(wǎng)絡技術與多媒體技術相結合,出現(xiàn)了多種多樣的網(wǎng)絡視頻服務形式。網(wǎng)絡視頻已經(jīng)成為主流的視頻服務方式之一,其形成過程如圖4所示。原始的視頻數(shù)據(jù)通過編碼器進行編碼壓縮并封裝,然后通過網(wǎng)絡進行傳輸,接收端的解碼器收到網(wǎng)絡視頻流后對數(shù)據(jù)進行解分組并解碼,最后將解碼后的視頻序列在終端設備上播放顯示。
圖4 網(wǎng)絡視頻形成過程
在上述過程中,網(wǎng)絡傳輸性能和視頻壓縮性能成為了影響視頻質量和用戶體驗的關鍵性能指標。保證網(wǎng)絡視頻質量成為網(wǎng)絡視頻服務的關鍵,視頻質量評價方法的研究也受到了廣泛的關注。
2.2.1 基于網(wǎng)絡傳輸性能的視頻質量評價
網(wǎng)絡傳輸質量的評價是利用可量化的評價指標對視頻質量受網(wǎng)絡損傷的影響程度進行合理有效的評定。由于網(wǎng)絡的傳輸環(huán)境錯綜復雜且具有時變性,因此存在多種多樣的因素能影響到傳輸視頻的質量,其中影響較大的因素包括分組丟失、端到端時延、時延抖動和帶寬等方面[6]。同時由于網(wǎng)絡性能中的抖動、時延所導致的主要后果就是產(chǎn)生數(shù)據(jù)分組丟失,即視頻流信息丟失,數(shù)據(jù)分組丟失對視頻質量有直接的影響,包含語義信息(例如如運動向量、量化參數(shù)等)的數(shù)據(jù)丟失會對與之相關的視頻內容產(chǎn)生影響,而與系統(tǒng)信息和分組頭信息有關的語法信息的丟失可能導致整塊數(shù)據(jù)無法解碼的嚴重后果,甚至會導致一個或更多片的丟失。此外,由于編碼/解碼的特性,數(shù)據(jù)分組丟失引起的誤差可能會在時間上或/和空間上擴散。采用有差別、可變長的編碼的方式會導致數(shù)據(jù)分組丟失在單個幀(任何類型的幀)中延續(xù),直到遇到下一個重新同步點,引起分組丟失誤差在空間上的擴散。時間上的誤差擴散是由于幀間預測產(chǎn)生的,主要指在參考幀(I幀或P幀)中發(fā)生分組丟失時,以該幀為參考的幀會受到影響。無線傳輸?shù)囊胧沟靡苿右曨l服務質量受到更多的傳輸差錯影響[7]。與網(wǎng)絡傳輸性能有關的參數(shù)通常包含在分組頭中的信息中。
網(wǎng)絡傳輸性能對于視頻服務質量的影響已經(jīng)在國際上引起廣泛關注,一系列與之相關的標準和模型應運而生。ITU-T G.1000系列標準主要關注通用的和與用戶相關的多媒體服務質量和性能。ITU-T G.1050[8]提供了IP網(wǎng)絡上多媒體傳輸性能的網(wǎng)絡評估模型,該模型著重對分組時延變化和分組丟失特性進行分析,可以用于評估來自任何類型網(wǎng)絡設備的 IP媒體數(shù)據(jù)流。ITU-T G.1080[9]對IPTV的用戶體驗質量和影響網(wǎng)絡傳輸和應用層行為的信息進行了定義。ITU-T G.1081[10]定義了 IPTV 服務中的性能監(jiān)測點。ITU-T G.1082[11]提供了基于實時測量結果,用于提高IPTV性能頑健性。此外,ITU-T P.1200系列標準提供了流媒體質量評估模型,其中部分模型對于基于網(wǎng)絡傳輸?shù)囊曨l質量進行了評估,例如ITU-T P.1201.2[12]。
2.2.2 基于視頻壓縮性能的視頻質量評價
壓縮編碼對于視頻的傳輸來說是必不可少的,視頻的壓縮編碼是由視頻編碼器來實現(xiàn)的。視頻編碼器的作用是將輸入的原始像素數(shù)據(jù)編碼成碼流數(shù)據(jù)并輸出,其最終的目的在于實現(xiàn)視頻的數(shù)據(jù)量的壓縮。視頻編碼過程是一個有損壓縮的過程,對視頻的質量產(chǎn)生決定性的影響。視頻編碼器輸出的視頻質量與編碼標準、編碼器種類、視頻內容、視頻碼率(比特率)和其他編碼參數(shù)(如幀率、分辨率等)有密切的關系:通常情況下,按照不同編碼標準(如H.264、HEVC等)對視頻進行壓縮獲得的視頻質量不同。不同編碼器的性能存在差異——即使采用相同的編碼標準,不同編碼器之間性能也有區(qū)別。同時,不同的視頻內容在相同的編碼情況下會有不同的質量。對同一編碼器壓縮的視頻,視頻質量和碼率大體上成正比的關系。此外,視頻編碼的過程并不是一個標準化定義的過程,用戶可以對編碼參數(shù)進行自主設置,只要編碼產(chǎn)生的碼流符合解碼規(guī)范即可。因此,采用不同的編碼參數(shù)設置輸出的視頻的質量往往可能相差很多。
基于視頻壓縮性能的視頻質量評價就是根據(jù)視頻壓縮過程中的關鍵影響因素對視頻質量的壓縮損傷進行評價?,F(xiàn)有的一些主流的視頻質量評價模型,包括國際電信聯(lián)盟(ITU)提出的標準化視頻質量評價模型和其他相關學者提出的模型,針對不同的應用場景對視頻壓縮質量進行了評估。這些模型引用了不同的參數(shù),見表1,使用相同的視頻序列集對這些模型的性能進行驗證,根據(jù)均方根誤差(RMSE)、樣本離群率(OR)和皮爾森相關系數(shù)(PCC)3個統(tǒng)計指標可以看出,各個模型在實際的應用中對視頻質量評價的準確性、一致性和線性相關性等方面存在差異[21]。
表1 模型比較
在現(xiàn)實的應用,如IP電視(IPTV)或OTT等視頻服務中,視頻編碼過程使用的參數(shù)通常是不規(guī)范的,一個視頻序列的GOP長度和結構通常是變化的。因此,基于 GOP的模型,如上述P.1201.2的性能可能受影響,而不是基于GOP的模型具有更好的性能。其中,新提出的模型uVESMode1和P1203.1 Mode 3在視頻質量評價過程中考慮了終端播放參數(shù)的影響,在實際應用中表現(xiàn)出了更優(yōu)的性能,這為未來提出性能更優(yōu)、泛化能力更強的視頻質量評價模型指明了方向。面臨更加復雜的應用環(huán)境和更多樣的視頻服務類型,視頻質量評價模型需要做出適當?shù)恼{整(例如引入更多的有效參數(shù))以跟上實際應用變化和發(fā)展的步伐。
2.3 KQI與視頻服務體驗
2.3.1 超高清視頻服務
2012 年國際電信聯(lián)盟無線電通信部門(ITU-R)頒布了面向新一代超高清視頻(ultra-high definition,UHD)制作與顯示系統(tǒng)的BT.2020標準[22],重新定義了電視廣播與消費電子領域關于超高清視頻顯示的各項參數(shù)指標,促進4K超高清家用顯示設備進一步走向規(guī)范化。其中最為關鍵的是,BT.2020標準指出超高清視頻顯示系統(tǒng)包括4K與8K兩個階段,其中4K的像素分辨率為3 840dpi×2 160 dpi,而8K則為7 680 dpi×4 320 dpi。之所以超高清視頻顯示系統(tǒng)會有兩個階段,實際上是因為全球各個地區(qū)超高清視頻顯示系統(tǒng)發(fā)展差異性所造成的,例如在電視廣播領域技術領先的日本就直接發(fā)展8K電視廣播技術,避免由4K過渡到8K可能出現(xiàn)的技術性障礙。而在世界的其他地區(qū),多數(shù)還是以4K技術作為下一代的電視廣播發(fā)展標準。超高清視頻服務代表著新的一輪視頻技術革新已經(jīng)歷將分辨率提升到4K的第一階段發(fā)展,到第二階段包含分辨(3 840 dpi×2 160 dpi)、幀率(50/60/120幀/s)、對比度(high dynamic range,HDR)、廣色域(wide color gamut , WCG)、位深(10 bit、12 bit)5方面全方位的提升。
此外,下一代視頻編碼標準,5G通信技術等保證了超高清視頻服務的落地,由此為用戶帶來了更為沉浸式的體驗,同時也對QoE模型的發(fā)展提出了更高的要求。最為顯著的是,目前視頻服務的質量評價應由傳統(tǒng)的誤差檢測過渡到性能檢測,即從區(qū)別“好”與“壞”,過渡到區(qū)別“好”與“更好”。從用戶角度衡量視頻服務質量需要進一步考慮人眼視覺系統(tǒng)對畫面的感知,設計基于圖像層信息的關鍵質量指標,以此提升QoE體系。
2.3.2 3C概念與視頻質量評價
作為工業(yè)界高端視頻生產(chǎn)和研究行業(yè)組織,Ultra HD Forum在2016年提出了基于關鍵質量指標的超高清圖像質量“3C”KQI概念,即顏色度、對比度、清晰度(colorfulness, contrast, clarity),顏色度側重圖像還原真實世界色彩的能力,對比度代表畫面呈現(xiàn)亮區(qū)和暗區(qū)細節(jié)的能力,清晰度強調圖像沒有細節(jié)質量的損傷,具體可細化為模糊度、塊效應程度、噪點度,即“3C”概念對應著5類人眼視覺相關評價指標:模糊度、塊效應程度、噪點度、顏色豐富度與噪點度。
視頻質量評價是圖像識別領域的一個研究方向,包含主觀質量評價與客觀質量評價兩部分,而如第2.1節(jié)所述,主觀質量評價雖然可以真實反映用戶對于服務的感受,但其需要大量人員參加測試并且進行多輪以實現(xiàn)統(tǒng)計顯著性,主觀評價需要極高的人力物力資本,故多數(shù)用于模型驗證等,不適用于實際應用環(huán)境??陀^評價的目的即通過提取視頻信息,設計相關評價算法,通過模型擬合對視頻進行客觀評價以預測出主觀感受分數(shù),是實際應用中更具價值的評價方案。根據(jù)評價算法是否需要無質量損失的參考源,客觀質量評價可以分為無參考、半?yún)⒖?、全參?類,其中以無參考客觀質量評價算法的應用場景更為廣泛。無參考客觀評價根據(jù)模型輸入的不同可分為傳輸層模型、碼流模型及混合模型,而“3C”概念即對應需要輸入視頻解碼后圖像層信息的混合客觀評價模型,如圖5所示。
圖5 視頻質量評價框架
由中國信息通信研究院、國家新聞出版廣電總局廣播電視規(guī)劃院牽頭,中國電信、華為公司、上海交通大學等深度參與的中國視頻服務用戶體驗標準工作組,與2016年9月發(fā)布了國內首個《視頻服務用戶體驗評估標準(1.0)》(以下簡稱《評估標準》)(如圖6所示),此外工作組還組織相關單位在國內部分地區(qū)開展了針對 IPTV 視頻業(yè)務和互聯(lián)網(wǎng)視頻業(yè)務的視頻服務用戶體驗評測工作,以驗證標準的實用性和有效性。
3.1 視頻服務用戶體驗評估標準
依據(jù)圖1中的QoE影響因素,由于用戶層面和環(huán)境層面變化多種多樣,對某個視頻業(yè)務整體的用戶體驗評估主要從服務層面進行。服務層面影響因素可分為應用層、傳輸層和服務層。視頻體驗的應用層面主要為音視頻質量,包括音視頻的信源質量和編碼質量等,傳輸層反映視頻的傳輸狀況,包括分組丟失、抖動和時延等,表現(xiàn)為用戶的觀看體驗。服務層主要為用戶的交互體驗,如初始加載、快進快退等?!对u估標準》將視頻終端用戶對視頻業(yè)務的總體主觀體驗分數(shù)Uves定義為 Uves=f(Qs,Qa,Qi,Qv),即用戶體驗綜合評分為視頻體驗質量(Qs)、音頻體驗質量(Qa)、交互體驗質量(Qi)、觀看體驗質量(Qv)的函數(shù)關系。標準區(qū)分了不同的應用場景,包括點播、直播以及視頻監(jiān)控等,其余場景正在逐步擴充中。
圖6 《視頻服務用戶體驗評估標準(1.0)》評價結構
3.1.1 視頻體驗質量
視頻體驗質量按照其處理信號層級主要包含Model0、Model1、Model2三層模型。其中Model0顯式包含比特率(BitRate)、視頻顯示屏幕尺寸(ScreenSize)、電視機分辨率(PPI)和編碼器類型(CodecType)變量。Model1需要從編碼數(shù)據(jù)分組及比特流中采集視頻幀關鍵編碼信息,包含視頻分辨率(Resolution)及幀率(FrameRate)、每一幀的編碼類型(FrameType)及幀大?。˙ytesPerFrame)、編碼量化參數(shù)(QP)、運動矢量信息(MV)以及每一幀內編碼單元跳過比例(SkipRatio)。Model2需要從播放器連續(xù)采集視頻幀的圖像層關鍵質量信息,包含模糊度(Blurriness)、塊效應(Blockiness)、對比度(Contrast)、噪點度(Noise)和顏色度(Color)。三層模型所需的輸入信息按獲取難度遞增,且評價精細化程度遞增,采用分層形式有利于根據(jù)實際應用條件中的靈活調整(如不具備完全解碼能力時可僅采用基于碼流的前兩層模型):
3.1.2 音頻體驗質量
音頻體驗質量同樣依據(jù)其處理信號層級分為三級。其中 Model0包含碼率和編碼類型變量,Model1 包含碼率、編碼類型(E-AC3、AAC、MPEG1 Layer2、Layer3)、音頻數(shù)據(jù)每秒采樣點數(shù)(SampleRate)、聲道數(shù)(NumberofChannels)和AAC編碼中的尺度因子(ScaleFactor),Model2需要從原始音頻或播放器連續(xù)采集音頻,獲得響度(Loudness)、動態(tài)范圍(Dynamic Range)和左右聲道相位差(Skewing)等關鍵質量信息:
3.1.3 交互體驗質量
交互體驗是指用戶在視頻業(yè)務使用過程中業(yè)務操作的便捷性和效率,包括直播、點播等業(yè)務操作的成功率以及交互時延等指標。用戶的交互體驗主要受視頻系統(tǒng)的響應速度影響;對于不同視頻業(yè)務,用戶關注的交互體驗具體指標有所不同。
直播交互體驗受傳統(tǒng)電視使用習慣的影響,用戶對換臺時延的期望值較高;因此對直播業(yè)務操作時,頻道切換的時延是影響交互體驗最重要的因素;頻道切換時延 tloadding越長,用戶體驗越差。由于點播業(yè)務在傳統(tǒng)操作上的反應就比較慢,用戶對其交互體驗的初始緩沖時延 tzapping容忍度比較高;業(yè)界普遍采用“2 s定律”來衡量;即大部分用戶對在點播操作后的 2 s內能完成視頻初始加載的服務是可以接受的;超過2 s之后,點播操作后的視頻初始加載時間每增加1 s約有10%的用戶會選擇放棄;當交互時延達到10 s時大多數(shù)用戶會選擇放棄。此外對于點播和直播應用,均需要考慮當前已播放時長t和最大遺忘時T(默認為系統(tǒng)參數(shù),用以構建遺忘曲線刻畫用戶對時延的忍耐性):
3.1.4 觀看體驗質量
觀看體驗即視頻在播放過程中是否有出現(xiàn)視頻圖像不連續(xù),圖像出現(xiàn)異常等質量劣化的情況,包括花屏、馬賽克、卡頓、聲畫不同步等。造成這些情況的原因主要是網(wǎng)絡和業(yè)務平臺的能力是否滿足要求,是否能協(xié)調一致。比如視頻直播時會因網(wǎng)絡分組丟失發(fā)生花屏現(xiàn)象,而點播時會因為網(wǎng)絡或平臺緩存等原因造成數(shù)據(jù)分組到達延遲而引起視頻卡頓。觀看體驗質量首先考慮視頻卡頓現(xiàn)象,一般代表著視頻重新進行緩沖,因此模型的輸入變量為緩沖平均時長(Duration,所有的緩沖時長之和除以緩沖次數(shù)Frequency)與多次緩沖情況下緩沖間隔的平均值(Interval)。其次考慮視頻流中花屏時間(BlockingTimeRatio)占比和花屏面積占比(BlockingAreaRatio):
3.2 部分地區(qū)視頻服務體驗現(xiàn)狀
為了驗證《評估標準》的實用性,工作組在標準(1.0)版本發(fā)布后首先以視頻播放服務為對象進行了標準驗證,國內主要電信運營商和互聯(lián)網(wǎng)視頻服務商聯(lián)合在國內開展了首次視頻播放的大范圍用戶體驗評測活動。國內目前的視頻播放服務主要包括 IPTV 業(yè)務、互聯(lián)網(wǎng)視頻業(yè)務和有線電視業(yè)務,由于時間原因,本次用戶體驗評測先采集了部分地區(qū)的 IPTV 業(yè)務(中國電信和中國聯(lián)通等部分省電信運營商的 IPTV 業(yè)務)和互聯(lián)網(wǎng)視頻業(yè)務(包括優(yōu)酷土豆、愛奇藝、騰訊視頻、樂視、芒果 TV和風行等主流服務商)的樣本數(shù)據(jù),而有線電視業(yè)務的樣本數(shù)據(jù)采集的工作正在進行中。本次測試的報告于2016年12月發(fā)布在《中國視頻服務體驗白皮書》中。根據(jù)報告中數(shù)據(jù)分析,IPTV 業(yè)務的用戶體驗基本得到保障,互聯(lián)網(wǎng)視頻體驗受網(wǎng)絡因素影響較大;圖7為我國IPTV及互聯(lián)網(wǎng)視頻服務uVES體驗得分,IPTV的樣本用戶的uVES得分平均為 3.06(良),而互聯(lián)網(wǎng)視頻服務在 PC 端的uVES得分平均為 1.79(差),互聯(lián)網(wǎng)視頻手機端的 uVES得分平均為2.53 (中);應該說相比 IPTV 業(yè)務,互聯(lián)網(wǎng)視頻服務仍然有很大的提升空間,其主要原因是 IPTV全程通過專網(wǎng)傳送,網(wǎng)絡傳輸質量能得到保障,而互聯(lián)網(wǎng)視頻服務通過公網(wǎng)傳送,需要和其他互聯(lián)網(wǎng)業(yè)務共享網(wǎng)絡資源,在出現(xiàn)流量高峰時用戶體驗難以保障。
圖7 我國IPTV及互聯(lián)網(wǎng)視頻服務uVES體驗得分(2016年12月)
此外,華為mLAB基于SpeedVideo App 2016年全球 vMOS測試數(shù)據(jù),對視頻體驗及網(wǎng)絡能力現(xiàn)狀進行了深入挖掘,并且從全球區(qū)域、國內省、國內一線城市典型場景等維度展開分析,與 2017年 2月發(fā)布了《全球 vMOS洞察報告2017Q1》。報告指出,全球區(qū)域維度視頻體驗:非洲東南部和中國區(qū)靠前,其平均vMOS約為3.8;拉丁美洲北部、南太平洋地區(qū)和亞洲中部靠后,其平均vMOS不到3.6,且南太平洋地區(qū)vMOS分布呈現(xiàn)多樣化。中國區(qū)vMOS Top30城市中東部城市占比 66.7%,超過了東部城市個數(shù)的比例56%;西部城市占比3.3%,少于西部城市個數(shù)的比例 12%;中部城市占比30.0%,基本持平中部城市個數(shù)的比例32%。在中國區(qū)大部分一線城市中按照場景vMOS得分對比看,高速和景區(qū)場景vMOS總體排名靠前,可能與該場景下4G覆蓋普遍較好且負荷較輕有一定關系;酒店、校園場景排名總體上處于中等水平;而高鐵和地鐵場景排名則整體比較靠后,可能與該場景下4G信號穿透損耗大、用戶較多且并發(fā)率高從而導致4G負荷較重有關。
對于國內專網(wǎng)傳輸?shù)腎PTV業(yè)務,由于網(wǎng)絡環(huán)境能夠得到有效保障,用戶體驗總體表現(xiàn)良好,但IPTV點播業(yè)務的4K內容的交互體驗卻較低,這是由于4K點播內容相對高清(1080P)內容在碼率上要求更高,在今后一段時期高清和 4K 內容占比不斷增加的情況下,需要開展網(wǎng)絡端到端的優(yōu)化,以提升交互體驗和觀看體驗。
對于互聯(lián)網(wǎng)服務業(yè)務用戶體驗目前發(fā)展水平不均衡現(xiàn)象,不能通過簡單的提升視頻碼率的方式來取得較好的視頻服務用戶體驗,因為互聯(lián)網(wǎng)視頻服務的高碼率得不到高帶寬的保障,碼率提升后播放出現(xiàn)卡頓的概率反而較大,導致用戶觀看體驗評分會下降。若單純增加初始視頻加載時間,緩沖更多的播放數(shù)據(jù)來保障用戶在觀看過程中的流暢性,也會造成點播的初始視頻加載時間的延長,影響用戶的交互體驗。因此互聯(lián)網(wǎng)廠商應同時面向視頻顯示質量、交互體驗和觀看體驗進行均衡配置,在初始視頻加載時間不大的情況下,盡力保證用戶觀看的流暢度;綜合采用多種技術手段,如CDN下沉盡量靠近用戶、新的編碼技術、基于主觀感受的碼率優(yōu)化及終端播放性能優(yōu)化等。
視頻服務流量目前已經(jīng)占到全球互聯(lián)網(wǎng)流量的75%以上,伴隨著超高清視頻服務的全面開展,用戶在選擇視頻服務時已經(jīng)從網(wǎng)絡質量轉向內容體驗質量,準確的用戶體驗質量評價技術具有迫切的產(chǎn)業(yè)發(fā)展需求。本文對用戶體驗質量理論與視頻質量評價技術做出了詳盡的介紹,總結了目前我國視頻體驗評價標準的進展,隨著學術界與工業(yè)界的共同參與,視頻用戶體驗評價技術將為今后大視頻業(yè)務體系的高質量發(fā)展提供堅實的保證。
參考文獻:
[1]ITU. Amendment 5: New definitions for inclusion in recommendation: ITU-T P.10/G.100[S]. 2006.
[2]ITU. Definitions of terms related to quality of service: ITU-T Rec.E.800[S]. 2009.
[3]姚良, 奚溪. 三網(wǎng)融合下視頻業(yè)務質量評估體系的研究[J].電信科學, 2011, 27(3):27-31. YAO L, XI X. Research of video service quality evaluation system in triple-play Filed[J]. Telecommunications Science, 2011, 27(3): 27-31.
[4]ITU. Subjective audiovisual quality assessment methods for multimedia applications: ITU-T Rec.P.910[S]. 2008.
[5]ITU. Methodology for the subjective assessment of the quality of television pictures: ITU-R Rec. BT.500-13[S]. 2012.
[6]韓建亭, 張夙. 基于智能終端的視頻通信業(yè)務服務質量評測模型研究[J]. 電信科學, 2013, 29(4): 27-32. HAN J T, ZHANG S. Study on the assessment model of video communication quality based on smart terminal[J]. Telecommunications Science, 2013, 29(4): 27-32.
[7]魏耀都, 謝湘, 匡鏡明, 等. 移動視頻質量評價方法及發(fā)展趨勢[J]. 電信科學, 2010, 26(3): 57-63. WEI Y D, XIE X, KUANG J M, et al. Testing method for routers of network-on-chip[J]. Telecommunications Science, 2010, 26(3): 57-63.
[8]ITU. Network model for evaluating multimedia transmission performance over internet protocol: ITU-T Rec.G.1050[S]. 2016.
[9]ITU. Quality of experience requirements for IPTV services: ITU-T Rec. G.1080[S]. 2008.
[10]ITU. Performance monitoring points for IPTV: ITU-T Rec. G.1081[S]. 2008.
[11]ITU. Measurement-based methods for improving the robustness of IPTV performance: ITU-T Rec. G.1082[S]. 2009.
[12]ITU. Parametric non-intrusive assessment of audiovisual media streaming quality-higher resolution application area: ITU-T Rec. P.1201.2[S]. 2012.
[13]ITU. Opinion model for video-telephony applications: ITU-T Rec. G.1070[S]. 2012.
[14]ITU. Parametric non-intrusive assessment of audiovisual media streaming quality-lower resolution application area: ITU-T Rec. P.1201.1[S]. 2012.
[15]ITU. Parametric bitstream-based quality assessment of progressive download and adaptive audiovisual streaming services over reliable transport-Video quality estimation module: ITU-T R.P.1203.1[S]. 2016.
[16]YAMAGISHI K, KAWANO T, HAYASHI T. Hybrid video-quality-estimation model for IPTV services[C]// Global Telecommunications Conference (GLOBECOM 2009), Nov 30-Dec 4, 2009, Honolulu, USA. New Jersey: IEEE Press, 2009: 1-5.
[17]RIES M, CRESPI C, NEMETHOVA O, et al. Content based video quality estimation for H.264/AVC video streaming[C]// 2007 Wireless Communications and Networking Conference(WCNC 2007), March 11-15, 2007, Kowloon, China. New Jersey: IEEE Press, 2007: 2668-2673.
[18]JOSKOWICZ J, L’ OPEZARDAO J C. Combining the effects of frame rate, bit rate, display size and video content in a para metric video quality model[C]//The 6th Latin America Networking Conference(LANC 2011), Oct 12-13, 2011, Quito, Ecuador. New York: ACM Press, 2011: 4-11.
[19]TAKAGI M, FUJII H, SHIMIZU A, et al. Subjective video quality estimation to determine optimal spatio-temporal resolution[C]//2013 Picture Coding Symposium, Dec 8-11, 2013, San Jose, USA. New Jersey: IEEE Press, 2013: 422-425.
[20]中國視頻服務用戶體驗標準工作組. 中國視頻服務體驗[M].北京: 人民郵電出版社, 2017. China Video Service User Experience Standards Working Group. China video service experience[M]. Beijing: Posts & Telecom Press, 2017.
[21]HE T T, LIU Y K, XIE R, et al. Evaluation of no reference bitstream-based video quality assessment methods[J]. arXiv: 1706.10143.
[22]ITU. Parameter values for ultra-high definition television systems for production and international programme exchange: ITU-T Rec. BT.2020-2[S]. 2015.
Theory and practice of quality of experience in video services
HE Tiantian1,2, LIU Yankai1,2, SONG Li1,2
1. Institute of Image Communication and Network Engineering, Shanghai Jiao Tong University, Shanghai 200240, China 2. Future Medianet Innovation Center, Shanghai 200240, China
As videos becoming the major sources of acquiring information in current era, consumers have raised their expectations for video quality experience, which has become the most critical competitiveness for video service providers. A thorough review of quality of experience (QoE) was presented, and then detailed analysis of video QoE and relevant no reference assessment methods were provided. Further, the standardization process of video QoE in China and the evaluation results of Chinese video services quality were introduced. Last but not the least, the characteristics of Chinese video services was summarized and advices of improvement were presented.
quality of experience, video service, no reference video quality assessment
s:The National Natural Science Foundation of China (No.61671296, No.61527804)
TP393
A
10.11959/j.issn.1000?0801.2017247
賀甜甜(1993?),女,上海交通大學圖像通信與網(wǎng)絡工程研究所、未來媒體網(wǎng)絡協(xié)同創(chuàng)新中心碩士生,主要研究方向為終端視頻質量評價。
劉彥凱(1992?),男,上海交通大學圖像通信與網(wǎng)絡工程研究所、未來媒體網(wǎng)絡協(xié)同創(chuàng)新中心碩士生,主要研究方向為超高清視頻質量評價。
宋利(1975?),男,上海交通大學圖像通信與網(wǎng)絡工程研究所、未來媒體網(wǎng)絡協(xié)同創(chuàng)新中心研究員、博士生導師,IEEE高級會員,主要研究方向為視頻編碼、圖像處理與計算機視覺。
2017?07?10;
2017?08?07
國家自然科學基金資助項目(No.61671296, No.61527804)