段保通,黃石華
(中國電信股份有限公司上海研究院 上海 200122)
在三網(wǎng)融合業(yè)務(wù)發(fā)展中,信息服務(wù)將覆蓋文字、語音、數(shù)據(jù)、圖像、視頻等多種媒體信息綜合服務(wù)形式,同時用戶使用的終端也將呈現(xiàn)多樣化、統(tǒng)一化,比如電視機、游戲機、機頂盒、手機、電腦、電冰箱等,不同的終端之間除了形式不同外,功能可能已經(jīng)趨于一致,比如可使用電視機上網(wǎng)瀏覽,用電腦看電視,用冰箱打電話等。這些終端的后臺通信以及數(shù)據(jù)傳輸渠道可能各不相同、各自獨立,但是對用戶使用來講完全一致,絲毫沒有差異的感覺。
為了達(dá)到這種用戶體驗的一致,又能適合各種不同終端處理、不同網(wǎng)絡(luò)傳輸?shù)哪繕?biāo),需要用到多種自適應(yīng)、自適配的機制和技術(shù),而自適應(yīng)編碼技術(shù)[1]就是解決關(guān)鍵的視頻數(shù)據(jù)信息處理和傳輸?shù)姆椒ê铜h(huán)節(jié)之一。
自適應(yīng)編碼技術(shù)本身在早期流媒體視頻業(yè)務(wù)發(fā)展中,就已經(jīng)得到了初步的應(yīng)用和發(fā)展,作為提升視頻業(yè)務(wù)質(zhì)量的有效手段之一,已經(jīng)出現(xiàn)的自適應(yīng)編碼技術(shù)包括以下兩種。
(1)實時編碼算法自適應(yīng)技術(shù)方案,該方案主要以視頻編碼方法為核心,首先探測視頻信息的解碼終端、傳輸網(wǎng)絡(luò)、環(huán)境的相關(guān)變化,并根據(jù)這些變化的反饋自動調(diào)整編碼相關(guān)參數(shù)或算法,使得視頻流的輸出能夠適應(yīng)當(dāng)前網(wǎng)絡(luò)傳輸?shù)膶嶋H情況。這種方法適用于單點到單點或少數(shù)幾個點的視頻傳輸應(yīng)用,比如視頻電話、視頻監(jiān)控、遠(yuǎn)程視頻會議等。
(2)多碼率自適應(yīng)技術(shù),這種方案是在編碼器前段預(yù)置多個規(guī)格的碼流輸出,其中每種碼流輸出適配一定的終端和網(wǎng)絡(luò)承載情況,而對終端提供實際流數(shù)據(jù)傳輸和自適應(yīng)的工作由流服務(wù)器完成,流服務(wù)負(fù)責(zé)對終端傳輸?shù)木W(wǎng)絡(luò)條件進(jìn)行探測,并根據(jù)實際情況,選擇一路合適的碼流輸出發(fā)送給終端,完成自動適配。這種技術(shù)適用于廣播式,即一點對多點的業(yè)務(wù)模式,比如IPTV、在線影院等。
隨著編解碼技術(shù)的不斷發(fā)展和三網(wǎng)融合等相關(guān)業(yè)務(wù)的迅速崛起,近年來,又出現(xiàn)了專門應(yīng)對自適應(yīng)特性的SVC分層編碼技術(shù)[2],為視頻自適應(yīng)編碼方案帶來了更加靈活和有效的手段和方法,也逐漸成為當(dāng)前視頻編碼技術(shù)及實現(xiàn)方案的熱點之一。
H.264/SVC(可擴展視頻編碼)[3]在進(jìn)行視頻信號編碼時,將圖像壓縮信號的輸出分成多個不同的層。當(dāng)網(wǎng)絡(luò)條件較差、帶寬不足時,網(wǎng)絡(luò)和終端只對基本層的碼流數(shù)據(jù)進(jìn)行傳輸和解碼;而當(dāng)帶寬條件改善,整個系統(tǒng)則可以進(jìn)一步傳輸和解碼增強層的碼流,提高視頻圖像的質(zhì)量。
SVC于2007年7月獲得ITU-T批準(zhǔn),成為H.264標(biāo)準(zhǔn)的一部分。當(dāng)前的大部分研究和試驗都是基于H.264標(biāo)準(zhǔn)進(jìn)行的,實際上SVC技術(shù)并不限于H.264編碼格式本身,其他一些編碼格式應(yīng)該都可以利用SVC類似技術(shù)提高視頻應(yīng)用的整體質(zhì)量。
H.264/AVC擴展的SVC提供了一個完整的時—空域和SNR可分級性,技術(shù)特點主要表現(xiàn)在以下幾個方面。
·時域分級性:主要是采用層次化B幀和基于運動補償?shù)臅r域濾波(MCTF)實現(xiàn)。
·用于空域可伸縮性的層間預(yù)測機制:主要使用層間幀內(nèi)紋理預(yù)測和層間運動補償冗余信息預(yù)測實現(xiàn)。
·基本層與H.264/AVC兼容:可以單獨被解碼。
·Fine Grain的SNR分級(FGS):通過在每個空域?qū)訉ψ儞Q系數(shù)漸精細(xì)地量化編碼實現(xiàn),實現(xiàn)多個質(zhì)量增強層。
·Coarse Grain SNR分級性(CGS):不同層具有相同的分辨率,進(jìn)行層間預(yù)測時,運動信息和紋理信息都不需要縮放。
·NAL單元概念的使用和擴展:當(dāng)需要降低時域或者空域分辨率比特流時,可以丟棄不需要的NAL單元,只需要得到基本層所需要的NAL單元。
綜合上述的SVC各種特性,與MPEG-2、MPEG-4等標(biāo)準(zhǔn)中的方法相比,H.264/AVC可分級編碼的時空域分層是通過增加MCTF和幾個層間的預(yù)測算法進(jìn)行的;質(zhì)量可伸縮性是通過H.264標(biāo)準(zhǔn)中對冗余信息的量化改進(jìn)得到的,即先用與H.264標(biāo)準(zhǔn)兼容的編碼方法編碼最低的視頻流,然后對變換系數(shù)逐次細(xì)分進(jìn)行編碼,得到增強層碼流。H.264標(biāo)準(zhǔn)的SVC把以上幾種特點有機地結(jié)合在一起,使輸出碼流能適應(yīng)較大的網(wǎng)絡(luò)帶寬動態(tài)變化范圍,提供可伸縮性更強的視頻流。
隨著三網(wǎng)融合業(yè)務(wù)的快速發(fā)展,運營商對SVC等相關(guān)的編碼技術(shù)十分關(guān)注。在新形勢下,業(yè)務(wù)不斷發(fā)展,市場競爭加劇,用戶的需求不斷提高,這些都對視頻業(yè)務(wù)的質(zhì)量提出了更高的要求,要想快速發(fā)展,推出真正有吸引力的產(chǎn)品和服務(wù),贏得用戶的滿意,就必須解決當(dāng)前視頻業(yè)務(wù)中一些亟待解決的重點問題。以SVC為代表的新型編碼,自適應(yīng)技術(shù)為這些問題的解決和完善帶來了新的方法和思路,也是當(dāng)前急需推進(jìn)和大力發(fā)展的重點技術(shù)內(nèi)容。
結(jié)合當(dāng)前SVC技術(shù)本身的發(fā)展情況以及三網(wǎng)融合業(yè)務(wù)的實際進(jìn)展,我們認(rèn)為,當(dāng)前可優(yōu)先在如下場景中引入SVC技術(shù)。
SVC的設(shè)計目標(biāo)就是有效提升視頻服務(wù)的質(zhì)量,并能針對不同的帶寬變化以及不同的終端能力進(jìn)行自動適配。當(dāng)前,多個運營商都已經(jīng)經(jīng)營了全業(yè)務(wù)視頻服務(wù),終端包括了PC、IPTV、手機、魔屏等各種不同形態(tài)。其中大部分業(yè)務(wù)用戶量規(guī)模較大,有較強的社會影響力,同時橫跨了以電視機為載體的廣電電視業(yè)務(wù)、以PC為終端的數(shù)字通信業(yè)務(wù)和以手機為代表的移動電信業(yè)務(wù),很好地代表了三網(wǎng)融合業(yè)務(wù)的一部分發(fā)展方向和應(yīng)用場景。
從這些業(yè)務(wù)多年的發(fā)展經(jīng)驗來看,視頻服務(wù)質(zhì)量正在不斷完善和優(yōu)化,用戶滿意度也正在逐步提升,但是整體的視頻服務(wù)質(zhì)量仍然存在不少問題需要解決,包括圖像質(zhì)量、播放流暢度等都不同層次問題,而且用戶本身對于視頻服務(wù)質(zhì)量的要求越來越高,技術(shù)的完善和進(jìn)步距離用戶的滿意程度還存在一定的距離,從而造成了對用戶吸引力的下降,影響了業(yè)務(wù)的進(jìn)一步發(fā)展。總之,在以視頻業(yè)務(wù)為主要內(nèi)容的三網(wǎng)融合業(yè)務(wù)中,視頻服務(wù)質(zhì)量仍然是當(dāng)前一個技術(shù)難點,視頻質(zhì)量的提升將在較長一段時間內(nèi)作為技術(shù)研究的核心內(nèi)容之一,引入SVC技術(shù)是最為重要且最有意義的一環(huán)。
視頻業(yè)務(wù)運營的經(jīng)驗表明,視頻服務(wù)質(zhì)量是一個端到端的保障服務(wù)體系,視頻服務(wù)質(zhì)量的問題可能由很多因素或者環(huán)節(jié)造成。為了盡量保證視頻服務(wù)的質(zhì)量,運營商對不同的業(yè)務(wù)模式采取了不同的技術(shù)方案。比如,當(dāng)前的IPTV業(yè)務(wù)采用專網(wǎng)承載方式,承載網(wǎng)絡(luò)不受其他業(yè)務(wù)或流量的影響,網(wǎng)絡(luò)條件較好,視頻質(zhì)量相對有一定的保障。而互聯(lián)網(wǎng)視頻業(yè)務(wù)采用互聯(lián)網(wǎng)承載方案,因互聯(lián)網(wǎng)本身的流量難以管理,流量互相競爭,導(dǎo)致網(wǎng)絡(luò)的承載條件無法保障,在這種模式下,互聯(lián)網(wǎng)業(yè)務(wù)大多都以免費模式為主,用戶相對視頻質(zhì)量的要求也不是很高。當(dāng)前的移動視頻業(yè)務(wù)作為運營商的重點推介產(chǎn)品,是各個運營商3G業(yè)務(wù)中的重點填充內(nèi)容,是帶動3G網(wǎng)絡(luò)發(fā)展和流量經(jīng)營的重要渠道和方法。移動視頻業(yè)務(wù)基于3G無線承載,網(wǎng)絡(luò)流量有一定的費用,用戶貢獻(xiàn)價值最高,但是質(zhì)量卻最沒有保證,成為當(dāng)前矛盾最為突出、最亟待解決的問題。同時在移動視頻業(yè)務(wù)中,影響視頻質(zhì)量最關(guān)鍵的瓶頸就是網(wǎng)絡(luò)條件變化頻繁,容易引起質(zhì)量嚴(yán)重下降。從這個角度看,移動視頻業(yè)務(wù)也正是SVC技術(shù)的用武之地,應(yīng)該積極在這一領(lǐng)域進(jìn)行嘗試和試驗。
在三網(wǎng)融合業(yè)務(wù)中,用戶可隨意使用PC、IPTV、手機或其他形式的三網(wǎng)融合終端進(jìn)行各種互動。比如使用手機和電視終端進(jìn)行節(jié)目書簽互動和同步,可在地鐵上使用手機接著電視轉(zhuǎn)播的書簽繼續(xù)觀看;使用手機和PC進(jìn)行三屏內(nèi)容互動,可將手機拍攝的視頻分享在好友的IPTV和PC上,遠(yuǎn)程教育的老師使用PC講課,而學(xué)生可使用手機和IPTV聽課等。
從以上這些描述可以看出,在多屏互動業(yè)務(wù)中,不管終端和屏幕是何種形式,互動的視頻內(nèi)容始終是相同的。無論是書簽的互動,還是節(jié)目與課程的互動,都必須基于一個前提,就是不同屏幕播放內(nèi)容必須是完全對應(yīng)的。而SVC技術(shù)采用的多層編碼方式,正好適合這種需求和方式。SVC可以很方便地實現(xiàn)同一個內(nèi)容為不同的終端提供不同的媒體服務(wù),比如使用同一個媒體文件為PC、IPTV、手機、魔屏提供不同分辨率和不同碼率質(zhì)量的視頻服務(wù)。
同時,三屏互動業(yè)務(wù)中終端形態(tài)各異、能力各不相同,當(dāng)進(jìn)行互動和互通時,視頻信息適配是首當(dāng)其沖的重點問題,而SVC正是解決該問題的最好方法。比如PC采集輸出的視頻流質(zhì)量較高,與手機互通時手機無法完全接收或解碼,此時應(yīng)用SVC技術(shù)只傳輸基本層媒體流給手機觀看,而PC或IPTV可同時接收包括基本層和擴展層的媒體數(shù)據(jù)流。
隨著三網(wǎng)融合的發(fā)展,運營商經(jīng)營的全業(yè)務(wù)視頻業(yè)務(wù)迎來了新的和全面的挑戰(zhàn)。市場競爭不僅僅是針對用戶服務(wù)質(zhì)量的提升和優(yōu)化,與合作伙伴和產(chǎn)業(yè)鏈的互動與整合,整個后臺管理和運維支撐的有效性、運營成本和方案的合理性都成為業(yè)務(wù)發(fā)展和競爭的重要環(huán)節(jié)。
在三網(wǎng)融合之前,各種業(yè)務(wù)分開經(jīng)營,內(nèi)容源分別引入,針對不同終端、不同屏幕分別進(jìn)行編碼和存儲,各種業(yè)務(wù)使用的內(nèi)容管理和分發(fā)平臺各自獨立。而在三網(wǎng)融合模式下,必須對內(nèi)容源頭進(jìn)行統(tǒng)一的引入、統(tǒng)一編碼和存儲,只有這樣才能實現(xiàn)三屏互動、三屏同看等相關(guān)的新型業(yè)務(wù)類型。原有那種內(nèi)容各自引入、各自編碼和存儲的模式已經(jīng)無法適應(yīng)新形式的需要了。同時,隨著內(nèi)容數(shù)量的急劇增大,內(nèi)容管理和運營的工作量急劇上升,要滿足內(nèi)容運營的及時性和豐富性,必須使用統(tǒng)一、有效的內(nèi)容管理模式和存儲模式。而SVC編碼方式可以使用同一個媒體文件存儲不同層次的編碼流數(shù)據(jù),而且這些流數(shù)據(jù)本身具有極大的圖像相關(guān)性,在節(jié)省存儲空間的同時,又為不同屏幕、不同分辨率、不同接入環(huán)境提供相應(yīng)的視頻服務(wù)。因此,應(yīng)該盡量在統(tǒng)一內(nèi)容管理和統(tǒng)一內(nèi)容存儲技術(shù)中引入SVC,完成內(nèi)容編碼和存儲的統(tǒng)一處理和統(tǒng)一管理。在這種模式下,要求使用SVC技術(shù)對同一內(nèi)容源進(jìn)行編碼,然后存儲成多個分層,分別對應(yīng)手機、PC、電視機等不同終端和網(wǎng)絡(luò)條件,可以實現(xiàn)一個內(nèi)容存儲文件適配所有終端和網(wǎng)絡(luò)條件。在運營管理上,等于實現(xiàn)多個操作合為一個操作,避免了多文件存儲、分發(fā)、同步、檢測等復(fù)雜操作。在節(jié)省存儲資源的同時,簡化了系統(tǒng)整體架構(gòu)和運維管理的流程,便于內(nèi)容運營效率的提升。
這種技術(shù)是利用轉(zhuǎn)碼技術(shù)實現(xiàn)自適應(yīng)編碼,首先在服務(wù)器中保存一份質(zhì)量足夠好的壓縮視頻數(shù)據(jù),當(dāng)需要降低輸出碼率時,可由相應(yīng)的轉(zhuǎn)碼模塊進(jìn)行轉(zhuǎn)碼后再輸出。轉(zhuǎn)碼可分為幾種方式,比較基本的是:全解全編進(jìn)行轉(zhuǎn)碼,在編碼過程中,通過改變壓縮參數(shù)達(dá)到降低碼率的目的,編碼的參數(shù)改變主要通過改變量化步長實現(xiàn),全編全解得到的PSNR值最高,但效率低。另一種較高效的轉(zhuǎn)碼方式是進(jìn)行部分的解碼和編碼,就可以輸出合適的視頻數(shù)據(jù)流,這種轉(zhuǎn)碼主要實現(xiàn)方法是選擇性丟棄視頻數(shù)據(jù)中不重要的部分,即舍棄后不會嚴(yán)重影響觀看質(zhì)量,如選擇性丟幀或丟棄DCT系數(shù)的高頻分量。或者進(jìn)行再量化,此時解碼出來的運動向量及預(yù)測值等都可以不變。這種技術(shù)系統(tǒng)復(fù)雜性相對較低,但服務(wù)器計算資源開銷仍然較大,如果大量用戶同時進(jìn)行點播,服務(wù)器難以承受。
為了減少開銷,自適應(yīng)轉(zhuǎn)碼技術(shù)[4]有多種研究方向,比如碼率轉(zhuǎn)換(bit-rate reduction)、空間分辨率轉(zhuǎn)換(spatial resolution reduction)、時間分辨率轉(zhuǎn)換(temporal resolution reduction)、語法轉(zhuǎn)換等。隨著數(shù)字電視和IPTV的發(fā)展,目前重點在MPEG-2轉(zhuǎn)H.264的轉(zhuǎn)碼研究上,最新的研究包括H.264變換域轉(zhuǎn)碼、H.264快速模式選擇算法、H.264轉(zhuǎn)碼快速運動估計技術(shù)等。
這種技術(shù)一般是在服務(wù)器中同時保存同一個視頻節(jié)目的多個或多層數(shù)據(jù),在未運用SVC技術(shù)之前,這些數(shù)據(jù)可以是獨立的多個拷貝,也可以是單文件內(nèi)多個數(shù)據(jù)軌道,進(jìn)一步運用SVC技術(shù)可以進(jìn)一步消除這多個拷貝或多層軌道數(shù)據(jù)之間的數(shù)據(jù)冗余,極大地節(jié)省存儲資源。一般來講,這些碼流的幀內(nèi)編碼幀(I幀)應(yīng)該是對齊的,由服務(wù)器根據(jù)用戶網(wǎng)絡(luò)帶寬情況選擇一個適當(dāng)?shù)拇a流發(fā)送給用戶。
這種技術(shù)的優(yōu)點是編碼和自動適配分別由不同的單元完成,編碼器輸出后,自適應(yīng)碼流切換的工作由流服務(wù)器完成。因此,編碼單元的輸出封裝格式必須采用一定的標(biāo)準(zhǔn),使得流服務(wù)器能夠識別,才能完成碼流數(shù)據(jù)的識別和獲取以及服務(wù)過程中關(guān)鍵幀搜索、時間定位服務(wù)等功能。
這種技術(shù)在以往的流媒體視頻業(yè)務(wù)中得了較多的應(yīng)用,比如在WMV、標(biāo)準(zhǔn)RTSP以及REAL等流媒體系統(tǒng),技術(shù)相對成熟。在RTSP協(xié)議中,客戶端的setup請求可通過對trackID的指定選擇不同的媒體流數(shù)據(jù),服務(wù)端可通過set parameter等指令重新指定相關(guān)的參數(shù)并發(fā)送新的數(shù)據(jù)流,完成自動切換。但是原有的切換機制只能完成一路碼流向另一路的切換,在SVC中,就需要在多層碼流中進(jìn)行切換。這樣就需要對原有的信令進(jìn)行擴充,擴充的內(nèi)容應(yīng)該包括可提供分層編碼數(shù)據(jù)流公告、實際切換指令和請求、切換的媒體數(shù)據(jù)協(xié)商信令等。
雖然SVC作為H.264標(biāo)準(zhǔn)的一個擴展,但是其本身對于媒體封裝和傳輸?shù)母袷綆砹溯^大的影響。原有媒體文件標(biāo)準(zhǔn)格式中,缺乏對于SVC編碼產(chǎn)生的多層碼流描述和標(biāo)志位,對于多層編碼數(shù)據(jù)組織,媒體音、視頻數(shù)據(jù)同步以及定位搜索都不可能涵蓋。而在SVC中,這些機制需要進(jìn)行新的定義,增加一些新的擴展。
當(dāng)前,H.264視頻封裝的媒體文件標(biāo)準(zhǔn)為MP4,事實上也存在FLV、MKV、TS流文件等多種形式。在MP4文件格式標(biāo)準(zhǔn)中,不同碼率或分辨率的媒體數(shù)據(jù)可以以不同的軌道進(jìn)行保存,兩個軌道之間互不影響。因此對于SVC碼流文件的封裝可采用基本層和擴展層分軌道保存的形式,并同時在媒體文件索引頭結(jié)構(gòu)中增加相應(yīng)的標(biāo)志位,標(biāo)識相關(guān)的分層編碼信息。
SVC的文件封裝格式已有相關(guān)研究給出了建議,但是尚未形成實質(zhì)性標(biāo)準(zhǔn),推進(jìn)比較小。對于面向大規(guī)模商用的SVC技術(shù),必須形成明確的工業(yè)標(biāo)準(zhǔn)化,才能保證不同廠商、不同平臺的接口互通以及穩(wěn)定和可靠的銜接。當(dāng)前的文件封裝和碼流封裝標(biāo)準(zhǔn)化已經(jīng)在一定程度上影響了SVC技術(shù)的實際應(yīng)用和推廣。
在傳統(tǒng)媒體應(yīng)用中,直播流大多采用RTP標(biāo)準(zhǔn)進(jìn)行封裝和傳輸。為了支持SVC,目前已經(jīng)有提交給IETF的H.264/SVC的RTP封裝草案[5],在載荷格式標(biāo)志上增加了一個新的媒體格式命名為“H.264/SVC”,但如果只是基本層的數(shù)據(jù)仍然以“H.264”命名。
在進(jìn)行SVC的直播流傳輸中,目前多數(shù)研究[6]都是將基本層和增強層數(shù)據(jù)分成兩個不同的信道進(jìn)行傳輸,并利用RTP的封裝進(jìn)行增強層的數(shù)據(jù)差錯隱藏,在基本層走低誤碼率通道,增強層走高誤碼率通道的情況下,進(jìn)行丟包率實驗測試后,表明視頻的客觀和主觀指標(biāo)都比通常方式有所提高,可充分利用SVC的分層和RTP傳輸結(jié)合的特性。
三網(wǎng)融合業(yè)務(wù)中的IPTV和數(shù)字電視都采用了TS流封裝格式,網(wǎng)絡(luò)條件和傳輸通道都有較好保障。這種情況下,SVC需要考慮TS流的封裝格式,采用TS流封裝時,可通過對NAL單元進(jìn)行擴充,區(qū)別SVC基本層和擴展層數(shù)據(jù),TS層不進(jìn)行區(qū)分,傳輸可繼續(xù)采用原有的單通道傳輸模式。
在以前的互聯(lián)網(wǎng)流媒體業(yè)務(wù)中,多碼率自適應(yīng)技術(shù)曾經(jīng)得到了一些較為廣泛的應(yīng)用,但是對于網(wǎng)絡(luò)帶寬實時變化的檢測技術(shù)仍然存在一定的缺陷,導(dǎo)致使用體驗不太理想。一個典型的問題就是用戶在觀看時,如果網(wǎng)絡(luò)條件劣化,系統(tǒng)可自動從高碼率切換到低碼率,但是從低碼率切換到高碼率的時機卻很難探測和把握,自動帶寬探測的機制還不是很完善。同樣,如果帶寬檢測技術(shù)沒有突破,SVC的優(yōu)勢就很難發(fā)揮和表現(xiàn)出來。
目前在互聯(lián)網(wǎng)中主要采用和式增加、積式減少(AIMD)的擁塞控制機制進(jìn)行帶寬檢測,常用的方法主要是基于RTCP數(shù)據(jù)傳輸?shù)慕y(tǒng)計得到一些傳輸?shù)馁|(zhì)量指標(biāo)。隨著目前流媒體應(yīng)用的不斷發(fā)展,出現(xiàn)了HTTP、RTP over TCP等多種傳輸方式,原有基于RTCP的計算已經(jīng)不太合適了,難以反映實時傳輸?shù)馁|(zhì)量和情況。同時對于AIMD,也需要進(jìn)行很多改進(jìn),比如在點播中,以丟包為參數(shù),研究具有學(xué)習(xí)能力的速率控制機制,再利用SVC的特性進(jìn)行碼率的切換。
當(dāng)前,隨著3G移動視頻業(yè)務(wù)的發(fā)展,移動視頻帶寬檢測質(zhì)量更加重要,也更加復(fù)雜。在無線網(wǎng)絡(luò)條件下,有時帶寬條件變化比較頻繁,除了帶寬檢測之外,還應(yīng)該采取一定的策略防止切換產(chǎn)生乒乓效應(yīng),并制定帶寬切換模型等。在當(dāng)前的技術(shù)條件下,移動視頻應(yīng)用層大多都繼續(xù)使用TCP或UDP進(jìn)行視頻信號的傳輸。但TCP/UDP缺乏對無線網(wǎng)絡(luò)質(zhì)量的反饋,比如基本的無線信號質(zhì)量或者強弱無法通過這些協(xié)議得到,也沒有標(biāo)準(zhǔn)的應(yīng)用層接口,導(dǎo)致應(yīng)用對網(wǎng)絡(luò)的變化無法感知,需要通過很多變通手段才能達(dá)到目的。這些問題都是帶寬檢測機制的實際難點和重點,對整個技術(shù)的應(yīng)用非常關(guān)鍵和重要。
SVC自適應(yīng)編碼需要編碼器和解碼器的互相配合,而當(dāng)前運營商經(jīng)營的視頻業(yè)務(wù)已經(jīng)過多年發(fā)展,原有的終端類型非常豐富,且數(shù)量巨大,這些存量終端很難經(jīng)過升級直接支持SVC解碼,因此必須逐步引入和過渡到SVC技術(shù)。SVC技術(shù)要想得到廣泛的應(yīng)用,也必須注意這一點。系統(tǒng)結(jié)構(gòu)如圖1所示。
圖1 系統(tǒng)結(jié)構(gòu)
首先,編碼端通過升級完成對SVC編碼的支持,輸出采用SVC格式的視頻流,并經(jīng)過平臺進(jìn)行存儲和分發(fā)。平臺在為終端提供服務(wù)時,可以根據(jù)不同的終端和網(wǎng)絡(luò)進(jìn)行相應(yīng)的適配,如果是舊的終端,不支持SVC,就需要發(fā)送單一流形式(原有格式),并按照原有的方式提供服務(wù)。對于新類型的終端,平臺可以盡量利用SVC特性,根據(jù)終端的不同發(fā)送相應(yīng)的SVC單層或多層編碼流,完成SVC的支持。
隨著云計算的發(fā)展,采用實時轉(zhuǎn)碼適配終端和網(wǎng)絡(luò)的云轉(zhuǎn)碼方案初步得到了應(yīng)用,并成為一些使用場景下的較好方案。因為實時轉(zhuǎn)碼需要消耗大量的計算資源,一般應(yīng)用在訪問量不大,但是數(shù)量較多的冷片內(nèi)容存儲和訪問上。如果離線轉(zhuǎn)碼進(jìn)行存儲,消耗的存儲資源較多,而且利用率較低,如果利用實時轉(zhuǎn)碼,可節(jié)省大量存儲資源,并且因為訪問量小,消耗的計算資源不多,剛好可以滿足用戶的需求。編碼方案如圖2所示。
圖2 利用SVC轉(zhuǎn)碼器的轉(zhuǎn)碼方案
在這種方案中,原有的編碼器繼續(xù)采用原有編碼方案,輸出為單一的視頻流。在終端和平臺之間增加一個SVC的實時轉(zhuǎn)碼器,當(dāng)終端訪問平臺時,平臺會自動對該終端和接入網(wǎng)絡(luò)進(jìn)行判斷,判斷該終端是否可以接收編碼器輸出的流。如果兩者不適配,就自動分配終端從SVC轉(zhuǎn)碼器上接收視頻流,此時SVC轉(zhuǎn)碼器會自動將平臺上原有的單一視頻流轉(zhuǎn)碼為適合該終端形式的SVC流,并發(fā)送給終端,這樣即可完成對終端的自動適配。
在實際應(yīng)用中,這兩種方法會綜合運營,根據(jù)不同的業(yè)務(wù)形式和不同的應(yīng)用場景靈活組合使用,互為補充,互相配合。
隨著三網(wǎng)融合業(yè)務(wù)的快速發(fā)展,各種業(yè)務(wù)應(yīng)用快速增長,以視頻質(zhì)量為核心的自適應(yīng)編碼技術(shù)也必將獲得廣泛的推廣和應(yīng)用,必將為視頻質(zhì)量的提升帶來更多、更靈活的解決思路和保障手段,一定會為三網(wǎng)融合提供更加合理、更加便利的解決方案和業(yè)務(wù)應(yīng)用。但是應(yīng)該看到,目前以SVC為代表的自適應(yīng)編碼技術(shù)在編碼算法和實現(xiàn)上雖然已經(jīng)趨于成熟,但是與應(yīng)用緊密結(jié)合的文件封裝、傳輸標(biāo)準(zhǔn)、緊密相關(guān)碼流檢測、自動切換等技術(shù)卻沒有大的突破,導(dǎo)致距離大規(guī)模商用還需一定的時間。對此,我們應(yīng)當(dāng)予以重視,加大研究的力度,并推進(jìn)各技術(shù)標(biāo)準(zhǔn)組織之間的緊密配合,使得自適應(yīng)編碼能夠快速發(fā)展成為符合當(dāng)前實際商用需求、可大規(guī)模推廣的完整技術(shù)。
1 畢厚杰.新一代視頻壓縮編碼標(biāo)準(zhǔn)——H.264/AVC.北京:人民郵電出版社,2005
2 OHM J-R.Advances in scalable video coding.Proceedings of the IEEE,2005,93(1):42~56
3 ITU-T,ISO/IEC JTC1,JVT-N020.Joint scalable video model JS-VM 0,2005
4 尚書林,杜清秀,盧漢清等.視頻轉(zhuǎn)碼技術(shù)研究現(xiàn)狀與最新進(jìn)展.自動化學(xué)報,2007,33(12)
5 Wenger S,Wang Y K,Schierl T,et al.RTP payload format for SVC video,http://tools.ietf.org/html/draft-ietf-avt-rtp-svc-20, 2008
6 柳偉,陳旭,梁永生.H.264/SVC的RTP封裝算法及其應(yīng)用.計算機工程與應(yīng)用,2010,46(19)
7 謝正光,包志華,徐晨等.分布式視頻編碼關(guān)鍵技術(shù)及其發(fā)展趨勢.電信科學(xué),2009,25(9)