陳戈,陳麒,海錦霞
(中國電信股份有限公司廣州研究院,廣東 廣州 510630)
基于IPTV的動態(tài)媒體封裝技術研究及應用
陳戈,陳麒,海錦霞
(中國電信股份有限公司廣州研究院,廣東 廣州 510630)
針對現(xiàn)有的IPTV在個性化、互動性的媒體封裝局限性,研究和分析了目前已經(jīng)存在的以及正在發(fā)展的動態(tài)媒體封裝技術。為使動態(tài)媒體封裝技術易于大規(guī)模推廣,提出通過把標簽信息加入信源中進行MPEG-2標準編碼,再利用TS封裝技術傳輸,最后通過解碼器解碼的解決方案,并利用該技術實現(xiàn)了九屏最熱業(yè)務系統(tǒng),得到了實際應用。
IPTV;動態(tài)媒體;個性化標簽編碼
近年來,以寬帶電視有線網(wǎng)為依靠的 IPTV(internet protocol television,互聯(lián)網(wǎng)協(xié)議電視)[1-3],通過互聯(lián)網(wǎng)以 IP(internet protocol,互聯(lián)網(wǎng)協(xié)議)形式傳送音視頻節(jié)目,使客戶可便捷地收看和點播電視、電影,并提供包括數(shù)字電視在內(nèi)的多種交互化、可定制的電視服務和信息服務。
隨著人們生活品質(zhì)的不斷提高,IPTV用戶數(shù)量呈現(xiàn)指數(shù)式增長。與此同時,用戶對于視頻內(nèi)容的高質(zhì)量、多元化以及自身個性化的消費要求與千篇一律的媒體內(nèi)容之間的矛盾日益突出,而且隨處可見的手機、平板電腦以及運營商對4G網(wǎng)絡的投入,使人們能更加便捷地瀏覽豐富多彩的媒體內(nèi)容,IPTV正面臨激烈的競爭。因此,IPTV系統(tǒng)急需通過引入給用戶提供個性化服務的能力,滿足不同用戶的個性化需求,這意味著對內(nèi)容的簡單耦合和單一組織轉(zhuǎn)變?yōu)閺碗s耦合和個性化組織,由此引發(fā)了內(nèi)容組織的爆炸性增長。
為滿足面向用戶提供個性化服務需求,動態(tài)媒體可面向用戶實現(xiàn)媒體與媒體、媒體與用戶、媒體與網(wǎng)絡、媒體與終端的內(nèi)容動態(tài)耦合,從而可提供豐富的動態(tài)媒體業(yè)務。為此,動態(tài)媒體業(yè)務需通過多個維度采集數(shù)據(jù),包括用戶基本數(shù)據(jù)、業(yè)務訂購數(shù)據(jù)、用戶行為數(shù)據(jù)、終端信息等,并基于用戶分類、時間狀態(tài)、內(nèi)容資源、地域分布等層次進行動態(tài)的內(nèi)容關聯(lián)和耦合,進而形成多維動態(tài)媒體元數(shù)據(jù)知識庫。
動態(tài)媒體業(yè)務使傳統(tǒng)數(shù)字媒體產(chǎn)業(yè)向跨網(wǎng)絡融合、交互化方向演進,帶動新的數(shù)字媒體產(chǎn)業(yè)的發(fā)展,在產(chǎn)業(yè)鏈各個環(huán)節(jié)催生新市場,將帶動媒體內(nèi)容、廣告等增值運營業(yè)務。動態(tài)媒體的應用使得廣大用戶能夠享受到高質(zhì)量、便利的滿足個性化需求的跨終端、跨網(wǎng)絡、跨媒體的視聽媒體服務,促進產(chǎn)生個性化與強互動相結(jié)合的媒體消費新模式,進一步推動信息化消費,具有顯著的社會效益與社會作用。
本文針對媒體內(nèi)容的動態(tài)形式,采用壓縮表示和組織結(jié)構(gòu),并且對其進行個性化標簽的編碼。在媒體關聯(lián)分析的基礎上,通過對廣播推送內(nèi)容關聯(lián)動態(tài)耦合信息,優(yōu)化組合內(nèi)容,通過高效的查詢、檢索和聚合算法,在終端通過內(nèi)容與設備耦合,有效地組織和表示內(nèi)容并高效地提供給不同的用戶,實現(xiàn)媒體的動態(tài)智能分發(fā),最終滿足大容量用戶的個性化需求,并在此基礎上,實現(xiàn)了九屏最熱業(yè)務系統(tǒng)。
2.1 動態(tài)媒體封裝需求
動態(tài)媒體相對于傳統(tǒng)的靜態(tài)媒體而言,綜合了視頻、音頻、動畫等多種媒體以及互動性的富媒體體驗,在人們消費或者創(chuàng)作媒體的時候,它能發(fā)生實時的變化。需要實現(xiàn)對動態(tài)媒體內(nèi)容的高效內(nèi)容分發(fā)、碼率和協(xié)議自適配的服務以及為多網(wǎng)多屏動態(tài)媒體服務提供高清、高質(zhì)、流暢的流媒體服務的能力,傳統(tǒng)的視音頻傳輸封裝格式與方法已無法滿足動態(tài)媒體的需求。
因此,動態(tài)媒體封裝除需要封裝傳統(tǒng)的視頻、音頻信息外,還需包含圖片、文本等內(nèi)容,而且動態(tài)媒體需支持與用戶的互動,并實現(xiàn)個性化內(nèi)容傳輸。ATSC(Advanced Television System Committee,先進電視制式委員會)提出下一代的媒體封裝技術應滿足個性化、互動化、浸入式服務這幾方面的要求。
動態(tài)媒體封裝層次如圖1所示。
圖1 動態(tài)媒體封裝層次示意
由圖1可以看出,動態(tài)媒體封裝應可封裝多種媒體內(nèi)容,封裝后的內(nèi)容應可在移動數(shù)據(jù)網(wǎng)、寬帶數(shù)據(jù)網(wǎng)、廣播電視網(wǎng)同時應用,支持單向廣播,同時也應支持雙向的互動服務。動態(tài)媒體內(nèi)容還應易于在不同終端上移植。
目前,IPTV、廣播電視都使用TS(transportstream,傳送流)封裝[3],從結(jié)構(gòu)上來說,TS流由分組頭和分組數(shù)據(jù)組成,擴充過的TS流還包含時間戳。這樣不管是什么格式的音頻,都很容易通過時間戳來同步圖像,這樣就不會產(chǎn)生音像同步問題。TS流攜帶的視頻信息被分割成許多小分組,損壞一個分組,別的分組還可以播放,并且從視頻流的任一片段開始都可以獨立解碼,由于這個原因,它易于傳輸,隨著容錯/糾錯技術的提高,加上它良好的網(wǎng)絡傳輸能力,很快成為了世界標準并廣泛應用于手機、數(shù)字電視和IPTV等各個領域。
但是,現(xiàn)有TS技術在支持動態(tài)媒體方面還存在以下不足:
ATSC3.0[4,5]提出的動態(tài)媒體封裝不再使用TS格式,其提出的內(nèi)容封裝如圖2所示。
圖2 ATSC3.0示意
ATSC3.0使用ISOBMFF(MP4)作為視音頻的流媒體封裝,對于互動化的動態(tài)媒體內(nèi)容則使用HTML5來表述。ATSC3.0不向后兼容,因此近期在現(xiàn)有平臺與系統(tǒng)中應用非常困難。
2.2 TS擴展的動態(tài)媒體封裝技術
由于 TS封裝支持數(shù)據(jù)廣播技術已經(jīng)比較成熟,為易于在現(xiàn)網(wǎng)大規(guī)模動態(tài)媒體業(yè)務,通過擴展 TS封裝實現(xiàn)動態(tài)媒體業(yè)務的承載是近期實現(xiàn)動態(tài)媒體業(yè)務推廣的較為可行的方案。
現(xiàn)有數(shù)據(jù)廣播方案沒考慮互動化內(nèi)容的承載,對多種終端、多種網(wǎng)絡的承載也缺乏描述。擴展TS封裝時,考慮到TS的小分組(188 byte)封裝,不適合傳輸大量的數(shù)字信息(如HTML5)。針對TS封裝動態(tài)媒體內(nèi)容,可使用以下方案:
本方案TS擴展支持動態(tài)媒體擴展字段如下。
(1)TS_program_map_section()(ISO/IEC 13818-1: 2000 2.4.4.8):需要添加對private_section()的描述信息。
(2)private_section()(ISO/IEC13818-1:2000 2.4.4.11),具體描述信息如下:
對于 private_section()在 TS分組中出現(xiàn)的頻率,規(guī)定在動態(tài)媒體內(nèi)容出現(xiàn)期間內(nèi)必須出現(xiàn)一次完整的 private_section(),這樣可以防止因為分組丟失引起數(shù)據(jù)缺失。動態(tài)媒體內(nèi)容消失后,private_section()不會出現(xiàn)。
另外需要注意的是,private_data_byte很有可能超過188 byte,意味著,private_section()可能由多個188 byte組成,按照13818-1的規(guī)范描述,對于第一個 private_section(),TS 頭的payload_unit_start_indicator為 1,且 PES頭帶有pointer_field(規(guī)定該值為 0),對于每個在private_section()需要指定 section_number以及section_number。
圖3所示為一個XML的樣本。
圖3 XML的樣本示例
XML形式定義如下。
Element為一個根節(jié)點,描述整個圖文信息,其中,num屬性描述共有多少個基本元素。
Element為一個基本圖文元素的描述,有如下屬性:
3.1 現(xiàn)有九屏最熱系統(tǒng)流程
九屏最熱業(yè)務是指在 IPTV上,將目前最多觀眾同時觀看的9個頻道列出來,并可根據(jù)用戶的觀看記錄,把該用戶最??吹念l道放在前列。
現(xiàn)有九屏最熱業(yè)務系統(tǒng)是在大數(shù)據(jù)分析技術的基礎上,將頻道信息和統(tǒng)計出的頻道觀看人數(shù)作為輸入源,通過在EPG(electronic programme guide,電子節(jié)目菜單)上畫出九宮格,進而面向用戶提供最熱頻道的信息。
九宮格頻道示意如圖4所示,九宮格EPG界面包含各類供用戶瀏覽的動態(tài)或靜態(tài)的多媒體內(nèi)容。在用戶移動焦點的同時切換音軌,此時如果按確認鍵,可以全屏播放。
圖4 九宮格頻道示意
基于EPG的九屏最熱業(yè)務流程如圖5所示。首先在當前時段,通過大數(shù)據(jù)分析技術生成9個收看人數(shù)最多的頻道,并把它們的音頻數(shù)據(jù)存儲于MEM(media entertainment mediakey,媒體娛樂中間鍵)中,同時設定每N s更新這9個頻道;再把9個頻道的音頻數(shù)據(jù)發(fā)送到編碼器中,按照約定的時間點生成九宮格頻道發(fā)送到 CDN[6](content distribution network,內(nèi)容分發(fā)網(wǎng)絡);當用戶從 STB(set-top-box,機頂盒)或者 EPG中訪問九宮格頻道時,需要從MEM中獲取各九宮格頻道的音頻數(shù)據(jù),此時用戶選擇小格對應的頻道,切換音軌;最后選擇確定鍵,進行全屏播放。
圖5 基于EPG的九屏最熱業(yè)務流程
圖6 編碼時間和播放時間示意
3.2 現(xiàn)有九屏業(yè)務系統(tǒng)存在的問題
現(xiàn)有九屏業(yè)務系統(tǒng)存在的最大問題就是由于EPG更新與視頻編碼時延不同步,會引起用戶未能播放正確頻道的問題。
圖6所示為編碼時間和播放時間示意,在t1時間點,用戶獲得的九宮格頻道數(shù)據(jù)與播放的九宮格頻道一致;當九宮格頻道由圖 4更新為圖 7時,在 t2時間點,用戶獲得馬賽克數(shù)據(jù)與播放的馬賽克頻道不一致,此時選擇CCTV-5大屏播放,結(jié)果卻播放廣東嘉佳卡通。
圖7 更新后的九宮格頻道示意
對圖5的時延進行分析,該時間包含較為固定的編碼時間、解碼時間和按鍵時間以及受網(wǎng)絡影響比較大從而不固定的傳輸時間。假設時延為L=8 s,每N s編碼器切換一次Top9頻道的數(shù)據(jù),九宮格頻道中頻道位置變換為 60%,那么,用戶選擇全屏播放時錯誤幾率可以用式(1)計算:
由式(1)可得,當N=3 600、L=8、E=0.001 3時,準確率約為 99.9%;當N=3 600、L=8、E=0.001 3時,準確率約為99.9%。
在實際應用中,如果正巧在時延的過程中進行切換,不準確率還會下降一半;而如果在時延的過程中對切換的動作不做出反應,不準確率可下降到約為0,但是此時系統(tǒng)的可用性降低,且對用戶不友好。
3.3 基于TS擴展的九屏最熱業(yè)務系統(tǒng)的動態(tài)媒體內(nèi)容封裝示例
為解決現(xiàn)有九屏最熱系統(tǒng)的同步問題,通過前面介紹的動態(tài)媒體TS封裝技術,把九宮格的最熱信息封閉封裝在TS流中,使TS視頻與九屏的信息變化同步,從而解決現(xiàn)有的同步問題。
基于 TS擴展的九屏最熱業(yè)務系統(tǒng)的動態(tài)媒體內(nèi)容XML的封裝定義如圖8所示。
圖8 基于TS擴展的九屏最熱業(yè)務系統(tǒng)的動態(tài)媒體內(nèi)容XML的封裝定義
Elements num=9,再通過Element描述9個格子的信息,第一格信息示例如下。
Element idx=0,其屬性如下:Idx=0,type=txt,href=多播地址,top=10,lef=10,width=300,height=200,font=20,color=blue。
基于TS擴展的九屏最熱業(yè)務流程示意如圖9所示。
九屏最熱實際應用如圖10所示。
圖9 基于TS擴展的九屏最熱業(yè)務流程示意
圖10 九屏最熱實際應用
本文介紹了目前已經(jīng)存在以及正在發(fā)展中的動態(tài)媒體傳輸?shù)姆庋b技術,分析了各自的優(yōu)缺點和適用場景,結(jié)合大數(shù)據(jù)平臺,通過改進的動態(tài)媒體TS封裝技術,實現(xiàn)了九屏最熱業(yè)務系統(tǒng),并進行了實際的應用?;趧討B(tài)媒體編碼的視頻能實現(xiàn)智能呈現(xiàn),通過廣播和寬帶網(wǎng)絡的協(xié)同傳送,為用戶提供高度個性化和高質(zhì)量的視聽媒體服務,并通過規(guī)?;瘧檬痉哆M一步創(chuàng)新互動媒體業(yè)務形態(tài),促進數(shù)字媒體的共振消費,最終提升未來媒體智能化服務水平與質(zhì)量。
[1]XIAO Y, DU X, ZHANG J, et al. Internet protocol television (IPTV): the killer application for the next-generation internet[J]. IEEE Communications Magazine, 2007, 45(11): 126-134.
[2]黃穎波. 廣東 IPTV播控平臺的設計與實現(xiàn)[D]. 廣州: 華南理工大學, 2016. HUANG Y B. Design and realization of Guangdong IPTV broadcasting control platform[D]. Guangzhou: South China University of Technology, 2016.
[3] 聶祥. 淺析現(xiàn)階段 IPTV 業(yè)務的應用及運營[J]. 電信科學, 2005, 21(5): 39-42. NIE X. Discussion about application and operation of IPTV business of the present stage[J]. Telecommunications Science, 2005, 21(5): 39-42.
[3]朱明海. 流媒體服務器 TS流封裝的實現(xiàn)及流控的研究[D].北京: 北京郵電大學, 2011. ZHU M H. Realization and flow control of TS stream encapsulation in streaming media server[D]. Beijing: Beijing University of Posts and Telecommunications, 2011.
[4]CHERNOCK R, WHITAKER J C. 美國新一代數(shù)字電視ATSC 3.0標準技術體系介紹[J]. 廣播與電視技術, 2015, 42(s2): 11-19. CHERNOCK R, WHITAKER J C. ATSC 3.0 system update[J]. Radio & TV Broadcast Engineering, 2015, 42(s2): 11-19.
[5]何大治, 趙康, 徐異凌, 等. ATSC3.0關鍵技術介紹[J]. 電視技術, 2015, 39(16): 105-114. HE D Z, ZHAO K, XU Y L, et al. ATSC3.0 key technology introduction[J]. Video Engineering, 2015, 39(16): 105-114.
[6]楊明川. 內(nèi)容分發(fā)網(wǎng)絡關鍵技術分析[J]. 電信科學, 2005, 21(8): 13-17. YANG M C. Key technology researches of content distribution network[J]. Telecommunications Science, 2005, 21(8): 13-17.
Research and application of dynamic media packaging technology based on IPTV
CHEN Ge, CHEN Qi, HAI Jinxia
Guangzhou Research Institute of China Telecom Co., Ltd., Guangzhou 510630, China
For the limitations of existing IPTV system in personal service, interactive service, the existing and developing dynamic media packaging technologies were studied. In order to make dynamic media packaging technologies easy to apply in the IPTV system, a method that adding the label information to the source for MPEG-2 standard encoding was proposed, and TS package technology was used to transmit, and finally decoding was achieved by the decoder. This technology had been used in realizing the system of nine screens hottest business system and had achieved practical application.
internet protocol television, dynamic media, label encoding personality
The National High Technology Research and Development Program(863 Program)(No.2015AA015803)
TP393
A
10.11959/j.issn.1000-0801.2017232
陳戈(1973?),男,中國電信股份有限公司廣州研究院高級工程師,主要研究方向為IPTV、CDN關鍵技術。
陳麒(1992?),男,現(xiàn)就職于中國電信股份有限公司廣州研究院,主要研究方向為動態(tài)媒體視頻編碼。
海錦霞(1983?),女,中國電信股份有限公司廣州研究院工程師,主要研究方向為CDN技術。
2017?07?15;
2017?07?26
國家高技術研究發(fā)展計劃(“863”計劃)基金資助項目(No.2015AA015803)