李仁杰,許柳竣熙,劉 屹
(云南廣播電視臺,云南 昆明 650050)
當(dāng)前,在廣播電視行業(yè),4K技術(shù)發(fā)展迅速。4K電視信號主要分為未經(jīng)壓縮的基帶信號和經(jīng)過壓縮的編碼信號兩大類。壓縮會造成原始數(shù)據(jù)的信息丟失。壓縮得越厲害,丟失的信息越多。由于制作過程中需要對視音頻內(nèi)容進(jìn)行再處理,應(yīng)盡量避免壓縮造成的數(shù)據(jù)損失、視音頻質(zhì)量下降,所以制作域一般使用基帶信號。國家廣播電視總局發(fā)布的《4K超高清電視節(jié)目制作技術(shù)實施指南(2020版)》推薦的4K節(jié)目技術(shù)參數(shù)為3 840×2 160/50P/10 bit,采樣格式為4∶2∶2[1]。一套未壓縮的4K節(jié)目信號需要接近10 Gb·s-1的傳輸帶寬,并不適合在網(wǎng)絡(luò)中大量分發(fā)和遠(yuǎn)距離傳輸。傳輸域一般不涉及電視內(nèi)容的再處理,主要傳輸?shù)氖蔷幋a壓縮后的電視信號,編碼格式主要包括AVS2、H265、H264等,一套節(jié)目占用的帶寬一般在20 Mb·s-1左右。
圖1為簡化的4K電視信號傳輸網(wǎng)絡(luò)。4K電視信號通過總控網(wǎng)絡(luò)、電視專網(wǎng)、互聯(lián)網(wǎng)分發(fā)到有線電視平臺、IPTV/OTT播控平臺、云平臺及其他網(wǎng)絡(luò)平臺,用戶通過互聯(lián)網(wǎng)(寬帶、4G、5G)、有線電視網(wǎng)絡(luò)觀看各平臺播放的4K電視??偪鼐W(wǎng)絡(luò)位于4K傳輸網(wǎng)絡(luò)的中心,集成了大量的信源設(shè)備,承擔(dān)了4K信號的編碼、轉(zhuǎn)碼、協(xié)議轉(zhuǎn)換、衛(wèi)星接收等功能,負(fù)責(zé)為不同的平臺和系統(tǒng)提供不同的信號格式和傳輸方式。內(nèi)網(wǎng)和專網(wǎng)的核心是通過PIM協(xié)議(Protocol Independent Multicast,PIM)和IGMP協(xié)議(Internet Group Management Protocol,IGMP)搭建的組播傳輸網(wǎng)絡(luò)。通過組播分發(fā)4K信號,能夠大大減少源端壓力和網(wǎng)絡(luò)負(fù)載。其他需要穿越互聯(lián)網(wǎng)的4K信號則通過RTMP、RTSP、SRT等單播協(xié)議進(jìn)行傳輸。
圖1 4K電視信號傳輸網(wǎng)絡(luò)示意圖
IP網(wǎng)絡(luò)通過分組交換的傳輸方式實現(xiàn)了通信線路的共享,大大簡化了網(wǎng)絡(luò),節(jié)約了資源,但同時也引入了時延、丟包、亂序和抖動的問題。IP傳輸是通過分組存儲轉(zhuǎn)發(fā)實現(xiàn)的。IP網(wǎng)絡(luò)中的交換機(jī)需要將整個分組存儲到緩沖區(qū),排隊等待著有序地從輸出鏈路輸出。所以分組在傳輸過程中,除了相對固定的傳播時延、存儲轉(zhuǎn)發(fā)時延,還會產(chǎn)生排隊時延。排隊時延取決于當(dāng)時網(wǎng)絡(luò)的擁塞情況。如果分組到達(dá)交換設(shè)備時設(shè)備的緩沖區(qū)已滿,設(shè)備會丟棄剛到達(dá)的分組或者排隊的分組;或是分組在傳輸過程中發(fā)生錯誤,交換機(jī)對分組進(jìn)行校驗時發(fā)現(xiàn)錯誤,則會丟棄該分組[2]。分組被丟棄簡稱丟包。屬于同一4K信號的不同分組從源端發(fā)出,但可能會經(jīng)由不同的路由到達(dá)目的端,導(dǎo)致目的端收到的分組亂序。而時延、丟包、亂序會導(dǎo)致用戶側(cè)信號抖動,直觀表現(xiàn)為4K信號馬賽克、花屏、黑屏等。
4K信號傳輸必須經(jīng)過源端設(shè)備、交換設(shè)備、傳輸介質(zhì)。設(shè)備和介質(zhì)故障都有可能導(dǎo)致4K信號異常或斷流。例如,信源設(shè)備、交換損壞或性能不足導(dǎo)致輸出的數(shù)據(jù)錯誤,人為的設(shè)備配置錯誤導(dǎo)致信號不符合要求,信號在光纖、雙絞線、電磁波中傳輸時造成的數(shù)據(jù)丟失或者數(shù)據(jù)失真等。
視音頻質(zhì)量監(jiān)測指的是對解碼后的4K電視節(jié)目進(jìn)行監(jiān)測,這是一種最常用的監(jiān)測手段,也是最直觀的監(jiān)測手段。視音頻質(zhì)量監(jiān)測主要是對視頻內(nèi)容和音頻內(nèi)容出現(xiàn)的問題進(jìn)行監(jiān)測,包括信號中斷、視頻靜幀、黑場、彩條、臺標(biāo)丟失以及音頻響度異常等。解碼后的4K電視信號可以由監(jiān)視器直接播放,所以音頻質(zhì)量監(jiān)測是搭配畫面監(jiān)測一起使用的,便于值班員判斷某些監(jiān)測設(shè)備無法識別的異常,例如4K電視信號在基帶側(cè)使用4路3G-SDI進(jìn)行傳輸,由于線序混亂造成的畫面異常。為了減少告警誤差,管理員對每一項監(jiān)測指標(biāo)都設(shè)置了報警門限,如圖2所示。指標(biāo)超出門限,系統(tǒng)才發(fā)送告警。視音頻質(zhì)量是影響用戶體驗的最終標(biāo)準(zhǔn)。
圖2 視音頻質(zhì)量監(jiān)測指標(biāo)
總控網(wǎng)絡(luò)主要通過組播的方式分發(fā)TS over UDP的4K電視信號。TS over UDP即應(yīng)用層實體根據(jù)MPEG2-TS標(biāo)準(zhǔn)對編碼的視音頻數(shù)據(jù)進(jìn)行封裝,并使用傳輸層用戶數(shù)據(jù)報協(xié)議(User Datagram Protocol,UDP)提供服務(wù)進(jìn)行通信。TR101-290標(biāo)準(zhǔn)提供了對TS流的三級錯誤監(jiān)測。為了減少報警信息,只對可能導(dǎo)致TS流無法正確解碼的致命錯誤進(jìn)行監(jiān)測,包括同步丟失錯誤、同步字節(jié)錯誤、PAT錯誤、連續(xù)計數(shù)錯誤、PMT錯誤、PID錯誤,傳輸錯誤、CRC錯誤以及CAT錯誤,如圖3所示。每個TS流中可以包含多套節(jié)目,每套節(jié)目一般包含一個視頻流和多個音頻流,其中每個視頻流或音頻流都通過唯一的PID進(jìn)行標(biāo)識。TS流監(jiān)測能夠提供基于單個視頻流或者音頻流的錯誤告警,而且對于傳輸錯誤相較視音頻質(zhì)量監(jiān)測更敏感[3]。
圖3 可能導(dǎo)致TS流無法正確解碼的致命錯誤
3.3.1 交換設(shè)備監(jiān)測
交換設(shè)備監(jiān)測對于故障的定位、診斷和預(yù)測有重要意義。交換設(shè)備的狀態(tài)會直接影響4K信號的傳輸。通常,傳輸介質(zhì)的故障也能通過交換設(shè)備的端口狀態(tài)變化獲知。使用簡單網(wǎng)絡(luò)管理協(xié)議SNMP對網(wǎng)絡(luò)中的交換設(shè)備進(jìn)行監(jiān)測[4],SNMP協(xié)議可以提供設(shè)備的CPU使用率、內(nèi)存使用率、設(shè)備溫度、光模塊收發(fā)功率以及接口當(dāng)前狀態(tài)等重要信息??偪鼐W(wǎng)絡(luò)中部署了統(tǒng)一的網(wǎng)絡(luò)管理系統(tǒng)NMS(版本SNMPv2c),被管設(shè)備啟用SNMP-agent協(xié)議,NMS可以向SNMP-agent查詢設(shè)備狀態(tài),設(shè)備也可以通過SNMP-agent協(xié)議向NMS上報trap和inform告警。圖4為交換機(jī)的SNMP相關(guān)配置。SNMP為交換機(jī)基本特性,不需要額外的硬件支持和軟件許可。交換機(jī)可以同時使能SNMP所有版本,保證可以和網(wǎng)絡(luò)中的不同版本的NMS通信。如果系統(tǒng)有信息安全的相關(guān)要求,可使用SNMPv3版本。該版本提供了認(rèn)證加密和基于用戶的訪問控制。
圖4 交換機(jī)SNMP相關(guān)配置
3.3.2 網(wǎng)絡(luò)性能監(jiān)測
統(tǒng)計周期內(nèi)的丟包率,可以監(jiān)測當(dāng)前IP網(wǎng)絡(luò)的性能[5]。例如,啟用交換機(jī)提供的iPCA功能,可以統(tǒng)計某個設(shè)備整體的丟包率、兩個設(shè)備間直連鏈路的丟包率以及目標(biāo)IP流在某個網(wǎng)絡(luò)區(qū)域內(nèi)的丟包率。IP分組的網(wǎng)絡(luò)層頭部和傳輸層頭部攜帶的五元組信息(協(xié)議、源地址、源端口、目的地址、目的端口)可以用來唯一標(biāo)識一個目標(biāo)IP流。統(tǒng)計設(shè)備整體的丟包率,可以快速定位某個交換設(shè)備導(dǎo)致的網(wǎng)絡(luò)故障。統(tǒng)計設(shè)備間直連鏈路的丟包率,可以快速定位連接兩臺設(shè)備的物理傳輸介質(zhì)的故障。統(tǒng)計目標(biāo)IP流在某個網(wǎng)絡(luò)區(qū)域內(nèi)的丟包率,可以測定該區(qū)域的網(wǎng)絡(luò)性能,適用于4K信號需要穿越外部網(wǎng)絡(luò),或者區(qū)域內(nèi)部的交換機(jī)不支持iPCA功能的情況。例如,總控網(wǎng)絡(luò)中的流媒體服務(wù)器向云平臺推送基于RTMP協(xié)議的4K流時,需要穿越業(yè)務(wù)外網(wǎng),一旦信號出現(xiàn)異常,通過測定4K流在該區(qū)域內(nèi)的丟包率,可以快速定位故障點。一旦確認(rèn)業(yè)務(wù)外網(wǎng)存在網(wǎng)絡(luò)故障,相關(guān)統(tǒng)計數(shù)據(jù)可以作為與其他部門協(xié)調(diào)的依據(jù)。
3.3.3 媒體傳輸質(zhì)量監(jiān)測
對目標(biāo)流出現(xiàn)的丟包、抖動、亂序等情況進(jìn)行監(jiān)控,需要分析TCP報文、RTP報文等來獲取信息。例如,通過TCP報文的重傳數(shù)量計算丟包率,通過RTP報文中的時間戳計算抖動等??梢灾苯訂⒂媒粨Q機(jī)提供的eMDI功能或者通過獨立的監(jiān)測設(shè)備對媒體傳輸質(zhì)量進(jìn)行監(jiān)測。
視音頻質(zhì)量監(jiān)測需要讀取4K信號的外層頭部(網(wǎng)絡(luò)接口層、網(wǎng)絡(luò)層、傳輸層、應(yīng)用層)信息,對分組數(shù)據(jù)進(jìn)行解封裝、重組、解碼之后才能對內(nèi)容進(jìn)行分析。而TS流監(jiān)測和媒體質(zhì)量監(jiān)測都只需要對4K信號進(jìn)行解封裝,并分析外層頭部數(shù)據(jù)。因此,獨立的視音頻質(zhì)量監(jiān)測設(shè)備也具備TS流監(jiān)測和媒體質(zhì)量監(jiān)測的功能。
系統(tǒng)中的設(shè)備達(dá)到時間同步是為了保證告警的準(zhǔn)確性,提高告警記錄的可讀性,有利于排除故障。設(shè)備時間同步是對IP傳輸質(zhì)量進(jìn)行監(jiān)測的先決條件。4K壓縮信號傳輸系統(tǒng)通過網(wǎng)絡(luò)時間協(xié)議NTP進(jìn)行設(shè)備時間同步。在時間同步子網(wǎng)中,設(shè)備所處的層數(shù)代表時間的精確度,層數(shù)越低,精確度越高。總控網(wǎng)絡(luò)中的主時間服務(wù)器直接同步到標(biāo)準(zhǔn)參考時間,時間精確度最高,處在1層。當(dāng)設(shè)備同步到處于N層的另一臺設(shè)備,則該設(shè)備處于N+1層。設(shè)備處于16層代表時鐘未同步。總控網(wǎng)絡(luò)中部署了兩臺主時間服務(wù)器。一般情況下,與主時間服務(wù)器直連的核心交換機(jī)通過單播Client/Server模式同步到服務(wù)器,其他交換機(jī)通過對等體模式,由高層的對等體向低層的對等體同步。網(wǎng)絡(luò)末端的主機(jī)直接同步最近的交換機(jī),減少NTP報文穿越網(wǎng)絡(luò)。圖4為其中一臺核心交換機(jī)的NTP配置。該設(shè)備配置了三個時鐘源(主時間服務(wù)器、對等體、設(shè)備本身),并擇優(yōu)同步到了時鐘精確度最高的主時間服務(wù)器,處于時鐘同步子網(wǎng)的2層。一旦主時間服務(wù)器失效,設(shè)備會擇優(yōu)同步到其他時鐘源。
當(dāng)目的端的4K電視節(jié)目發(fā)生異常,需要逆著傳輸方向一段鏈路一段鏈路地向前排查,或者根據(jù)經(jīng)驗去排查概率較高的故障點。由于4K信號的傳輸線路一般需要經(jīng)過幾臺甚至十幾臺分組交換設(shè)備,會增加故障排查的難度和時間。因此需要設(shè)計一個合理的監(jiān)測部署方式來加快故障排查的速度。對上文提到的三種監(jiān)測方式進(jìn)行對比,如表1所示。
表1 三種監(jiān)測方式對比
圖5 交換機(jī)NTP配置
由表1可知,視音頻質(zhì)量監(jiān)測除了需要對4K網(wǎng)絡(luò)信號進(jìn)行解封裝外,還要解碼,耗費資源最多、時間最長、成本最高。TR101-290只能監(jiān)測應(yīng)用層使用了TS封裝的信號。傳輸信號包含大量TS over IP信號,例如總控網(wǎng)絡(luò)中以組播方式傳輸?shù)腡S over UDP信號。IP傳輸質(zhì)量監(jiān)測不需要增加單獨的監(jiān)測設(shè)備,可以利用傳輸鏈路原本存在的交換機(jī)來實現(xiàn),成本最低。視音頻質(zhì)量監(jiān)測成本最高,但有其必要性,IP傳輸質(zhì)量監(jiān)測和TR101-290三級錯誤監(jiān)測主要針對信號在傳輸過程中出現(xiàn)的數(shù)據(jù)丟失和數(shù)據(jù)失真問題,TR101-290還能識別流故障,但是無法識別視音頻編碼數(shù)據(jù)原本就存在的錯誤,這種錯誤是信源設(shè)備在對4K信號進(jìn)行編碼、轉(zhuǎn)碼等相關(guān)操作時導(dǎo)致的,可能是設(shè)備性能不足或者人為操作失誤造成的。例如,當(dāng)信源設(shè)備的編碼功能主要依靠GPU,且使用獨立的通道控制輸入輸出,設(shè)備編碼能力不足會導(dǎo)致視音頻數(shù)據(jù)異常但不會影響信號的輸入及輸出。以上情況導(dǎo)致的信號異常不會表現(xiàn)在IP層面和TS層面,因此,IP傳輸監(jiān)測和TS流監(jiān)測并不能識別此種信號故障,此時只能依靠視音頻質(zhì)量監(jiān)測。
為了盡可能減少成本,且達(dá)到最好的監(jiān)測效果,需要在傳輸線路的所有交換機(jī)上都啟用IP傳輸質(zhì)量監(jiān)測;在源端和末端部署視音頻質(zhì)量監(jiān)測;對于TS流的傳輸,需要在網(wǎng)絡(luò)中的重要節(jié)點部署TS流監(jiān)測。
監(jiān)測管理采用近端監(jiān)測、分散采集,遠(yuǎn)端記錄、集中管理的模式。為了盡可能保證告警的準(zhǔn)確性,部署的信號監(jiān)測設(shè)備應(yīng)當(dāng)盡可能靠近傳輸線路,避免多余設(shè)備和傳輸鏈路引入新的故障。需將監(jiān)測設(shè)備分散部署到網(wǎng)絡(luò)的各節(jié)點中。監(jiān)測信號為組播流時,利用組播的泛洪特性,將監(jiān)測口與傳輸口加入同一虛擬局域網(wǎng)(Virtual Local Area Network,VLAN);監(jiān)測信號為單播流時,在傳輸交換機(jī)配置本地端口鏡像,將4K信號鏡像到同一臺交換機(jī)的監(jiān)測口。
為了對告警數(shù)據(jù)進(jìn)行統(tǒng)一記錄和查詢,需建立單獨的管理網(wǎng)絡(luò)。傳輸設(shè)備和監(jiān)測設(shè)備的日志、告警數(shù)據(jù)通過管理網(wǎng)絡(luò)回傳到遠(yuǎn)端的總控系統(tǒng)中,由統(tǒng)一的管理服務(wù)器進(jìn)行記錄和分析。
在4K超高清電視信號傳輸過程中,通過對解碼后的視音頻質(zhì)量、TS流傳輸質(zhì)量以及IP網(wǎng)絡(luò)傳輸質(zhì)量進(jìn)行監(jiān)測,可以提供全面的報警信息,有利于故障的排查和傳輸鏈路的切換。其中,在IP網(wǎng)絡(luò)傳輸質(zhì)量監(jiān)測層面,利用傳輸鏈路上的分組交換設(shè)備提供設(shè)備報警以及網(wǎng)絡(luò)性能和媒體傳輸質(zhì)量的監(jiān)測,不但節(jié)約監(jiān)測設(shè)備的成本,最大程度上簡化網(wǎng)絡(luò)結(jié)構(gòu),同時能夠掌握整個傳輸網(wǎng)絡(luò)的變化情況。隨著4K超高清電視信號的發(fā)展,通過IP網(wǎng)絡(luò)傳輸?shù)奈磯嚎s電視信號的監(jiān)測也需要增加到現(xiàn)有系統(tǒng)中,提供全信號的監(jiān)測能力。