田 娟,方國強,卓劉珺
(四川省氣象探測數(shù)據(jù)中心,四川 成都 610072)
多媒體通信技術可以不受時空的限制進行圖像、聲音、文字的交流,視頻會議系統(tǒng)就是依托這種技術的一種通信系統(tǒng)[1]。采用視頻會議的方式,不同會場之間不僅可以相互聽到聲音,還可以進行視頻圖像和文字的交流。這不但拉近了與會者之間的距離,增強了臨場感,還能夠提高工作效率,降低遠距離會議的費用。近年,在疫情影響下,“無接觸”成為會議召開的關鍵詞,而視頻會議這種便捷高效的會議方式成為了各個部門的首選。
從1990 年開始,ITU-T 就陸續(xù)制定了一系列多媒體技術標準來規(guī)范其圖像、聲音、數(shù)據(jù)的通信方式。常見的有基于N-ISDN的會議終端協(xié)議H.320,基于分組交換網(wǎng)絡的會議終端協(xié)議H.323,基于PSTN 的會議終端協(xié)議H.324[2]。H.323 是基于現(xiàn)有的TCP/IP 網(wǎng)絡平臺,可以在同一平臺上實現(xiàn)語音、視頻、數(shù)據(jù)的三網(wǎng)合一,充分利用了帶寬資源,是目前應用較為廣泛的終端協(xié)議。嚴格遵守H.323 協(xié)議的通信終端,具有良好的開放性和互通性,正是這種特性使得不同廠商的終端可以互聯(lián)互通。但是,H.323 只是一個框架性協(xié)議,許多方面并沒有做出明確規(guī)定。對標準理解程度不同,編碼和實現(xiàn)方式就不盡相同。因此,各個廠商基于標準H.323 開發(fā)的終端存在兼容性問題。本文以四川省氣象視頻會商系統(tǒng)為研究對象,對基于H323協(xié)議開發(fā)的不同終端的兼容性進行了研究,提出了幾種融合優(yōu)化的方法,在實際應用中得到了良好的效果。
H.323協(xié)議被普遍認為是目前在分組網(wǎng)上支持數(shù)據(jù)、圖像、語音業(yè)務最成熟的協(xié)議,廣泛應用于視頻會議、遠程監(jiān)控、交互式網(wǎng)絡視頻、視頻新聞等領域。其系統(tǒng)包括終端(Terminal)、網(wǎng)關(Gateway)、網(wǎng)守(Gatekeeper)和多點控制單元(Multipoint Control Unit,MCU)[3]。其中,終端、網(wǎng)關、多點控制單元是H.323 中的終端設備,是網(wǎng)絡中的邏輯單元。
終端是分組網(wǎng)絡中能夠提供實時、雙向通信的節(jié)點設備,也是一種終端用戶設備,它可以和網(wǎng)關及多點控制單元進行通信,所有終端都支持語音通信,視頻和數(shù)據(jù)通信可選。H.323終端功能結構如圖1所示。在發(fā)送端,音視頻I/O 設備獲取信號,經(jīng)編碼器壓縮并打包成一定格式,通過網(wǎng)絡發(fā)送出去。在接收端,來自網(wǎng)絡的數(shù)據(jù)包首先被解包,得到的音視頻解壓數(shù)據(jù)經(jīng)解碼器解碼后送入輸出設備,用戶數(shù)據(jù)和控制數(shù)據(jù)也得到相應的處理。
圖1 H.323終端功能結構圖
H.323 包含多個功能單元及協(xié)議。視頻編解碼器通信協(xié)議H.261等,完成對視頻碼流的冗余壓縮編碼。音頻編解碼器通信協(xié)議G.711 等,完成語音信號編碼的編解碼。系統(tǒng)控制單元中的通信控制協(xié)議H.245 負責邏輯信道的關閉、參數(shù)的設定、收發(fā)雙方的能力協(xié)商以及多點會議中心呼叫各邏輯信道的配合控制?!癏.225.0層封裝”將音視頻、控制等數(shù)據(jù)格式化并發(fā)送,同時從網(wǎng)絡接收數(shù)據(jù),并完成邏輯分幀、加序列號、錯誤檢測等[4]。
針對視頻編碼協(xié)議,所有終端必須支持H.261 標準,H.263、H.264 可任意支持某一種。相較于H.263,H.264 具有更高的壓縮比、更好的IP 和無線網(wǎng)絡信道的適應性,在相同的帶寬下能提供更加優(yōu)秀的圖像質量,是目前市面上大多數(shù)終端都會選擇的一種視頻編碼標準[5]。但是,對于較老終端或少數(shù)終端可能支持H.263 標準。因此,一個平臺要兼容多類終端就需要支持多種視頻編碼標準。其中,H.261標準是H.323中本身就包含的。H.323對H.263提供了支持接口,只要按照接口規(guī)定要求加入實際編解碼庫即可實現(xiàn)H.263的視頻互通。但是,H.323 不直接提供H.264 的支持,而是由隨后發(fā)布的H.241 標準來擴展。因此,需要添加H.323 對H.264 的能力支持和H.264 的能力實體,以實現(xiàn)H.264 視頻的互通。H.323 協(xié)議棧中的視頻傳輸流程如圖2所示。
圖2 H.323視頻傳輸流程圖
市面上主流的視頻分辨率有QCIF、CIF、4CIF、720P 以及1080P,分別對應的圖像長寬像素點為176x144、352x288、704x576、1280x720、1920x1080。其中720P、1080P分別稱為標清(SDTV)和高清(HDTV)視頻[6]。高分辨率的終端可以向下兼容低分辨率的終端。但是一個系統(tǒng)中可能存在較老終端,分辨率較低,如果為適用新終端只編碼一種格式的視頻圖像就會導致一些終端無法解析視頻,帶來較差的兼容性。因此,為使系統(tǒng)達到一定的兼容能力可以編碼多種視頻圖像格式以適應不同終端。
此外,兩個不同的終端在進行通信時,H.225.0層封裝的數(shù)據(jù)包在他們之間無法解析或解析不好也會導致兩者兼容性差。具體表現(xiàn)為對方終端收不到信號、黑屏或者圖像模糊等現(xiàn)象。“H.225.0 層封裝”負責將音視頻、控制等數(shù)據(jù)格式化并發(fā)送,同時接收來自網(wǎng)絡的數(shù)據(jù)[7]。因此,它是兩個H.323 終端通信時發(fā)送/接收的數(shù)據(jù)格式。其中,時實音視頻數(shù)據(jù)信號用RTP 封裝,H.225 呼叫控制信息、H.245 數(shù)據(jù)及消息用TCP 封裝,RAS 消息用UDP 封裝。H.323 通信協(xié)議棧組成如圖3 所示。由于各個廠商終端H.323 部分的實現(xiàn)不盡相同,原始代碼也是公司機密,這使得要完全編碼出一模一樣的交換數(shù)據(jù)包基本不可能。不同終端要兼容,只能使他們H.225.0層封裝出的數(shù)據(jù)包盡量相同,使不同終端均能解析。
圖3 H.323通信協(xié)議棧組成圖
服務器的編碼分發(fā)規(guī)則也直接影響到整個會商系統(tǒng)的質量,需要根據(jù)系統(tǒng)特點制定一套適用于本系統(tǒng)的編碼分發(fā)規(guī)則。以四川省氣象視頻會商系統(tǒng)為例,其系統(tǒng)結構如圖4 所示。該系統(tǒng)屬于省市縣三級級聯(lián)結構,可召開省市縣三級和市縣兩級會議,省局和各市州局均建有自己的編碼分發(fā)服務器,縣局只有會議終端。根據(jù)系統(tǒng)特點制定了以下分發(fā)編碼規(guī)則。
圖4 四川省氣象視頻會商系統(tǒng)結構圖
⑴將省局編碼分發(fā)任務固定在省局的服務器上。各市州局編碼分發(fā)任務固定在市州自己的服務器上。如果市州有兩臺服務器的,將縣局終端分散部署在兩臺服務器上,以緩解服務器壓力。這樣既滿足了自建資源自己使用的原則,又合理利用了資源,不會使某幾臺服務器處于滿負荷狀態(tài),導致服務器卡死、畫面突然黑屏、閃爍等現(xiàn)象。
⑵省局一共建有六臺服務器,如果省局現(xiàn)運行的某臺服務器掛掉,可按規(guī)則轉入另外一臺服務器。市局現(xiàn)運行的服務器掛掉,如果市局有兩臺服務器的,轉入下一臺服務器,如果沒有則轉入省局的服務器。
⑶為避免有服務器掛掉后很多終端都集中在某一臺服務器上運行這種極端情況出現(xiàn),可限定服務器的最大接入用戶數(shù)。
四川省氣象視頻會商系統(tǒng)包括華為、寶利通、網(wǎng)動三個品牌的終端。其中華為和寶利通各個系列,不同型號的終端都有包括,網(wǎng)動作為最新引入終端。系統(tǒng)建設完成后,整個系統(tǒng)基本兼容了所有終端,但是兼容效果并不好。具體表現(xiàn)為:某個終端無法解析省局分發(fā)的視頻,導致丟幀率特別嚴重或者直接黑屏;由于實時帶寬跟不上,視頻出現(xiàn)延遲、馬賽克嚴重等現(xiàn)象。系統(tǒng)融合優(yōu)化前部分視頻效果如圖5所示。
圖5 系統(tǒng)融合優(yōu)化前部分視頻效果
為使得這些來自不同廠商,不同型號的終端互聯(lián)互通且達到一定的分辨率要求,按照上訴方法做了融合優(yōu)化。服務器的編碼分發(fā)規(guī)則按上訴規(guī)則執(zhí)行,并根據(jù)實際需要做了一些細微調整。
針對視頻協(xié)議,除H.323本身就包含的H.261標準外,系統(tǒng)還支持H.263 和H.264 標準,以滿足不同終端對視頻編碼協(xié)議的需求。在配置視頻協(xié)議選項時系統(tǒng)提供了三個選項,分別是“自動”、“H.263”、“H.264”,如圖6所示。各個終端可根據(jù)自身情況和時下網(wǎng)絡情況選擇對應協(xié)議,也可選擇“自動”選項,讓終端之間在進行能力協(xié)商階段自動匹配。
圖6 視頻協(xié)議配置選項
針對編碼圖像大小,系統(tǒng)定義了CIF、4CIF、720P、1080P 四種圖像格式。在配置視頻大小選項時系統(tǒng)提供了五個選項,分別是“自動”、“352x288”、“704x576”、“1280x720”、“1920x1080”,如圖7 所示。同樣的,各個終端可根據(jù)自身情況和時下網(wǎng)絡情況選擇對應視頻大小,也可選擇“自動”選項自動匹配。
圖7 視頻協(xié)議配置選項
除數(shù)據(jù)包解析不好導致通信質量不好外,網(wǎng)絡也是其中的一個影響因素。當網(wǎng)絡不好時只能通過降低碼流的方式解決。系統(tǒng)定義了三種碼流格式,如圖8所示。主碼流定義的是當帶寬高于2M 時,發(fā)送視頻大小為1920x1080p;子碼流1定義了帶寬在1M-2M之間發(fā)送視頻大小為1280x720p;子碼流2定義了帶寬在512K-1M之間發(fā)送視頻大小為704x396p。
圖8 碼流設置
經(jīng)過融合優(yōu)化,終端卡死、掉線,視頻丟幀、延遲、馬賽克等現(xiàn)象得到明顯改善。視頻的分辨率也得到提高,大多數(shù)終端的分辨率能達到720p及以上。融合優(yōu)化后的部分視頻效果如圖9所示。
圖9 系統(tǒng)融合優(yōu)化前部分視頻效果
視頻會議系統(tǒng)已經(jīng)發(fā)展得很成熟。近年,在疫情影響下市場的認可度也是只增不減,各個廠商非??粗刈陨砥放圃谑袌龅恼加新?。但是,各個品牌終端的兼容性問題仍是需要關注的,也是市場所需要的。
本文以自建視頻會商系統(tǒng)為研究對象,在系統(tǒng)面臨升級改造或引入其他品牌終端時,對各終端之間的兼容性進行了研究。研究發(fā)現(xiàn)視頻編碼協(xié)議、終端分辨率、H.225.0層數(shù)據(jù)封裝方式以及服務器的分發(fā)編碼規(guī)則都會影響終端之間的兼容性。針對每種影響因子,提出了相應融合優(yōu)化的方法,在實際應用中取得了良好的效果。希望該優(yōu)化方法能為有關視頻會商系統(tǒng)升級改造提供參考。