高玉陽
(云南廣播電視臺,云南 昆明 650000)
在全球疫情爆發(fā)之前,網(wǎng)絡(luò)會議的技術(shù)及應(yīng)用一直處在“夠用”的范疇內(nèi),即能滿足小范圍群體實時交流即可,多用于跨部門協(xié)作、與客戶的日常溝通等非正式交流場合,主要解決工作效率問題。這些網(wǎng)絡(luò)會議的特點是接入點少,幾十人的規(guī)模最多見;設(shè)備簡單,一般使用筆記本電腦或者手機,通過設(shè)備的前置攝像頭和麥克風(fēng)就能采集音視頻信號;通用性強但安全性較低,參會者注冊登錄進(jìn)入房間即可參會,信號質(zhì)量受當(dāng)?shù)鼐W(wǎng)絡(luò)影響較大。但鑒于這種會議往往是臨時性、非正式的,用戶并不太在意使用體驗,可以接受偶爾的延遲或斷線。
然而近年來,隨著全球疫情的持續(xù),人們逐漸意識到,無論正式還是非正式,很多時候網(wǎng)絡(luò)會議是溝通的唯一可用方式。一時間,全球?qū)W(wǎng)絡(luò)會議的需求激增,各種大小活動都開始依托于網(wǎng)絡(luò),其中也包括如國家領(lǐng)導(dǎo)人會晤、跨國論壇之類的高級別會議。一旦這類活動在網(wǎng)絡(luò)上舉辦,網(wǎng)絡(luò)會議就由一種單純的技術(shù)形式,升級為一套服務(wù)于高級別政治活動的儀式,這對整套系統(tǒng)都提出了更高、更新的需求。由于沒有先例,技術(shù)上需要一套全新的解決方案來支撐,畢竟靠之前單一的平臺、簡單的設(shè)備以及不可控的網(wǎng)絡(luò)已經(jīng)無法滿足此類需求[1]?;诖?,本文以某次大型國際會議為例,介紹實現(xiàn)全球高級別網(wǎng)絡(luò)實時會議的解決方案及技術(shù)支撐系統(tǒng),可為類似項目的方案設(shè)計提供參考。出于保密需要,文中省略了部分細(xì)節(jié)。
本次會議的規(guī)模及需求:會議主會場設(shè)在中國,參與國家近170個,有500多位政黨和地區(qū)組織領(lǐng)導(dǎo)人參加會議,超過1萬名代表通過視頻連線或者網(wǎng)絡(luò)直播的方式參與會議,共約160處國內(nèi)外分會場遠(yuǎn)程集體參會,20多名國外政黨領(lǐng)導(dǎo)人需要線上發(fā)言,100多個國家的駐華使節(jié)在主會場線下參會。會議需要一套會議系統(tǒng)將以上需求整合,在保證安全的前提下完成大會所有議程。
在確定技術(shù)方案前,首先需要評估和測試意向性使用的會議平臺。一般而言,會議主辦方會有一個或多個傾向性意見,希望盡量使用他們期望的會議軟件來構(gòu)建系統(tǒng),這樣可以避免每個參會者重復(fù)熟悉新軟件。由于全球會議平臺多種多樣,最理想的方案應(yīng)該是一種跨平臺的融合架構(gòu),即無論參會者使用哪個平臺都能加入會議,這點會在后文詳細(xì)論述。在此之前,需要對每個融合進(jìn)來的平臺做評估和測試,以確定其是否適合這個技術(shù)環(huán)境。一般來說,測試項目主要針對應(yīng)用功能和技術(shù)架構(gòu)兩大方面。以下介紹部分需要重點評測的要素。
1.1.1 支持的最大接入點數(shù)量
這個數(shù)據(jù)指標(biāo)不僅影響會議的規(guī)模,更直接決定了搭建融合系統(tǒng)時使用的網(wǎng)絡(luò)終端數(shù)量。如果參會者超過單一平臺的接入量,需要增設(shè)更多網(wǎng)絡(luò)會場,意味著需要更多的網(wǎng)絡(luò)終端進(jìn)行信號轉(zhuǎn)換,進(jìn)一步影響矩陣、周邊設(shè)備的規(guī)模,這直接關(guān)系到系統(tǒng)的整體設(shè)計[2]。同時,也可以利用此數(shù)據(jù)評估每個會議房間的適合人數(shù)。
1.1.2 畫廊模式最大顯示數(shù)量
畫廊模式最大顯示數(shù)量決定了信號源和畫面分割信號的數(shù)量,直接影響系統(tǒng)的規(guī)模。所謂畫廊模式,顧名思義就是在一個屏幕內(nèi),將眾多參會者的小畫面排列分布,像畫廊展示一樣。一般的網(wǎng)絡(luò)會議往往只需要觀看發(fā)言人,普通參會者并不露面。但高級別的網(wǎng)絡(luò)會議仍然需要遵守傳統(tǒng)線下會議的禮節(jié),凡是參會的嘉賓都要在形式上出席,如同線下會議時在席位上就坐,因此每個人的畫面都需要呈現(xiàn)。畫廊模式顯示數(shù)量決定了信號輸入量,例如,ZOOM會議軟件支持最大顯示25個畫面,假如有100人參會,則至少需要4頁畫廊信號,相應(yīng)地用4臺網(wǎng)絡(luò)終端,形成4路輸入源,以此類推。另外,還需要測試在會議進(jìn)行過程中,假如某位參會者掉線或關(guān)閉攝像頭,其他布局內(nèi)的畫面是否會移動。如果排序布局會受參會者的操作而改變,就需要使用單畫面選看功能。
1.1.3 是否支持單畫面選看功能
平臺是否支持單畫面選看功能,涉及到禮賓排序的問題,需要為每個重要的參會者建立獨立的信號通道,再在視頻特技臺上進(jìn)行手動布局拼成畫廊模式,這點后文會單獨論述。
1.1.4 是否有強制靜音功能
有些會議平臺可以檢測是否有語音輸入來自動觸發(fā)發(fā)言,甚至自動將發(fā)言者的畫面全屏。這個功能會對高級別會議產(chǎn)生嚴(yán)重干擾。除非有需要,畫廊模式不允許隨意全屏某位參會者,也不允許發(fā)言人之外的參會者隨意開啟麥克風(fēng)插話。如果會議系統(tǒng)不支持強制靜音和禁止全屏,那在會議控制系統(tǒng)端的處理會比較麻煩。這種情況下,該會議平臺評估不能通過評估。
1.2.1 單畫面的最大清晰度與網(wǎng)絡(luò)帶寬需求
對于高級別會議,可以接受的畫面分辨率至少為720 P,某些平臺在降低幀速率的情況下可以傳輸1 080 P,此時建議最低幀速率在10~15 f·s-1。 由于會議圖像的變化區(qū)域很小,低幀率不會造成太大不適,特別適合那些如H.263及更高標(biāo)準(zhǔn)的基于DCT變換和運動估計與預(yù)測技術(shù)的視頻編碼,往往在1.5 Mb·s-1時仍有較好的質(zhì)量。不過對于國際 會議,建議至少保證10 Mb·s-1的上下行帶寬。
1.2.2 會議平臺支持的框架協(xié)議
會議平臺支持的框架協(xié)議涉及到可以接入的設(shè)備選型。例如,支持SIP或者H323的會議平臺,可使用相應(yīng)的網(wǎng)絡(luò)設(shè)備搭建系統(tǒng),如使用SIP電話作為會議信號的備份,在圖像信號斷線的時候及時啟用,可至少保證參會者的發(fā)言聲音傳遞到大會。
1.2.3 會議平臺服務(wù)器的跳轉(zhuǎn)方向
會議平臺服務(wù)器的跳轉(zhuǎn)方向主要評估對于國內(nèi)而言,該網(wǎng)絡(luò)的出口是否可能成為瓶頸。很多會議平臺在全球都部署有服務(wù)器,需要弄清跨國信號跳轉(zhuǎn)的網(wǎng)絡(luò)路徑,至少需要知道亞太地區(qū)的服務(wù)器分布和訪問延遲量。例如,本次會議使用的其中一種會議平臺由歐洲某國開發(fā),基于亞馬遜云AWS的服務(wù),其對于中國的跳轉(zhuǎn)方向是新加坡。而新加坡是亞太地區(qū)的網(wǎng)絡(luò)樞紐,到我國有大出口的帶寬,雙向CN2線路一般延遲在30 ms,最大不超過100 ms, 完全可以滿足會議需求,實際測試結(jié)果也符合這個情況。而如果是國產(chǎn)會議軟件,往往對國內(nèi)和發(fā)達(dá)國家支持較好,則需要了解其在海外的服務(wù)器分布狀況,特別是在第三世界地區(qū)。
1.2.4 會議平臺的安全性
作為國際會議的主辦方,一定要對所使用會議軟件的安全性進(jìn)行評估,需重點評估對于高強度網(wǎng)絡(luò)攻擊的防范能力,包括防止DDOS攻擊、域名劫持等[3]。例如,本次會議使用的幾種會議平臺基于亞馬遜云,其AWS shield托管式服務(wù)可以有效防范DDOS攻擊,同時使用AWS Route 53云域名系統(tǒng),總體而言安全性比較高。
除以上項目外,還需要掌握其他可能影響會議體驗的性能指標(biāo),如是否支持電腦客戶端,在網(wǎng)絡(luò)不穩(wěn)定且發(fā)生抖動的情況下,畫質(zhì)如何變化(自動降低清晰度、降低幀速率、或降低分辨率等);是否支持低帶寬時只傳送音頻,是否可以自行關(guān)閉畫中畫功能,是否可以隱藏未開啟攝像頭的參會者,平臺能夠覆蓋哪些國家,平臺針對本次會議的運維保障方案,是否滿足數(shù)據(jù)主權(quán)需求等。
一個理想的會議系統(tǒng)應(yīng)該滿足以上所有需求,然而目前全球尚沒有這樣完美的平臺。使用單一平臺,不僅接入點不全、功能有短板、安全性和可靠性較低,還存在數(shù)據(jù)主權(quán)的政治問題。經(jīng)過測試與評估,本次會議最終確定使用華為云會議、騰訊會議、ZOOM視頻會議平臺,共同進(jìn)行會議保障。
技術(shù)方案需要圍繞需求制定。本次會議的呈現(xiàn)要求是:主會場設(shè)在人民大會堂,主席臺有9位領(lǐng)導(dǎo)就座;國外駐華使節(jié)于就近分會場參會,其他所有人員通過網(wǎng)絡(luò)遠(yuǎn)程參會;發(fā)言人一共22人,我國領(lǐng)導(dǎo)人一人,其余21人在國外;同聲傳譯有14個語種,加原聲一共15路;主會場、6個國內(nèi)分會場、200個國外分會場及500多位個人參會者之間,使用的3種不同會議平臺需要完全音視頻互通(包含所有同傳信號)。主會場設(shè)置5組LED大屏幕,中間的1號主屏幕顯示主會場及21位國外發(fā)言人畫面;兩側(cè)的2、3號屏幕既顯示國內(nèi)外分會場畫面,也顯示特寫畫面,還會播放一些會議相關(guān)的視頻短片;再兩側(cè)的4、5號屏幕顯示其他500多位個人參會者。大屏幕布局示意圖如圖1所示。大會還需要備播視頻、照片備份、電話備份等手段以提高安全性。這些信號及每個大屏幕上的畫廊模式信號不僅要在現(xiàn)場呈現(xiàn),還需傳送至線上,供每位參會者觀看。
圖1 主會場大屏幕布局示意圖
常規(guī)的廣播電視系統(tǒng)一般是單向架構(gòu),即從信號源開始,經(jīng)過各種設(shè)備逐級傳送至末端。網(wǎng)絡(luò)會議平臺混合后,系統(tǒng)則是多向的,每個接入點既是信號源也是終端,大家互為外來信號。這種系統(tǒng)沒有先例,只能根據(jù)需求逐步摸索。設(shè)計時,需先將系統(tǒng)的整體邏輯關(guān)系理順,再細(xì)化各部分細(xì)節(jié),系統(tǒng)邏輯如圖2所示。
圖2 系統(tǒng)邏輯圖
這是一個由信號源、現(xiàn)場大屏及線上會議平臺組成的三方系統(tǒng)。上百個信號源經(jīng)過切換調(diào)度系統(tǒng)送至畫面拼接器,根據(jù)會議需求進(jìn)行指定位置、指定大小布局的禮賓排序上屏。而信號源大多來自融合后的會議平臺,經(jīng)過一系列信號處理后,形成類似傳統(tǒng)PGM的會議信號再返回融合會議平臺,同時拼接后的大屏畫廊模式也返回會議平臺,這樣在任何地方使用任何一種參會方式都能在形式上實現(xiàn)線上線下結(jié)合,滿足了會議需求。該三方系統(tǒng)的信號源主要包括以下類型。
(1)攝像機拍攝的畫面。在主會場面對主席臺的大屏下方設(shè)置廣播級攝像機若干臺,拍攝發(fā)言人鏡頭。為了避免攝像機遮擋大屏幕、影響線上交流,大屏幕高度建議在5 m以上,主席臺不做地臺,與攝像機保持在一個水平面。
(2)國內(nèi)分會場畫面。國內(nèi)分會場使用華為云會議接入網(wǎng)絡(luò),音視頻信號通過主會場的華為終端輸出。
(3)22位發(fā)言人畫面。21位國外發(fā)言人在各自的國家使用華為云會議接入網(wǎng)絡(luò),同樣通過主會場的華為終端輸出。而主會場需要將攝像機信號轉(zhuǎn)換成網(wǎng)絡(luò)視頻,成為第22路發(fā)言人信號,作為線上平臺的信號源,這也是多向系統(tǒng)的特點。
(4)畫廊信號。其他分會場及個人參會者不提供單獨畫面,以畫廊模式集體展現(xiàn)。按照每屏5×5布局,每個畫廊信號顯示25位參會者,再將兩組畫廊信號上下拼接,形成50個窗口的大畫廊,顯示在主會場4、5號大屏上。畫廊模式的獲取方法是使用參會者身份加入會議房間,設(shè)置屏幕為畫廊模式,通過HDMI或DP接口將屏幕信號采集出來。這種方式只適合安全要求較低的畫面,對于重要嘉賓,必須使用專業(yè)的網(wǎng)絡(luò)終端采集信號。
(5)提取單人信號。會議中有部分參會者不是發(fā)言人,但也需要提供全屏的單人信號,實現(xiàn)方式同上。
(6)視頻短片信號。由主會場的視頻播放器播放,除了播放會議相關(guān)短片,還作為某些重要嘉賓的信號備份。
本次會議將3種網(wǎng)絡(luò)平臺進(jìn)行融合,形成一個大虛擬會議室,音視頻信號、同聲傳譯信號跨平臺傳輸。不同平臺使用的協(xié)議及軟件接口千差萬別,無法在網(wǎng)絡(luò)應(yīng)用層融合,即平臺之間不可能打通,只能通過在鏈路層進(jìn)行設(shè)備到設(shè)備的連接實現(xiàn)。融合系統(tǒng)的原理如圖3所示。
圖3 系統(tǒng)流程
圖3 融合系統(tǒng)的原理圖
融合系統(tǒng)的原理就是將會議音視頻信號通過HDMI、SDI、DP、TRS、XLR之類的物理接口進(jìn)行交互,通過格式轉(zhuǎn)換器統(tǒng)一到某個單一平臺,進(jìn)行一系列處理后再返回各自系統(tǒng)。這種方式的優(yōu)點是不受平臺限制,只要有音視頻接口即可,并且可以防范部分網(wǎng)絡(luò)攻擊[4];缺點是所需設(shè)備種類復(fù)雜,數(shù)量巨大。因為從信號處理邏輯上說,融合系統(tǒng)就是一臺沒有現(xiàn)成接口的矩陣,每個輸入、輸出口都需要根據(jù)會議平臺、賬號類型、接口類型及畫面內(nèi)容等自行“DIY”設(shè)備來實現(xiàn),再加上備份的需求,設(shè)備規(guī)模往往既龐大又松散,但這是目前唯一可行可控的、能將任意音視頻平臺或系統(tǒng)整合的方式。
基于以上系統(tǒng)邏輯及技術(shù)方式,本次會議搭建的視頻系統(tǒng)架構(gòu)如圖4所示。
圖4 視頻系統(tǒng)架構(gòu)圖
該系統(tǒng)將安全性放到最高優(yōu)先級。在物理層面上,鏈路和設(shè)備均做了多重交叉?zhèn)浞荨?/p>
首先,主會場大屏由兩套完全獨立的路由提供信號,包括兩套切換系統(tǒng)和兩套屏幕拼接系統(tǒng),兩者之間互為備份,作為大屏主信號;另外還有兩套提供線上平臺的調(diào)度系統(tǒng)和畫面拼接系統(tǒng)也接入了主鏈路,作為大屏的備用信號。同理,兩路大屏主信號也接入了線上平臺的信號鏈路,作為線上備用信號;而上面提到的兩路提供線上平臺主信號的系統(tǒng)內(nèi)部也互為備份。
其次,重要嘉賓均使用至少兩種會議平臺接入。主會場、21個國外政黨發(fā)言人及6個國內(nèi)分會場使用華為作為主系統(tǒng),騰訊做備份系統(tǒng);國外分會場除了50個使用ZOOM外,全部使用華為系統(tǒng);500多位政黨和地區(qū)組織領(lǐng)導(dǎo)人使用ZOOM或者華為參會。華為廣泛且完善的全球業(yè)務(wù)網(wǎng)絡(luò)及服務(wù)體系為這次會議提供了強大保障。
最后,每個子系統(tǒng)內(nèi)的設(shè)備也做了充足備份,不僅常規(guī)的攝像機、矩陣、切換臺及畫面特技臺等都是雙備份,重要的線上信號均使用多臺網(wǎng)絡(luò)終端或筆記本電腦進(jìn)行采集。
除此之外,在運維層面上也采取了多種手段以保證安全性。首先,作為網(wǎng)絡(luò)會議,使用的所有計算機設(shè)備必須系統(tǒng)干凈、補丁齊全,關(guān)閉自動更新和屏保,無關(guān)軟件一律清除。其次,進(jìn)行應(yīng)用層的隔離。融合系統(tǒng)有兩個層面,一是不同平臺間的融合,這源于技術(shù)上的限制;二是同一平臺不同房間的融合,這源于會議安全上的考慮。例如,22位重要發(fā)言人和其他分會場雖然使用同樣的平臺、技術(shù)、線路及設(shè)備,但必須分成不同的虛擬會議房間,再通過融合系統(tǒng)合并。
本次會議使用了約500臺筆記本電腦、120臺華為網(wǎng)絡(luò)會議終端CloudLink Box 500/700/900系列。與直接通過筆記本電腦采集信號相比,該系列可以外接顯示設(shè)備、攝像機、麥克風(fēng)及揚聲器,豐富的 I/O接口可以為本會議系統(tǒng)提供更穩(wěn)定、更規(guī)范的信號源,主要部署在重要嘉賓及會場的鏈路上。而大屏拼接系統(tǒng)使用了BARCO的系列產(chǎn)品,包括EC-210 Large Event Controller控制面板、C3控制面板以及E2-Gen Event Master信號處理器等。
音頻系統(tǒng)框架如圖5所示。
圖5 音頻系統(tǒng)框架圖
音頻系統(tǒng)的煩瑣之處在于,要將14路翻譯和原聲從不同平臺的各個會議房間采集出來,再送回到不同平臺的各個房間,使每個參會者都可以從15個聲道中選擇收聽。每個房間都要通過翻譯員賬號上傳一種語言,例如一臺筆記本用“英語翻譯”身份登錄某房間,其通過音頻采集卡上傳的信號就成為整個房間“英語頻道”的音頻。而每個房間都需要15路這樣的鏈路,系統(tǒng)規(guī)模就隨房間數(shù)量和備份需求不斷翻倍。本次會議的翻譯員均在會議現(xiàn)場,翻譯信號相對比較好獲取。如果會議采用線上翻譯,即翻譯員也是通過加入會議房間在異地參與工作,則每個房間都需要一路參會者賬號采集某一種翻譯語言,系統(tǒng)規(guī)模要再翻倍。除此之外,需要提前對會議平臺的音頻進(jìn)行輸入輸出的環(huán)路測試,在回聲消除、自動增益控制、噪音抑制等方面也需加入干預(yù),而這些工作所需的經(jīng)驗性會更強一些[5]。
本次會議音頻系統(tǒng)主要使用了DiGiCo系列產(chǎn)品,如DiGiCo SD12等。
對于高級別的會議而言,安全性永遠(yuǎn)都是第一位,本次會議系統(tǒng)設(shè)計處處體現(xiàn)了這一點,網(wǎng)絡(luò)安全、系統(tǒng)安全及運維安全等都是要重點考慮的方面。系統(tǒng)設(shè)計要為最終呈現(xiàn)形式服務(wù),要跳出傳統(tǒng)設(shè)計思路中的行業(yè)界限和技術(shù)界限,重新評估規(guī)模與成效之間的平衡關(guān)系。另外,“媒體融合”是未來發(fā)展的必然趨勢,不僅是廣播電視行業(yè)狹義的“媒體”,更是指全球化的、通用化的可視信息交互。疫情只是初步激發(fā)了這個需求,未來還有更廣闊的應(yīng)用前景,相關(guān)業(yè)界應(yīng)給予重視。本次會議采用的系統(tǒng)方案受限于目前的技術(shù),雖然煩瑣但卻唯一可行,希望今后隨著技術(shù)發(fā)展,整合度更高、安全性更強的解決方案可以加快實現(xiàn)。