亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        云視頻系統(tǒng)服務(wù)高可用技術(shù)

        2023-08-31 03:05:36謝永強李忠博李少南
        指揮與控制學(xué)報 2023年3期
        關(guān)鍵詞:故障服務(wù)系統(tǒng)

        徐 艷 謝永強 李忠博 齊 錦 李少南

        視頻技術(shù)的飛速發(fā)展?jié)M足了人們?nèi)找嬖鲩L的可視化通信需求[1],深刻改變了溝通交流、目標(biāo)監(jiān)控和情報傳遞方式.視頻通信系統(tǒng)已經(jīng)滲透到遠程會議、在線教育、遠程醫(yī)療等多個民用領(lǐng)域[2],在指揮控制領(lǐng)域也構(gòu)成了信息基礎(chǔ)設(shè)施的重要部分.

        隨著云計算技術(shù)的不斷成熟,視頻通信系統(tǒng)逐漸向云化演進,形成了彈性部署、實時高效、架構(gòu)靈活的云視頻系統(tǒng).在民用領(lǐng)域,圍繞音視頻編解碼、資源調(diào)度、云視頻架構(gòu)等關(guān)鍵技術(shù)已有大量研究.國內(nèi)外視頻通信和云計算廠商也推出了許多云視頻系統(tǒng)產(chǎn)品,例如國產(chǎn)的阿里釘釘、華為WeLink、騰訊會議等,以及國外的Polycom、Zoom 等,因其低成本、高質(zhì)量的視頻服務(wù)得到了市場高度認可.2019 年12月,新冠疫情爆發(fā),云視頻系統(tǒng)更是在人們居家隔離對抗疫情期間發(fā)揮了不可或缺的作用,使經(jīng)濟、政治、民生得以遠程開展.

        在軍用領(lǐng)域,視頻通信系統(tǒng)傳遞音視頻資源為主體的戰(zhàn)場信息,為指揮員提供身臨其境、高效快捷的指揮能力,為可視化信息作戰(zhàn)提供技術(shù)平臺支撐.例如美軍的遠程視頻增強(remotely operated video enhanced receiver,ROVER)系統(tǒng)[3],以軍的戰(zhàn)場視頻網(wǎng)系統(tǒng)等,利用共享實時圖像,建立戰(zhàn)場信息共識以及形象直觀、準(zhǔn)確翔實的可視化指揮方式.戰(zhàn)術(shù)云是云技術(shù)在邊緣的擴展,可搭載在車輛、艦艇等前出平臺上,賦能戰(zhàn)術(shù)角色的云視頻系統(tǒng)增強態(tài)勢感知和決策能力[4].動態(tài)、高壓、資源有限的惡劣戰(zhàn)場環(huán)境對云視頻系統(tǒng)服務(wù)可用性形成嚴峻考驗,而瞬息萬變的戰(zhàn)場敵我對抗則要求云視頻系統(tǒng)服務(wù)連續(xù)可靠.因此,面向指揮控制領(lǐng)域,云視頻系統(tǒng)服務(wù)高可用研究具有必要性和挑戰(zhàn)性.

        服務(wù)高可用是云視頻系統(tǒng)的非功能性需求之一,指系統(tǒng)穩(wěn)定運行所需的故障恢復(fù)和快速接替能力[5],包括冗余、備份、監(jiān)測、恢復(fù)4 個基礎(chǔ)組件.許多服務(wù)高可用技術(shù)的研究圍繞上述4 個基礎(chǔ)組件角度分別展開,關(guān)于整體高可用架構(gòu)方案的討論并不多[6-7].另外,云視頻系統(tǒng)依托云平臺基礎(chǔ)資源,服務(wù)部署在虛擬機或容器等虛擬環(huán)境中,處理數(shù)據(jù)更多,服務(wù)粒度更細、服務(wù)交互更復(fù)雜,故障監(jiān)測及失效恢復(fù)開銷更大[8].因此,云視頻系統(tǒng)服務(wù)高可用解決方案需考慮應(yīng)用特性.本文從軟件架構(gòu)、故障監(jiān)測、失效恢復(fù)3 個角度全面梳理了服務(wù)高可用技術(shù)的研究進展.結(jié)合云視頻系統(tǒng)虛擬化運行環(huán)境的特點和視頻傳輸協(xié)議棧的特性,提出了包括管理控制服務(wù)、信令協(xié)商服務(wù)、媒體處理服務(wù)在內(nèi)的云視頻系統(tǒng)核心服務(wù)高可用解決方案,旨在改進故障監(jiān)測效率和失效恢復(fù)速率.展望了服務(wù)高可用的云視頻系統(tǒng)在指揮控制領(lǐng)域的若干應(yīng)用,以期為云視頻系統(tǒng)在指揮控制領(lǐng)域的實現(xiàn)提供參考.最后,探討了相應(yīng)的網(wǎng)絡(luò)安全因素.

        1 云視頻系統(tǒng)概述

        1.1 起源發(fā)展

        視頻通信系統(tǒng)是一種利用網(wǎng)絡(luò)通信技術(shù)、多媒體處理技術(shù)和計算機技術(shù)實現(xiàn)點對點或多點間的音視頻交互的通信系統(tǒng)[9-10],其發(fā)展歷程如圖1 所示.

        圖1 視頻通信系統(tǒng)發(fā)展歷程Fig.1 Development history of video communication system

        20 世紀(jì)60 年代,在通信可視化需求的推動下,美國AT&T 公司研制了一套模擬電視會議系統(tǒng)[11],標(biāo)志著視頻通信系統(tǒng)的發(fā)展開端,掀起了模擬視頻通信系統(tǒng)的研究熱潮.20 世紀(jì)80 年代,隨著數(shù)字信號處理技術(shù)的成熟,出現(xiàn)了2 Mbit/s 的彩色數(shù)字視頻會議系統(tǒng),是視頻通信系統(tǒng)數(shù)字化的里程碑.同一階段,音視頻編解碼技術(shù)的提升和視頻通信標(biāo)準(zhǔn)規(guī)范的統(tǒng)一促進了視頻通信系統(tǒng)的商用普及.

        20 世紀(jì)90 年代,互聯(lián)網(wǎng)技術(shù)浪潮下,出現(xiàn)了基于分組網(wǎng)絡(luò)的H.323 視頻通信系統(tǒng),并逐漸替代以往基于專線的H.320 視頻通信系統(tǒng),成為工業(yè)界主流.另一方面,國際電信聯(lián)盟電信標(biāo)準(zhǔn)分局(International Telecommunication Union-Telecommunication,ITU-T)引領(lǐng)的H.26x 標(biāo)準(zhǔn)和國際標(biāo)準(zhǔn)化組織(International Organization for Standardization,ISO)引領(lǐng)的動態(tài)圖像專家組(moving picture experts group,MPEG)標(biāo)準(zhǔn)推動視頻通信系統(tǒng)從標(biāo)清向高清、超高清發(fā)展.

        21 世紀(jì)初,云計算技術(shù)的快速發(fā)展,促使了視頻通信系統(tǒng)在基礎(chǔ)平臺上的創(chuàng)新.以云計算平臺為基礎(chǔ)的云視頻系統(tǒng)相較于專用硬件平臺為基礎(chǔ)的傳統(tǒng)視頻通信系統(tǒng)而言,改善了擴展成本高、運維管理難、資源利用低效的問題,具備高彈性、高性能、高并發(fā)的優(yōu)勢[12].云化是視頻通信系統(tǒng)繼數(shù)字化、網(wǎng)絡(luò)化、高清化后的重要發(fā)展趨勢[13].

        1.2 云視頻系統(tǒng)組成

        云視頻系統(tǒng)可分為云視頻服務(wù)、終端和網(wǎng)絡(luò)3部分[14],其組成如圖2 所示.

        圖2 云視頻系統(tǒng)組成Fig.2 Cloud-based video system composition

        云視頻服務(wù)側(cè)由大規(guī)模、分布式的視頻服務(wù)器集群構(gòu)成,實現(xiàn)信令交互、媒體處理、媒體存儲、業(yè)務(wù)邏輯等[15],是云視頻系統(tǒng)的核心部分.

        終端側(cè)是用戶獲取視頻服務(wù)的基本入口,實現(xiàn)媒體數(shù)據(jù)的采集、播放、編解碼.云視頻系統(tǒng)支持泛在終端接入[16],例如會議室終端、PC 終端、手機App以及具備音視頻功能的智能穿戴設(shè)備等.

        網(wǎng)絡(luò)是云視頻服務(wù)和終端之間傳遞服務(wù)的信道.云視頻系統(tǒng)支持泛在網(wǎng)絡(luò)接入,包括專線、寬帶和移動互聯(lián)網(wǎng)、衛(wèi)星等通信網(wǎng)絡(luò).

        云視頻系統(tǒng)提供服務(wù)的模式為:用戶與運營者簽訂服務(wù)等級協(xié)議(service level agreement,SLA),就視頻質(zhì)量、使用時長、數(shù)據(jù)存儲與訪問等各項服務(wù)指標(biāo)達成一致;用戶選擇終端接入方式,包括終端設(shè)備和接入網(wǎng)絡(luò);云視頻服務(wù)按用戶需求實現(xiàn)終端互連和媒體處理;最終,用戶通過終端獲得已付費和授權(quán)的實時視頻通信服務(wù).

        1.3 云視頻系統(tǒng)服務(wù)

        云視頻系統(tǒng)的特點是功能服務(wù)化,基本的視頻通信組件和上層的視頻業(yè)務(wù)應(yīng)用均以服務(wù)形式封裝,依托虛擬機或容器等運行環(huán)境部署[17].云視頻系統(tǒng)的服務(wù)包括控制管理、信令協(xié)商、媒體處理等核心服務(wù),以及視頻會議、視頻協(xié)作、視頻監(jiān)控等應(yīng)用服務(wù).

        云視頻系統(tǒng)可從服務(wù)級、網(wǎng)絡(luò)級、平臺級、數(shù)據(jù)中心級等多個層級設(shè)置高可用機制.基于服務(wù)化特點,服務(wù)高可用是云視頻系統(tǒng)整體高可用中最為關(guān)鍵的部分,后續(xù)章節(jié)對當(dāng)前主流服務(wù)高可用技術(shù)進行梳理分析.

        2 服務(wù)高可用技術(shù)研究進展

        服務(wù)高可用技術(shù)是一種依托軟件架構(gòu),結(jié)合冗余、備份、監(jiān)測、恢復(fù)等高可用組件,實現(xiàn)服務(wù)穩(wěn)定、可靠運行的技術(shù)[18].對于云視頻系統(tǒng)而言,虛擬化技術(shù)使服務(wù)資源更加靈活,從而降低了服務(wù)高可用機制中冗余和備份策略的成本.但同時,不斷擴大的服務(wù)規(guī)模對軟件架構(gòu)設(shè)計形成挑戰(zhàn),驟增的服務(wù)單元及其之間頻繁的交互提升了監(jiān)測和恢復(fù)策略的開銷.分別從軟件架構(gòu)、故障監(jiān)測、失效恢復(fù)3 個方面梳理國內(nèi)外已有研究.

        2.1 基于軟件架構(gòu)的服務(wù)高可用

        軟件架構(gòu)定義了應(yīng)用的組件結(jié)構(gòu)及其交互關(guān)系,是服務(wù)高可用的基礎(chǔ)[19].典型的軟件架構(gòu)包括單體架構(gòu)、面向服務(wù)的架構(gòu)(service oriented architecture,SOA)和微服務(wù)架構(gòu)等.

        2.1.1 單體架構(gòu)

        傳統(tǒng)軟件應(yīng)用大多采用單體架構(gòu),即業(yè)務(wù)所需的邏輯模塊、運行數(shù)據(jù)等作為整體被設(shè)計、開發(fā)、打包和部署[20],如圖3 所示.

        圖3 單體架構(gòu)Fig.3 Monolithic architechture

        單體架構(gòu)系統(tǒng)的所有軟件功能在同一個進程中執(zhí)行,多個服務(wù)器共同支持其計算任務(wù),但內(nèi)部各個組成模塊無法獨立運行,單個模塊故障將導(dǎo)致整體功能故障[21].

        隨著業(yè)務(wù)需求變更和系統(tǒng)規(guī)模擴增,單體架構(gòu)越來越龐大、復(fù)雜,新業(yè)務(wù)交付周期延長,對于強實時性、高可用性、高伸縮性要求的系統(tǒng)應(yīng)用而言,不利于開發(fā)部署、運維管理和升級維護[22].例如,2008年,知名流媒體服務(wù)商——Netflix 公司的單體架構(gòu)數(shù)據(jù)中心發(fā)生故障,導(dǎo)致服務(wù)中斷3 d[23],影響全球過億付費訂閱用戶體驗.Netflix 公司意識到必須通過垂直擴展架構(gòu)以避免單點故障后,花費近7 年時間重構(gòu)其單體系統(tǒng),于2016 年完成從單體到微服務(wù)的架構(gòu)遷移,進而增強了服務(wù)可用性.

        2.1.2 面向服務(wù)的架構(gòu)

        為了克服單體架構(gòu)的弊端,應(yīng)對大規(guī)模軟件應(yīng)用服務(wù)高可用要求,產(chǎn)生了SOA.SOA 是一種將整個應(yīng)用分解為若干個相互獨立、自包含、可重用的服務(wù),具有動態(tài)、松耦合和分布式特性的架構(gòu)設(shè)計原則[24].SOA 相對于單體架構(gòu)降低了組件間的耦合性,便于故障隔離;可啟動多個實例對外提供業(yè)務(wù),便于水平擴展;通過服務(wù)發(fā)布、注冊機制,在線部署服務(wù),無須離線升級維護,提供了服務(wù)高可用基礎(chǔ).

        Nuve 是一個典型的SOA 架構(gòu)用例[25],面向視頻會議即服務(wù).其將音頻、視頻、共享應(yīng)用、協(xié)作等功能封裝成服務(wù),以不同的組合形式為用戶提供靈活、虛擬的云會議室.位于Nuve 架構(gòu)下層的Marte 服務(wù)器可實時創(chuàng)建虛擬會議室資源,為上層服務(wù)的高可用性提供資源基礎(chǔ).Nuve 架構(gòu)是開源WebRTC 平臺的Licode 組件.

        類似的SOA 架構(gòu)用例還有“Study on Service-Oriented Cloud Conferencing”[26].該研究提出將SOA架構(gòu)應(yīng)用于視頻會議系統(tǒng)的平臺層與應(yīng)用層,并描述了其詳細結(jié)構(gòu).平臺層是若干原子服務(wù),如會議管理、用戶管理、發(fā)言權(quán)控制、音頻處理、視頻處理,服務(wù)動態(tài)發(fā)布并在服務(wù)注冊中心注冊,應(yīng)用層可動態(tài)訂閱平臺層提供的相關(guān)服務(wù),實時構(gòu)建、擴展不同功能的虛擬會議室.某個服務(wù)實例故障時,服務(wù)注冊中心即服務(wù)代理指派其他實例接替服務(wù),實現(xiàn)服務(wù)高可用.

        SOA 雖然相較于單體架構(gòu),在服務(wù)高可用方面有所提升,但仍存在中心式服務(wù)和共享數(shù)據(jù)環(huán)境的瓶頸.因此,圍繞服務(wù)拆分粒度以及服務(wù)交互環(huán)境又產(chǎn)生了新的架構(gòu)設(shè)計方法.

        2.1.3 微服務(wù)架構(gòu)

        為了避免SOA 中心式服務(wù)的瓶頸,進一步細化服務(wù)拆分粒度,出現(xiàn)了微服務(wù)架構(gòu)[27-29].2014 年Lewis和Flower 提出微服務(wù)定義:通過一套小型服務(wù)(即微服務(wù))的集合來構(gòu)造單個應(yīng)用程序,其中每個微服務(wù)都在自己的進程中運行,并采用例如HTTP 等輕量通信機制.首次總結(jié)了這一新的架構(gòu)設(shè)計原則.

        微服務(wù)相對于SOA 有3 個顯著特性:1)去中心化;2)服務(wù)管理機制;3)更細的服務(wù)拆分粒度[30].以上3 點特性使微服務(wù)架構(gòu)在避免單點故障、橫向擴展和故障隔離方面表現(xiàn)更佳.

        2016 年,Alam A F B 在云視頻軟件開發(fā)研究中提出了一種基于微服務(wù)的軟件架構(gòu)[31].該架構(gòu)主要在平臺層對服務(wù)編排和管理作出創(chuàng)新,與以往的SOA單一注冊中心而沒有編排和管理形成對比.基礎(chǔ)設(shè)施層調(diào)用第三方提供的會議基底組件,如呼入信令、呼出信令、音頻混合、視頻混合,提供了比虛擬機更細的服務(wù)資源粒度,平臺開發(fā)過程無須關(guān)注會議通信細節(jié),主要聚焦于服務(wù)部署與交互.2018 年,該團隊對此架構(gòu)進行了擴展[32],如圖4 所示.

        圖4 云視頻軟件架構(gòu)Fig.4 Cloud-based video software architecture

        該架構(gòu)延伸至基礎(chǔ)設(shè)施層,其命名為子服務(wù)即服務(wù)(sub as a service,SubaaS).該研究包含概念原型驗證,但缺少如服務(wù)切換時間、服務(wù)恢復(fù)開銷等高可用性評價指標(biāo).2020 年,TAKASHI 等提出了一種基于容器技術(shù)的微服務(wù)架構(gòu)[33].研究目的是利用擴展的伯克利包過濾器作為服務(wù)相關(guān)容器的測量傳感器,從而獲取高可用相關(guān)性能指標(biāo).這些指標(biāo)不僅僅體現(xiàn)服務(wù)質(zhì)量,也體現(xiàn)服務(wù)所利用的基礎(chǔ)設(shè)施的質(zhì)量,相較于之前的架構(gòu)在性能測量方面更加直觀.

        2.2 基于故障監(jiān)測的服務(wù)高可用

        軟件架構(gòu)為服務(wù)高可用機制提供了良好的運行環(huán)境,而機制的實現(xiàn)首先依賴于故障監(jiān)測策略,其通過探測服務(wù)節(jié)點狀態(tài),為系統(tǒng)容錯提供信息支持[34].故障監(jiān)測的實現(xiàn)主要基于心跳機制,即判斷被監(jiān)測節(jié)點發(fā)出的消息能否在規(guī)定時間內(nèi)到達,從而判定被監(jiān)測節(jié)點是否發(fā)生故障.隨著系統(tǒng)規(guī)模和復(fù)雜性不斷增加,需要監(jiān)測的節(jié)點數(shù)量驟增,同時,系統(tǒng)拓撲的動態(tài)變化性、消息延遲的不可預(yù)測性等挑戰(zhàn)不斷涌現(xiàn),監(jiān)控任務(wù)更富有挑戰(zhàn)性.圍繞時效性和擴展性兩項質(zhì)量目標(biāo),故障監(jiān)測的研究方向劃分為自適應(yīng)故障監(jiān)測和共享故障監(jiān)測兩方面.

        2.2.1 自適應(yīng)故障監(jiān)測

        自適應(yīng)故障監(jiān)測是針對監(jiān)測時效性(速度、準(zhǔn)確性)的監(jiān)測優(yōu)化方法,通過動態(tài)調(diào)整心跳消息發(fā)送間隔n 和超時閾值Δt 來適應(yīng)監(jiān)測環(huán)境變化.基于上次心跳是一種復(fù)雜度較低的自適應(yīng)故障監(jiān)測方法,超時閾值取自上一次接收心跳回復(fù)時間.這種方法可以適應(yīng)網(wǎng)絡(luò)突發(fā)變化,但仍不能跟蹤網(wǎng)絡(luò)緩慢過程中的動態(tài)變化.平均心跳方法使用n 次心跳傳輸時間的平均值作為超時閾值Δt,從而作出周期性地動態(tài)自適應(yīng).索托馬在公共對象請求代理體系結(jié)構(gòu)(common object request broker architecture,CORBA)系統(tǒng)中實現(xiàn)了基于平均心跳方法的失效檢測器[35],通過真實數(shù)據(jù)驗證了平均心跳方法的自適應(yīng)性強于基于上次心跳.相比于平均心跳方法,最大心跳方法利用n 次心跳傳輸時間的最大值作為超時閾值Δt 的預(yù)測值[36],進一步改善準(zhǔn)確性.基于上次心跳和平均心跳方法都是基于人工規(guī)則設(shè)定的數(shù)值,自適應(yīng)性弱.為此,有研究將差分自回歸移動平均模型引入心跳監(jiān)測,具有更高的超時閾值預(yù)測準(zhǔn)確性,但實現(xiàn)復(fù)雜度也有所提高[37].綜合對比以上方法,基于上次心跳方法實現(xiàn)簡單、監(jiān)測較快、準(zhǔn)確性較好,平均心跳方法和最大心跳方法性能接近,差分自回歸移動平均方法預(yù)測準(zhǔn)確性最佳,但實現(xiàn)復(fù)雜度最高.

        2.2.2 共享故障監(jiān)測

        共享故障監(jiān)測是提升監(jiān)測擴展性的優(yōu)化方法.在一個節(jié)點數(shù)為n 的系統(tǒng)中,至多有n2個監(jiān)測關(guān)系.隨著系統(tǒng)規(guī)模不斷增加,被監(jiān)測節(jié)點數(shù)量和監(jiān)測關(guān)系也在不斷增加,進而導(dǎo)致巨大的監(jiān)測開銷.為了提升監(jiān)測擴展性,被監(jiān)測節(jié)點之間通過共享結(jié)果的方法減少監(jiān)測關(guān)系、降低監(jiān)測開銷,以改善監(jiān)測擴展性[38].共享故障監(jiān)測包括層次式方法和Gossip 方法.

        層次式方法利用樹或森林等特殊層次結(jié)構(gòu)組織被監(jiān)測節(jié)點,節(jié)約監(jiān)測關(guān)系以降低監(jiān)測負載,并提高監(jiān)測擴展性[39].其典型結(jié)構(gòu)如圖5 所示.

        圖5 層次式檢測方法Fig.5 Hierarchical detection method

        面向Globus 網(wǎng)格計算平臺的故障監(jiān)測協(xié)議中使用到了層次式監(jiān)測方法[40].本地主機上的每個運行進程為一個被監(jiān)測節(jié)點,每臺主機上配置一個監(jiān)測模塊,對本地主機所有運行進程實施監(jiān)測.網(wǎng)格間,不同主機相互交換本地監(jiān)測結(jié)果,進而使所有主機共享全局檢測結(jié)果.該協(xié)議是一種類兩層的結(jié)構(gòu),主機之間并沒有嚴格的層次關(guān)系,降低開銷的性能有限.BERTIER 等提出了一個雙層結(jié)構(gòu)的監(jiān)測協(xié)議[41].根據(jù)IP 地址將被監(jiān)測節(jié)點劃分到不同分組中,每個分組通過選舉產(chǎn)生一個主節(jié)點部署監(jiān)測組件,主節(jié)點監(jiān)測分組內(nèi)的節(jié)點狀態(tài),而所有的主節(jié)點通過互相交換監(jiān)測結(jié)果可形成共享.這種監(jiān)測方法形成了效率較高的層級機構(gòu),但并不適合拓撲結(jié)構(gòu)頻繁變化的系統(tǒng).

        Gossip 方法是基于概率多播協(xié)議的故障監(jiān)測方法,采用蠕蟲病毒原理的快速傳播方式,通過多輪監(jiān)測結(jié)果交換以迅速實現(xiàn)全局監(jiān)測結(jié)果共享.主要有基本Gossip 檢測器和多層Gossip 檢測器兩種實現(xiàn)形式[42].基本Gossip 檢測器是在每輪檢測中隨機選取鄰居節(jié)點進行檢測并交換檢測結(jié)果,通過數(shù)輪交換可以獲得其他所有節(jié)點狀態(tài).這種檢測器的負載不受系統(tǒng)拓撲結(jié)構(gòu)的影響,但檢測時間受算法隨機性影響.多層Gossip 檢測器是基本Gossip 檢測器與層次式方法的結(jié)合,一般在子網(wǎng)內(nèi)交換檢測結(jié)果,少數(shù)交換跨子網(wǎng)進行.因檢測負載只與子網(wǎng)數(shù)量相關(guān),進一步減少檢測時間和監(jiān)測開銷.對比分析以上兩類共享故障監(jiān)測方法,層次式方法復(fù)雜度低、擴展性強,適用于拓撲結(jié)構(gòu)相對固定的大規(guī)模系統(tǒng);Gossip方法復(fù)雜度高,不受拓撲結(jié)構(gòu)影響、擴展性強且監(jiān)測迅速快.

        2.3 基于失效恢復(fù)的服務(wù)高可用

        失效恢復(fù)是故障監(jiān)控組件提供故障報警信息后為實現(xiàn)服務(wù)接替而采取的故障切換(Failover).失效恢復(fù)的相關(guān)研究有失效恢復(fù)模型與失效恢復(fù)實現(xiàn)兩個方面.

        2.3.1 失效恢復(fù)模型

        失效恢復(fù)模型是規(guī)劃恢復(fù)策略的依據(jù),建模參考因素有失效原因、失效規(guī)律、恢復(fù)性能等.

        LAPRIE 等在云服務(wù)可靠性的研究中提出了服務(wù)失效原因與恢復(fù)策略的分類[43],如表1 所示.其中列舉了7 種服務(wù)失效原因,給出了與之對應(yīng)的重啟、重試、重構(gòu)、遷移4 種恢復(fù)策略.但是該模型沒有給出恢復(fù)策略相應(yīng)的實現(xiàn)方案.

        表1 服務(wù)失效原因與恢復(fù)策略Table 1 Causes of service failure and recovery strategies

        2013 年,顧軍等提出了一種失效恢復(fù)性能建模分析方法[44].其主要思想是采用排隊Petri 網(wǎng)來描述組合服務(wù)失效的發(fā)生與處理過程,并基于此模型研究各種失效恢復(fù)策略的運行情況.通過不同策略對系統(tǒng)整體性能影響的綜合分析,指導(dǎo)不確定網(wǎng)絡(luò)環(huán)境下失效恢復(fù)策略的實施.

        2018 年,齊平等提出了一種基于Weibull 分布的失效規(guī)律評估模型[45].Weibull 分布是一種常用于描述失效規(guī)律的負超指數(shù)分布.基于Weibull 分布的失效規(guī)律評估模型對于不同時段資源節(jié)點和通信鏈路失效規(guī)律的局部特征進行描述,根據(jù)并行任務(wù)之間存在的各類交互關(guān)系分析.2019 年,該模型進行了優(yōu)化,從負載均衡級別充分考略備選恢復(fù)資源的可靠程度[46].實驗結(jié)果表示,該模型可以提高云服務(wù)的可用性,且只增加了少量額外恢復(fù)開銷.

        2.3.2 失效恢復(fù)實現(xiàn)

        失效恢復(fù)實現(xiàn)有兩項性能指標(biāo):

        1)故障恢復(fù)時間(recovery time objective,RTO):從速度上衡量恢復(fù)策略的優(yōu)劣.RTO 值為0 時,故障立即得到恢復(fù),沒有任何中斷;RTO 值為無窮大時,服務(wù)故障無法恢復(fù).

        2)數(shù)據(jù)恢復(fù)程度(recovery point objective,RPO):從完整度上衡量恢復(fù)策略的優(yōu)劣.RPO 值為0 時,沒有任何數(shù)據(jù)丟失.RPO 大于0 時,表示恢復(fù)后有數(shù)據(jù)丟失.

        恢復(fù)策略的理想模型是RTO=RPO=0,但是實現(xiàn)開銷過大,研究與實踐中通常平衡兩者與系統(tǒng)開銷.針對降低RTO,相關(guān)方法是集群技術(shù)以及負載均衡;針對降低RPO,相關(guān)方法是分布式存儲技術(shù).

        2001 年,Alexandre Cassen 為解決Linux 虛擬服務(wù)器的配置管理,開發(fā)了主流高可用軟件之一Keepalived[47].其中在故障切換方面使用的是虛擬路由冗余協(xié)議(virtual route redundancy protocol,VRRP)來實現(xiàn)快速的服務(wù)恢復(fù).

        傳統(tǒng)故障恢復(fù)方法依賴于運行時服務(wù)狀態(tài)的備份,因此,引入了額外的系統(tǒng)開銷.2021 年,張建華等提出了一種針對優(yōu)化故障恢復(fù)性能的基于隱馬爾可夫模型的失效恢復(fù)方法[48].該方法面向虛擬機平臺,引入隱馬爾可夫模型對系統(tǒng)運行時的狀態(tài)進行預(yù)測分析,判斷系統(tǒng)未來運行狀態(tài)的概率趨勢,從而減少狀態(tài)備份產(chǎn)生的性能開銷.

        隨著容器替代虛擬機作為平臺既服務(wù)和軟件既服務(wù)層服務(wù)載體的趨勢,更多的失效恢復(fù)面向容器平臺展開.例如,一種面向容器的高可用性(high availability,HA)方案.該方案的創(chuàng)新貢獻在于引入了容器狀態(tài)的檢查點備份機制,通過一組與應(yīng)用無關(guān)的高可用代理構(gòu)成的中間件將高可用功能添加到系統(tǒng)中,不用強制修改應(yīng)用代碼.這種方式被稱為高可用無關(guān)的集成方式.將此方案運用到視頻應(yīng)用中的測試表明,故障切換時間隨視頻服務(wù)器的數(shù)量增加而增加,但RTO 性能優(yōu)于面向虛擬機的HA 方案.

        3 云視頻系統(tǒng)服務(wù)高可用方案

        云視頻系統(tǒng)的服務(wù)包括核心服務(wù)和應(yīng)用服務(wù),核心服務(wù)是應(yīng)用服務(wù)的基礎(chǔ).本章面向管理控制、信令協(xié)商、媒體處理3 項核心服務(wù),提出云視頻系統(tǒng)服務(wù)高可用方案,在實現(xiàn)核心服務(wù)高可用的同時為應(yīng)用服務(wù)高可用提供基礎(chǔ).

        3.1 核心服務(wù)架構(gòu)

        本方案現(xiàn)采用服務(wù)化架構(gòu),后期根據(jù)業(yè)務(wù)規(guī)模拓展可重構(gòu)為微服務(wù)架構(gòu).管理控制服務(wù)、信令協(xié)商服務(wù)、媒體處理服務(wù)3 項核心服務(wù)部署在不同的虛擬機服務(wù)集群上,分別為管理控制集群、信令協(xié)商集群、媒體處理集群.方案中引入了數(shù)據(jù)庫集群,存儲失效恢復(fù)所需的服務(wù)狀態(tài)數(shù)據(jù).整個核心服務(wù)軟件架構(gòu)如圖6 所示.

        圖6 云視頻系統(tǒng)服務(wù)高可用方案Fig.6 High availability solution of cloud-based video system service

        管理控制集群包含兩個主備冗余模式的管控節(jié)點,管理控制所有服務(wù)并以集群IP 方式提供主備節(jié)點的統(tǒng)一入口.數(shù)據(jù)庫集群包含3 個分布式存儲的節(jié)點,同步存儲服務(wù)狀態(tài)數(shù)據(jù).數(shù)據(jù)讀寫由管理控制集群實施,為服務(wù)失效恢復(fù)提供高可用、強一致的狀態(tài)數(shù)據(jù).信令協(xié)商集群包含多活冗余模式的N 個節(jié)點,提供終端呼叫、媒體協(xié)商服務(wù)等.媒體處理集群包含多活冗余模式的N 個節(jié)點,提供媒體轉(zhuǎn)發(fā)、媒體混流服務(wù)等.

        以視頻會議應(yīng)用為例,核心服務(wù)的工作流程如下:用戶向管理控制集群發(fā)起視頻會議請求;控制管理主節(jié)點在監(jiān)聽端口上獲取會議請求指令,通過負載均衡插件從媒體處理集群中選取若干節(jié)點以及若干空閑端口作為本地媒體流接收方;管理控制主節(jié)點通過負載均衡插件選取若干信令協(xié)商節(jié)點,并發(fā)送參會終端信息(IP 地址、呼叫端口)和媒體流接收端口;被選取的信令協(xié)商節(jié)點根據(jù)管理控制主節(jié)點提供的指令及信息,通過H.323 協(xié)議棧發(fā)起終端呼叫和媒體協(xié)商;信令協(xié)商服務(wù)將協(xié)商獲取的媒體收流端口反饋至管理控制主節(jié)點;控制管理節(jié)點開啟對應(yīng)媒體處理節(jié)點的端口收流.最終,參會終端與媒體處理節(jié)點之間可以進行媒體流收發(fā).

        分析上述工作流程可知,核心服務(wù)之間存在緊密交互,進而提供云視頻系統(tǒng)的各項功能.因此,云視頻系統(tǒng)高可用方案需分別考慮每一項核心服務(wù)的高可用機制.

        3.2 管理控制服務(wù)高可用

        管理控制服務(wù)是有狀態(tài)服務(wù),請求之間存在依賴關(guān)系,因此,服務(wù)集群采用主備冗余模式,同一時間只有主節(jié)點對外提供服務(wù),另一個節(jié)點為備用.選取虛擬路由冗余技術(shù)(virtual router redundancy protocol,VRRP)對外提供虛擬IP,終端、信令協(xié)商服務(wù)、媒體處理服務(wù)可通過此統(tǒng)一IP 訪問管理控制服務(wù)的主節(jié)點,故障切換時無須更改服務(wù)入口.主備節(jié)點之間需要相互監(jiān)測健康狀態(tài).主節(jié)點發(fā)生故障時,備節(jié)點在超時閾值Δt 后仍未收到心跳回復(fù)信息則準(zhǔn)備接替主節(jié)點.失效恢復(fù)時需遷移業(yè)務(wù),從數(shù)據(jù)庫集群讀取當(dāng)前主節(jié)點任務(wù)的服務(wù)狀態(tài),然后進行IP 漂移,將集群IP 與備用節(jié)點綁定.方案選取開源高可用組件Keepalived,其同時包含VRRP技術(shù)和上次心跳方法的心跳監(jiān)測,監(jiān)測快速準(zhǔn)確且簡單易集成.

        3.3 信令協(xié)商服務(wù)高可用

        信令協(xié)商服務(wù)是無狀態(tài)服務(wù),因此該服務(wù)集群一般采取雙活或多活冗余模式,同一時間由多個活動節(jié)點對外提供服務(wù),保證高可用性和高并發(fā)性.信令協(xié)商服務(wù)的健康狀態(tài)由管理控制服務(wù)監(jiān)測,采取拉模式的心跳連接.監(jiān)測實現(xiàn)采用基于超文本傳輸協(xié)議(hyper text transfer protocol,HTTP)的平均心跳方法.HTTP 協(xié)議中自帶超時監(jiān)測機制,但是監(jiān)測頻率固化,方案中引入平均心跳方法可以提升超時檢測的準(zhǔn)確性,使超時閾值Δt 動態(tài)適應(yīng)網(wǎng)絡(luò)變化.

        信令協(xié)商服務(wù)故障時,管理控制節(jié)點根據(jù)故障原因,選擇重試策略或遷移策略,兩種策略的狀態(tài)恢復(fù)數(shù)據(jù)起點不一樣,將會影響RTO 與RPO.例如,一類故障是發(fā)生在信令協(xié)商的過程中,終端還未進入收發(fā)流,此時大多采用重試策略,仍在原有的信令協(xié)商節(jié)點上重試呼叫或協(xié)商,RPO 較小.還有一類故障發(fā)生在終端參與媒體會話過程中,信令協(xié)商服務(wù)如果采用重試策略其RPO 可能會高于遷移策略.

        3.4 媒體處理服務(wù)高可用

        媒體處理服務(wù)也屬于無狀態(tài)服務(wù),其任務(wù)數(shù)量和節(jié)點數(shù)量更多,冗余模式一般采用多活模式.另外,針對實時視頻通信的特點,故障恢復(fù)期間不需要重傳丟失的視頻數(shù)據(jù),管理控制服務(wù)僅提供給媒體處理服務(wù)若干媒體會話相關(guān)的服務(wù)狀動態(tài)適應(yīng)網(wǎng)絡(luò)變化態(tài).

        綜合上述3 項核心服務(wù)高可用機制所形成的云視頻系統(tǒng)服務(wù)高可用方案可以應(yīng)對節(jié)點宕機、離線等服務(wù)失效.其參考了主流服務(wù)高可用技術(shù)和業(yè)界用例,具有理論依據(jù).在監(jiān)測和恢復(fù)方面結(jié)合了視頻業(yè)務(wù)特性,并引入數(shù)據(jù)庫集群存儲狀態(tài)數(shù)據(jù),具有創(chuàng)新特點.

        4 指揮控制領(lǐng)域應(yīng)用展望

        云視頻系統(tǒng)已經(jīng)邁入高速發(fā)展階段,不斷滿足超高業(yè)務(wù)吞吐量、超高連接數(shù)并發(fā)、超高可用性等服務(wù)需求,同時與工業(yè)、交通、軍事等場景深度融合,賦能可視化、信息化指揮控制領(lǐng)域應(yīng)用.本章展望了云視頻系統(tǒng)服務(wù)高可用技術(shù)在態(tài)勢感知和虛擬戰(zhàn)場中的應(yīng)用前景,并探討了面對復(fù)雜的網(wǎng)絡(luò)安全環(huán)境時存在的問題與挑戰(zhàn).

        態(tài)勢感知.未來,云視頻系統(tǒng)可應(yīng)用于態(tài)勢感知,有效發(fā)揮其高可用、動態(tài)、快速的態(tài)勢數(shù)據(jù)傳輸、流轉(zhuǎn)服務(wù)能力.戰(zhàn)場態(tài)勢感知的處理過程分為覺察、理解和預(yù)測3 個層次[49],依賴于陸、海、空、天多維空間中的傳感器設(shè)備[50],其部署場景計算能力弱、網(wǎng)絡(luò)環(huán)境復(fù)雜.服務(wù)高可用技術(shù)將是云視頻系統(tǒng)作用于態(tài)勢感知的關(guān)鍵.其可監(jiān)測傳感器網(wǎng)絡(luò)的完整性,保證態(tài)勢數(shù)據(jù)傳輸服務(wù)穩(wěn)定連續(xù),避免服務(wù)超載和服務(wù)失效等故障.除傳統(tǒng)傳感器設(shè)備以外,云機器人圖像采集設(shè)備將作為態(tài)勢感知的新型終端[51].云端需實現(xiàn)高可用的計算服務(wù)、媒體分發(fā)服務(wù),進而為瞬息萬變的戰(zhàn)場態(tài)勢感知提供可靠媒體服務(wù)保障.

        虛擬戰(zhàn)場.云視頻系統(tǒng)為虛擬現(xiàn)實(virtual reality,VR)設(shè)備提供廣泛接入,高效可靠地處理設(shè)備所產(chǎn)生的大量視頻數(shù)據(jù),再將預(yù)測處理后的結(jié)果反饋到終端設(shè)備.虛擬戰(zhàn)場是VR 技術(shù)在軍事斗爭準(zhǔn)備中的應(yīng)用,具有現(xiàn)實符合性和未來預(yù)判性[52].VR 設(shè)備對時延要求極高,因此,服務(wù)高可用性非常關(guān)鍵,能夠快速響應(yīng)故障并從中恢復(fù)服務(wù)能力,將影響虛擬戰(zhàn)場指戰(zhàn)員的穿戴體驗和戰(zhàn)場模擬的有效性.未來,云視頻系統(tǒng)故障恢復(fù)RTO 需降低至毫秒級以適配虛擬戰(zhàn)場的時延要求.依托服務(wù)高可用技術(shù),云視頻系統(tǒng)大量豐富多樣的媒體應(yīng)用服務(wù)有了完備的容災(zāi)備份機制.虛擬戰(zhàn)場得以持續(xù)可靠地提供一個多感官模擬的三維世界,提升指戰(zhàn)員使用體驗.

        面向異構(gòu)復(fù)雜的指揮控制環(huán)境,還必須將服務(wù)可用性和服務(wù)安全性合并考量.當(dāng)前,云視頻系統(tǒng)使得海量高清多媒體數(shù)據(jù)得以實時交互,提高了指揮控制系統(tǒng)的信息共享能力.然而,隨著云平臺、5G 等技術(shù)的融入,勢必在提高通信效能的同時引入新的網(wǎng)絡(luò)安全風(fēng)險因素[53-54].與其他系統(tǒng)不同之處在于,云視頻系統(tǒng)為保證服務(wù)高可用,必須設(shè)置冗余的備份,可能成為敵方網(wǎng)絡(luò)安全攻擊的對象.從網(wǎng)絡(luò)安全機制對服務(wù)高可用性的影響角度來看,信道加密、信源加密、用戶身份認證鑒權(quán)等安全手段因其復(fù)雜性或?qū)⒂绊懛?wù)故障切換速率.總的來說,對于云視頻這類交互信息量廣且意深的系統(tǒng)而言,網(wǎng)絡(luò)安全機制和服務(wù)高可用機制之間存在著平衡做法而非矛盾關(guān)系,在今后的研究中可以協(xié)同發(fā)展.

        5 結(jié)論

        云視頻系統(tǒng)在服務(wù)高可用性上獲得了長足進步,尤其是在縮短故障響應(yīng)時間和優(yōu)化失效恢復(fù)策略方面有顯著提高,增加了其在指揮控制領(lǐng)域應(yīng)用的廣度和深度.同時,云視頻服務(wù)高可用也面臨占用額外系統(tǒng)資源、產(chǎn)生巨大性能開銷等問題挑戰(zhàn).本文從提出云視頻系統(tǒng)服務(wù)高可用需求出發(fā),梳理了服務(wù)高可用相關(guān)的軟件架構(gòu)演進、故障檢測及失效恢復(fù)技術(shù)發(fā)展,并總結(jié)分析各類方法的優(yōu)缺點.合理指出應(yīng)權(quán)衡監(jiān)測開銷與準(zhǔn)確性、恢復(fù)開銷與完整性之間的矛盾.文中結(jié)合云視頻系統(tǒng)的服務(wù)特點,提出了一種創(chuàng)新、可行的云視頻系統(tǒng)服務(wù)高可用方案,并展望了服務(wù)高可用的云視頻系統(tǒng)在指揮控制領(lǐng)域中的應(yīng)用,闡述分析了其與網(wǎng)絡(luò)安全之間的問題.以期為讀者了解主流服務(wù)高可用技術(shù),設(shè)計服務(wù)高可用的云視頻系統(tǒng),構(gòu)想服務(wù)高可用云視頻系統(tǒng)在指揮控制領(lǐng)域中的前景提供幫助.

        猜你喜歡
        故障服務(wù)系統(tǒng)
        Smartflower POP 一體式光伏系統(tǒng)
        WJ-700無人機系統(tǒng)
        ZC系列無人機遙感系統(tǒng)
        北京測繪(2020年12期)2020-12-29 01:33:58
        故障一點通
        服務(wù)在身邊 健康每一天
        服務(wù)在身邊 健康每一天
        服務(wù)在身邊 健康每一天
        連通與提升系統(tǒng)的最后一塊拼圖 Audiolab 傲立 M-DAC mini
        招行30年:從“滿意服務(wù)”到“感動服務(wù)”
        商周刊(2017年9期)2017-08-22 02:57:56
        奔馳R320車ABS、ESP故障燈異常點亮
        亚洲青青草视频在线播放| 色欲aⅴ亚洲情无码av| 一本一道av无码中文字幕﹣百度 | 天堂av中文在线官网 | 麻豆网神马久久人鬼片| 韩国19禁无遮挡啪啪无码网站| 中文字幕在线观看国产双飞高清| 国产成人久久综合第一区| 亚洲精品国产精品乱码视色| 色播亚洲视频在线观看| 国产av一区二区三区在线播放 | 人妻人妇av一区二区三区四区 | 富婆叫鸭一区二区三区| 少妇下面好爽好紧好湿一区二区| 亚洲熟妇无码一区二区三区导航| 国产成人午夜精品免费视频| 亚洲国产精品一区二区第一| 中国黄色一区二区三区四区| 各种少妇正面着bbw撒尿视频| 久久国产成人精品国产成人亚洲| aa视频在线观看播放免费| 白白色发布的在线视频| 欧美白人战黑吊| 永久免费观看国产裸体美女| 中文不卡视频| 精品国产av一区二区三四区| av无码电影一区二区三区| 在线亚洲人成电影网站色www| 日本岛国精品中文字幕| 少妇被粗大的猛进69视频| 狠狠的干性视频| 九九精品视频在线观看| 亚洲精品在线观看一区二区 | 亚洲一区在线观看中文字幕| 国产黄在线观看免费观看不卡 | 色一情一乱一伦一区二区三区| 一区二区在线亚洲av蜜桃| 一级内射免费观看视频| 精品久久人妻av中文字幕| 国产最新地址| 亚洲一区二区三区厕所偷拍|