曹輝 史勝偉 劉培 公安部第一研究所
2020年底,工信部印發(fā)了《“工業(yè)互聯(lián)網(wǎng)+安全生產(chǎn)”行動計劃(2021-2023年)》,其中提出推進邊緣云和5G+邊緣計算能力建設,下沉計算能力,實現(xiàn)精準預測、智能預警和超前預警的目標。隨著移動警務手機在全國各地的普及,推動了邊緣計算的發(fā)展。而萬物互聯(lián)、萬物感知的智能社會,則是跟物聯(lián)網(wǎng)發(fā)展相伴而生,邊緣計算系統(tǒng)也因此應聲而出。隨著云計算的發(fā)展,端邊云的協(xié)同是必然趨勢。這對警用通信技術提出了新的要求,在滿足各類警用物聯(lián)網(wǎng)設備互聯(lián)互通的同時,要解決安全問題。公安部第一研究所通信技術事業(yè)部首先提出了警用數(shù)據(jù)鏈(Police Data Link,PDL)的概念,警用數(shù)據(jù)鏈是實現(xiàn)警務物聯(lián)網(wǎng)設備互聯(lián)互通的安全通信組件,用于支撐警務物聯(lián)網(wǎng)設備相關業(yè)務,采用發(fā)布/訂閱模式進行數(shù)據(jù)傳送。
運維,顧名思義維系運行。每個信息系統(tǒng),交付后的運維從來都是必不可少的重要一環(huán)。從最開始的人工運維,每每系統(tǒng)出現(xiàn)故障,只能由工程師去查看系統(tǒng)日志,分析可能的問題所在,這往往需要依賴工程師過往的經(jīng)驗積累;到自動化運維,系統(tǒng)的無人值守,最終目標是實現(xiàn)系統(tǒng)的智能化運維。
警用數(shù)據(jù)鏈是為滿足在不同環(huán)境下執(zhí)行多種任務的各級公安機關共享現(xiàn)場態(tài)勢和實時指揮控制的需求,滿足系統(tǒng)、人、物間主動信息交互、任務協(xié)同需求,充分利用現(xiàn)有公安各類信息系統(tǒng)和通信系統(tǒng)資源,采用標準化消息傳輸協(xié)議、靈活可靠的組網(wǎng)方式、安全保密的通信傳輸信道,而構成的一種警用通信技術。
警用數(shù)據(jù)鏈由三部分組成:警務物聯(lián)網(wǎng)消息協(xié)議(PMQ)、警用物聯(lián)網(wǎng)管理模塊(PDLM)、數(shù)據(jù)字典,如圖1所示。
圖1 警用數(shù)據(jù)鏈組成
警用數(shù)據(jù)鏈在邏輯上分為三層:通信層、警務物聯(lián)網(wǎng)消息協(xié)議層(PMQ)、管理層(PDLM)。通信層需要建立安全的通信鏈路,針對不同的物理介質,其安全方案不同,目前可支持安全局域網(wǎng)、有線、APN等,對上層是透明的,如圖2所示。
圖2 警用數(shù)據(jù)鏈邏輯框圖
警用數(shù)據(jù)鏈應用于新一代移動警務體系可以分為三層:云、邊、端。終端設備上的應用程序可以直接經(jīng)PDL與平臺相關業(yè)務通信,也可經(jīng)邊設備后的PDL與平臺或其他終端設備通信。移動警務平臺、智能網(wǎng)關、警用終端設備可以視為移動警務云邊端三級架構,如圖3所示??紤]到警用設備的多樣性,設備跨越年代較長,針對老舊設備的運維管理占據(jù)了各地方公安人員日常工作相當?shù)谋戎亍?/p>
圖3 移動警務云邊端三級架構
警用數(shù)據(jù)鏈可以分為管理通道和業(yè)務通道。管理通道以發(fā)布/訂閱模式對設備安全接入、數(shù)據(jù)加密、授權管理、協(xié)同業(yè)務等進行安全管控;業(yè)務通道主要負責設備本身的實時業(yè)務數(shù)據(jù)傳輸。
AIOps(Artificial Intelligence for IT Operations,智能化運維)是著名IT咨詢公司Gartner于2016年首次提出的概念,經(jīng)過幾年的發(fā)展,目前已經(jīng)成為運維技術發(fā)展的必然趨勢。
近幾年,人工智能技術發(fā)展很快,通常理解的智能運維是把人工智能技術應用在IT運維領域,替代人工進行風險管理決策。從通過機器實現(xiàn)自動化流程、替代人工并解放運維人員的根本需求出發(fā),能替代人腦進行運維決策、人手管理配置的算法和工具都可以稱為智能運維系統(tǒng)。IT運維管理通過程序實現(xiàn)軟件、硬件的自動管理,這已經(jīng)是智能運維的初級階段。未來,智能運維技術借助概率計算、深度神經(jīng)網(wǎng)絡、因果推理分析等高級人工智能算法,將進一步提升系統(tǒng)自主分析決策能力,實現(xiàn)自治程度更高的智能運維。
AIOps,通俗地講,是對規(guī)則的AI化,即將人工總結運維規(guī)則的過程變?yōu)闄C器學習的過程。具體而言,就是針對平時運維工作中長時間積累形成的自動化運維和監(jiān)控等能力,將其規(guī)則配置部分通過機器自學習的方式進行“去規(guī)則化”改造,最終達到終極目標:有AI調度中樞管理的,質量、成本、效率三者兼顧的無人值守運維,力爭所經(jīng)營系統(tǒng)的綜合收益最大化。
5G時代日益復雜化和智能化的網(wǎng)絡,要求更加智能化的運維技術。但是,傳統(tǒng)的運維方式在面對日益復雜的運維問題、海量的運維設備和運維數(shù)據(jù)時,已經(jīng)顯得越來越無能為力。因此,以人工智能賦能運維,基于已有的大量運維數(shù)據(jù)(日志、監(jiān)控信息、資源數(shù)據(jù)等),通過機器學習的方式,實現(xiàn)統(tǒng)一、完整、閉環(huán)和智能化的運維,提高系統(tǒng)的預判能力、分析能力和穩(wěn)定性,成為大勢所趨。
智能運維的目標是在非完美的軟硬件之上,利用大數(shù)據(jù)、機器學習和其他分析技術,通過預防預測、個性化和動態(tài)分析,直接和間接增強IT業(yè)務的相關技術能力,實現(xiàn)所維護產(chǎn)品或服務的更高質量、合理成本及高效支撐。其實質就是通過人工智能技術、圍繞質量保障、效率提升和成本管理等方向,從簡單智能化到完全智能化,最終達到自主式自愈和無人值守的智能化目標。
由于警用數(shù)據(jù)鏈管理通道是以發(fā)布/訂閱模式進行通信的,所以警用設備運維的重點就是網(wǎng)絡是否正常。以攝像頭為例,維護人員最常使用的方法是通過網(wǎng)絡訪問其管理頁面來判斷其工作正常與否。根據(jù)智能網(wǎng)關工作方式不同,可以分為離線模式、聯(lián)網(wǎng)模式和上下級配合三種模式。
1. 離線模式
在智能網(wǎng)關離線模式使用的情況下,通過智能網(wǎng)關基于網(wǎng)絡實時狀況管理其下掛終端側。由于警務物聯(lián)網(wǎng)消息協(xié)議(PMQ)是在MQTT(Message Queue Telemetry Transport)協(xié)議的基礎上規(guī)范了主題字段并重新封裝了載荷部分。PMQ協(xié)議中載荷部分結構見表1。其中,使用HMAC作為PMQ協(xié)議中載荷部分的校驗值,填充數(shù)據(jù)使用SM1或者SM4國密對稱加密算法進行加密,管理通道數(shù)據(jù)使用主密鑰進行加密。
表1 PMQ協(xié)議中載荷部分結構
PMQ繼承了MQTT協(xié)議簡單易用、支持QoS、報文小、輕量、節(jié)省帶寬、可以時刻感知設備是否在線等特點。具體來說,警用終端設備向智能網(wǎng)關周期性發(fā)送CONNECT報文表明存活狀態(tài),智能網(wǎng)關回復CONNECTACK應答控制報文對下掛設備進行響應,這是一個完整的心跳流程。
智能網(wǎng)關在未收到下線請求前,如果警用終端設備心跳異常,智能網(wǎng)關會嘗試通過管理通道遠程重啟終端設備的軟件。在數(shù)次重啟不成功后,則通過網(wǎng)關管理界面推送告警信息,提示網(wǎng)關管理員盡快檢查警用終端設備。
2. 聯(lián)網(wǎng)模式
在智能網(wǎng)關聯(lián)網(wǎng)模式使用的情況下,各個聯(lián)網(wǎng)網(wǎng)關會基于網(wǎng)絡實時狀況向移動警務平臺發(fā)送心跳消息。在平臺未收到下線請求前,如果智能網(wǎng)關心跳異常,移動警務平臺會嘗試遠程重啟智能網(wǎng)關的軟件。在數(shù)次重啟不成功后,則通過平臺管理界面推送告警信息,并向網(wǎng)關管理員發(fā)送短信盡快檢查智能網(wǎng)關。
3. 上下級配合式
在智能網(wǎng)關有上級平臺且在線模式使用的情況下,智能網(wǎng)關作為邊側,直接管理其下掛設備的網(wǎng)絡狀況,同時移動警務平臺管理智能網(wǎng)關的網(wǎng)絡狀況。上下級配合式除了能實現(xiàn)離線和聯(lián)網(wǎng)模式下的功能,還可以將網(wǎng)關及其下掛設備異常信息反饋到平臺側進行人工智能算法分析,在決策后觸發(fā)相應的處理辦法。
根據(jù)警務物聯(lián)網(wǎng)消息協(xié)議(PMQ)中主題字段的分級規(guī)劃,可以在不解析PMQ載荷部分就可以知道傳輸?shù)臄?shù)據(jù)類型、傳輸上下級對象等信息。基于此,平臺側根據(jù)人工智能算法周期性評估各智能網(wǎng)關的網(wǎng)絡情況,在網(wǎng)絡環(huán)境不穩(wěn)定的時候,可以直接對傳輸量很大的數(shù)據(jù)類型進行載荷消息的主動校驗,從而判定消息是否完整。在完成當前處理后,會記錄到平臺側形成閉環(huán),提高系統(tǒng)的預判能力、分析能力和穩(wěn)定性。
警用數(shù)據(jù)鏈業(yè)務通道是根據(jù)警用終端設備原有業(yè)務方式實現(xiàn)的通路。根據(jù)警用終端設備能力不同,可以分為啞終端和智能終端;根據(jù)業(yè)務性質不同又可以分為文字業(yè)務、語音業(yè)務和視頻業(yè)務等。通過集中監(jiān)控、指標監(jiān)控、日志分析、故障排查等手段,給運維人員減負。同時利用人工智能算法判斷出哪些故障需要人工修復,進一步向著理想的設備故障自愈的效果前進。
1. 文字業(yè)務
文字業(yè)務是三種業(yè)務中負載量最小的實時業(yè)務,智能運維可以通過對設備日志的分析,動態(tài)檢測設備的運行狀態(tài),許多漏報不一定能從指標監(jiān)控改造中獲取,就需要加強對日志的利用。通過傳入和傳出的文字消息,檢測出偏離正常網(wǎng)絡行為的潛在危險。同時針對海量日志及不同模塊間的日志,可以進行收集并學習,為同類型的設備狀態(tài)檢測提供依據(jù)。
同時,考慮到文字業(yè)務對通道占用較少的特點,通過警用數(shù)據(jù)鏈主題對消息進行流轉,位于端側的強算力終端,甚至可以在本地對其他端側設備繼續(xù)輔助運維,例如移動警務手機可以有效分析身份證讀卡器工作是否正常等。
2. 語音業(yè)務
在智能網(wǎng)關有一定算力的情況下,在管理通道配以基于動態(tài)閾值的網(wǎng)絡運維異常檢測。通常來說網(wǎng)絡指標的時序數(shù)據(jù)會表現(xiàn)出較明顯的運行規(guī)律,一旦出現(xiàn)異常,則可以判定業(yè)務的流轉出現(xiàn)異常。這樣就實現(xiàn)了在不占用業(yè)務通道的條件下,及時準確評估當前業(yè)務通道的網(wǎng)絡情況。另外,也可以根據(jù)語音流進行質量評估,從而計算出當前網(wǎng)絡狀況下最合適的傳輸速率。
3. 視頻業(yè)務
視頻業(yè)務和語音業(yè)務一樣,可以在管理通道實行網(wǎng)絡運維異常檢測。隨著硬件算力的不斷提高,針對視頻處理已經(jīng)達到了實用程度。在智能網(wǎng)關側,配合特定的AI算力,可以在網(wǎng)關側檢測出當前視頻流的傳輸狀態(tài)。當檢測到視頻流長時間異常后,可以通過警用數(shù)據(jù)鏈管理通道向管理員推送告警信息,對相關設備進行人工檢查。
隨著自主操作系統(tǒng)鴻蒙的發(fā)展,設備間的互聯(lián)互通、應用協(xié)作正在成為現(xiàn)實。誠然,智能運維已經(jīng)在實際落地過程中取得了一定的成果,但是進一步研究移動警務端邊設備如何靈活應用、服務公安系統(tǒng),研究智能運維在警用設備領域具有普適性應用將是未來需要解決的問題。
AIOps不僅僅是技術或產(chǎn)品,更是一種理念和策略。智能運維以數(shù)據(jù)為基礎,場景為導向,算法為支撐,為警用數(shù)據(jù)鏈現(xiàn)有運維管理工具和管理體系賦予統(tǒng)一數(shù)據(jù)管控能力和智能化數(shù)據(jù)分析能力?;诰脭?shù)據(jù)鏈物聯(lián)網(wǎng)消息協(xié)議對不同網(wǎng)絡架構、不同業(yè)務類型的設備進行智能運維,可以提升運維管理效率,打造智能安防與警用產(chǎn)品,用實際行動助推科技強警的戰(zhàn)略。