宋晶晶
摘要:針對通信站點分散、自然條件惡劣、不適宜派駐人員值守的狀況,提出了一種基于無人值守的綜合網(wǎng)絡(luò)管理系統(tǒng)模式。介紹了該系統(tǒng)的工作模式、軟件功能、軟件控制流程、軟件運行的軟硬件環(huán)境及其性能。重點闡述了軟件的控制流程。實現(xiàn)了無人值守狀態(tài)下設(shè)備遠(yuǎn)程通信狀態(tài)監(jiān)控、故障診斷定位及故障修復(fù)工作,有效縮減了人力資源及交通等成本,提高了效率。系統(tǒng)測試驗證了其在實際工作中的可行性。
關(guān)鍵詞:無人值守;綜合網(wǎng)絡(luò)管理系統(tǒng);自動化;遠(yuǎn)程監(jiān)控
中圖分類號:TP393文獻(xiàn)標(biāo)志碼:A文章編號:1008-1739(2022)11-54-4
綜合網(wǎng)絡(luò)管理系統(tǒng)作為一個實用的、集成的、可普及的集成管理工具,已被各企業(yè)普遍使用。但實際情況中,部分站點分布廣且位于交通不發(fā)達(dá)地區(qū),有些站點自然條件非常惡劣,派駐人員值守管理有很大困難,且隨著企業(yè)通信崗位大幅縮減及勞動力成本的不斷提高,很多站點處于無人或少人的狀態(tài)。基于無人值守的綜合網(wǎng)絡(luò)管理系統(tǒng),在無人值守的情況下,對設(shè)備及環(huán)境進行集中監(jiān)控,對數(shù)據(jù)進行及時采集,以便及時了解現(xiàn)場的情況,并根據(jù)實際情況發(fā)送一些簡單的控制命令,實現(xiàn)遠(yuǎn)程通信狀態(tài)監(jiān)控、故障診斷定位及故障修復(fù)工作[1],有效縮減了人力資源及交通等成本,提高了效率。
無人值守遠(yuǎn)程控制系統(tǒng)由遠(yuǎn)端綜合站控軟件和本地綜合網(wǎng)管軟件組成。遠(yuǎn)端綜合站控軟件提供無人值守及自動化管理能力[2],功能上等價于遠(yuǎn)端站智能代理;本地綜合網(wǎng)管軟件提供遠(yuǎn)程管控能力,功能上等價于管理員。無人值守的綜合網(wǎng)絡(luò)管理系統(tǒng)組成如圖1所示。
系統(tǒng)設(shè)計堅持高可靠性、實時性、實用性、兼容性、模塊化、可維護性、可擴展性和易升級的原則,兼顧經(jīng)濟性。
無人值守的遠(yuǎn)程控制網(wǎng)絡(luò)管理系統(tǒng)主要包括設(shè)備自檢、鏈路檢測、故障診斷、預(yù)案管理及系統(tǒng)維護五大功能模塊。各模塊之間協(xié)作完成各項功能;各個模塊作為多個可執(zhí)行程序在后臺自動啟動運行[3]。當(dāng)終端首次登錄網(wǎng)管軟件,并且通過安全驗證,該軟件會與自身各模塊進行一次內(nèi)部通信,檢測模塊是否已經(jīng)正常啟動并且運行正常。如果存在某個模塊未正常啟動或響應(yīng)異常,則通過后臺服務(wù)監(jiān)控程序?qū)υ撃K進行重啟,并在事件欄打印相關(guān)信息,通告給操作人員。
遠(yuǎn)端綜合站控設(shè)備自檢模塊為本地綜合網(wǎng)管設(shè)備監(jiān)測提供實時數(shù)據(jù)支撐[4];遠(yuǎn)端綜合站控鏈路檢測模塊為本地綜合網(wǎng)管鏈路監(jiān)測提供實時鏈路質(zhì)量數(shù)據(jù);本地綜合網(wǎng)管故障診斷調(diào)用遠(yuǎn)端綜合站控故障診斷模塊執(zhí)行故障診斷;遠(yuǎn)端綜合站控執(zhí)行本地綜合網(wǎng)管下發(fā)的預(yù)案;遠(yuǎn)端綜合站控自動巡檢為本地綜合網(wǎng)管遠(yuǎn)程維護上報巡檢結(jié)果。
2.1軟件功能
(1)設(shè)備自檢
設(shè)備自檢包括特征參數(shù)的檢測和診斷評估自身運行狀態(tài),各類設(shè)備對外提供信息輸出接口,由綜合網(wǎng)絡(luò)管理系統(tǒng)軟件匯集并上報。通過自檢,可以獲悉各設(shè)備是否運行正常,是否需要維護或技術(shù)支持。對于主備設(shè)備,可以進行“或”的操作,即有一臺可以正常運行即可保障系統(tǒng)正常運行;對于上、下行串聯(lián)設(shè)備,則進行“與”的操作,即有一臺(套)設(shè)備工作異常,則無法保障系統(tǒng)正常運行。
(2)鏈路檢測
綜合網(wǎng)絡(luò)管理軟件定時檢測鏈路的連通性、時延、丟包率和收發(fā)速率等質(zhì)量信息,將鏈路測試結(jié)果收集,生成鏈路檢測報告,上報綜合網(wǎng)管鏈路監(jiān)測模塊,若有告警則上報綜合網(wǎng)管拓?fù)浔O(jiān)控模塊。任務(wù)執(zhí)行前,通信綜合網(wǎng)管將鏈路測試結(jié)果收集,生成鏈路狀態(tài)統(tǒng)計評估報告,評估通信鏈路對任務(wù)的支撐能力。當(dāng)鏈路建立成功后,綜合網(wǎng)管軟件會向遠(yuǎn)端軟件發(fā)送小包數(shù)據(jù)驗證鏈路通信狀況,若收發(fā)延遲穩(wěn)定、無丟包情況,則判定通信正常;若收發(fā)延遲跳變或丟包率高,則判定通信鏈路不穩(wěn)定;若發(fā)包無響應(yīng),則判定通信異常。
(3)故障診斷
故障診斷是由網(wǎng)管系統(tǒng)軟件發(fā)起故障診斷命令,設(shè)備經(jīng)過查詢后將故障源信息上報網(wǎng)管系統(tǒng)。網(wǎng)管系統(tǒng)軟件監(jiān)控到設(shè)備故障或鏈路異常,向相關(guān)設(shè)備發(fā)起故障診斷指令,如果設(shè)備定位故障,則將故障源上報綜合網(wǎng)管系統(tǒng)。設(shè)備進行故障判斷,首先,以設(shè)備通斷狀態(tài)為基礎(chǔ),設(shè)備中斷則判定設(shè)備不正常;其次,檢測設(shè)備狀態(tài)參數(shù),如溫度過高告警等,如果這些參數(shù)異常,則判定設(shè)備不正常,系統(tǒng)無法正常工作;最后,檢測設(shè)備的性能參數(shù),如累計加電時間,若累計加電時間超過了設(shè)備安全使用上限,則判定設(shè)備存在風(fēng)險、系統(tǒng)運行存在風(fēng)險。
(4)預(yù)案管理
預(yù)案管理功能預(yù)先錄入需要修改的設(shè)備參數(shù)及參數(shù)值,通過執(zhí)行預(yù)案完成對多類設(shè)備參數(shù)的統(tǒng)一、有序修改,從而達(dá)到一鍵更換遠(yuǎn)端站點設(shè)備配置的目的。預(yù)案管理功能包括預(yù)案生成、預(yù)案編輯、預(yù)案傳輸、預(yù)案解析和預(yù)案執(zhí)行。預(yù)案管理功能的操作對象為預(yù)案文件,預(yù)案文件通過IP網(wǎng)傳輸,使用UDP協(xié)議。預(yù)案管理功能可以有效縮短遠(yuǎn)端站點執(zhí)行不同任務(wù)時任務(wù)轉(zhuǎn)換的時間,減少人員操作,提高系統(tǒng)容錯率。
(5)系統(tǒng)維護
系統(tǒng)維護主要是針對系統(tǒng)內(nèi)各設(shè)備和鏈路的狀態(tài),進行自動巡檢,并生成巡檢報告,上報本地綜合網(wǎng)管軟件。通過自動巡檢報告可評估當(dāng)前系統(tǒng)正常完成任務(wù)的可能性;可以預(yù)測設(shè)備失效率,提前進行設(shè)備維修和更換。巡檢報告內(nèi)容包括記錄設(shè)備當(dāng)前狀態(tài),以及周期內(nèi)設(shè)備狀態(tài)統(tǒng)計;記錄主要鏈路當(dāng)前狀態(tài),以及周期內(nèi)主要鏈路狀態(tài)統(tǒng)計。
2.2軟件控制流程
本地綜合網(wǎng)管軟件具備遠(yuǎn)程監(jiān)控能力,包括設(shè)備狀態(tài)信息監(jiān)控、拓?fù)錉顟B(tài)監(jiān)視及資源信息管理等。主要完成心跳監(jiān)測、資源管理、設(shè)備監(jiān)測、鏈路監(jiān)測、拓?fù)浔O(jiān)視、故障診斷、預(yù)案管理和遠(yuǎn)程維護幾大功能。
心跳監(jiān)測是為了確保實時監(jiān)測遠(yuǎn)端綜合站控軟件的入網(wǎng)狀態(tài),在本地綜合網(wǎng)管和遠(yuǎn)端綜合站控軟件之間定時進行的一問一答式的動作。
資源管理是本地綜合網(wǎng)管軟件,對遠(yuǎn)端綜合站控軟件的所有資源信息具備管理能力,包括查詢、添加、修改和刪除。數(shù)據(jù)處理過程由本地綜合網(wǎng)管軟件發(fā)起,遠(yuǎn)端綜合站控軟件進行響應(yīng)處理和應(yīng)答。
設(shè)備監(jiān)測是遠(yuǎn)端綜合站控軟件實時將各變化的設(shè)備自檢參數(shù)上報。設(shè)備狀態(tài)信息監(jiān)視分為本地綜合網(wǎng)管軟件主動查詢和遠(yuǎn)端綜合站控軟件主動上報2種,主動查詢由本地綜合網(wǎng)管軟件發(fā)起,遠(yuǎn)端綜合站控軟件將當(dāng)前設(shè)備狀態(tài)參數(shù)信息返回;主動上報是指遠(yuǎn)端綜合站控軟件通過系統(tǒng)自檢或輪詢檢測到設(shè)備狀態(tài)變化后,主動上報本地綜合網(wǎng)管軟件。
鏈路監(jiān)測是遠(yuǎn)端綜合站控軟件實時將鏈路質(zhì)量上報本地綜合網(wǎng)管。通信綜合網(wǎng)管支持對任務(wù)鏈路進行自動檢查及測試。通信綜合網(wǎng)管定時監(jiān)測鏈路的連通性和時延等質(zhì)量信息,任務(wù)執(zhí)行前,通信綜合網(wǎng)管將鏈路測試結(jié)果收集,生成鏈路狀態(tài)統(tǒng)計評估報告,評估通信鏈路對任務(wù)的支撐能力。
拓?fù)浔O(jiān)視提供遠(yuǎn)端綜合站控端站內(nèi)設(shè)備連接關(guān)系及連接狀態(tài)信息,若軟件監(jiān)測到設(shè)備狀態(tài)或網(wǎng)絡(luò)連接狀態(tài)變化,則主動將拓?fù)鋽?shù)據(jù)打包壓縮處理后上報本地綜合網(wǎng)管。通過拓?fù)溥B接關(guān)系視圖,可以清晰顯示各設(shè)備及鏈路等的連接關(guān)系,及軟件與后臺服務(wù)的連接狀態(tài)和設(shè)備自檢狀態(tài)。
故障診斷提供故障的定位功能:本地綜合網(wǎng)管發(fā)現(xiàn)遠(yuǎn)端設(shè)備故障后向遠(yuǎn)端綜合站控軟件發(fā)起故障診斷請求,遠(yuǎn)端綜合站控軟件將查詢的故障源信息打包發(fā)送至本地綜合網(wǎng)管。
預(yù)案管理支持任務(wù)預(yù)案和應(yīng)急預(yù)案:本地綜合網(wǎng)管生成預(yù)案文件,下發(fā)至遠(yuǎn)端綜合站控,遠(yuǎn)端綜合站控解析預(yù)案文件,下發(fā)被管對象執(zhí)行(包括參數(shù)配置和鏈路切換等操作),被管對象將配置生效情況上報遠(yuǎn)端綜合站控,遠(yuǎn)端綜合站控生成預(yù)案執(zhí)行結(jié)果的回饋文件,將預(yù)案執(zhí)行結(jié)果上報本地綜合網(wǎng)管。預(yù)案管理功能的操作對象為預(yù)案文件。預(yù)案文件通過IP網(wǎng)傳輸,使用UDP協(xié)議。執(zhí)行任務(wù)前,本地綜合網(wǎng)管制定預(yù)案并下發(fā),若任務(wù)中監(jiān)控到網(wǎng)絡(luò)故障,本地綜合網(wǎng)管下發(fā)緊急預(yù)案,遠(yuǎn)端綜合站控執(zhí)行預(yù)案,解決通信故障問題。
遠(yuǎn)程維護主要是遠(yuǎn)端綜合站控軟件定期將各設(shè)備的服務(wù)參數(shù)及工作狀態(tài)進行自檢,綜合生成自檢報告,并上報本地綜合網(wǎng)管。本地綜合網(wǎng)管與遠(yuǎn)端綜合站控軟件間的控制流程如圖2所示。
遠(yuǎn)端綜合站控軟件主要完成設(shè)備自檢、鏈路檢測、故障診斷、預(yù)案執(zhí)行和自動巡檢功能。
遠(yuǎn)端綜合站控軟件通過向系統(tǒng)設(shè)備發(fā)送自檢命令,系統(tǒng)設(shè)備通過自檢本身健康狀態(tài),將自檢結(jié)果上報軟件設(shè)備監(jiān)測模塊,若有告警,上報軟件拓?fù)浔O(jiān)控模塊。
鏈路檢測是監(jiān)測通信鏈路的通斷及鏈路質(zhì)量,確定是否可以保障通信鏈路的建立及保持。遠(yuǎn)端綜合站控軟件通過向系統(tǒng)設(shè)備發(fā)送鏈路質(zhì)量監(jiān)測命令,將鏈路質(zhì)量數(shù)據(jù)上報軟件鏈路監(jiān)測模塊,若有告警則上報軟件拓?fù)浔O(jiān)控模塊。
故障診斷是由遠(yuǎn)端綜合站控軟件發(fā)起故障診斷命令,系統(tǒng)設(shè)備經(jīng)查詢后將故障源信息上報遠(yuǎn)端綜合站控軟件的過程。
預(yù)案執(zhí)行是指遠(yuǎn)端綜合站控收到下發(fā)的預(yù)案后,將預(yù)案轉(zhuǎn)化為配置工作流程,包括參數(shù)設(shè)置和設(shè)備標(biāo)校等,按照配置工作流程將配置信息分別下發(fā)各系統(tǒng)設(shè)備執(zhí)行,系統(tǒng)設(shè)備統(tǒng)計預(yù)案執(zhí)行結(jié)果,向遠(yuǎn)端綜合站控上報。
自動巡檢是遠(yuǎn)端綜合站控軟件通過設(shè)置自動輪詢命令[5],定時向系統(tǒng)設(shè)備發(fā)送巡檢命令,系統(tǒng)設(shè)備將生成的巡檢報告上報遠(yuǎn)端綜合站控軟件。
遠(yuǎn)端綜合站控軟件與系統(tǒng)設(shè)備間的流程如圖3所示。
2.3軟件運行環(huán)境
基于無人值守的綜合網(wǎng)絡(luò)管理系統(tǒng)運行所需硬件環(huán)境要求:CPU≥3.4 GHz;內(nèi)存≥8 GB;顯卡為獨立顯卡;硬盤≥1 TB;顯示器的分辨率為1 920×1 080;通信/網(wǎng)絡(luò)接口卡為千兆網(wǎng)卡;
基于無人值守的綜合網(wǎng)絡(luò)管理系統(tǒng)運行所需軟件環(huán)境要求:操作系統(tǒng)為麒麟操作系統(tǒng);數(shù)據(jù)庫管理系統(tǒng)為達(dá)夢數(shù)據(jù)庫;應(yīng)用支撐軟件為JDK;測試軟件為JTest。
2.4軟件性能
本地綜合網(wǎng)管與遠(yuǎn)端綜合站控信息傳輸交換采用文件傳輸和數(shù)據(jù)幀2種方式。文件傳輸用于非實時控制、評估報告和報表等;數(shù)據(jù)幀傳輸用于實施控制和實時狀態(tài)上報。
在軟件設(shè)計中,文件傳輸種類統(tǒng)一制定,文件名稱和信息格式統(tǒng)一定義。
文件傳輸信息種類包括:
①設(shè)備配置文件、參數(shù)宏文件和控制過程文件等。
②鏈路檢測報告、設(shè)備自檢報告和自動巡檢報告等。
在軟件設(shè)計中,數(shù)據(jù)幀格式統(tǒng)一定義,數(shù)據(jù)幀傳輸種類包括控制幀和監(jiān)視幀。采用不同的傳輸方式,有利于降低監(jiān)控信息交換對通信帶寬占用,減少信道資源占用。
軟件中,本地綜合網(wǎng)管與遠(yuǎn)端綜合站控信息傳輸采用以下原則進行信息傳輸:
①在網(wǎng)絡(luò)帶寬受限的條件下,窄帶數(shù)據(jù)壓縮傳輸服務(wù)考慮到傳輸實時性和可靠性,采用RUDP協(xié)議,RUDP協(xié)議在UDP協(xié)議基礎(chǔ)上增加確認(rèn)機制、重傳機制和滑動窗口機制。
②數(shù)據(jù)壓縮傳輸,使用zlib數(shù)據(jù)壓縮函數(shù)庫,zlib使用deflate算法,deflate算法是無損數(shù)據(jù)壓縮算法,先使用LZ77算法壓縮,然后使用哈夫曼編碼算法壓縮。
針對該綜合網(wǎng)絡(luò)管理系統(tǒng)進行功能測試,建立系統(tǒng)運行的安裝環(huán)境后,安裝運行軟件,系統(tǒng)內(nèi)各設(shè)備參數(shù)、狀態(tài)等信息通過相關(guān)軟件模擬,并對系統(tǒng)內(nèi)各功能模塊進行用例測試,發(fā)現(xiàn)測試結(jié)果均與預(yù)期結(jié)果相符,符合軟件設(shè)計要求系統(tǒng)測試的本地綜合網(wǎng)管顯示遠(yuǎn)端綜合站控的拓?fù)淙鐖D4所示。
本系統(tǒng)的遠(yuǎn)端綜合站控軟件—本地綜合網(wǎng)管軟件管理模式借鑒智能代理的概念,智能代理是代表管理者完成特定任務(wù)的軟件實體,它通過本地或就近管理的資源,能夠感知網(wǎng)絡(luò)狀態(tài)的變化,并能夠利用管理的資源信息來相應(yīng)調(diào)整下一步的行為。遠(yuǎn)程綜合站控軟件就是一個具有智能代理功能的軟件實體。該系統(tǒng)借鑒國內(nèi)外無人值守站建設(shè)的先進理念和工程應(yīng)用實踐[6],基于管理流程規(guī)范化、系統(tǒng)能力統(tǒng)一化和系統(tǒng)接口標(biāo)準(zhǔn)化的設(shè)計原則,分析設(shè)計了適合無人值守及自動化運行的綜合網(wǎng)絡(luò)管理系統(tǒng)的管理流程,解決了沒有常駐人員對設(shè)備進行操作或維護、完全通過遠(yuǎn)程監(jiān)控和自動化流程對系統(tǒng)進行操作和運行管理的運維需求,具有顯著效果。
[1]席江月,郭威.中波臺機房遠(yuǎn)程監(jiān)控與無人值機項目的設(shè)計與實現(xiàn)[J].西部廣播電視,2019(3):229-230.
[2]陳志剛.遠(yuǎn)程監(jiān)控系統(tǒng)在CMMB無人值守機房日常維護中的應(yīng)用[J].廣播電視信息,2014(10):95-97.
[3]孔祥新,劉敬科,閆紹敏.無人值守機房遠(yuǎn)程智能監(jiān)控系統(tǒng)[J].電子技術(shù),2011,38(10):26-27.
[4]張榮升.無人值守機房遠(yuǎn)程監(jiān)控系統(tǒng)的設(shè)計分析[J].大眾科學(xué),2020(3):26-27.
[5]秦積偉.廣播電視無人值守機房的設(shè)計與實現(xiàn)[J].甘肅科技, 2018,34(22):26-27.
[6]宋玉龍.淺析無人值守機房遠(yuǎn)程監(jiān)控和安防系統(tǒng)的建設(shè)[J].中外企業(yè)家,2018(13):109.