夏友斌 俞鵬 蘇志朋 潘文虎 宋銘敏
摘 要:隨著國家電網(wǎng)的統(tǒng)一堅強智能電網(wǎng)建設的深入推進,安徽在全省開展了“大運行 ”體系的建設,實現(xiàn)對省市縣公司的扁平化管理,但是,由于調(diào)控系統(tǒng)具有規(guī)模龐大、所轄廠站眾多,自動化設備節(jié)點繁冗、拓撲結構復雜,及各操作站地域范圍分布廣等特點,以及自動化系統(tǒng)運行值班的專業(yè)特殊性,若靠人為去發(fā)現(xiàn)與判斷系統(tǒng)的異常或故障狀態(tài),時常會出現(xiàn)問題。為此,公司決定開發(fā)一套集中監(jiān)控管理平臺,實現(xiàn)對地縣調(diào)度自動化系統(tǒng)運行情況等相關信息的實時采集與集中監(jiān)視及相關設備運行信息的全面監(jiān)控。
關鍵詞:集中監(jiān)控;管理平臺;數(shù)據(jù)采集
中圖分類號:TP212.13 文獻標識碼:A 文章編號:1671-2064(2018)13-0157-01
1 背景
隨著國家電網(wǎng)的統(tǒng)一堅強智能電網(wǎng)建設的深入推進,安徽在全省開展了“大運行”體系的建設,實現(xiàn)對省市縣公司的扁平化管理,全面實施電網(wǎng)運行管理模式轉變,實現(xiàn)地縣調(diào)控一體化,并實現(xiàn)一地區(qū)一系統(tǒng)平臺。但是,鑒于調(diào)度自動化系統(tǒng)本身具有覆蓋范圍廣、管理廠站多一節(jié)設備復雜等特點,若僅僅依靠人力去發(fā)現(xiàn)系統(tǒng)故障,無法快速發(fā)現(xiàn)系統(tǒng)問題,難以做到快速處理,具體有如下幾點問題:
(1)異常數(shù)據(jù)的延遲性發(fā)現(xiàn)?,F(xiàn)有系統(tǒng)一旦出現(xiàn)關鍵數(shù)值的異常,管理人員無法及時發(fā)現(xiàn)問題,僅僅可以在定期巡視或是其他人員電話溝通后才可以發(fā)現(xiàn)問題;而此期間也已耽誤相當長時間,影響電網(wǎng)整體調(diào)度情況。(2)系統(tǒng)服務異常無法及時發(fā)現(xiàn)。在實際使用過程中,系統(tǒng)可能出現(xiàn)進程終止或是磁盤空間已用完等情況。但是管理人員是無法及時發(fā)現(xiàn)異常情況,只有當系統(tǒng)功能表現(xiàn)出明顯的異常時才可發(fā)現(xiàn);而這一過程可能已經(jīng)造成大量的關鍵數(shù)據(jù)的丟失,不利于調(diào)度精確化管理。(3)網(wǎng)絡設備較多,無法及時監(jiān)控。在實踐工作中發(fā)現(xiàn),調(diào)度系統(tǒng)的網(wǎng)絡拓撲結構較為復雜,特別是系統(tǒng)中配置了多個遠程工作服務后,導致網(wǎng)絡簡化設備的繁多;同時由于調(diào)度系統(tǒng)本身所具有的地域跨度廣的特點;一旦某處網(wǎng)絡節(jié)點發(fā)生故障,維護人員無法迅速實現(xiàn)故障定位判斷。(4)地縣一體化結構使得電網(wǎng)監(jiān)控信息量突增、信息層次多且復雜,自動化系統(tǒng)維護的設備的數(shù)量和難度加大,自動化系統(tǒng)的安全性和可靠性問題更加突出。
為解決上述問題,公司決定開發(fā)一套集中監(jiān)控管理平臺,實現(xiàn)對地縣調(diào)度自動化系統(tǒng)運行情況、廠站情況等設施相關信息的實時采集與集中監(jiān)視及相關設備運行信息的全面監(jiān)控。
2 系統(tǒng)總體設計
2.1 系統(tǒng)架構方案
如圖1所示。
采集告警平臺。采集告警平臺作為集中監(jiān)控系統(tǒng)的基石,主要為整個系統(tǒng)提供數(shù)據(jù)來源,實現(xiàn)對所有自動化設備的關聯(lián)處理。采集告警平臺為了達到高效、可持續(xù)的目的采用了并發(fā)處理技術,以保證每個采集任務都是獨立運行,互補干擾同時對使用線程池的調(diào)配機制進行相應的優(yōu)化從而保證整個采集系統(tǒng)中的各個任務能夠獨立高效有序地運行。同時,本平臺對每個采集到的數(shù)據(jù)都將依據(jù)隊列由公共服務組件進行處理,以提高數(shù)據(jù)的整體處理效率。另外,為保證在采集異常情況下系統(tǒng)依然可以正常工作,系統(tǒng)將會為每一個采集任務分配一個監(jiān)控線程;一旦采集程序出現(xiàn)異常,監(jiān)控線程將重啟采集任務。
管理平臺。管理平臺提供實時狀態(tài)監(jiān)測、數(shù)據(jù)管理、統(tǒng)計分析等功能。依據(jù)頁面風格和使用需求的不同,將平臺再細分為兩個模塊分別是,實時運行監(jiān)控模塊和數(shù)據(jù)管理模塊。實時監(jiān)控運行模塊主要提供可視化直觀的檢測設備運行狀態(tài),以還原各系統(tǒng)線程運行情況;數(shù)據(jù)管理模塊則主要提供更為專業(yè)的數(shù)據(jù)管理功能,采用傳統(tǒng)菜單模式,利于管理人員的系統(tǒng)數(shù)據(jù)管理。
2.2 系統(tǒng)功能設計
如圖2所示。
2.2.1 管理平臺功能
(1)展示當前設備告警信息及告警處理過程。其中包括對最新告警信息的展現(xiàn),動環(huán)、業(yè)務系統(tǒng)的數(shù)據(jù)展示。(2)環(huán)境機房。主要展現(xiàn)機房配電數(shù)據(jù),以及UPS的監(jiān)測數(shù)據(jù)。(3)業(yè)務系統(tǒng)。主要展示OPEN3000廠站工況信息,特別是遙測、遙信數(shù)據(jù)的展示。(4)系統(tǒng)管理。主要用來配置系統(tǒng)用戶、角色、權限等信息。
2.2.2 采集模塊功能
(1)主控程序。主控程序部分包括獲取任務腳本,初始化服務實例運行參數(shù),監(jiān)控服務初始化,關聯(lián)分析引擎初始化,最新任務輪詢等。(2)任務管理。本模塊主要指通過對任務參數(shù)的初始化運行,建立采集任務,實現(xiàn)采集結果的組裝和相關任務狀態(tài)的更新。(3)數(shù)據(jù)采集。本模塊主要包含數(shù)據(jù)監(jiān)聽、Socket通訊等功能,實現(xiàn)依據(jù)任務需要發(fā)送相關命令,同時可實現(xiàn)數(shù)據(jù)接收。(4)關聯(lián)分析。本模塊主要指通過利用關聯(lián)分析方法開啟分析引擎,得到相關設備的安全狀態(tài)信息,并將得到的關聯(lián)分析記過存儲到相對應的隊列中。(5)運行狀態(tài)監(jiān)測。本模塊主要指通過對線程的運行監(jiān)控,實現(xiàn)異常情況的重啟,所得到的結果存儲至相應的隊列中。(6)異常服務。本模塊主要指當設備運行處于異常情況時,系統(tǒng)可將異常數(shù)據(jù)如設備狀態(tài)、接口狀態(tài)進行處理與記錄。
3 結語
通過建設集中監(jiān)控管理平臺實現(xiàn)對地縣調(diào)度自動化系統(tǒng)運行情況、廠站工況、告警信息、網(wǎng)絡資源、服務器資源及機房環(huán)境、UPS電源等設施相關信息的運行信息的全面監(jiān)控,實現(xiàn)自動化專業(yè)對調(diào)控系統(tǒng)及相關設備采用無人值班的可能性,實現(xiàn)調(diào)度自動化系統(tǒng)運行監(jiān)控和運行維護人力資源優(yōu)化配置。