鄒根華,金學成,陳明亮,姚諸香,吉躍瑾,盧才云,毛建維
(1.國網(wǎng)江西省電力公司,江西 南昌 330077;2.國網(wǎng)江西省電力公司贛州供電分公司,江西 贛州 341000;3.南京南瑞繼保工程技術有限公司,江蘇 南京 211102)
隨著智能電網(wǎng)和“三集五大”體系建設的深入開展,變電站均已實現(xiàn)無人值守,電網(wǎng)調控一體化運行對電網(wǎng)運行實時數(shù)據(jù)和變電站集中監(jiān)控數(shù)據(jù)等自動化基礎數(shù)據(jù)的完整、及時性、準確性和遠動通信的可靠性提出了越來越高的要求,這些數(shù)據(jù)均由變電站遠動通信工作站(以下簡稱“遠動機”)上送調度主站。作為聯(lián)接調度主站與變電站的關鍵環(huán)節(jié),遠動機運行的穩(wěn)定性和可靠性直接決定著自動化基礎數(shù)據(jù)質量。隨著調度主站系統(tǒng)硬件冗余技術的推廣應用和備用調度體系建設的不斷推進,遠動機面對的主站數(shù)量越來越多,承擔的數(shù)據(jù)傳輸業(yè)務也越來越多,大大增加了遠動機的故障率。而目前對于遠動機的運行狀態(tài)沒有任何主動監(jiān)視和管控手段,只能通過其上送的變電站監(jiān)控數(shù)據(jù)間接判斷。一旦遠動通信出現(xiàn)問題,只能依靠運維檢修人員奔赴現(xiàn)場分析和處理,不僅耗費人力物力,而且耽誤事故處理時間,造成變電站監(jiān)控數(shù)據(jù)長時間中斷,極可能對電網(wǎng)安全運行及事故處理造成影響,帶來一定的經(jīng)濟損失。另一方面,由于對于實時數(shù)據(jù)及時性的要求,要求盡快恢復數(shù)據(jù)通信,造成故障現(xiàn)場很難保留,不利于故障原因分析。
目前,國內外對遠動通信狀態(tài)的監(jiān)視多集中在遠動通道狀態(tài)和通信質量的間接監(jiān)視,比如對通道誤碼率、通道中斷情況的監(jiān)視。文獻[1]當一臺遠動機故障、死機或者掉電時,由另一臺遠動機上送到主站,實現(xiàn)遠方對遠動機的運行狀態(tài)監(jiān)視。文獻[2]通過GPRS數(shù)據(jù)傳輸自動或手動監(jiān)視遠動機通道通信狀態(tài)或檢測自動化遠動裝置的運行狀態(tài)。而對于遠動機本身運行狀態(tài)的監(jiān)視工作開展較少,遠動機故障遠程分析和處理的技術手段更是十分缺乏。另一方面,遠動機的配置工作目前必須在站內就地更新,缺乏遠程維護手段。文獻[3]說明了通過服務端和客戶端進行遠動裝置的裝置復位、文件傳輸和參數(shù)配置的交互圖。文獻[4]開發(fā)了RTU遠程維護系統(tǒng),實現(xiàn)遠方對RTU進行冷啟動、熱啟動、遠方數(shù)據(jù)下裝、報文監(jiān)視和數(shù)據(jù)獲取等。
本文研究實現(xiàn)了對遠動機細粒度運行狀態(tài)的監(jiān)視,從而發(fā)現(xiàn)遠動機局部故障情況;研究實現(xiàn)了遠動機遠程復位控制,及時處理緊急故障;研究實現(xiàn)了遠動機參數(shù)維護,提高日常運維效率。
子站端遠動機實現(xiàn)自身狀態(tài)收集、控制命令執(zhí)行和下發(fā)參數(shù)配置修改等功能。主站實現(xiàn)遠動機狀態(tài)監(jiān)控、運行狀態(tài)分析、運行維護和歷史統(tǒng)計功能。
主站采用104通道與子站端遠動機通信,此通道與EMS系統(tǒng)通道相互獨立,互不影響,通過104虛點號方式采集站端遠動的運行狀態(tài),包括緩存區(qū)滿、進程僵死、各個調度通道的通信狀態(tài)等,通過下發(fā)復位命令實現(xiàn)遠程重啟遠動機。主站作為客戶端主動建立與子站遠動的連接,并統(tǒng)一維護所有站端遠動連接,實現(xiàn)主備集群、通道負載均衡和自動切換等功能,能夠滿足用戶橫向可擴展性和高可用性方面的要求。總體架構如圖1所示。
圖1 遠動機在線監(jiān)測及遠程控制總體架構圖
早期國內主流的遠動機廠家一般采用VxWorks操作系統(tǒng),對遠動機自身狀態(tài)的監(jiān)視主要包括主備機的通信狀態(tài)、對時信號異常和時鐘跳變。目前多數(shù)廠家的遠動機是基于Linux操作系統(tǒng),也有的用工控機。通過調用遠動機操作系統(tǒng)的相關系統(tǒng)函數(shù)可以監(jiān)視遠動機運行中系統(tǒng)相關信息,實現(xiàn)對遠動機本身資源利用情況(CPU利用率、內存占用率、緩存占用率等)、進程運行情況、通道狀態(tài)等信息實時采集和監(jiān)視。同時遠動機可以主動獲取與站控層設備的通信狀態(tài)以及與各級調度的通信狀態(tài),從而實現(xiàn)遠動機對外通信狀態(tài)的監(jiān)視。這些監(jiān)視的數(shù)據(jù)通過常規(guī)規(guī)約上送到主站,主站對站端上送的模擬量/狀態(tài)量進行合理性檢查、數(shù)據(jù)過濾、限值檢查、跳變檢查、人工設定告警等級和告警條件從而實現(xiàn)對遠動機異常和故障(CPU利用率過高、內存利用率過高、緩存區(qū)滿、進程僵死、與間隔層通信異常、主備機切換、死機等)進行自動告警。圖2為運動機自身狀態(tài)前置監(jiān)視界面。
圖2 運動機自身狀態(tài)前置監(jiān)視界面
變電站報文分析數(shù)據(jù)作為變電站一個重要的故障分析手段在傳統(tǒng)方式下是無法上送到主站側的。如果需要診斷變電站二次設備的故障,必須人工從變電站里獲得報文分析數(shù)據(jù)。
文獻[5-6]介紹了變電站的告警分類、推理模型和推理規(guī)則,文獻[7]介紹了基于時序因果網(wǎng)路的故障診斷方法,文獻[8-9]介紹基于時序模糊Petri網(wǎng)的故障診斷方法,上述文獻都從不同的角度介紹了電力系統(tǒng)的故障診斷技術。本論文研究變電站內的報文分析數(shù)據(jù)通過遠動機上送到遠動機在線監(jiān)視及遠程控制平臺的“過路召喚”技術,利用遠動機作為中轉,將遠動機內部的診斷信息上送到主站。同時利用實時監(jiān)視的遠動通信狀態(tài)信息、告警信息,以及遠程召喚的報文、配置文件、日志文件等,通過基于業(yè)務的依賴關系和規(guī)則的分析功能推理,實現(xiàn)故障遠程快速定位,并在系統(tǒng)平臺上進行展示和分析。
業(yè)務系統(tǒng)就是用戶日常使用的各類維持生產的應用系統(tǒng),是用戶直接接觸或操作的層面。電力相關的業(yè)務系統(tǒng)包括EMS系統(tǒng)、保信系統(tǒng)、電量系統(tǒng)和氣象系統(tǒng)等。業(yè)務的依賴關系是一種邏輯的依賴關系或者動態(tài)的依賴關系,跟功能模塊、應用場景等相關。圖3為業(yè)務的依賴關系圖。
圖3 業(yè)務依賴關系圖
圖4 推理規(guī)則庫示意圖
推理規(guī)則是指將日常處理故障中積累的經(jīng)驗用形式化語言固化并存儲在知識庫中,規(guī)則按照類別組織,比如按照采集的運行數(shù)據(jù)類別制訂規(guī)則,或者按照各種事件的類別制訂規(guī)則,規(guī)則由因子的邏輯運算實現(xiàn),規(guī)則的最底層用類似計算公式的形式實現(xiàn),復雜的規(guī)則可以通過因子的復雜運算得到,部分因子是數(shù)據(jù)庫某些域值或者常量,部分因子屬于復雜因子,不能用數(shù)據(jù)庫中的某些域值來表達,復雜因子通過封裝成插件的形式供調用。如EMS主站系統(tǒng)檢查是否有“人工置數(shù)”操作事件,內部邏輯必須到操作記錄表中查找是否有“人工置數(shù)”的操作記錄,同時必須滿足一定時間、同一設備的約束條件,這么復雜的規(guī)則只能通過封裝。圖4為遠動機故障診斷推理規(guī)則庫示意圖。
傳統(tǒng)對遠動機的運維方法有兩種:一種是使用遠動機面板上功能鍵實現(xiàn)對遠動機基本參數(shù)設定,如對上IP/端口,重啟鏈路/進程等,這種方法只能實現(xiàn)最基本的維護操作,一些高級功能則無法完成;另一種則是使用調試工作站或變電站后臺系統(tǒng)連接到遠動機的控制口,使用專用的調試工具/組態(tài)軟件完成遠動機的修改,這種方法雖然可以對遠動機進行所有的維護操作,但是使用專用的調試工作站和工具完成,不能夠完成遠端運維。
本文研究開發(fā)的運維系統(tǒng)則接入多個變電站的遠動通信裝置,并利用分布式技術使得平臺具備多冗余、負載均衡和一主多備等特點。同時在不破壞二次安防策略的情況下利用已有的通信方式完成運維數(shù)據(jù)的上傳下載。
運維平臺采用模塊化設計思想,實現(xiàn)遠動運維數(shù)據(jù)采集與分析處理的分離,運維數(shù)據(jù)分析處理與綜合應用的分離,綜合應用與展現(xiàn)的分離,系統(tǒng)總體邏輯架構分為平臺層和應用層兩部分,如圖5所示。
圖5 運維平臺系統(tǒng)邏輯架構
在規(guī)約擴展方面,采用基于IEC104遠動通信規(guī)約。利用遠動規(guī)約進行文件/遠動參數(shù)傳輸。IEC104遠動通信規(guī)約雖然對鏈路/進程控制有規(guī)定,但是運維平臺還需要對遠動機本身進行控制。采用IEC104的擴展ASDU方式,擴展運維平臺對遠動通信裝置直接操作。
將裝置可識別的命令裝入到ASDU中,遠動機接受到該報文直接按照報文中的內容進行維護操作,如重啟某一Linux進程等。圖6為通過運維平臺進行的維護流程。
圖6 通過運維平臺進行的維護流程
在文件傳輸方面有兩種方案:一種是擴展104文件傳輸方案;一種是采用通用服務協(xié)議文件傳輸方案。擴展104文件傳輸方案中擴展類型為116的ASDU,實現(xiàn)文件目錄讀取,文件傳輸?shù)裙δ?,使得遠動機可以識別帶有路徑的文件名,從而避免標準IEC104傳輸文件中只能用序號標識文件的不方便性。擴展104文件傳輸方案、通用服務協(xié)議文件傳輸方案分別如表1、表2所示。
表1 擴展104文件傳輸方案
表2 通用服務傳輸協(xié)議傳輸方案
傳統(tǒng)的遠動機維護都是使用專用的調試軟件或組態(tài)工具進行修改或設定,不同廠家的遠動機的維護流程也不盡相同。但是從最終用戶的角度來看,遠動機的主要功能則是遠動測點的增加、修改和刪除,所有遠動機的維護目的大部分也局限于此。因此,簡化當前的維護操作對電網(wǎng)中所有遠動機進行遠程維護是必要的。
本文提出遠動機通用的維護流程:
(1)鏈路/進程重啟;
(2)遠動測點增加、修改或刪除操作;
(3)遠動機運行參數(shù)修改;
(4)其他維護操作。
比如重啟遠動機,主站僅需發(fā)送重啟命令。至于是直接的還是間接,通過什么方式到達遠動機,遠動機怎么執(zhí)行,用戶不關心,主站可以通過發(fā)送執(zhí)行命令或者通過規(guī)約進行遠動機的重啟。增加、刪除或修改測點可以通過遠程進行維護,然后遠程下裝,再遠程重啟遠動機。圖7為重啟遠動機規(guī)約報文。
圖7 重啟報文監(jiān)視界面
如圖8所示,遠動機在線監(jiān)測與遠程運維平臺實現(xiàn)數(shù)據(jù)的歷史存儲、統(tǒng)計分析與報表展示。綜合展示KPI指標,某個KPI出現(xiàn)異常時,第一時間告知運行人員,同時可自動觸發(fā)相關分析模塊,輔助調度、運行人員通過統(tǒng)一的調度操控臺及時進行異常處理,使異常指標盡快恢復正常。遠動KPI監(jiān)視公式如下。
(1)
式中:K為廠站遠動KPI指標;∑t為值班通道通訊時間之和;T為廠站投運總時間;∑s為廠站通信日平均中斷次數(shù)。
圖8 遠動KPI監(jiān)視曲線圖
本文闡述了遠動機在線監(jiān)視及遠程運維的總體思路,詳細闡述了遠動機自身狀態(tài)實時監(jiān)視和告警技術,在此基礎上利用遠動通信狀態(tài)信息、告警信息,以及遠程召喚的報文、配置文件、日志文件等,實現(xiàn)故障遠程快速定位,縮短故障處理時間,保證電網(wǎng)安全運行。同時,提出的模塊化運維技術能夠有效節(jié)省運維檢修部門的人力物力成本,大大提高工作效率。