蔣鋒
(江蘇華電通州熱電有限公司,江蘇 南通226300)
某廠AVC系統(tǒng)采用雙主機配置,單臺服務器出現(xiàn)故障時,切換至另一臺服務器運行,同時將AVC目標值、電壓調(diào)節(jié)情況、各等級電壓實際值、閉鎖情況等信號傳至NCS系統(tǒng),以供監(jiān)盤人員監(jiān)視。
系統(tǒng)投運初期,AVC系統(tǒng)頻繁出現(xiàn)運行中自動切換服務器的現(xiàn)象(就地檢查未發(fā)現(xiàn)服務器故障),切換現(xiàn)象約1 個月發(fā)生一次。同時NCS系統(tǒng)運行過程中,發(fā)現(xiàn)針對AVC系統(tǒng)正常運行中的報警、提示信息過多,絕大部分為AVC系統(tǒng)運行過程中的閉鎖、增減磁等信息。重要的報警信息出現(xiàn)時,不容易發(fā)現(xiàn),亦影響了正常的事件追溯。
現(xiàn)場針對AVC系統(tǒng)進行了排查,所做工作如下:
①登陸系統(tǒng)終端,持續(xù)監(jiān)視程序進程工作情況,發(fā)現(xiàn)變化較大的有psx_main 主程序占用內(nèi)存情況,所占內(nèi)存由程序運行初始的200M 左右升至1G 左右,并保持增長趨勢。進一步分析發(fā)現(xiàn),主程序在內(nèi)存控制機制中存在一定的缺陷,在對畫面及程序進行正常的操作中有引發(fā)內(nèi)存泄露缺陷的可能,進一步引發(fā)程序的不穩(wěn)定,導致主程序自動退出。
②雙機同步通道為TCP 以太網(wǎng)通道,且為唯一同步通道。當此通道故障或受干擾時,導致的后果即為雙服務器間無法同步,最終導致雙服務器系統(tǒng)失去穩(wěn)定。
③對AVC服務器硬件系統(tǒng)檢查發(fā)現(xiàn),TCP 以太網(wǎng)通道的網(wǎng)線水晶頭制作不規(guī)范,未能正確地將屏蔽層金屬絲接地。在特殊情況下,附近電磁干擾有可能對通訊造成干擾。
現(xiàn)場針對NCS系統(tǒng)進行了排查,發(fā)現(xiàn)日常運行中各類報警及SOE 事件過多過雜,其中大部分為AVC系統(tǒng)正常運行中的閉鎖,增減磁信息等。這些事件大量占用了報警信息欄的空間,導致重要事件發(fā)生時可能漏過報警,亦對事件后追溯SOE信息造成不便。因此,亟需對NCS報警系統(tǒng)進行優(yōu)化,刪除部分重要性不高的報警,僅保留其在分界面的光字牌功能[1]。
根據(jù)上述檢查結(jié)果,對AVC及NCS系統(tǒng)進行了如下優(yōu)化工作:
①針對內(nèi)存管控機制的漏洞,升級主程序,增加防內(nèi)存溢出機制(圖1為升級前,圖2為升級后),可以發(fā)現(xiàn),升級后的程序穩(wěn)定地將內(nèi)存占用率控制在55M 左右。升級看門狗程序,除狗糧倒計時外,增加心跳機制(見圖3),狗糧倒計時與心跳計時做邏輯處理,當雙計時同時失效時,方判定看門狗程序錯誤,有效杜絕因看門狗自身問題導致程序的異常退出[2]。
圖1
圖2
圖3
②增加串口同步通道,日常運行中以以太網(wǎng)同步為主,特殊情況下可自動切換至串口同步通道,保證雙服務器同步順暢[3]。
③在NCS的AVC界面增加第一組串口故障、第二組串口故障、TCP 同步故障三個報警信號,針對AVC同步情況進行直觀化監(jiān)視(見圖4)。
圖4
④對AVC服務器柜的盤柜接地、以太網(wǎng)網(wǎng)線接地進行全面排查及整改,最大程度避免電磁干擾對AVC服務器運行的影響。
⑤針對NCS系統(tǒng)報警信息系統(tǒng)進行數(shù)據(jù)庫配置修改,取消AVC調(diào)節(jié)中的閉鎖信號、增減磁信號、越限信號等,僅保留其光字牌功能。這樣即保證了這些信號的可視化,也避免了過多冗余信號對運行監(jiān)盤的影響。
改造完成后,經(jīng)長時間運行的觀察,AVC系統(tǒng)未發(fā)生切換現(xiàn)象,母線電壓調(diào)節(jié)過程中調(diào)節(jié)速度快,調(diào)節(jié)精準到位。NCS系統(tǒng)工作正常,報警欄簡明直觀,AVC分畫面各調(diào)節(jié)信息光字牌工作正常,總體改造效果顯著。
隨著電網(wǎng)系統(tǒng)的日益發(fā)展,組成結(jié)構(gòu)的日益龐雜,對發(fā)電機組的調(diào)度管理要求也越來越高,考核也越來越嚴。對AVC系統(tǒng)的運行穩(wěn)定性要求也越來越高,經(jīng)實踐與觀察表明,此次改造有效地提高了AVC系統(tǒng)的性能與可靠性。