趙 暉,林繼承
(馬鞍山鋼鐵股份有限公司能源管控中心,安徽馬鞍山 243000)
馬鋼新區(qū)能源中心是一個集過程監(jiān)控、能源管理、能源調(diào)度為一體的管控中心,監(jiān)控管理的能源介質(zhì)主要有:供配電系統(tǒng)、焦爐煤氣、高爐煤氣、轉(zhuǎn)爐煤氣、混合煤氣、壓縮空氣、氧氣、氮氣、氬、蒸汽、生產(chǎn)水等。作為新區(qū)能源的生產(chǎn)指揮控制中心,調(diào)度人員借助EMS系統(tǒng)實現(xiàn)集中的能源生產(chǎn)調(diào)度,對無人值守的能源公輔設施實現(xiàn)集中監(jiān)視和控制,保證新區(qū)主作業(yè)線正常有序的生產(chǎn)。
EMS系統(tǒng)的5#、6#服務器是動力和水調(diào)度臺遠程操作監(jiān)視的重要基礎平臺,硬件采用2臺IBM服務器,軟件采用CiTECT6.0 SCADA,形成互相冗余的熱備系統(tǒng),以保證在某一臺服務器出現(xiàn)故障時,能夠及時的切換到備用服務器上,依然保證調(diào)度的實時操作和監(jiān)控。
但在后續(xù)運行中5#、6#服務器運行一直不是很穩(wěn)定,期間發(fā)生過數(shù)次同時中斷的故障,導致系統(tǒng)不能正常運行,使相關設備處在失控狀態(tài),給調(diào)度的操作帶來了不便和風險。
經(jīng)過分析,我們發(fā)現(xiàn)5#、6#I/O服務器不但承擔了7881點動力/水系統(tǒng)數(shù)據(jù)的讀取,寫入功能之外,還承擔了動力/水系統(tǒng)3921點報警顯示、1313點趨勢顯示的功能。其中趨勢及報警以秒為時間單位將數(shù)據(jù)寫入系統(tǒng)形成趨勢文件,占用系統(tǒng)資源較大,5#、6#服務器本身還承擔著與基礎自動化站點及EMS子站40個站點7289信息點的通訊及數(shù)據(jù)交換、操作功能,連接數(shù)較多。
和一直很穩(wěn)定的電力服務器相比,電力服務器點數(shù)和動力/水服務器大致相等,占用資源較大的趨勢報警是單獨放在電力報警趨勢服務器上運行,且電力服務器的連接數(shù)分別為5個和3個,遠遠小于動力/水服務器的40個連接數(shù)。因此我們判定5#、6#服務器同時離線的故障應該在負載過大方面。
針對5#、6#服務器負載過大的問題,我們設想新增一套冗余服務器,對5#、6#服務器負載進行分擔,設計了負載分擔的方案:
按照站點的重要性分開,即有遠程操作的站點放在另一套服務器運行,采集及監(jiān)視的站點及動力/水報警趨勢放在一套服務器中運行。
負載進行了優(yōu)化,站點數(shù)分別為監(jiān)視24和遠控16(連接數(shù)較為均衡),點數(shù)分別為監(jiān)視1291和遠控5998,報警為監(jiān)視3921和遠控0,趨勢為監(jiān)視1313和遠控0,總點數(shù)為監(jiān)視6525和遠控5998。其中采集和監(jiān)視站集中一套服務器,遠程控制集中一套服務器,可以將系統(tǒng)風險分散,采集系統(tǒng)故障不會影響遠程操作系統(tǒng)的正常運行。
(1)5#/6#服務器將原有的動力水采集站點的I/O服務和所有的報警趨勢服務拆分到新增的冗余服務器,僅保留動力水控制站點的I/O服務。
(2)5#/6#服務器:分擔高焦煤氣儲配站、轉(zhuǎn)爐煤氣儲配站、制氫站、空壓站、制水廠等共計16個站點共計5998個遠控點的I/O服務。
(3)新增冗余服務器:承擔料場、燒結(jié)、焦化、煉鐵、煉鋼、連鑄、熱軋、冷軋、石灰窯、制氧、雨排泵房等區(qū)域共計24個站點共計6525個采集點(含報警、趨勢)的I/O服務。
具體數(shù)據(jù)流程圖如圖1、圖2所示
圖1 通訊連接負載均衡數(shù)據(jù)流程圖
圖2 信號負載均衡數(shù)據(jù)流程圖
EMS系統(tǒng)是在線系統(tǒng),為不影響正常生產(chǎn),將對系統(tǒng)采用分步驟分離的方法,在分離過程中,始終保證原有5#、6#服務器上運行的所有功能在分離過程中始終處于冗余狀態(tài)下,保證生產(chǎn)操作可靠穩(wěn)定。具體分離步驟過程如下:
(1)CITECT項目分離
將5#、6#服務器最新的CITECT項目按照采集監(jiān)視和遠控經(jīng)行IO設備、標簽點、畫面、報警、趨勢、CICODE腳本等進行分離,在原有項目中刪除遠控的相關內(nèi)容,形成一個獨立的采集監(jiān)視項目,用于新增的冗余服務器;在原有項目中刪除采集監(jiān)視的相關內(nèi)容,形成一個獨立的遠控項目,用于原有的5#、6#服務器;分離完成后進行編譯和運行測試,保證其正確、一致、完整。
(2)對分離出的采集監(jiān)視項目進行式運行
在保持原有5#、6#冗余系統(tǒng)不變的情況下,在新增的冗余服務器中運行分離出的采集監(jiān)視項目,形成冗余系統(tǒng),利用調(diào)度臺多個終端中的某一臺終端進行新增服務的采集監(jiān)視功能測試,順序從動力開始,最后到水臺結(jié)束,調(diào)度臺的操作均使用測試終端進行,驗證新增服務器的所有功能是否完整、可靠,測試完畢且正確無誤后,對系統(tǒng)地冗余性能進行測試,在系統(tǒng)具有冗余功能后,將新增的兩臺服務器投入運行。
(3)對6#服務器進行分離
5#服務器依然運行原有項目,同時用另外一臺服務器(臨時)也運行原有項目,和5#服務器形成冗余系統(tǒng),保證整個系統(tǒng)的正常運行;將停止運行原有項目的6#服務器運行分離出來的遠控項目,利用另一臺終端對其所有監(jiān)視和控制等功能按照從動力到水的順序進行測試,驗證新增服務器的所有功能是否完整、可靠,測試完畢且正確無誤后,將6#服務器上的遠控項目正式投入系統(tǒng)中運行。
(4)對5#服務器進行分離
在6#服務器上的遠控項目正式投入系統(tǒng)中運行后,同時保證臨時服務器運行原有項目,這樣在6#和臨時服務器上都具有遠控功能,這時將5#服務器從原有項目上退出運行,將分離出的遠控項目在5#服務上運行,利用一臺終端對其所有監(jiān)視和控制等功能按照從動力到水的順序進行測試,驗證新增服務器的所有功能是否完整、可靠,測試完畢且正確無誤后,將5#服務器上的遠控項目正式投入系統(tǒng)中運行,這時5#、6#服務器重新形成遠控項目冗余系統(tǒng),對5#、6#服務器進行冗余功能的測試,測試正確后,5#、6#服務器通入遠控項目的正常運行,此時11#服務器可以完全退出運行,至此這個分離過程完成。
在整個分離過程中,利用臨時服務器始終保證系統(tǒng)處于冗余狀態(tài),不會影響系統(tǒng)的正常操作和監(jiān)視。由于5#、6#服務器相對其它系統(tǒng)是一套獨立系統(tǒng),所以在分離過程中也不會對其它系統(tǒng)產(chǎn)生任何影響,其它系統(tǒng)不需作任何改動。
通過對我單位新區(qū)EMS系統(tǒng)動力/水服務器的設計、實施。完成后,動力/水服務器未發(fā)生過同時中斷的故障,順利解決了困擾多年的服務器故障,保障了系統(tǒng)的安全穩(wěn)定運行。