程 正
(洪家渡發(fā)電廠,貴州 黔西 551501)
ON-CALL系統(tǒng)也稱為在線呼尋系統(tǒng),其將當下無線網(wǎng)絡技術和尋呼技術相結(jié)合,并利用智能移動終端的靈活性、及時性和普遍性,通過語音和短信等方式將發(fā)電廠的運行狀態(tài)信息、故障等告警信息快速、及時發(fā)送給相關處理人員[1-2],該系統(tǒng)具備告警信息存儲和電話終端查詢功能,相關人員可在第一時間查詢告警內(nèi)容,并迅速到達故障地點,采取相應的解決措施,保證發(fā)電廠無人看守時的運行安全[3]。
但是在運行過程中,發(fā)電廠ON-CALL監(jiān)控系統(tǒng)會采集以及存儲海量的告警信息,會導致服務器以及相關運行軟件的運行延遲,甚至產(chǎn)生存儲瓶頸,影響系統(tǒng)的性能[4]。所以,諸多學者設計并優(yōu)化相關的解決措施,例如盧繼哲等[5]以及曹康華等[6]分別采用基于NTP協(xié)議的以及基于虛擬蜜網(wǎng)的用電信息采集方法,以NTP時間同步方法和虛擬蜜網(wǎng)為核心,實現(xiàn)電力相關信息采集,可分別提升信息采集的時間精度和信息安全程度,但是前者不涉及虛擬化設計過程,導致計算時、空間效率較低,后者會造成資源占用過大問題。因此,本文研究發(fā)電廠ONCALL系統(tǒng)告警信息采集虛擬化設計與應用方法,其創(chuàng)新之處在于引用基于超融合基礎架構的采集虛擬化設計過程,處理上述的問題,實現(xiàn)一個服務器同時完成多個系統(tǒng)操作的目的,可使虛擬機的安全性和使用性能顯著提升,并且對軟件的虛擬化方案執(zhí)行的靈活性和可靠性也具有明顯的提升作用。
ON-CALL系統(tǒng)建設部署在發(fā)電廠網(wǎng)絡信息管理Ⅲ區(qū),實現(xiàn)將安全控制Ⅰ區(qū)的計算機監(jiān)控系統(tǒng)告警測點信息,通過橫向隔離裝置進行數(shù)據(jù)傳輸,自動發(fā)送到ON-CALL系統(tǒng)應用服務器、電話語音告警應用服務器、手機APP告警信息推送應用服務器,通過短信發(fā)送、電話語音、微信、APP信息推送功能向特定人群發(fā)送,提供相關人員及時獲取實時生產(chǎn)信息的途徑。
拓撲結(jié)構如圖1所示。
圖2中通過計算服務器虛擬化軟件、網(wǎng)絡虛擬化軟件、虛擬存儲軟件、ON-CALL平臺軟件和集群軟件等信息化軟件的充分應用,實現(xiàn)了ON-CALL系統(tǒng)數(shù)據(jù)采集、處理、存儲發(fā)布的冗余配置。監(jiān)控系統(tǒng)數(shù)據(jù)采集服務器、ON-CALL系統(tǒng)數(shù)據(jù)服務器、短信發(fā)布服務器、WEB服務器的功能均通過超融合平臺的虛擬化技術實現(xiàn),還實現(xiàn)內(nèi)部冗余雙機熱備。
圖1 ON-CALL網(wǎng)絡拓撲圖
圖2 ON-CALL超融合服務器虛擬化網(wǎng)絡圖
橫向隔離裝置:部署A/B網(wǎng)各1臺橫向隔離裝置,實現(xiàn)監(jiān)控系統(tǒng)控制I區(qū)與信息管理Ⅲ區(qū)的數(shù)據(jù)傳輸通道,滿足系統(tǒng)安全防護要求;
ON-CALL系統(tǒng)數(shù)據(jù)采集服務器(采用超融合平臺):利用超融合平臺部署出2臺數(shù)據(jù)采集服務器,通過橫向隔離裝置建立與監(jiān)控系統(tǒng)通信,用于采集監(jiān)控系統(tǒng)報警信息;
ON-CALL系統(tǒng)數(shù)據(jù)庫服務器(采用超融合平臺):利用超融合平臺部署出2臺數(shù)據(jù)庫服務器,同時增加超融全平臺存儲軟件,提供數(shù)據(jù)的存儲功能,實現(xiàn)雙通道監(jiān)控系統(tǒng)告警數(shù)據(jù)采集和數(shù)據(jù)庫冗余雙機熱備;
ON-CALL系統(tǒng)應用服務器(采用超融合平臺):利用超融合平臺部署出2臺應用服務器,實現(xiàn)信息的發(fā)布功能,根據(jù)告警級別和告警策略提供給短信平臺發(fā)送告警信息;
ON-CALL系統(tǒng)WEB服務器(采用超融合平臺):利用超融合平臺部署出2臺WEB服務器,實現(xiàn)ON-CALL系統(tǒng)的遠程登錄和信息的遠程手動發(fā)布功能。
ON-CALL發(fā)布方式,實現(xiàn)告警信息的可靠發(fā)送。
除通過手機短信發(fā)送告警信息外,還實現(xiàn)了電話語音和微信、網(wǎng)絡短信方式告警。
(1)在ON-CALL系統(tǒng)增加1臺語音工控機和語音板卡,建立電話語音數(shù)據(jù)庫和語音告警子系統(tǒng),接入廠內(nèi)程控電話通過專線連接,能將重要故障及事故告警信息通過電話呼叫方式通知到相關人員。
(2)采用超融合平臺,虛擬化1臺微信信息發(fā)布服務器,通過微信平臺進行報警信息推送。
(3)通過阿里云的租用,實現(xiàn)ON-CALL信息的網(wǎng)絡短信發(fā)布。
采集子系統(tǒng)作為ON-CALL系統(tǒng)的核心部分,是系統(tǒng)告警信息虛擬化采集、存儲、執(zhí)行的重要保障,且其告警通告模塊具備通告機制,可以根據(jù)告警信息的處理結(jié)果,自動、靈活地確定通告人員的匹配,實現(xiàn)無人看守的科學、智能的管理[9]。
由于發(fā)電廠告警信息量較大,為保證系統(tǒng)以及服務器高效運行,采集子系統(tǒng)融合HCI(見圖3),實現(xiàn)系統(tǒng)告警信息虛擬化采集、計算、存儲、傳輸。
圖3 超融合基礎架構
圖3中,HCI是一種信息基礎架構,結(jié)合虛擬計算資源和存儲設備,使計算、網(wǎng)絡、存儲、服務器虛擬化等多種操作和技術可通過一個服務器實現(xiàn),同時,應用多個服務器的結(jié)合構建統(tǒng)一的告警信息資源池,提升系統(tǒng)存儲性能[10],使數(shù)據(jù)庫的擴展性極大程度提升,且服務器數(shù)量越多,計算性能以及存儲性能越高,各個服務器之間可實行告警信息的復制和備份,顯著增加信息的安全性和使用便捷性。
管理子系統(tǒng)中融入HCI后,主要完成4方面的虛擬化處理,分別為采集、計算、存儲以及網(wǎng)絡。
(1)采集虛擬化
在虛擬機上構建虛擬數(shù)據(jù)采集服務器,涵蓋虛擬CPU、RAM和網(wǎng)絡接口,其應用和操作程序是由數(shù)據(jù)采集的基本要求決定的,以此作為提供數(shù)據(jù)采集服務的軟件容器。
大部分物理硬件不具備兼容性、隔離性、封裝性和獨立性的優(yōu)勢,而虛擬數(shù)據(jù)采集服務器是由多個虛擬數(shù)據(jù)采集站組成,每個虛擬數(shù)據(jù)采集站都存儲著要采集的數(shù)據(jù)采集站的應用程序和操作系統(tǒng),無硬件結(jié)構,擁有全軟件性,可以通過虛擬數(shù)據(jù)接口接收并發(fā)送到數(shù)據(jù)庫進行并行存儲。
(2)計算虛擬化
計算虛擬化可使虛擬數(shù)據(jù)采集服務器擁有虛擬化程序,完成虛擬數(shù)據(jù)采集服務器的虛擬化,將其轉(zhuǎn)變?yōu)檫壿嬞Y源,使硬盤、CPU等分開運行的物理資源能夠服從統(tǒng)一管理[11],可以在1臺物理服務器上建立相互隔離、同時運行的虛擬機執(zhí)行環(huán)境,提高資源利用率和系統(tǒng)性能,降低復雜度,高效可靠地完成系統(tǒng)服務。
(3)存儲虛擬化
以分布式存儲技術為主,加入能夠提升服務器硬盤性能的SSD讀寫緩存加速技術以及可將信息數(shù)據(jù)存儲至數(shù)個服務器硬盤中的多副本機制技術,實現(xiàn)存儲虛擬化[12],它可以將所有服務器的存儲空間結(jié)合起來,形成一個共享的告警信息存儲資源池,大大提高告警信息的存儲和安全性,保證相關服務的有效執(zhí)行。
(4)網(wǎng)絡虛擬化
為了提升網(wǎng)絡的傳輸效率,降低網(wǎng)絡連接和轉(zhuǎn)換模式,可根據(jù)需求自動實現(xiàn)網(wǎng)絡調(diào)用,構建共享網(wǎng)絡,如圖4所示。
圖4中,在應用程序和存儲服務器中,以多臺服務器為聯(lián)結(jié)點,將虛擬機與共享網(wǎng)絡結(jié)合起來,降低網(wǎng)絡連接和轉(zhuǎn)換模式。
圖4 超融合網(wǎng)絡結(jié)構
發(fā)電廠告警信息數(shù)據(jù)在傳輸過程中會存在誤差,因此基于ON-CALL系統(tǒng)的數(shù)據(jù)傳輸特點,采用DLPTP時鐘同步機制的對時方法作為采集子系統(tǒng)對告警信息采集的控制機制[13]。該方法采用點對點方式作為電廠主站與各監(jiān)測采集點之間的通信方式,完成告警信息的采集,提高了網(wǎng)絡信道傳輸時延的計算,避免了傳輸誤差。
根據(jù)定制的DLPTP協(xié)議算法,反復計算時鐘誤差,對采集終端和電能表的時鐘進行校正,其主要步驟如下:
(1)采集終端接收由主站發(fā)送的報文,且具有時間標簽t1,并將t2作為接收到報文的時間。
(2)采集終端將一幀對應的報文回傳至主站,主站完成報文接收,并且將回傳的時間和接收的時間記錄為t3和t4。
(3)主站向采集終端傳送時間報文,且該報文屬于一幀數(shù)據(jù)域內(nèi),內(nèi)容和時標分別為t4和t5。
(4)接收報文后,采集終端將該時間標記為t6,以此采集終端共獲取6個時間標記,分別為t1、t2、t3、t4、t5、t6,并根據(jù)t6-t5和t2-t1之間是否存在等同關系,判斷網(wǎng)絡信道在時鐘同步時的狀態(tài)。
(5)若結(jié)果表示信道為穩(wěn)定狀態(tài),則網(wǎng)絡之間的延時為:((t4-t1)-(t3-t2))/2;采集終端的時鐘修正為:t5+((t4-t1)-(t3-t2))/2。若結(jié)果表示信道為不穩(wěn)定狀態(tài),則采集終端對主站回應無效,則需讓主站重新履行上述流程,該實行次數(shù)可根據(jù)實際情況設置。
(6)成功完成采集終端時鐘同步修正后,需對電能表的時鐘實行定時抄讀,將抄讀結(jié)果與采集終端的時鐘對比[14],加入其超過設定閾值,則采集終端向主站上報以此形成的時鐘異常事件。
(7)主站利用DLPTP協(xié)議算法,采取其和采集終端同步的方式,對時鐘異常事件實行同步處理,同步流程如圖5所示。
圖5 同步流程圖
告警識別是在對采集到的告警信息進行挖掘的基礎上,確定告警事件的類型,這是告警通知的前提。利用關聯(lián)規(guī)則算法對告警信息數(shù)據(jù)進行挖掘,得到數(shù)據(jù)中的關聯(lián)規(guī)則[15],并根據(jù)不同的告警因素完成告警信息分類。
第k種告警信息和其對應的權值分別用ik和wk表示,則H={h1,h2,...,hm}和W={w1,w2,...,wm}分別表示每一種告警信息的分類集合和全部告警對應的權值集合。采用時間跨度interval對告警數(shù)據(jù)實行劃分處理,形成告警集g,且該處理根據(jù)時間順序完成;k項告警頻繁項目集用L表示,其組成的元素{hj1,hj2,...,hjk}(1<jk<m)為H中的k個不同告警,并且該元素符合最小支持度小于、元素之間的告警規(guī)則為:
挖掘告警數(shù)據(jù)關聯(lián)規(guī)則算法的詳細計算過程如圖6所示。
(1)采用時間跨度interval對告警數(shù)據(jù)實行劃分處理,將告警集中冗余、重疊的告警類別刪除后形成告警集g,且該處理根據(jù)時間順序完成。
(2)對g實行查找,獲取頻繁項目集L1,且屬于1項。
(3)為獲取Lk(k≥2)項告警頻繁項集Lk,在Lk-1為k-1項告警頻繁項目集的前提下,對g實行查找完成,停止條件為獲取的為空集。
(4)將告警頻繁項目集實行融合,即L=L1∪L2∪...Lm(1<n<m)。
圖6 關聯(lián)規(guī)則挖掘算法流程
(5)對L中的各個元素Lk實行遍歷操作,獲取符合最小置信度的告警關聯(lián)規(guī)則的元素,并對實行求解,重復該操作,當該項集中所有元素都完成遍歷則停止。
(6)向規(guī)則庫中輸入遍歷獲取的符合標準的告警關聯(lián)規(guī)則。
以此獲得將告警信息分類結(jié)果,經(jīng)超融合共享網(wǎng)絡實現(xiàn)發(fā)電廠ON-CALL系統(tǒng)告警信息采集虛擬化。
以某發(fā)電廠的機組(2×25 MW、4×125 MW)作為實例測試對象,驗證本文方法的應用效果。
該發(fā)電廠要求ON-CALL系統(tǒng)各項功能必須滿足運營需求標準,信息采集時的延時誤差不可超過1 s,且必須保證ON-CALL系統(tǒng)的存儲性能。
測試應用本文方法后ON-CALL系統(tǒng)各項功能的應用性能,主要從系統(tǒng)告警用戶管理、告警資料管理、告警信息發(fā)布、手機終端信息發(fā)布幾方面完成,測試應用本文方法后ON-CALL系統(tǒng)功能是否滿足使用標準,結(jié)果如表1所示。
根據(jù)表1的測試結(jié)果可知,應用本文方法后,ON-CALL系統(tǒng)的告警用戶管理、告警資料管理、告警信息發(fā)布、手機終端信息發(fā)布幾方面功能的使用性能良好,能夠滿足用戶使用標準。
選取文獻[5]和[6]的基于NTP協(xié)議的用電信息采集系統(tǒng)的時間同步方法和基于虛擬蜜網(wǎng)的用電信息采集系統(tǒng)攻擊檢測方法作與本文方法進行對比,統(tǒng)計3種方法應用后的告警信息對時采集的誤差,見圖7。
圖7 3種方法應用后系統(tǒng)對時采集誤差平均值
根據(jù)圖7的測試結(jié)果可知,應用本文方法的ON-CALL系統(tǒng)在進行不同次數(shù)的時鐘同步時,最小平均誤差和最大平均誤差分別為0.08 s和0.16 s;應用另外2種對比方法的系統(tǒng)最小平均誤差和最大平均誤差分別為1.06 s和1.48 s、1.08 s和1.56 s;應用本文方法的ON-CALL系統(tǒng)的平均誤差最小,顯著優(yōu)于2種對比方法,誤差均在0.2 s以內(nèi),符合使用需求標準。
在進行大型數(shù)據(jù)量的操作時,ON-CALL系統(tǒng)的空間效率是影響其運行的重要指標。為測試應用本文方法的ON-CALL系統(tǒng)告警信息分類計算性能,連續(xù)3個月內(nèi)采集大小為20 GB的告警信息時的內(nèi)存使用情況,統(tǒng)計3種方法應用后的系統(tǒng)空間效率,結(jié)果見圖8。
圖8 應用3種方法后系統(tǒng)占用內(nèi)存對比結(jié)果
根據(jù)圖8的測試結(jié)果可知,應用本文方法后,ON-CALL系統(tǒng)在進行較小數(shù)據(jù)量的告警信息分類計算時,與應用2種對比方法后的系統(tǒng)占用情況較為接近,差距極小;但是隨著數(shù)據(jù)量的增加,應用本文方法的系統(tǒng)占用內(nèi)存逐漸降低,而應用2種對比方法的系統(tǒng)占用內(nèi)存呈上升趨勢,這是由于本文方法采用關聯(lián)規(guī)則對告警信息頻繁項集實行挖掘,可有效忽略冗余告警集,并且通過基于超融合基礎架構的采集虛擬化設計過程,極大程度降低對內(nèi)存占用率,使系統(tǒng)具備良好的空間效率。
為測試本文方法的虛擬化能力,測試應用3種方法后系統(tǒng)在相同情況下的運行結(jié)果,如表2所示。
表2 應用3種方法后系統(tǒng)的虛擬化測試結(jié)果
根據(jù)表2測試結(jié)果可知,應用本文方法的ONCALL系統(tǒng)優(yōu)于應用其他2種對比方法的系統(tǒng)虛擬化效果,是因為超融合基礎架構可有效提升數(shù)據(jù)中心的運行效率,其虛擬化效果更為顯著。
發(fā)電廠ON-CALL系統(tǒng)是實現(xiàn)無人看守時監(jiān)控告警的重要手段,但是其需要采集的告警信息數(shù)量巨大,為實現(xiàn)更好的告警信息采集和處理,發(fā)電廠ON-CALL系統(tǒng)引入基于超級融合基礎架構的告警信息采集虛擬化設計過程,應用一個服務器同時完成多個系統(tǒng)操作目標,實現(xiàn)采集、計算、存儲以及網(wǎng)絡的虛擬化,保證系統(tǒng)的最佳運行,可實現(xiàn)告警信息的實時采集,為該領域的相關研究提供參考。