徐曉虹,鄭 昀
(北京市化工職業(yè)病防治院,北京 100093)
配電設(shè)備處于電力配電系統(tǒng)的末端,直接向企業(yè)與用戶分配與供應(yīng)電能,其穩(wěn)定性與可靠性對(duì)于工業(yè)生產(chǎn)及人類生活均十分重要。為了將人工操作失誤率降低,減少人力資源浪費(fèi),提供便利且可行的控制方式于配電設(shè)備的自動(dòng)化監(jiān)控與維護(hù),必須以合理的控制邏輯為支持,對(duì)配電設(shè)備施以計(jì)算機(jī)管理[1]。目前,我國不少供電公司存在著配電設(shè)備類型多、人員配置緊湊的問題,致使公司面臨較大的設(shè)備運(yùn)行維護(hù)與故障搶修壓力,故障搶修時(shí)間長,一旦有大面積多點(diǎn)故障出現(xiàn),將會(huì)難以應(yīng)對(duì)。所以,需要借助先進(jìn)的科技手段進(jìn)行配電設(shè)備運(yùn)行監(jiān)控與故障診斷系統(tǒng)的設(shè)計(jì),在遠(yuǎn)程故障診斷與預(yù)(告)警系統(tǒng)的支持下縮短故障搶修時(shí)間,實(shí)現(xiàn)配電設(shè)備監(jiān)控智能化[2]。劉明祥等[3]提出一種配電設(shè)備運(yùn)行狀態(tài)綜合評(píng)估方法,并以此為基礎(chǔ)進(jìn)行了設(shè)備狀態(tài)多維度評(píng)估指標(biāo)體系的構(gòu)建,但體系涉及的設(shè)備自身運(yùn)行狀態(tài)因素中的關(guān)鍵硬件狀態(tài)與環(huán)境因素等數(shù)據(jù)通常在配電設(shè)備中并未采集,故此評(píng)估方法很難在實(shí)際應(yīng)用中取得理想結(jié)果。張鐵峰等[4]通過研究一體化配電網(wǎng)智能運(yùn)行與維護(hù)系統(tǒng),明確了系統(tǒng)的技術(shù)架構(gòu)及實(shí)現(xiàn)技術(shù),但該項(xiàng)研究主要以配電網(wǎng)一次系統(tǒng)的運(yùn)行與維護(hù)為重點(diǎn),并未涉及到配電設(shè)備運(yùn)行狀態(tài)的監(jiān)控與維護(hù)管理。針對(duì)配電設(shè)備傳統(tǒng)運(yùn)行與維護(hù)存在的不足以及所需解決的相應(yīng)問題,文章提出一種以大數(shù)據(jù)為基礎(chǔ)的配電設(shè)備運(yùn)行狀態(tài)監(jiān)控與故障預(yù)警系統(tǒng)設(shè)計(jì)方案,以此方案為指導(dǎo),利用大數(shù)據(jù)技術(shù)對(duì)所采集的配電設(shè)備運(yùn)行數(shù)據(jù)進(jìn)行實(shí)時(shí)分析,實(shí)現(xiàn)對(duì)配電設(shè)備的采集監(jiān)控、預(yù)警分析與閉環(huán)管理,提供可靠的決策支持于檢修策略的優(yōu)化、設(shè)備的選型以及備品備件等的管理。
配電設(shè)備運(yùn)行狀態(tài)監(jiān)控與故障預(yù)警系統(tǒng)主要由數(shù)據(jù)采集層、集成計(jì)算層、數(shù)據(jù)分析層以及應(yīng)用層組成[5],在集成信息通信一體化調(diào)度運(yùn)行支撐平臺(tái)的基礎(chǔ)之上,統(tǒng)一管理配電設(shè)備資源,高效挖掘大量的配電設(shè)備數(shù)據(jù)信息,及時(shí)定位、分析、預(yù)警并解決設(shè)備運(yùn)行故障,達(dá)到全面提升配電設(shè)備運(yùn)行與維護(hù)整體水平的目的。系統(tǒng)總體架構(gòu)如圖1所示。
圖1 配電設(shè)備運(yùn)行狀態(tài)監(jiān)控與故障預(yù)警系統(tǒng)總體架構(gòu)Fig.1 Overall architecture of power distribution equipment operation status monitoring and fault early warning system
數(shù)據(jù)采集層以數(shù)據(jù)采集協(xié)議為基礎(chǔ)采集配電設(shè)備的運(yùn)行與應(yīng)用數(shù)據(jù),系統(tǒng)采集的各種數(shù)據(jù)信息主要涉及基礎(chǔ)設(shè)施數(shù)據(jù)、系統(tǒng)運(yùn)維數(shù)據(jù)以及外部數(shù)據(jù)等;集成計(jì)算層匯聚、存儲(chǔ)并清洗多元異構(gòu)數(shù)據(jù),提供批量數(shù)據(jù)以及實(shí)時(shí)流數(shù)據(jù)計(jì)算服務(wù);數(shù)據(jù)分析預(yù)警層基于大數(shù)據(jù)挖掘技術(shù)及海量的配電設(shè)備運(yùn)行狀態(tài)歷史數(shù)據(jù)對(duì)設(shè)備的先期故障特征進(jìn)行分析,在實(shí)時(shí)分析設(shè)備狀態(tài)數(shù)據(jù)的基礎(chǔ)之上發(fā)布設(shè)備異常預(yù)警[6];應(yīng)用層基于底部支撐實(shí)現(xiàn)上層應(yīng)用,提供前臺(tái)交互服務(wù),系統(tǒng)主要包括采集監(jiān)控、預(yù)警分析、閉環(huán)管理與決策輔助4大功能應(yīng)用。
基于大數(shù)據(jù)的配電設(shè)備運(yùn)行狀態(tài)監(jiān)控與故障預(yù)警系統(tǒng)通過實(shí)時(shí)流處理技術(shù)以及自行編寫的業(yè)務(wù)模塊完成數(shù)據(jù)挖掘分析(異常檢出)、預(yù)警通知與可視化3項(xiàng)功能。
配電設(shè)備運(yùn)行數(shù)據(jù)日志的異常檢測應(yīng)將非結(jié)構(gòu)化原始日志向結(jié)構(gòu)化日志模式的轉(zhuǎn)化作為首要任務(wù)[7]。根據(jù)異常檢測算法的輸入要求,日志模式提取程序?qū)⒔Y(jié)構(gòu)化數(shù)據(jù)輸入生成,在分析端以分布式流處理技術(shù)為支持執(zhí)行對(duì)日志模式的提取任務(wù),結(jié)合全局異常檢測算法以及綜合時(shí)序模型的具體輸入生成經(jīng)過聚合與轉(zhuǎn)換的結(jié)構(gòu)化輸入。
日志模式提取任務(wù)由在Storm集群中部署的定制化Topology來執(zhí)行。Storm集群基于Kafka消費(fèi)者模式進(jìn)行流數(shù)據(jù)源(Spout)的建立,連續(xù)讀取存儲(chǔ)于消息隊(duì)列的日志。Topology完成日志模式提取之后,將生成的分類結(jié)果存儲(chǔ)于Redis中,為數(shù)據(jù)挖掘模塊的查詢與調(diào)用提供便利。Storm集群與Zookeeper集群共同擔(dān)負(fù)起對(duì)分布式流式處理過程的監(jiān)控與任務(wù)分配職責(zé)。
分布式流處理程序?yàn)槟J椒诸愑?jì)算的并行化實(shí)現(xiàn)提供保證,與傳統(tǒng)批處理算法相比有更為突出的實(shí)時(shí)性特點(diǎn)。全部分類結(jié)果均在Redis中存儲(chǔ),并接受globalinfo的維護(hù),全局?jǐn)?shù)據(jù)的一致性由此能夠得到保證。
在完成日志模式化與統(tǒng)計(jì)工作之后,各類配電設(shè)備及相關(guān)模塊的日志模式化信息以及分時(shí)間窗的統(tǒng)計(jì)信息全部暫存于Redis中。此時(shí),綜合時(shí)序分析模塊與全局異常檢測模塊對(duì)Redis上的結(jié)構(gòu)化日志數(shù)據(jù)進(jìn)行讀取,執(zhí)行時(shí)序分析與異常檢測的任務(wù)。大量結(jié)構(gòu)化中間數(shù)據(jù)存儲(chǔ)于Redis上,可結(jié)合異常檢測模塊的差異化需求提取并調(diào)用這些數(shù)據(jù)。具體抽取方法及聚合粒度通過程序模塊來實(shí)現(xiàn),綜合時(shí)序分析模型根據(jù)系統(tǒng)配置的日志模式進(jìn)行各時(shí)間單元內(nèi)日志模式的抽取,生成時(shí)間序列,以此為基礎(chǔ)執(zhí)行綜合時(shí)序分析與異常檢測任務(wù)。全局異常檢測模塊利用Storm集群在高維場景下計(jì)算異常因子,并結(jié)合設(shè)定好的閾值對(duì)異常點(diǎn)作出判別。如果日志模式有較多分類,則采用數(shù)據(jù)降維法降維處理全局異常檢出模塊的數(shù)據(jù)輸入,達(dá)到節(jié)省算法計(jì)算時(shí)間的目的。如果檢測結(jié)果為異常,預(yù)警通知模塊將會(huì)發(fā)出短信或郵件告警,提醒運(yùn)維人員及時(shí)采取措施規(guī)避故障的發(fā)生。
出于對(duì)配電設(shè)備故障發(fā)生具有緊急性與時(shí)效性特點(diǎn)的考慮,系統(tǒng)采用短信形式優(yōu)先向運(yùn)維人員發(fā)出通知,為其提前做出響應(yīng)提供便利。為了在故障解決過程中提供有效參考于故障的恢復(fù),系統(tǒng)還應(yīng)將可能出現(xiàn)故障的配電設(shè)備的基礎(chǔ)信息、異常檢出結(jié)果等采用郵件的方式發(fā)送給運(yùn)維人員與設(shè)備供應(yīng)商,為問題的快速定位提供便利。
在解決相應(yīng)故障之后,業(yè)務(wù)人員與數(shù)據(jù)分析人員還要執(zhí)行對(duì)日志的溯源與經(jīng)驗(yàn)歸納任務(wù),對(duì)此,系統(tǒng)應(yīng)采用可視化方式將日志統(tǒng)計(jì)信息、異常檢測數(shù)據(jù)結(jié)果等呈現(xiàn)出來,便于形成有效的知識(shí)進(jìn)行真實(shí)環(huán)境的部署。
采集監(jiān)控模塊對(duì)數(shù)據(jù)的采集頻率為5 min/次,模塊采集的內(nèi)部數(shù)據(jù)信息包括基礎(chǔ)設(shè)施數(shù)據(jù)以及系統(tǒng)運(yùn)維數(shù)據(jù)2種類型,前者由各類配電設(shè)備、數(shù)據(jù)庫以及中間件的實(shí)時(shí)與歷史數(shù)據(jù)構(gòu)成;后者則主要包括配電設(shè)備運(yùn)行狀態(tài)監(jiān)控與故障系統(tǒng)各主要頁面的響應(yīng)數(shù)據(jù)以及響應(yīng)時(shí)長等指標(biāo)。
針對(duì)實(shí)時(shí)產(chǎn)生的數(shù)據(jù),使用Flume實(shí)時(shí)數(shù)據(jù)采集技術(shù)進(jìn)行收集,此方式可將最新數(shù)據(jù)發(fā)送至分布式集群執(zhí)行實(shí)時(shí)處理操作,快速生成分析結(jié)果;針對(duì)歷史數(shù)據(jù),使用Storm對(duì)其進(jìn)行分析,通過Kafka消息生成器對(duì)歷史數(shù)據(jù)流進(jìn)行逐條讀取,并將其發(fā)送至分布式集群作進(jìn)一步的分析,該模式可復(fù)現(xiàn)與回溯以往發(fā)生的故障案例,有利于故障的復(fù)核及問題歸因。采集監(jiān)控模塊的功能在于監(jiān)控并采集各類數(shù)據(jù)信息,對(duì)內(nèi)外部數(shù)據(jù)進(jìn)行高效傳輸與匯聚,為上層應(yīng)用奠定基礎(chǔ)。
原始數(shù)據(jù)的產(chǎn)生到故障預(yù)警的生成需要經(jīng)歷模式化、指標(biāo)計(jì)算以及算法分析等流程,以分布式大數(shù)據(jù)技術(shù)為支持,為配電設(shè)備運(yùn)行產(chǎn)生的海量日志的及時(shí)處理提供保證。運(yùn)維人員與業(yè)務(wù)人員需要分別對(duì)設(shè)備異常檢測結(jié)果進(jìn)行故障追因與業(yè)務(wù)求證,在對(duì)比并認(rèn)證原始日志與故障樣本之后,生成新的規(guī)則并將其在知識(shí)庫中存儲(chǔ)。運(yùn)維人員、業(yè)務(wù)人員以及數(shù)據(jù)分析人員共同參與故障預(yù)警規(guī)則及相關(guān)知識(shí)的生成。以多方檢驗(yàn)及求證為基礎(chǔ),配電設(shè)備運(yùn)行狀態(tài)監(jiān)控與故障預(yù)警系統(tǒng)可以在持續(xù)的運(yùn)行過程中不斷將異常檢測精度提高,同時(shí),實(shí)現(xiàn)對(duì)各類故障預(yù)警覆蓋范圍的擴(kuò)大?;谂潆娫O(shè)備運(yùn)行數(shù)據(jù)的日志處理及故障預(yù)警流程如圖2所示。
圖2 配電設(shè)備運(yùn)行數(shù)據(jù)日志處理與故障預(yù)警流程Fig.2 Distribution equipment operation data log processing and fault warning process
由圖2可知,配電設(shè)備產(chǎn)生的日志數(shù)據(jù)在模式化、指標(biāo)計(jì)算、算法檢測、故障確認(rèn)、數(shù)據(jù)分析以及規(guī)則發(fā)現(xiàn)等一系列處理之后生成可用知識(shí)存儲(chǔ)在知識(shí)庫中,并在系統(tǒng)運(yùn)行過程中對(duì)后續(xù)異常問題的檢出結(jié)果產(chǎn)生影響,以此實(shí)現(xiàn)對(duì)運(yùn)行狀態(tài)分析效率以及故障預(yù)警準(zhǔn)確度的提高。
為了提高配電設(shè)備消缺管理流程的規(guī)范化程度,系統(tǒng)以Activiti工作流為基礎(chǔ)提供配電設(shè)備故障閉環(huán)流程管理功能,整個(gè)流程由設(shè)備故障提取、故障確認(rèn)、消缺派工管理、現(xiàn)場消缺與信息反饋、反饋信息審核等子環(huán)節(jié)[8]共同構(gòu)成。
(1)設(shè)備運(yùn)維檢修計(jì)劃優(yōu)化。根據(jù)配電設(shè)備故障預(yù)警的實(shí)際情況對(duì)運(yùn)維檢修計(jì)劃進(jìn)行優(yōu)化安排,在減少不必要的檢修工作、保證工作效率的同時(shí),防患于未然,采取提前、主動(dòng)的維護(hù)措施對(duì)故障的發(fā)生加以規(guī)避。例如針對(duì)存在嚴(yán)重故障風(fēng)險(xiǎn)的配電設(shè)備立即安排維修;針對(duì)存在異常運(yùn)行狀態(tài)的設(shè)備優(yōu)先安排維護(hù)檢修計(jì)劃;針對(duì)需引起注意的設(shè)備應(yīng)將其列入日常運(yùn)維觀察列表之中。
(2)家族性缺陷分析。在聚類與關(guān)聯(lián)分析各類配電設(shè)備故障的基礎(chǔ)之上,對(duì)設(shè)備故障缺陷所表現(xiàn)出來的家族性特征進(jìn)行識(shí)別,制定運(yùn)行維護(hù)策略及計(jì)劃。舉例而言,若通過家族性缺陷分析發(fā)現(xiàn)某廠家某一型號(hào)的特定版本或批號(hào)的配電設(shè)備出現(xiàn)某類故障的次數(shù)比較多,可針對(duì)其制定統(tǒng)一批量維護(hù)與升級(jí)的計(jì)劃。
(3)備品備件管理優(yōu)化。圍繞廠家、型號(hào)、版本以及年限等角度對(duì)配電設(shè)備展開深入的分析,與設(shè)備運(yùn)行狀態(tài)監(jiān)控及故障預(yù)警相結(jié)合,預(yù)測今后特定時(shí)期內(nèi)所需配電設(shè)備備品備件的種類及數(shù)量,以此為基礎(chǔ)進(jìn)行備品備件采購計(jì)劃的優(yōu)先安排。①規(guī)避在配電設(shè)備出現(xiàn)故障之時(shí)由于備品備件的欠缺而延誤故障處理時(shí)間這一問題的發(fā)生;②減少不必要的備品備件采購。
上述系統(tǒng)使用配電設(shè)備運(yùn)行數(shù)據(jù)日志的實(shí)時(shí)采集,通過時(shí)序分析模塊與全局異常檢測模塊進(jìn)行故障檢測,并在發(fā)現(xiàn)故障時(shí)基于預(yù)警通知模塊,及時(shí)提醒運(yùn)維管理人員,以溫度監(jiān)控為例,在選定監(jiān)控設(shè)備后,系統(tǒng)界面可實(shí)時(shí)顯示設(shè)備溫度變化的數(shù)據(jù)日志,可見,通過異常檢測,可得設(shè)備溫度未出現(xiàn)明顯變化,較為平穩(wěn),此時(shí)未見故障。
為檢驗(yàn)上述系統(tǒng)的可行性,本文選用人工檢測方法、文獻(xiàn)[3]指標(biāo)評(píng)價(jià)方法作為參照對(duì)象,以實(shí)地采集的配電網(wǎng)設(shè)備運(yùn)行數(shù)據(jù)日志為測試源,其中無故障、存在故障的配電網(wǎng)設(shè)備日志分別為86、72個(gè),故障主要表征為導(dǎo)線、絕緣纖芯等損傷。配電設(shè)備運(yùn)行數(shù)據(jù)日志中的故障信息見表1。
根據(jù)表1配電設(shè)備運(yùn)行數(shù)據(jù)日志中的故障信息,選用變壓器漏油數(shù)據(jù)日志為實(shí)驗(yàn)組,遵循上述故障預(yù)警流程進(jìn)行異常檢測,所得結(jié)果如圖3所示??梢姡萌斯z測與指標(biāo)評(píng)價(jià)方法進(jìn)行故障預(yù)警后,變壓器漏油量差異較小,而對(duì)比之下,上述研究所提出的方法因能夠高效、精準(zhǔn)的進(jìn)行故障預(yù)警,極大的減少了變壓器漏油量,故而,漏油量最少,驗(yàn)證了其應(yīng)用的優(yōu)勢性。
圖3 各方法對(duì)變壓器漏油故障預(yù)警結(jié)果Fig.3 Early warning results of various methods for transformer oil leakage fault
同時(shí),為驗(yàn)證上述方法故障預(yù)警的可靠性,本文以表1中的故障為例,選用檢測正確率、召回率和F
表1 配電設(shè)備運(yùn)行數(shù)據(jù)日志中的故障信息Tab.1 Fault information in operation data log of distribution equipment
值作為評(píng)價(jià)指標(biāo),分析其與人工檢測方法、指標(biāo)評(píng)價(jià)方法的差異性,所得結(jié)果如圖4所示。
圖4 各方法故障預(yù)警的可靠性結(jié)果Fig.4 Reliability results of fault early warning of each method
顯然,從故障預(yù)警的正確率看,研究所提出的方法正確率優(yōu)于其他2類方法,且正確率變幅較小,較為平穩(wěn);而且,檢測召回率最高,并隨著實(shí)驗(yàn)次數(shù)的增加大幅增加,表明研究所提方法對(duì)于配電設(shè)備運(yùn)行故障的檢測查全率最優(yōu),由此,也可推理得出研究方法的F值最高,驗(yàn)證了其在配電設(shè)備運(yùn)行故障預(yù)警中具有高度可靠性,具有應(yīng)用可行性。
圍繞具體的業(yè)務(wù)需求,文章進(jìn)行基于大數(shù)據(jù)的配電設(shè)備運(yùn)行狀態(tài)監(jiān)控與故障預(yù)警系統(tǒng)設(shè)計(jì),研究配電設(shè)備采集監(jiān)控、預(yù)警分析、故障閉環(huán)管理以及輔助決策等主要應(yīng)用,有利于彌補(bǔ)傳統(tǒng)配電設(shè)備運(yùn)行與維護(hù)管控方式中存在的不足,提高配電設(shè)備運(yùn)行狀態(tài)監(jiān)控及故障預(yù)警效率,提供有效支撐于配電設(shè)備的可靠運(yùn)行。今后,研究人員應(yīng)進(jìn)一步擴(kuò)大配電設(shè)備大數(shù)據(jù)來源,制定更為詳細(xì)與完善的監(jiān)控與預(yù)警方案,與配電設(shè)備的遠(yuǎn)程運(yùn)維支持相結(jié)合,進(jìn)一步優(yōu)化配電設(shè)備的運(yùn)行、維護(hù)及管理水平。