武 江 王 寧 陳毅波 劉 琪 王 梓 王 剛
?
基于大數(shù)據(jù)的設(shè)備家族性缺陷分析
武江1王寧2陳毅波3劉琪1王梓4王剛1
1.南瑞集團(tuán)北京科東公司;2.國網(wǎng)黑龍江省電力有限公司;3.國網(wǎng)湖南省電力公司;4.國網(wǎng)天津市電力公司
行業(yè)曲線
大數(shù)據(jù)時代的到來,特別是大數(shù)據(jù)技術(shù)在數(shù)據(jù)存儲、數(shù)據(jù)挖掘等領(lǐng)域的廣泛應(yīng)用,為電網(wǎng)運(yùn)行數(shù)據(jù)進(jìn)行深度挖掘提供了可能。針對原有的設(shè)備家族性缺陷分析需要依靠人工記錄和判斷的現(xiàn)狀,本文通過研究大數(shù)據(jù)在數(shù)據(jù)存儲與數(shù)據(jù)挖掘方面的最新技術(shù),結(jié)合設(shè)備家族性缺陷分析的業(yè)務(wù)特點(diǎn),提出了基于大數(shù)據(jù)的設(shè)備家族性缺陷分析系統(tǒng)架構(gòu),實(shí)現(xiàn)了設(shè)備家族性缺陷的智能分析與預(yù)測,提高了電網(wǎng)監(jiān)控專業(yè)的業(yè)務(wù)水平與工作效率,保障了電網(wǎng)的安全穩(wěn)定運(yùn)行。
在當(dāng)前電網(wǎng)運(yùn)行環(huán)境中,電力設(shè)備發(fā)生缺陷,尤其是危急和嚴(yán)重缺陷,會危及人身的安全和設(shè)備、電網(wǎng)的可靠穩(wěn)定運(yùn)行,電力設(shè)備在設(shè)計(jì)、制造、安裝、運(yùn)行、檢修等環(huán)節(jié)的任何一個過程、環(huán)節(jié)稍有不慎,都會給設(shè)備帶來缺陷或者隱患。
目前針對設(shè)備運(yùn)行中出現(xiàn)的缺陷與故障,主要靠人為上報確認(rèn),當(dāng)設(shè)備發(fā)生缺陷或故障時,會伴隨發(fā)生相關(guān)的告警信息,站端人員通過電話溝通通知主站的監(jiān)控人員,監(jiān)控人員將缺陷或故障信息記錄到監(jiān)控日志當(dāng)中。
隨著“大數(shù)據(jù)時代”的到來,許多行業(yè)將大數(shù)據(jù)技術(shù)應(yīng)用于存儲、分析與處理海量的結(jié)構(gòu)化/非結(jié)構(gòu)化數(shù)據(jù),突破了原有的技術(shù)壁壘,也為電網(wǎng)公司分析、處理海量數(shù)據(jù),多維度挖掘設(shè)備與事件之間的關(guān)聯(lián)關(guān)系提供了新的方向。
國調(diào)設(shè)備監(jiān)控專業(yè)“十三五”規(guī)劃明確提出了開展設(shè)備運(yùn)行大數(shù)據(jù)分析的要求,實(shí)現(xiàn)設(shè)備履歷與設(shè)備缺陷、告警信息等的關(guān)聯(lián)應(yīng)用,尋找設(shè)備家族性的缺陷,達(dá)到保障電網(wǎng)穩(wěn)定運(yùn)行目的,提高電網(wǎng)監(jiān)控業(yè)務(wù)故障分析的智能化水平,現(xiàn)提出基于大數(shù)據(jù)的設(shè)備家族性缺陷分析方案。
本文首先依據(jù)電網(wǎng)數(shù)據(jù)的存儲特點(diǎn)與原理,結(jié)合設(shè)備家族性缺陷分析的業(yè)務(wù)特點(diǎn),提出了基于大數(shù)據(jù)的設(shè)備家族性缺陷分析的系統(tǒng)架構(gòu),從數(shù)據(jù)采集->數(shù)據(jù)存儲->數(shù)據(jù)挖掘->數(shù)據(jù)應(yīng)用建立了一套完成的解決方案,不僅解決了數(shù)據(jù)源的接入與存儲從而形成了用于設(shè)備家族性缺陷分析的大數(shù)據(jù),同時通過數(shù)據(jù)挖掘技術(shù),設(shè)定分析規(guī)則與模型,為上層的分析應(yīng)用提供了技術(shù)支撐。最后,通過展示具體的應(yīng)用案例,驗(yàn)證了本方案的可行性與有效性。
總體架構(gòu)
本系統(tǒng)通過整合D5000系統(tǒng)設(shè)備遙信、遙測等數(shù)據(jù)、OMS系統(tǒng)設(shè)備缺陷、故障、檢修、臺賬等數(shù)據(jù),基于大數(shù)據(jù)平臺建立以設(shè)備為核心的數(shù)據(jù)模型,利用數(shù)據(jù)挖掘技術(shù)建立設(shè)備缺陷、故障識別模型,自動識別設(shè)備缺陷、故障告警信息,同時支持自定義設(shè)備缺陷、故障規(guī)則定制,正向判定存在缺陷、故障設(shè)備,實(shí)現(xiàn)設(shè)備家族性缺陷分析。系統(tǒng)架構(gòu)圖如圖1所示。
缺陷規(guī)則定義
依據(jù)人為定義的缺陷規(guī)則找出缺陷設(shè)備,并展示其家族設(shè)備缺陷情況、檢修情況、告警信息等。
缺陷斷線=控制回路斷線,即對于斷路器,包含“控制回路斷線”的告警內(nèi)容在6秒內(nèi)頻發(fā)次數(shù)大于3,可確認(rèn)此開關(guān)存在設(shè)備缺陷的概率為80%。Sql:select * from“PSIDP”.”HISDB”.”YX_BW_OVER_2015_06”a where 信號內(nèi)容 like ‘%斷線%’ and 設(shè)備表ID=407 order by 發(fā)生時間,以設(shè)備為出發(fā)點(diǎn),查詢告警數(shù)據(jù)中的內(nèi)容,結(jié)合缺陷規(guī)則定義及關(guān)鍵字鎖定此設(shè)備的ID,同時關(guān)聯(lián)設(shè)備臺帳,尋找同一廠家生產(chǎn)的設(shè)備,遍歷所有與這些設(shè)備的關(guān)聯(lián)的特征數(shù)據(jù)信息,得出此廠家生產(chǎn)了多少設(shè)備,其中擁有家族性缺陷的設(shè)備數(shù)量,以及此類設(shè)備擁有家族性缺陷的概率。
圖1 系統(tǒng)架構(gòu)圖
設(shè)備缺陷識別預(yù)警模型
將設(shè)備缺陷、故障識別看成一個分類問題,通過首先采集一批樣本,這批樣本已經(jīng)標(biāo)注了故障類型,通過故障設(shè)備的遙信、遙測數(shù)據(jù)及人工上報的故障文本數(shù)據(jù)作為特征,使用分類算法,建立分類模型,分類模型可以識別出未標(biāo)注故障類型的設(shè)備故障種類。
圖2 文本分類模型
圖3 設(shè)備缺陷識別分析
缺陷識別分類
對于已經(jīng)發(fā)生的缺陷,基于其描述信息(如“一次性設(shè)備缺陷”中的“內(nèi)容”等)和歷史信號(如“遙信、遙測數(shù)據(jù)”等),對其進(jìn)行自動歸類,從而為最終人工判定提供輔助。
比如,對于一個新發(fā)生的缺陷,模型基于該一次性設(shè)備缺陷信息的內(nèi)容和最近一周的電壓等傳感器信號,對其進(jìn)行歸類,輸出可能的缺陷類型及其對應(yīng)的可能性,一個可能的輸出為:”重合閘未動作90%;重合不良10%”。建模流程:
1.缺陷描述信息規(guī)范化,對于關(guān)系型數(shù)據(jù)庫“監(jiān)控日志”中的“一次設(shè)備缺陷”的非結(jié)構(gòu)化設(shè)備缺陷描述(“內(nèi)容”字段)進(jìn)行結(jié)構(gòu)化處理。建立缺陷字典(比如,1代表”重合閘未動作“,2代表”重合不良“等),將每一條缺陷描述指定到對應(yīng)的類別ID。本環(huán)節(jié)是一個典型的文本分類問題。首先,人工標(biāo)注部分的缺陷描述數(shù)據(jù),比如一共有10W條缺陷描述,人工將其中的1W條歸類到對應(yīng)的類別ID。接著使用TF-IDF + BiGram算法提取文本特征,即將一條描述文本轉(zhuǎn)換為一個高維特征向量。然后基于1W條缺陷的類別ID和特征向量,利用支持向量機(jī)算法訓(xùn)練出一個文本分類子模型。子模型調(diào)試完畢,對其余9W條故障描述進(jìn)行分類,從而得到所有文本描述的類別ID。文本分類模型如圖3所示。
2.特征編碼?;谒幸呀?jīng)發(fā)生的缺陷數(shù)據(jù),從描述信息和歷史信號中提取出相應(yīng)特征,并將之編碼為一個特征向量。
3.訓(xùn)練缺陷識別模型。結(jié)合缺陷類別ID和特征向量,分別使用隨機(jī)森林(RandomForest)、邏輯回歸(Logistic Regression)、卷積神經(jīng)網(wǎng)絡(luò)(Convolutional Neural Network)等算法調(diào)試建立一系列子模型。最后,基于融合方法(Ensemble),將上述子模型融合成為一個最終模型。該模型的輸入是設(shè)備的描述信息和歷史信號,輸出是發(fā)生設(shè)備缺陷的分類及概率值。利用標(biāo)注數(shù)據(jù),建立神經(jīng)網(wǎng)絡(luò)子模型如圖4所示,并對全量缺陷數(shù)據(jù)進(jìn)行歸類。
缺陷預(yù)測
對于正常運(yùn)行中的設(shè)備,同樣基于其描述信息(如“設(shè)備臺賬數(shù)據(jù)”中的“生產(chǎn)廠家”等)和歷史信號(如“遙信數(shù)據(jù)”等),預(yù)測其未來一段時間(比如一周)內(nèi)出現(xiàn)缺陷的概率,從而有針對性的指引設(shè)備檢修和應(yīng)對措施。
比如,對于一個正常運(yùn)行的設(shè)備,模型基于該設(shè)備的描述信息和最近一周的電壓等傳感器信號,對其進(jìn)行缺陷預(yù)測,輸出可能的缺陷類型及其發(fā)生的概念,一個可能的輸出為:”未來一周內(nèi),出現(xiàn)重合閘未動作30%;出現(xiàn)重合不良20%;出現(xiàn)未歸類缺陷5%”。
建模流程:
1.缺陷描述信息規(guī)范化,同”缺陷分類“中的方法。
2.選取樣本。發(fā)生的每一條缺陷,以其缺陷分類ID為準(zhǔn);對于正常運(yùn)行超過一個月的設(shè)備,該正常運(yùn)行記錄作為正常類。
3.特征編碼。基于所有已經(jīng)發(fā)生的缺陷數(shù)據(jù),從描述信息和歷史信號中提取出相應(yīng)特征,并將之編碼為一個特征向量。這一步驟類似”缺陷分類“中的方法。
4.建立缺陷預(yù)測模型。結(jié)合類別ID(各個缺陷類別和正常類別)和特征向量,分別使用隨機(jī)森林(RandomForest)、邏輯回歸(Logistic Regression)、卷積神經(jīng)網(wǎng)絡(luò)(Convolutional Neural Network)等算法調(diào)試建立一系列子模型。最后,基于融合方法(Ensemble),將上述子模型融合成為一個最終模型。該模型的輸入是設(shè)備的描述信息和最近一個月的歷史信號,輸出是該設(shè)備未來一周出現(xiàn)各種缺陷的概率。圖5利用樣本數(shù)據(jù)(故障記錄+正常運(yùn)行記錄),建立神經(jīng)網(wǎng)絡(luò)子模型,并對未來一周缺陷發(fā)生進(jìn)行預(yù)測。
圖4 缺陷預(yù)測分析
圖5 設(shè)備缺陷實(shí)時信息分析
基于上述設(shè)備家族性缺陷分析技術(shù)和大數(shù)據(jù)平臺,本系統(tǒng)在實(shí)際的應(yīng)用情況如圖6所示。圖中顯示選中的存在缺陷或者故障的設(shè)備的信息情況,包括基本信息、故障描述等內(nèi)容。點(diǎn)擊型號、廠商顯示同一商場、型號設(shè)備的缺陷故障情況。點(diǎn)擊具體設(shè)備查看設(shè)備其他相關(guān)信息,包括檢修、運(yùn)行情況及警告情況。
本文通過分析設(shè)備運(yùn)行大數(shù)據(jù)的分類及特點(diǎn),建立設(shè)備家族性缺陷分析的大數(shù)據(jù)平臺,利用數(shù)據(jù)挖掘技術(shù)實(shí)現(xiàn)了設(shè)備履歷與設(shè)備缺陷、告警信息等的關(guān)聯(lián)應(yīng)用,不僅提高了尋找設(shè)備家族性缺陷的效率,達(dá)到保障電網(wǎng)穩(wěn)定運(yùn)行目的,而且提高了電網(wǎng)監(jiān)控業(yè)務(wù)故障分析的智能化水平。
DOI:10.3969/j.issn.1001- 8972.2016.13.039