杜冠洲,韋古強(qiáng),凌俊斌
(1.都城偉業(yè)集團(tuán)有限公司,北京 100020;2.國(guó)網(wǎng)江蘇省電力公司經(jīng)濟(jì)技術(shù)研究院,江蘇 南京 210008)
基于數(shù)據(jù)挖掘技術(shù)的風(fēng)電設(shè)備可靠性分析
杜冠洲1,韋古強(qiáng)1,凌俊斌2
(1.都城偉業(yè)集團(tuán)有限公司,北京 100020;2.國(guó)網(wǎng)江蘇省電力公司經(jīng)濟(jì)技術(shù)研究院,江蘇 南京 210008)
本文以風(fēng)電設(shè)備可靠性為研究對(duì)象,分別運(yùn)用C5.0決策樹(shù)和貝葉斯信念網(wǎng)絡(luò)建立風(fēng)電設(shè)備可靠性評(píng)價(jià)模型,并對(duì)兩種分類(lèi)算法的準(zhǔn)確性進(jìn)行了評(píng)估,對(duì)比分析得出,貝葉斯信念網(wǎng)絡(luò)模型的分類(lèi)性能更好,能更好地應(yīng)用于風(fēng)電設(shè)備可靠性的智能評(píng)價(jià),從而為企業(yè)的決策、發(fā)展提供科學(xué)的參考依據(jù)。
風(fēng)電設(shè)備可靠性;C5.0;貝葉斯信念網(wǎng)絡(luò)
近年來(lái),我國(guó)風(fēng)電產(chǎn)業(yè)發(fā)展迅速。2015年,我國(guó)新增安裝風(fēng)電機(jī)組16740臺(tái),新增裝機(jī)容量30753MW,同比增長(zhǎng)32.6%;累積安裝風(fēng)電機(jī)組92981臺(tái),累積裝機(jī)容量145362MW,同比增長(zhǎng)26.8%。風(fēng)電產(chǎn)業(yè)已經(jīng)成為我國(guó)電力產(chǎn)業(yè)的重要組成部分。隨著風(fēng)電機(jī)組裝機(jī)容量越來(lái)越大,系統(tǒng)越來(lái)越復(fù)雜,設(shè)備故障率也隨之增長(zhǎng),導(dǎo)致風(fēng)電機(jī)組的運(yùn)行、維護(hù)成本增加。
目前,我國(guó)風(fēng)電機(jī)組的運(yùn)行、維護(hù)主要借鑒火電機(jī)組的運(yùn)維策略,采用定期維護(hù)和事后維護(hù)的方式。但是,由于風(fēng)電機(jī)組和火電機(jī)組在結(jié)構(gòu)、運(yùn)行環(huán)境和運(yùn)行方式之間的差異,從而導(dǎo)致風(fēng)電機(jī)組運(yùn)維無(wú)法準(zhǔn)確、有效地監(jiān)控設(shè)備的運(yùn)行狀況,容易出現(xiàn)各種設(shè)備故障。
為了提高風(fēng)電機(jī)組的運(yùn)維水平,發(fā)展易維護(hù)、高可靠性、高質(zhì)量的機(jī)組,本文通過(guò)構(gòu)建風(fēng)電設(shè)備可靠性指標(biāo)體系,運(yùn)用C5.0決策樹(shù)、貝葉斯信念網(wǎng)絡(luò)等數(shù)據(jù)挖掘技術(shù)建立風(fēng)電設(shè)備可靠性分析模型,并利用混淆矩陣和ROC曲線(xiàn)對(duì)模型進(jìn)行評(píng)估,擇優(yōu)選取分類(lèi)性能優(yōu)異的模型作為實(shí)踐應(yīng)用的工具,從而實(shí)現(xiàn)風(fēng)電設(shè)備可靠性控制的實(shí)時(shí)化、智能化、可預(yù)測(cè)化,為風(fēng)電機(jī)組運(yùn)維提供科學(xué)的參考依據(jù)。
2.1 風(fēng)電機(jī)組狀態(tài)劃分
風(fēng)電機(jī)組(以下簡(jiǎn)稱(chēng)機(jī)組)狀態(tài)劃分如圖1。
2.2 風(fēng)電設(shè)備可靠性指標(biāo)體系
本文根據(jù)某集團(tuán)公司新能源發(fā)電產(chǎn)業(yè)的實(shí)際情況,利用散點(diǎn)圖觀察、相關(guān)性分析和協(xié)方差分析等方法,從風(fēng)力發(fā)電設(shè)備可靠性評(píng)價(jià)規(guī)程所給出的指標(biāo)清單中篩選出10個(gè)指標(biāo),作為本文進(jìn)行風(fēng)電設(shè)備可靠性評(píng)估的指標(biāo)體系。10個(gè)指標(biāo)分別為:可用系數(shù)、等效可用系數(shù)、出力系數(shù)、強(qiáng)迫停運(yùn)率、等效強(qiáng)迫停運(yùn)率、暴露率、平均無(wú)故障可用小時(shí)、啟動(dòng)可靠度、平均啟動(dòng)間隔小時(shí)、檢修費(fèi)用、計(jì)劃停運(yùn)系數(shù)。
圖1 風(fēng)電機(jī)組狀態(tài)劃分
3.1 模型概述
本文基于風(fēng)電設(shè)備可靠性指標(biāo)體系,擬采用C5.0決策樹(shù)算法和貝葉斯信念網(wǎng)絡(luò)等分類(lèi)算法建模。
(1)決策樹(shù)是一種類(lèi)似于流程圖的樹(shù)結(jié)構(gòu),其結(jié)構(gòu)是一棵倒置的樹(shù),它主要圍繞生長(zhǎng)和剪枝兩大核心問(wèn)題展開(kāi)。決策樹(shù)獲取的知識(shí),用樹(shù)的形式表示出來(lái),其中包括分類(lèi)樹(shù)和回歸樹(shù),分類(lèi)或預(yù)測(cè)的結(jié)果均體現(xiàn)在決策樹(shù)的葉節(jié)點(diǎn)上。分類(lèi)樹(shù)葉節(jié)點(diǎn)所含樣本中,其輸出變量的眾數(shù)類(lèi)別就是分類(lèi)結(jié)果;回歸樹(shù)葉節(jié)點(diǎn)所含樣本中,其輸出變量的平均值就是預(yù)測(cè)結(jié)果。決策樹(shù)直觀易懂且其歸納學(xué)習(xí)和分類(lèi)步驟簡(jiǎn)單快速,并且具有很好的準(zhǔn)確率。C5.0可用來(lái)處理數(shù)值型或分類(lèi)型的資料,它的分類(lèi)預(yù)測(cè)是基于邏輯的,即通過(guò)對(duì)輸入變量取值的布爾比較實(shí)現(xiàn)對(duì)輸出變量的分類(lèi)預(yù)測(cè),在眾多的輸出變量中選擇一個(gè)當(dāng)前最佳的分組變量,并從分組變量的眾多取值中找到一個(gè)最佳的分割點(diǎn)。并且為了清楚地表示分析結(jié)果,可用決策樹(shù)(decision trees)或是 if- then 的關(guān)系顯示。
(2)貝葉斯信念網(wǎng)絡(luò)是說(shuō)明聯(lián)合條件概率分布。它允許在變量的子集間定義類(lèi)條件獨(dú)立性。它提供一種因果關(guān)系的圖形模型,可以在其上進(jìn)行學(xué)習(xí)。訓(xùn)練后的貝葉斯信念網(wǎng)絡(luò)可以用于分類(lèi)。貝葉斯信念網(wǎng)絡(luò)有兩個(gè)成分定義——有向無(wú)環(huán)圖和條件概率表。有向無(wú)環(huán)圖每個(gè)節(jié)點(diǎn)代表一個(gè)隨機(jī)變量,每條弧表示一個(gè)概率依賴(lài)。如果一條弧由節(jié)點(diǎn)Y到Z,則Y是Z的雙親或直接前驅(qū),而Z是Y的后代,給定雙親后,每個(gè)變量條件獨(dú)立于圖中它的非后代。
對(duì)于貝葉斯信念網(wǎng)絡(luò)當(dāng)中的每一個(gè)變量都有一個(gè)條件概率表(ConditionalProbabilityTable,CPT)。變量Y的CPT說(shuō)明條件分布P(Y|Parents(Y)),其中Parents(Y)是Y的雙親。
1.3.2 利率標(biāo)準(zhǔn)突破難,商業(yè)銀行不愿貸。利率市場(chǎng)化后,商業(yè)銀行吸儲(chǔ)成本上升,中長(zhǎng)期貸款實(shí)行基準(zhǔn)利率往往會(huì)出現(xiàn)存貸成本倒掛的情況。商業(yè)銀行普遍認(rèn)為執(zhí)行基準(zhǔn)利率偏低,按基準(zhǔn)利率放貸,銀行會(huì)出現(xiàn)虧損;再加上貸款期限長(zhǎng),商業(yè)銀行擔(dān)心風(fēng)險(xiǎn)較大。在政策性銀行和國(guó)有銀行(農(nóng)行)不貸的情況下,沒(méi)有商業(yè)銀行愿意承貸。
設(shè)X=(x1, …, xn)是被變量或?qū)傩訷1, …, Yn描述的數(shù)據(jù)元組。這時(shí),信念網(wǎng)絡(luò)用下式提供存在的聯(lián)合概率分布的完全表示:
其中,P(x1, …, xn)是X的值的特定組合的概率,而P(xi|Parents(Yi))的值對(duì)應(yīng)于Yi的CPT的表目。
網(wǎng)絡(luò)內(nèi)的節(jié)點(diǎn)可以選作“輸出”節(jié)點(diǎn),代表類(lèi)標(biāo)號(hào)屬性??梢杂卸鄠€(gè)輸出節(jié)點(diǎn)。多種推斷和學(xué)習(xí)算法都可以用于這種網(wǎng)絡(luò)。分類(lèi)過(guò)程不是返回單個(gè)類(lèi)標(biāo)號(hào),而是可以返回概率分布,給出每個(gè)類(lèi)的概率。
3.2 模型構(gòu)建
本文擬選取99臺(tái)風(fēng)電機(jī)組設(shè)備可靠性指標(biāo)數(shù)據(jù)進(jìn)行建模,因評(píng)價(jià)指標(biāo)間存在量綱不統(tǒng)一的問(wèn)題,因此,首先利用IBM SPSS Statistics軟件對(duì)指標(biāo)數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化處理,然后,借助IBM SPSS Modeler14.1軟件,運(yùn)用C5.0決策樹(shù)算法和貝葉斯信念網(wǎng)絡(luò)算法建模,對(duì)設(shè)備可靠性進(jìn)行評(píng)價(jià)。最后,利用混淆矩陣和ROC曲線(xiàn),選定分類(lèi)性能較好的算法,應(yīng)用于實(shí)踐。最終構(gòu)建模型如圖2所示。
圖2 風(fēng)電設(shè)備可靠性模型
圖3 決策樹(shù)模型
3.2.1 C5.0決策樹(shù)模型
(1)C5.0決策樹(shù)模型運(yùn)行結(jié)果如圖3所示。根據(jù)上圖可知:對(duì)于可用系數(shù)小于等于93.516的機(jī)組,平均啟動(dòng)間隔小時(shí)決定實(shí)際鑒定結(jié)果,對(duì)于可用系數(shù)大于93.516的機(jī)組,等效可用系數(shù)決定機(jī)組的實(shí)際鑒定結(jié)果。
(2)C5.0模型實(shí)際鑒定結(jié)果的混淆矩陣如表1所示。
表1 C5.0模型實(shí)際鑒定結(jié)果的混淆矩陣
由表1可知,C5.0模型的分類(lèi)準(zhǔn)確率為87.88%,實(shí)際鑒定結(jié)果為一級(jí)被誤判為二級(jí)結(jié)果的出現(xiàn)2次,被誤判為四級(jí)結(jié)果的出現(xiàn)1次;實(shí)際鑒定結(jié)果為三級(jí)被誤判為一級(jí)結(jié)果的出現(xiàn)2次,被誤判為四級(jí)結(jié)果的出現(xiàn)2次;實(shí)際鑒定結(jié)果為二級(jí)被誤判為一級(jí)結(jié)果的出現(xiàn)2次,被誤判為三級(jí)結(jié)果的出現(xiàn)2次;實(shí)際鑒定結(jié)果為四級(jí)被誤判為一級(jí)結(jié)果的出現(xiàn)1次。
3.2.2 貝葉斯信念網(wǎng)絡(luò)模型
(1)貝葉斯信念網(wǎng)絡(luò)模型的結(jié)構(gòu)類(lèi)型使用TAN算法,參數(shù)學(xué)習(xí)方法使用最大似然法,最終構(gòu)造出的有向無(wú)環(huán)圖如圖4所示。
圖4 有向無(wú)環(huán)圖
由圖4可知,可用系數(shù)在所有指標(biāo)中,對(duì)實(shí)際鑒定結(jié)果起著決定性的作用,是最重要的指標(biāo)。
(2)貝葉斯信念網(wǎng)絡(luò)模型實(shí)際鑒定結(jié)果的混淆矩陣如表2所示。
表2 貝葉斯信念網(wǎng)絡(luò)模型實(shí)際鑒定結(jié)果的混淆矩陣
由表2可知,貝葉斯信念網(wǎng)絡(luò)模型的分類(lèi)準(zhǔn)確率為98.99%,實(shí)際鑒定結(jié)果為四級(jí)被誤判為二級(jí)結(jié)果的出現(xiàn)1次。
3.3 模型評(píng)價(jià)
對(duì)比C5.0決策樹(shù)和貝葉斯信念網(wǎng)絡(luò)的分類(lèi)準(zhǔn)確率,可以看出,貝葉斯信念網(wǎng)絡(luò)的分類(lèi)準(zhǔn)確率較高。為進(jìn)一步評(píng)估模型分類(lèi)的性能,采用ROC曲線(xiàn)對(duì)兩者進(jìn)行評(píng)估,如圖5、圖6所示。
圖5 C5.0決策樹(shù)的ROC曲線(xiàn)
圖6 貝葉斯信念網(wǎng)絡(luò)的ROC曲線(xiàn)
通過(guò)圖5、圖6可以看出,對(duì)于實(shí)際鑒定結(jié)果為一級(jí),貝葉斯信念網(wǎng)絡(luò)的ROC曲線(xiàn)較C5.0決策樹(shù)的ROC曲線(xiàn)更加靠近單位方形的左上角,貝葉斯信念網(wǎng)絡(luò)ROC曲線(xiàn)下的面積更大,說(shuō)明貝葉斯信念網(wǎng)絡(luò)的分類(lèi)性能較好,能夠用于風(fēng)電設(shè)備可靠性評(píng)價(jià)。
對(duì)于設(shè)備密集型企業(yè)來(lái)說(shuō),設(shè)備的可靠性關(guān)系著企業(yè)的生存發(fā)展。對(duì)于發(fā)電企業(yè)來(lái)說(shuō)尤其重要。本文是以大數(shù)據(jù)技術(shù)為基礎(chǔ)進(jìn)行建模、分析,實(shí)現(xiàn)自動(dòng)智能識(shí)別鑒定,對(duì)風(fēng)電設(shè)備可靠性的研究預(yù)期目標(biāo)和成果如下。(1)借助大數(shù)據(jù)技術(shù)手段,研究利用C5.0決策樹(shù)算法和貝葉斯信念網(wǎng)絡(luò),對(duì)風(fēng)電設(shè)備的可靠性進(jìn)行分析預(yù)測(cè),從而更好地對(duì)風(fēng)電設(shè)備的可靠性進(jìn)行有針對(duì)性、有方向性的控制。(2)利用C5.0決策樹(shù)和貝葉斯信念網(wǎng)絡(luò)進(jìn)行對(duì)比分析,使得預(yù)測(cè)鑒定結(jié)果最大程度與指標(biāo)的實(shí)際鑒定結(jié)果相符,從而擇優(yōu)選用準(zhǔn)確率更高的貝葉斯信念網(wǎng)絡(luò)作為實(shí)踐應(yīng)用的分類(lèi)器。
[1]陳樹(shù)勇,戴慧珠,白曉民,等.風(fēng)電場(chǎng)的發(fā)電可靠性模型及其應(yīng)用[J].中國(guó)電機(jī)工程學(xué)報(bào),2000,20(03).
[2]吳義純,丁明.基于蒙特卡羅仿真的風(fēng)力發(fā)電系統(tǒng)可靠性評(píng)價(jià)[J].電力自動(dòng)化設(shè)備,2004,24(01).
[3]李輝,李學(xué)偉,胡姚剛,等.風(fēng)電機(jī)組運(yùn)行狀態(tài)參數(shù)的非等間隔灰色預(yù)測(cè)[J].電力系統(tǒng)自動(dòng)化,2012,36(09).
[4]王海超,魯宗相,周雙喜.風(fēng)電場(chǎng)發(fā)電容量可信度研究[J].中國(guó)電機(jī)工程學(xué)報(bào),2005,25(10).
[5]張瑞君. 風(fēng)力發(fā)電機(jī)組性能考核方法探討[J].能源技術(shù)經(jīng)濟(jì),2011,23(11).
[6]蘇寅生.電力設(shè)備可靠性數(shù)據(jù)收集統(tǒng)計(jì)述評(píng)[J].南方電網(wǎng)技術(shù),2015,09(03).
TM774
A
1671-0711(2017)06(下)-0092-03
國(guó)家電網(wǎng)公司科技項(xiàng)目《多業(yè)務(wù)生產(chǎn)數(shù)據(jù)智能監(jiān)測(cè)與分析一體化平臺(tái)研究及示范應(yīng)用》,(編號(hào):[2015] 709-37)。