馬洪斌,王文峰,石峰,楊飛,郇帥
(國(guó)網(wǎng)棗莊供電公司,山東 棗莊 277000)
電網(wǎng)的安全穩(wěn)定運(yùn)行是保障電力可靠供應(yīng)的基礎(chǔ),作為電網(wǎng)組成部分的電力設(shè)備是否得到及時(shí)、準(zhǔn)確的監(jiān)測(cè)對(duì)于電網(wǎng)堅(jiān)強(qiáng)運(yùn)行至關(guān)重要。通過(guò)對(duì)設(shè)備進(jìn)行有效的監(jiān)測(cè)分析,了解設(shè)備的整體運(yùn)行狀況,可大大降低設(shè)備故障發(fā)生的概率,保障居民穩(wěn)定用電和經(jīng)濟(jì)社會(huì)高效發(fā)展[1-3]。
隨著大數(shù)據(jù)分析技術(shù)在電力領(lǐng)域的廣泛應(yīng)用,變電設(shè)備監(jiān)測(cè)分析的方法也得到廣泛的研究,文獻(xiàn)[4]針對(duì)變電設(shè)備狀態(tài)評(píng)價(jià)參數(shù)復(fù)雜多樣且各參數(shù)之間存在不明確的關(guān)聯(lián)關(guān)系,應(yīng)用主成分分析構(gòu)建參數(shù)體系。文獻(xiàn)[5]針對(duì)輸電線路的狀態(tài)評(píng)價(jià)問(wèn)題,提出了構(gòu)建多棵決策樹(shù)組合模型。文獻(xiàn)[6]針對(duì)設(shè)備的類別及設(shè)備數(shù)據(jù)的結(jié)構(gòu),通過(guò)構(gòu)建支持向量機(jī)分析模型進(jìn)行狀態(tài)評(píng)價(jià)。文獻(xiàn)[7]通過(guò)對(duì)變壓器運(yùn)行過(guò)程中的監(jiān)測(cè)數(shù)據(jù)及變壓器的缺陷故障等數(shù)據(jù)進(jìn)行處理,并提取其故障特征向量,進(jìn)行數(shù)據(jù)建模和優(yōu)化處理,實(shí)現(xiàn)對(duì)變壓器故障識(shí)別的高準(zhǔn)確性。
變電設(shè)備的狀態(tài)評(píng)價(jià)影響因素眾多,設(shè)備參數(shù)、運(yùn)行工況、試驗(yàn)數(shù)據(jù)等信息均與設(shè)備的狀態(tài)密切相關(guān),隨著大數(shù)據(jù)技術(shù)應(yīng)用和數(shù)據(jù)中臺(tái)建設(shè),加快了電力數(shù)據(jù)分析和應(yīng)用,中臺(tái)的建設(shè),逐步實(shí)現(xiàn)對(duì)設(shè)備信息、運(yùn)行信息等大量數(shù)據(jù)的集成共享,逐漸形成了電力大數(shù)據(jù)體系,結(jié)合大數(shù)據(jù)分析技術(shù)對(duì)設(shè)備進(jìn)行狀態(tài)監(jiān)測(cè)有了強(qiáng)力的支撐[8-10]。
本文第一部分首先提出了變電設(shè)備關(guān)鍵參數(shù)體系,第二部分介紹變電設(shè)備狀態(tài)評(píng)價(jià)分析模型的搭建,第三部分展示變電設(shè)備狀態(tài)評(píng)價(jià)結(jié)果。通過(guò)對(duì)建立設(shè)備的參數(shù)體系,提取設(shè)備的特征信息,采用梯度提升樹(shù)算法搭建設(shè)備監(jiān)測(cè)分析模型,實(shí)現(xiàn)對(duì)設(shè)備的精準(zhǔn)、快速、可靠分析。
變電設(shè)備從出廠到現(xiàn)場(chǎng)運(yùn)行到發(fā)生缺陷及故障直至報(bào)廢過(guò)程中會(huì)產(chǎn)生大量的信息及數(shù)據(jù),這些數(shù)據(jù)通常表征著設(shè)備的運(yùn)行狀態(tài)。通過(guò)對(duì)設(shè)備的運(yùn)行數(shù)據(jù)進(jìn)行統(tǒng)計(jì)分析,可以將設(shè)備數(shù)據(jù)分為靜態(tài)參數(shù)、實(shí)時(shí)參數(shù)、準(zhǔn)實(shí)時(shí)參數(shù)[11-13],將三類參數(shù)作為電力設(shè)備狀態(tài)評(píng)價(jià)的因素對(duì)設(shè)備的運(yùn)行狀態(tài)進(jìn)行識(shí)別。靜態(tài)參數(shù)信息主要包括設(shè)備的技術(shù)參數(shù)、投運(yùn)日期、地理位置、出廠實(shí)驗(yàn)參數(shù)等。實(shí)時(shí)參數(shù)信息主要是設(shè)備的在線監(jiān)測(cè)信息及運(yùn)行環(huán)境氣象信息。準(zhǔn)實(shí)時(shí)參數(shù)據(jù)信息主要是設(shè)備的帶電檢測(cè)數(shù)據(jù)、設(shè)備的故障、缺陷及檢修等信息。通過(guò)對(duì)變電設(shè)備的靜態(tài)參數(shù)、實(shí)時(shí)參數(shù)、準(zhǔn)實(shí)時(shí)參數(shù)進(jìn)行分析,滿足設(shè)備狀態(tài)評(píng)價(jià)的科學(xué)性和準(zhǔn)確性。
本文分析的變電設(shè)備主要是110kV及220kV變電站內(nèi)的設(shè)備,包括油浸式變壓器、互感器、開(kāi)關(guān)等。結(jié)合設(shè)備的實(shí)際運(yùn)行分析和設(shè)備狀態(tài)評(píng)價(jià)研究,對(duì)變電設(shè)備的運(yùn)行參數(shù)進(jìn)行選擇。針對(duì)電壓互感器、電流互感器、斷路器和隔離開(kāi)關(guān)的特征主要包括基本參數(shù)、缺陷數(shù)據(jù)和試驗(yàn)數(shù)據(jù)。由于目前變電站內(nèi)的高壓變壓器設(shè)備主要是以絕緣油作為介質(zhì),在實(shí)際的運(yùn)行過(guò)程中,隨著負(fù)荷的增加,油溫的變化,油中會(huì)產(chǎn)生大量的氣體,通過(guò)對(duì)油中氣體進(jìn)行監(jiān)測(cè)分析和試驗(yàn)研判,實(shí)現(xiàn)變壓器的運(yùn)行的有效監(jiān)測(cè),因此對(duì)變壓器設(shè)備的特征選取主要包括基本參數(shù)、油中氣體、缺陷數(shù)據(jù)和試驗(yàn)數(shù)據(jù)。
根據(jù)特征提取獲得的基本參數(shù)信息、油中氣體數(shù)據(jù)信息、缺陷數(shù)據(jù)信息和試驗(yàn)數(shù)據(jù)信息,通過(guò)關(guān)鍵字段關(guān)聯(lián)生成樣本數(shù)據(jù)寬表,在對(duì)樣本數(shù)據(jù)的標(biāo)簽定義上,通過(guò)結(jié)合實(shí)際的工作對(duì)每條樣本數(shù)據(jù)集的故障類型進(jìn)行標(biāo)簽化,包括正常、注意、異常等三種狀態(tài)類型。將得到的變電設(shè)備狀態(tài)評(píng)價(jià)特征信息和所對(duì)應(yīng)的故障類型信息作為新的數(shù)據(jù)集,對(duì)數(shù)據(jù)集進(jìn)行數(shù)據(jù)預(yù)處理操作,確保數(shù)據(jù)的完整性和可靠性。針對(duì)數(shù)據(jù)集數(shù)據(jù)存在缺失的情況,采用前一項(xiàng)或后一項(xiàng)數(shù)據(jù)進(jìn)行填充,對(duì)缺失值進(jìn)行補(bǔ)全。針對(duì)數(shù)據(jù)集中數(shù)據(jù)由于采集裝置異常等原因造成的數(shù)據(jù)異常問(wèn)題,對(duì)異常數(shù)據(jù)進(jìn)行刪除操作,得到干凈的數(shù)據(jù)。由于機(jī)器學(xué)習(xí)只能識(shí)別數(shù)值,無(wú)法對(duì)狀態(tài)的文字進(jìn)行判斷,因此將電力設(shè)備的狀態(tài)信息進(jìn)行數(shù)值化處理,對(duì)設(shè)備狀態(tài)評(píng)價(jià)結(jié)果正常、注意、異常三種狀態(tài)分別采用0、1、2表示,得到完整的電力設(shè)備樣本數(shù)據(jù)集[14-15]。數(shù)據(jù)集包括每條樣本設(shè)備數(shù)據(jù)的參數(shù)及數(shù)據(jù)對(duì)應(yīng)的設(shè)備運(yùn)行狀態(tài)。
圖1 設(shè)備參數(shù)Fig.1 Parameters of equipment
結(jié)合設(shè)備的靜態(tài)參數(shù)、實(shí)時(shí)參數(shù)、準(zhǔn)實(shí)時(shí)參數(shù),對(duì)設(shè)備參數(shù)進(jìn)行選取,所用的參數(shù)如下:運(yùn)行天數(shù)、運(yùn)行月數(shù),運(yùn)行年數(shù),設(shè)備類型,設(shè)備廠家,電壓等級(jí),氣體數(shù)據(jù)、缺陷總次數(shù),危急缺陷次數(shù),嚴(yán)重缺陷次數(shù),一般缺陷次數(shù),已消缺缺陷數(shù),未消缺缺陷數(shù),設(shè)備試驗(yàn)數(shù)據(jù),設(shè)備名稱編號(hào)等15項(xiàng)參數(shù)數(shù)據(jù)。
主成分分析是一種將多變量進(jìn)行組合,從而得到較少變量的一種降維方法。原始的變量之間存在關(guān)聯(lián)關(guān)系,通過(guò)線性組合的方式生成互不相關(guān)的綜合指標(biāo),即主成分。通過(guò)主成分分析可以大大減少變量的個(gè)數(shù),降低數(shù)據(jù)之間存在的關(guān)聯(lián)關(guān)系導(dǎo)致的信息冗余等問(wèn)題[16-17]。
基本原理是假設(shè)有p個(gè)綜合評(píng)價(jià)的原始指標(biāo)x1,x2,…,xp,設(shè)定這些指標(biāo)在m個(gè)單位之間進(jìn)行比較,則共有mp個(gè)數(shù)據(jù)。主成分分析是把原始的指標(biāo)進(jìn)行組合形成新的互不關(guān)聯(lián)的新的指標(biāo)y1,y2,…,yp,新的指標(biāo)為原始指標(biāo)的線性組合函數(shù):
(1)
由以上的分析可以得到綜合指標(biāo)yi之間是線性不相關(guān)的。主成分分析得到的新的指標(biāo)y1,y2,…,yp,對(duì)于新指標(biāo)的方差按照從大到小的順序進(jìn)行排序,p個(gè)綜合指標(biāo)的方差之和等于原始指標(biāo)的總方差。若p個(gè)綜合指標(biāo)的前r個(gè)即可以有效地表征原始指標(biāo)的信息,那么我們就將r值作為我們得到的主成分個(gè)數(shù)。通過(guò)主成分分析,我們將指標(biāo)的個(gè)數(shù)由p個(gè)降為r個(gè)(r
主成分分析的步驟主要包括以下。
(1)對(duì)原始數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化處理。得到的數(shù)據(jù)往往由于量綱或者數(shù)量的大小存在差異,影響分析結(jié)果,因此在進(jìn)行主成分分析之前,對(duì)數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化。
(2)查看指標(biāo)之間的關(guān)聯(lián)關(guān)系,通過(guò)計(jì)算指標(biāo)之間的協(xié)方差,得到協(xié)方差矩陣。
(3)計(jì)算協(xié)方差矩陣的特征值和特征向量,識(shí)別主成分。主成分是原始指標(biāo)線性組合得到的,之間相關(guān)獨(dú)立互不關(guān)聯(lián),第一個(gè)主成分中包含了最多的信息,第二個(gè)主成分第二多,以此類推。得到p個(gè)主成分,其相加信息等于原始指標(biāo)。
(4)通過(guò)特征值的順序?qū)μ卣飨蛄窟M(jìn)行排序,從最高到最低,即得到按重要性排序的主成分,根據(jù)實(shí)際需求選擇合適的主成分進(jìn)行評(píng)價(jià)分析。
決策樹(shù)是一種采用樹(shù)狀結(jié)構(gòu)對(duì)數(shù)據(jù)進(jìn)行分類的分析模型。通常應(yīng)用于預(yù)測(cè)分析,通過(guò)決策樹(shù)對(duì)大量的數(shù)據(jù)進(jìn)行分類分析,找到數(shù)據(jù)內(nèi)部潛在的價(jià)值信息。決策樹(shù)分類樹(shù)結(jié)構(gòu)簡(jiǎn)單易懂,描述簡(jiǎn)單,分類速度較快,便于人們理解,同時(shí)決策樹(shù)的樹(shù)狀分析結(jié)構(gòu)決定了在構(gòu)建決策樹(shù)模型時(shí)不需要大量的額外訓(xùn)練數(shù)據(jù)進(jìn)行學(xué)習(xí)[19-20]。
通常采用信息熵對(duì)決策樹(shù)進(jìn)行屬性選擇,信息熵是描述消息中,不確定性的值,也叫不確定程度。熵越低,不確定性越低,就更容易得到確定的信息;熵越高,不確定性就越高,就難以得到確定的信息。在決策樹(shù)種由于存在各個(gè)分支,各個(gè)分支中的樣本數(shù)量又是不同的,若某一個(gè)分支中含有的樣本數(shù)越大,則它的影響就越大,考慮到該問(wèn)題采用權(quán)重方式進(jìn)行處理。因此我們采用信息增益的方式對(duì)分支進(jìn)行選擇若計(jì)算得到信息增益值較大,則表明使用該屬性進(jìn)行分支劃分時(shí)信息的純度越高,效果越好。
決策樹(shù)的生成步驟如下所示:
(1)首先是所有的特征均為符號(hào)值,即離散值。如果某個(gè)特征的值為連續(xù)值,那么需要先將其離散化。
(2)決策樹(shù)中包含有根節(jié)點(diǎn)、葉節(jié)點(diǎn)以及中間的路徑,一個(gè)節(jié)點(diǎn)代表一個(gè)對(duì)象,在節(jié)點(diǎn)之間的分叉路徑處代表屬性值,從根節(jié)點(diǎn)到葉節(jié)點(diǎn)中間的路徑代表對(duì)象值。某一個(gè)節(jié)點(diǎn)數(shù)據(jù)若都屬于同一類型的話,那么該節(jié)點(diǎn)就是葉節(jié)點(diǎn)。若樣本數(shù)據(jù)不是同一類型的話,我們就利用信息熵、信息增益來(lái)對(duì)樣本數(shù)據(jù)進(jìn)行劃分,選擇信息增益大的特征作為根節(jié)點(diǎn)。
(3)依次遞歸,直至特征劃分時(shí)信息增益很小或者為特征可以劃分,我們就得到了決策樹(shù)模型。遞歸操作的停止條件為:一個(gè)節(jié)點(diǎn)中所有樣本數(shù)據(jù)均為一類;沒(méi)有特征可以用來(lái)對(duì)該節(jié)點(diǎn)樣本進(jìn)行劃分;沒(méi)有樣本能夠滿足其他特征的取值。
梯度提升樹(shù)是一種組合的算法,通過(guò)對(duì)多個(gè)決策樹(shù)的結(jié)果進(jìn)行求和得到梯度提升樹(shù)的識(shí)別結(jié)果。每棵決策樹(shù)針對(duì)其中的部分?jǐn)?shù)據(jù)做出預(yù)測(cè),所有樹(shù)的結(jié)果加起來(lái)即可以很好地分析最終結(jié)果,通過(guò)增加樹(shù)的數(shù)量,可以不斷迭代提升識(shí)別性能,是一種泛化能力較強(qiáng)的算法,占用內(nèi)存較少,且預(yù)測(cè)速度較快[21-22]。
X為屬性向量,假設(shè)梯度提升樹(shù)模型生成了n個(gè)弱回歸樹(shù),每一個(gè)弱回歸樹(shù)得到一個(gè)預(yù)測(cè)結(jié)果fi(X),i=1,2,…,n,f0為模型的初始值,則梯度提升樹(shù)的預(yù)測(cè)結(jié)果為n個(gè)弱回歸樹(shù)的預(yù)測(cè)結(jié)果之和,
F(X)=f0+f1(X)+…+fn(X)
(2)
梯度提升樹(shù)的步驟如下。
對(duì)于給定的訓(xùn)練集數(shù)據(jù),表達(dá)式如下:
T={(X1,y1),(X2,y2),…,(XN,yN)},
Xi∈γ∈Rn,yi∈γ∈R
(3)
N為訓(xùn)練樣本數(shù)據(jù)的個(gè)數(shù),對(duì)于每個(gè)樣本數(shù)據(jù)Xi都含有z個(gè)變量(x1i,x2i,…,xzi),損失函數(shù)為L(zhǎng)(y,f(x)),假設(shè)進(jìn)行了M次的迭代過(guò)程,則梯度提升樹(shù)的實(shí)現(xiàn)步驟如下所示。
(1)對(duì)模型進(jìn)行初始化。首先我們要找到一個(gè)常數(shù)值c,確保常數(shù)值使得損失函數(shù)L最小,
(4)
對(duì)于這里的回歸樹(shù)模型,我們采用平方誤差損失函數(shù):
(5)
式中:y為真實(shí)值;g(x)為預(yù)測(cè)值。
(2)迭代過(guò)程。迭代的總次數(shù)為M。
1)對(duì)于i=1,2,…,N,通過(guò)計(jì)算得到損失函數(shù)的負(fù)梯度:
(6)
對(duì)于平方誤差損失函數(shù),其梯度為:
(7)
將梯度函數(shù)負(fù)梯度表達(dá)式進(jìn)行簡(jiǎn)化得到:
rmi=yi-fm-1(Xi)
(8)
當(dāng)我們利用平方誤差函數(shù)進(jìn)行求解時(shí),上式得到的誤差稱為擬合殘差。
2)我們將得到的(Xi,rmi),i=1,2,…,N從新作為訓(xùn)練數(shù)據(jù),繼續(xù)使用回歸樹(shù)模型進(jìn)行學(xué)習(xí),這樣就得到了若干個(gè)葉節(jié)點(diǎn)區(qū)域,Rmj,j=1,2,…,J,其中J為第m顆弱回歸樹(shù)的葉節(jié)點(diǎn)數(shù)。
3)針對(duì)葉節(jié)點(diǎn)區(qū)域Rmj,j=1,2,…,J,我們利用線性搜索的方法求解使損失函數(shù)最小時(shí)所對(duì)應(yīng)的常數(shù)c的值,
(9)
4)更新強(qiáng)回歸模型為:
(10)
式中:I()是指示函數(shù),當(dāng)Xi落入Rmj中,該值為1,否則該值為0。
(3)通過(guò)迭代,并結(jié)合式(1)我們得到了最終的預(yù)測(cè)模型:
F(X)=fM(X)
(11)
影響變電設(shè)備狀態(tài)評(píng)價(jià)的特征信息較多,考慮到大量信息作為特征輸入會(huì)降低模型學(xué)習(xí)的時(shí)間和效率。對(duì)選取的運(yùn)行天數(shù)、運(yùn)行月數(shù),運(yùn)行年數(shù),設(shè)備類型,設(shè)備廠家,電壓等級(jí),氣體數(shù)據(jù)、缺陷總次數(shù),危急缺陷次數(shù),嚴(yán)重缺陷次數(shù),一般缺陷次數(shù),已消缺缺陷數(shù),未消缺缺陷數(shù),設(shè)備試驗(yàn)數(shù)據(jù),設(shè)備名稱編號(hào)等15項(xiàng)參數(shù)作進(jìn)一步的篩選,選擇差異性明顯的指標(biāo)變量作為建模變量。通過(guò)對(duì)15項(xiàng)參數(shù)進(jìn)行均值和標(biāo)準(zhǔn)差計(jì)算,并用非參數(shù)檢驗(yàn)方法對(duì)各參數(shù)進(jìn)行校驗(yàn),發(fā)現(xiàn)設(shè)備廠家、氣體數(shù)據(jù)和試驗(yàn)數(shù)據(jù)的P值均大于0.05,指標(biāo)差異性不顯著剔除,保留12項(xiàng)特征參數(shù)信息。通過(guò)對(duì)含有12項(xiàng)特征信息的數(shù)據(jù)集分為訓(xùn)練集和測(cè)試集數(shù)據(jù),以訓(xùn)練集數(shù)據(jù)進(jìn)行識(shí)別分類器模型構(gòu)建,并通過(guò)測(cè)試集數(shù)據(jù)驗(yàn)證模型的準(zhǔn)確性。選擇準(zhǔn)確率較高的分類器作為我們的故障識(shí)別模型。進(jìn)一步對(duì)12項(xiàng)特征參數(shù)信息進(jìn)行主成分分析,選擇合適的主成分因子個(gè)數(shù),分析因子貢獻(xiàn)率,得到降維的表征設(shè)備狀態(tài)的主成分。將新的特征信息作為樣本數(shù)據(jù)集,劃為訓(xùn)練集和測(cè)試集,以訓(xùn)練集數(shù)據(jù)進(jìn)行訓(xùn)練學(xué)習(xí)得到設(shè)備的狀態(tài)識(shí)別模型,利用測(cè)試集數(shù)據(jù)對(duì)模型的識(shí)別結(jié)果進(jìn)行驗(yàn)證分析。模型采用梯度提升樹(shù)作為狀態(tài)識(shí)別模型,為驗(yàn)證模型的準(zhǔn)確性,同時(shí)采用決策樹(shù)、隨機(jī)森林等多種模型進(jìn)行分析,并結(jié)合交叉驗(yàn)證進(jìn)行驗(yàn)證[23]。
將含有12項(xiàng)特征參數(shù)的數(shù)據(jù)集分為訓(xùn)練數(shù)據(jù)和測(cè)試數(shù)據(jù)進(jìn)行數(shù)據(jù)建模和模型驗(yàn)證,并通過(guò)與決策樹(shù)、隨機(jī)森林、AdaBoost、KNN、神經(jīng)網(wǎng)絡(luò)、支持向量機(jī)、XGBoost、LGBM等分類器進(jìn)行比較分析[24-29]。數(shù)據(jù)集數(shù)據(jù)為474條,訓(xùn)練集數(shù)據(jù)為332條,測(cè)試集數(shù)據(jù)為142條。各分類器的分類識(shí)別結(jié)果如表1 所示。
表1 不同分類器識(shí)別結(jié)果Tab.1 Identify results of different classifier
從表中的分析結(jié)果可以看出在9個(gè)分類器中,KNN的訓(xùn)練用時(shí)最小,僅為0.006s,但是其訓(xùn)練集和測(cè)試集的準(zhǔn)確率過(guò)低,分別為0.801、0.601。梯度提升樹(shù)的訓(xùn)練用時(shí)較長(zhǎng)為1.349s,但是訓(xùn)練集和測(cè)試集的準(zhǔn)確率較高,分別為1、0.839。在實(shí)際工作中,檢修運(yùn)維人員對(duì)于設(shè)備的狀態(tài)評(píng)價(jià)考慮更多的是識(shí)別結(jié)果的準(zhǔn)確率,因此我們舍棄訓(xùn)練時(shí)間因素,考慮高識(shí)別率,最終選擇梯度提升樹(shù)作為我們的變電設(shè)備狀態(tài)識(shí)別模型。
進(jìn)一步對(duì)梯度提升樹(shù)分類模型的識(shí)別結(jié)果進(jìn)行分析,細(xì)化每類設(shè)備狀態(tài)的識(shí)別結(jié)果,得到如下表2的結(jié)果。
表2 變電設(shè)備不同狀態(tài)識(shí)別結(jié)果Tab.2 Identify results of different status of substation equipment
由以上的分析結(jié)果可以看到,模型對(duì)于正常狀態(tài)、注意狀態(tài)的識(shí)別準(zhǔn)確率較高,分別為85.91%、83.10%,由于異常狀態(tài)的數(shù)據(jù)樣本數(shù)較少,導(dǎo)致識(shí)別效果較差。
為進(jìn)一步優(yōu)化狀態(tài)評(píng)價(jià)模型的特征參數(shù),通過(guò)主成分分析對(duì)特征參數(shù)進(jìn)行方差解釋,獲得主成分分析的個(gè)數(shù)及每一個(gè)成分的貢獻(xiàn)率和主成分的累計(jì)貢獻(xiàn)率,得到結(jié)果如下表3所示。
表3 主成分分析結(jié)果Tab.3 Analyze results of principal component
基于以上的分析結(jié)果可以看出在主成分4時(shí),總方差解釋的特征根低于1,變量解釋的貢獻(xiàn)率達(dá)到75.321%,可以有效地表征設(shè)備的特征,因此我們選擇四個(gè)主成分進(jìn)行分析。
表4 主成分分析因子載荷系數(shù)Tab.4 Load coefficient of analyze fctor of principal component
上表為因子載荷系數(shù)表,可以分析到每個(gè)主成分中隱變量的重要性。在主成分1中缺陷總次數(shù)、一般缺陷次數(shù)、已消缺缺陷數(shù)的權(quán)重較大,主要體現(xiàn)為缺陷數(shù)據(jù)對(duì)特征的影響;在主成分2中天數(shù)、月數(shù)和年數(shù)的權(quán)重較大,主要體現(xiàn)為設(shè)備的運(yùn)行時(shí)間對(duì)特征的影響;在主成分3中,危急缺陷次數(shù)、嚴(yán)重缺陷次數(shù)的權(quán)重較大,主要體現(xiàn)在缺陷的程度對(duì)特征的影響;在主成分4中,主要是設(shè)備的運(yùn)行時(shí)間對(duì)特征的影響,在共同度分析中,可以得到電壓等級(jí)、嚴(yán)重缺陷次數(shù)和未消缺缺陷數(shù)的權(quán)重較小,因此排除掉電壓等級(jí)、嚴(yán)重缺陷次數(shù)和未消缺次數(shù),保留其他參數(shù)作為主成分。
將含有天數(shù)、月數(shù)、年數(shù)、設(shè)備類型、num、缺陷總次數(shù)、危急缺陷次數(shù)、一般缺陷次數(shù)、已消缺缺陷數(shù)等9項(xiàng)特征參數(shù)的數(shù)據(jù)集分為訓(xùn)練數(shù)據(jù)和測(cè)試數(shù)據(jù)進(jìn)行數(shù)據(jù)建模和模型驗(yàn)證,選擇狀態(tài)識(shí)別模型為梯度提升樹(shù),對(duì)訓(xùn)練集數(shù)據(jù)進(jìn)行驗(yàn)證分析,數(shù)據(jù)集數(shù)據(jù)為474條,訓(xùn)練集數(shù)據(jù)為332條,測(cè)試集數(shù)據(jù)為142條。梯度提升樹(shù)的分類識(shí)別結(jié)果如下表5所示。
表5 主成分分析分類識(shí)別結(jié)果Tab.5 Results of calssifying identify of principal component
由上表的識(shí)別結(jié)果可以看出,基于主成分分析獲得新的特征數(shù)據(jù)集,通過(guò)梯度提升樹(shù)分類器模型進(jìn)行建模分析,訓(xùn)練集、交叉驗(yàn)證集和測(cè)試集的準(zhǔn)確率分別為1、0.758和0.881,相比于未進(jìn)行主成分分析的故障識(shí)別結(jié)果0.839,準(zhǔn)確率上升了0.042。
對(duì)每類設(shè)備狀態(tài)的識(shí)別結(jié)果進(jìn)行分析,得到如下表6結(jié)果 。
表6 變電設(shè)備不同狀態(tài)識(shí)別結(jié)果Tab.6 Identify results of different status of substation equipment
由以上的分析結(jié)果可以看出正常狀態(tài)、注意狀態(tài)的識(shí)別準(zhǔn)確率分別為83.10%、94.37%,相對(duì)于主成分分析之前的結(jié)果得到了大大的提升,同時(shí)我們得到注意狀態(tài)的識(shí)別準(zhǔn)確率達(dá)到94.37%,相比于未進(jìn)行主成分分析之前的識(shí)別率83.10%,提高了11.27%,注意狀態(tài)的識(shí)別效果更好,對(duì)于我們?cè)谌粘5淖冸娫O(shè)備監(jiān)測(cè)中具有較好的指導(dǎo)意義。
本文通過(guò)梳理變電設(shè)備的參數(shù)體系,選擇特征信息,采用主成分分析獲得新的特征參數(shù)集,搭建梯度提升樹(shù)分類模型,并與其他類型的分類器識(shí)別結(jié)果進(jìn)行比較分析,驗(yàn)證梯度提升樹(shù)的準(zhǔn)確性,對(duì)于設(shè)備的監(jiān)測(cè)分析具有重要的意義。在特征的選擇上結(jié)合數(shù)據(jù)分析技術(shù)進(jìn)行優(yōu)化,將會(huì)進(jìn)一步提升狀態(tài)評(píng)價(jià)結(jié)果的準(zhǔn)確性和可靠性。