饒歡 陳鳳超 何毅鵬
摘 要:針對(duì)配電網(wǎng)配變不匹配的問題,本文提出基于分類決策樹對(duì)電網(wǎng)配變不匹配問題的故障診斷算法,通過獲取省海量平臺(tái)計(jì)量數(shù)據(jù)和營(yíng)銷數(shù)據(jù),從數(shù)據(jù)質(zhì)量檢查、數(shù)據(jù)真實(shí)性校驗(yàn)、數(shù)據(jù)修正和數(shù)據(jù)駁回四個(gè)步驟對(duì)數(shù)據(jù)進(jìn)行分析,從而達(dá)到提高數(shù)據(jù)質(zhì)量的目的,分類決策樹算法的應(yīng)用可以輔助調(diào)度人員迅速識(shí)別故障,保證配電網(wǎng)的安全穩(wěn)定運(yùn)行。
關(guān)鍵詞:配電變壓器;決策樹算法;數(shù)據(jù)質(zhì)量;故障診斷
0 引言
配電變壓器數(shù)據(jù)中電壓或電流超限后報(bào)警,配網(wǎng)調(diào)度員從數(shù)據(jù)庫中核查報(bào)警位置處理數(shù)據(jù),調(diào)取臺(tái)賬數(shù)據(jù)與原始報(bào)文,逐一排查配變匹配問題。這種利用手工排查故障過程十分繁瑣,需要大量人力而且容易出錯(cuò),自動(dòng)化數(shù)據(jù)校驗(yàn)水平較低。為提高故障診斷的準(zhǔn)確性和快速性,一些學(xué)者提出了基于專家系統(tǒng)[1]、人工神經(jīng)網(wǎng)絡(luò)[2]、遺傳算法[3]和Petri網(wǎng)絡(luò)[4]的等多種排查方法,上述方法均存在一定的局限性,基于分類決策樹對(duì)電網(wǎng)配變不匹配問題的算法應(yīng)用適應(yīng)各種不利情況的配電網(wǎng)故障診斷方法,輔助調(diào)度人員迅速識(shí)別故障,保證配電網(wǎng)的安全穩(wěn)定運(yùn)行。
1 決策樹算法
1.1 決策樹算法原理
決策樹[5-7]是在已知情況發(fā)生概率的基礎(chǔ)上,通過構(gòu)成決策樹來計(jì)算凈現(xiàn)值的期望值是否大于等于零的概率,判斷發(fā)生問題可行性的決策分析方法。在機(jī)器學(xué)習(xí)中,決策樹是一個(gè)預(yù)測(cè)計(jì)算模型,它代表的是對(duì)象屬性與對(duì)象值之間的相互映射關(guān)系。決策樹是一種樹形結(jié)構(gòu),其中決策樹每個(gè)內(nèi)部節(jié)點(diǎn)表示一個(gè)屬性上的測(cè)試,決策樹每個(gè)分支代表一個(gè)測(cè)試輸出,決策樹每個(gè)葉節(jié)點(diǎn)表示一種類別。
1.2 分類決策樹算法原理
分類樹是一種比較常用的分類方法,屬于一種有監(jiān)督機(jī)器學(xué)習(xí)算法,從一堆待測(cè)試樣本中選取樣本,每個(gè)樣本都有一組相應(yīng)的屬性和類別,屬性和類別是提前確定的,那么通過有監(jiān)督學(xué)習(xí)得到一個(gè)分類器,分類器可以新的樣本給出正確的分類。分類決策樹模型表示一種對(duì)實(shí)例進(jìn)行樣本分類的樹形結(jié)構(gòu),決策樹通常由有向邊和結(jié)點(diǎn)兩部分組成,樣本中的每個(gè)結(jié)點(diǎn)由內(nèi)部節(jié)點(diǎn)和葉子節(jié)點(diǎn)組成。內(nèi)部節(jié)點(diǎn)通常表示的是特征或者屬性,葉子節(jié)點(diǎn)表示單個(gè)獨(dú)立的個(gè)體,屬于不能再細(xì)分的類別。當(dāng)樣本的節(jié)點(diǎn)進(jìn)行分類劃分時(shí),從一個(gè)根節(jié)點(diǎn)開始,針對(duì)實(shí)例的某一特征向量進(jìn)行測(cè)試,依據(jù)樣本的測(cè)試結(jié)果,將樣本實(shí)例分配到其子結(jié)點(diǎn),每一個(gè)樣本子結(jié)點(diǎn)和特征的取值相對(duì)應(yīng)。設(shè)置相應(yīng)閾值,不斷遞歸向下移動(dòng),到達(dá)葉結(jié)點(diǎn)為止,這時(shí)將樣本實(shí)例分配到葉子結(jié)點(diǎn)的種類。
1.3 分類決策樹的建立
分類決策樹剪枝是針對(duì)決策樹過早擬合問題而提出來的。分類決策樹剪枝一般分先剪枝和后剪枝。通過提前停止樹的構(gòu)造方法屬于先剪枝,假如決定在某個(gè)關(guān)鍵節(jié)點(diǎn)不再進(jìn)行分裂,對(duì)樹節(jié)點(diǎn)進(jìn)行剪枝,如果剪枝停止,那么該節(jié)點(diǎn)就變成樣本中的葉子節(jié)點(diǎn)。對(duì)該葉子節(jié)點(diǎn)選取包含樣本子集中類別最多的一個(gè)類,作為樣本節(jié)點(diǎn)的一個(gè)類別。后剪枝是針對(duì)完全成長(zhǎng)的樹進(jìn)行剪枝,通過去掉節(jié)點(diǎn)的分枝,用葉子節(jié)點(diǎn)代替,葉子節(jié)點(diǎn)用子集中類別中出現(xiàn)頻率最高的類別進(jìn)行標(biāo)記。本文基于分類決策樹對(duì)電網(wǎng)配變不匹配問題的故障診斷算法采用后剪枝的策略。
2 整體實(shí)現(xiàn)
本文從數(shù)據(jù)質(zhì)量檢查、數(shù)據(jù)真實(shí)性校驗(yàn)、數(shù)據(jù)修正和數(shù)據(jù)駁回四個(gè)步驟實(shí)現(xiàn)了解決電網(wǎng)配變不匹配問題,在同一個(gè)用戶同時(shí)擁有高供高計(jì)和高供低計(jì)兩個(gè)測(cè)量點(diǎn),電壓數(shù)據(jù)經(jīng)常在高壓側(cè)和低壓側(cè)切換,造成電壓越限。用戶側(cè)設(shè)備更新,而計(jì)量系統(tǒng)或營(yíng)銷系統(tǒng)中的變比數(shù)據(jù)未及時(shí)同步或填寫不規(guī)范,或由于計(jì)費(fèi)原因不能同步更新,直接影響PQIU等量測(cè)數(shù)據(jù)計(jì)算。本文數(shù)據(jù)來源于某省海量平臺(tái)計(jì)量數(shù)據(jù)和省海量平臺(tái)營(yíng)銷數(shù)據(jù),先匹配臺(tái)帳營(yíng)銷數(shù)據(jù),獲取導(dǎo)致錯(cuò)誤異常報(bào)數(shù)據(jù)警,系統(tǒng)中對(duì)UI設(shè)定上下限的閾值。獲取某省海量平臺(tái)計(jì)量數(shù)據(jù)和省海量平臺(tái)營(yíng)銷數(shù)據(jù)。檢查電壓電流,匹配臺(tái)帳營(yíng)銷數(shù)據(jù),提取異常報(bào)警數(shù)據(jù),檢查異常數(shù)據(jù)確實(shí)、重復(fù)情況,如果沒有重復(fù),提取異常超限數(shù)據(jù),提取數(shù)據(jù)相關(guān)匹配、變比、電壓、電流信息,利用變比關(guān)系對(duì)比量測(cè)數(shù)據(jù),高供高記變比計(jì)算和高供低記變比計(jì)算,利用變比關(guān)系對(duì)比量測(cè)數(shù)據(jù),如果匹配,錄入缺失數(shù)據(jù)計(jì)量點(diǎn)位,如果不匹配。利用專家系統(tǒng)分析具體原因[8,9],建立數(shù)據(jù)規(guī)則,利用決策樹皮判別,訓(xùn)練決策樹參數(shù),載入后續(xù)參數(shù),分析電壓電流報(bào)警原因,建立數(shù)據(jù)集規(guī)則,判斷是否誤報(bào)警,如果沒有報(bào)警輸出真實(shí)報(bào)警信息,并重新檢查線路功率,如果報(bào)警,恢復(fù)變比數(shù)據(jù),包含匹配信息、變比信息、電壓計(jì)量數(shù)據(jù)和電流計(jì)量數(shù)據(jù)。
2.1 數(shù)據(jù)質(zhì)量檢查
首先由計(jì)量系統(tǒng)得到越限警告,核查越限處數(shù)據(jù)是否有缺失、重復(fù)、格式錯(cuò)誤,如果數(shù)據(jù)有問題,結(jié)束質(zhì)量檢查;再判斷數(shù)據(jù)有問題的次數(shù),生成錯(cuò)誤報(bào)告,結(jié)束質(zhì)量檢查,如果數(shù)據(jù)多次沒有問題,從省海量平臺(tái)重新下載數(shù)據(jù)。提取報(bào)警數(shù)據(jù),校驗(yàn)警報(bào)信息的完整性,包括報(bào)警數(shù)據(jù)的時(shí)間、地點(diǎn)、設(shè)備編號(hào)、報(bào)警類型與嚴(yán)重程度,并且需要檢查報(bào)警時(shí)間是否缺失。報(bào)警地點(diǎn)與報(bào)警設(shè)備線路需要相匹配,報(bào)警設(shè)備編號(hào)與臺(tái)賬數(shù)據(jù)信息需要匹配等。等待報(bào)警類型提取確認(rèn),查看是否存在明顯誤報(bào)信息如圖1所示。
2.2 數(shù)據(jù)真實(shí)性校驗(yàn)
使用基于決策樹的專家系統(tǒng)判別錯(cuò)誤原因,判別規(guī)則流程如圖2所示,越線比例安裝大、中、小三個(gè)維度來劃分,持續(xù)時(shí)間按長(zhǎng)、短兩個(gè)維度來劃分,其中規(guī)則中的“大”、“中”、“小”、“長(zhǎng)”和“短”等詞語使用明確的閾值替代。排查工作集從越線比例大小、持續(xù)發(fā)生時(shí)間長(zhǎng)短、是否斷續(xù)出現(xiàn)、是否有高供高計(jì)和高供低計(jì)混亂。
擬使用分類和回歸書(CART)模型來訓(xùn)練閾值。CART描述如:用s表示閾值,t表示節(jié)點(diǎn)位置,則s的優(yōu)劣衡量為:其中tL,tR為t的左/右子節(jié)點(diǎn),其中,PL代表左子節(jié)點(diǎn)的記錄數(shù)占訓(xùn)練集的記錄數(shù)比例,PR代表右子節(jié)點(diǎn)的記錄數(shù)占訓(xùn)練集的記錄數(shù)比例,P(j|tL)表示在tL處,j類的記錄數(shù)占節(jié)點(diǎn)的記錄數(shù)的比例,P(j|tR)表示在tR處,j類的記錄數(shù)占節(jié)點(diǎn)的記錄數(shù)的比例,使用Φ(s|t)取得最大值的劃分閾值作為本條規(guī)則的閾值。
2.3 數(shù)據(jù)修正
當(dāng)配電變壓器重過載報(bào)警,負(fù)載超限60%,持續(xù)發(fā)生30分鐘閾值大于12h,時(shí)常出現(xiàn)斷續(xù),利用分類決策樹算法進(jìn)行數(shù)據(jù)分析和過濾,如果沒有超限,將數(shù)據(jù)寫入修正工單如圖3所示。
2.4 數(shù)據(jù)駁回
當(dāng)越限比例閾值大于130%,持續(xù)時(shí)間大于16h,采用分類決策樹算法,如果沒有斷續(xù)出現(xiàn),變比未及時(shí)更新,將數(shù)據(jù)駁回進(jìn)行手工排查如圖4所示。
3 結(jié)語
本文提出基于分類決策樹對(duì)電網(wǎng)配變不匹配問題的故障診斷算法,從數(shù)據(jù)質(zhì)量檢查、數(shù)據(jù)真實(shí)性校驗(yàn)、數(shù)據(jù)修正和數(shù)據(jù)駁回四個(gè)步驟實(shí)現(xiàn)了電網(wǎng)配變不匹配問題的快速診斷和定位。該故障診斷流程包括分類決策樹的建立、剪枝與測(cè)試。與其他分類算法相比,分類決策樹不需要參數(shù)假設(shè),且準(zhǔn)確率較。
參考文獻(xiàn)
[1] 劉少宇,郭宗軍,董明,等.專家系統(tǒng)在變電站設(shè)備診斷中的應(yīng)用[J].高電壓技術(shù),2001(5):17-19.
[2] 陳長(zhǎng)征,勾軼,王毅,等.基于遺傳神經(jīng)網(wǎng)絡(luò)的汽輪發(fā)電機(jī)組故障診斷研究[J].高電壓技術(shù),2003(8):1-2+25.
[3] 顏景斌,夏賽,王飛,等.基于改進(jìn)遺傳算法的有源配電網(wǎng)故障定位分析[J].電力系統(tǒng)及其自動(dòng)化學(xué)報(bào),2019(6):107-112.
[4] 劉棟,陳允平,沈廣,等.基于UML和Petri網(wǎng)的電力系統(tǒng)恢復(fù)模型[J].高電壓技術(shù),2006(6):90-93+121.
[5] 焦亞男,馬杰.一種改進(jìn)的MEP決策樹剪枝算法[J].河北工業(yè)大學(xué)學(xué)報(bào),2019(6):24-29.
[6] 王英英,羅毅,涂光瑜.基于粗糙集與決策樹的配電網(wǎng)故障診斷方法[J].高電壓技術(shù),2008(4):794-798.
[7] 中國(guó)電力科學(xué)研究院,國(guó)家電網(wǎng)公司,國(guó)網(wǎng)遼寧省電力有限公司沈陽供電公司.基于復(fù)雜事件處理技術(shù)和決策樹的配電網(wǎng)態(tài)勢(shì)感知方法:CN201610237515.2[P].2016-09-07.
[8] 馬春雷,丁健,陳宣林,等.基于決策樹自標(biāo)識(shí)的主動(dòng)配電網(wǎng)狀態(tài)估計(jì)算法[J].電力大數(shù)據(jù),2019(5):26-32.
[9] 陳思翰.試析智能配電網(wǎng)技術(shù)在配電網(wǎng)中的應(yīng)用[J].大科技,2019(35):101.