付卿卿
(貴州電網(wǎng)有限責(zé)任公司, 貴州,貴陽(yáng) 550002)
隨著我國(guó)經(jīng)濟(jì)的發(fā)展和社會(huì)的進(jìn)步,我國(guó)終端數(shù)據(jù)的接入量和采集量逐漸地上升,尤其是電力計(jì)量數(shù)據(jù)的積累呈現(xiàn)高儲(chǔ)備的趨勢(shì)。每天僅電力計(jì)量數(shù)據(jù)的積累就高達(dá)上億,故障問(wèn)題也隨之頻繁發(fā)生,因此需要有效的電力故障診斷模型從儲(chǔ)備的電力計(jì)量數(shù)據(jù)中挖掘潛在的規(guī)律,科學(xué)準(zhǔn)確地預(yù)測(cè)電力故障問(wèn)題。電力故障的有效預(yù)測(cè)也可以幫助企業(yè)提高電網(wǎng)的運(yùn)行效率,節(jié)約維護(hù)過(guò)程中所需的成本。針對(duì)該領(lǐng)域的研究正處于發(fā)展的階段,部分專(zhuān)家學(xué)者[1-2]利用回歸分析法建立預(yù)測(cè)模型,從多因素預(yù)測(cè)角度出發(fā),分析因素變量間的相關(guān)性,判定不同因素對(duì)電力故障的影響。也有部分專(zhuān)家[3-4]學(xué)者從電力計(jì)量數(shù)據(jù)的角度出發(fā),利用電力計(jì)量數(shù)據(jù)得到計(jì)量系統(tǒng)網(wǎng)絡(luò)阻抗與電流互感器一次、二次側(cè)短路故障之間的關(guān)系,將得到的規(guī)律應(yīng)用在故障檢測(cè)中,但是并沒(méi)有真正地實(shí)現(xiàn)預(yù)測(cè)智能化,更好的還是將規(guī)律和主觀經(jīng)驗(yàn)判斷相結(jié)合,再將判斷后的經(jīng)驗(yàn)用于預(yù)測(cè)。還有部分專(zhuān)家學(xué)者[5-6]利用人工智能技術(shù)建立診斷模型,旨在從海量的電力計(jì)量數(shù)據(jù)中挖掘潛在的規(guī)律,但是模型更多是在理論上構(gòu)建,并未真正地實(shí)現(xiàn)故障的診斷,也未真正地將模型搭建起來(lái)。
綜上可知,目前利用電力計(jì)量數(shù)據(jù)實(shí)現(xiàn)電力故障的預(yù)測(cè)是一種大的趨勢(shì),主要集中在知識(shí)經(jīng)驗(yàn)判斷、數(shù)據(jù)理論模型分析等方面。這些診斷方法十分依賴(lài)人工操作和專(zhuān)家的經(jīng)驗(yàn),而采集海量的數(shù)據(jù)時(shí),電力計(jì)量終端極容易出現(xiàn)問(wèn)題,故障情況經(jīng)常發(fā)生。因此,本研究利用優(yōu)化的Tradaboost回歸算法建立電力故障預(yù)測(cè)模型,從大量的電力計(jì)量數(shù)據(jù)中挖掘潛在的規(guī)律,實(shí)現(xiàn)電力計(jì)量數(shù)據(jù)驅(qū)動(dòng)。
電力計(jì)量數(shù)據(jù)的獲取主要通過(guò)電度表、電壓互感器、電流互感器,并獲取二次側(cè)電流。對(duì)于高壓電力計(jì)量系統(tǒng)故障性質(zhì)深入分析可知,將故障分為直接可診斷的故障和間接可診斷的故障。直接可診斷的故障即直接通過(guò)電力儀表的測(cè)量結(jié)果,判斷是否可以直接發(fā)生,并不需要深入的研究潛在的故障特性。間接診斷的故障指電力計(jì)量數(shù)據(jù)長(zhǎng)期儲(chǔ)存后,通過(guò)相應(yīng)的模型算法可以實(shí)現(xiàn)對(duì)故障的提前預(yù)測(cè),因?yàn)殡娏τ?jì)量數(shù)據(jù)是多維度數(shù)據(jù)的綜合,因此可以在主觀觀測(cè)不到的情況下實(shí)現(xiàn)提前預(yù)測(cè)的功能。根據(jù)高壓電力計(jì)量系統(tǒng)的結(jié)構(gòu),對(duì)計(jì)量回路的多個(gè)參數(shù)進(jìn)行檢測(cè)和電力實(shí)時(shí)監(jiān)測(cè)樣本的采集。將歷史數(shù)據(jù)和實(shí)時(shí)監(jiān)測(cè)的數(shù)據(jù)輸入神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)模型中,實(shí)現(xiàn)對(duì)監(jiān)測(cè)情況的提前預(yù)測(cè),對(duì)故障問(wèn)題進(jìn)行處理和分析。
在積累了大量的電力計(jì)量數(shù)據(jù)的基礎(chǔ)上,為解決Tradaboost算法權(quán)重初始化策略,利用LR()算法進(jìn)行優(yōu)化,為得到源域中與目標(biāo)域數(shù)據(jù)分布類(lèi)似的數(shù)據(jù)集,以類(lèi)似度為標(biāo)準(zhǔn)對(duì)數(shù)據(jù)進(jìn)行權(quán)重初始化,本文引入LR算法來(lái)優(yōu)化Tradaboost源樣本權(quán)重初始化步驟,將數(shù)據(jù)先通過(guò)LR算法進(jìn)行篩選。LR算法的本質(zhì)是二分類(lèi)概率輸出器,通過(guò)LR算法分類(lèi)后,可以認(rèn)為更加靠近決策邊界的源域數(shù)據(jù)與目標(biāo)域數(shù)據(jù)類(lèi)似程度更高。假設(shè)源域數(shù)據(jù)分布為a,標(biāo)記為0,目標(biāo)域數(shù)據(jù)分布為b,標(biāo)記為1。訓(xùn)練LR模型,將得到分類(lèi)概率,這個(gè)概率即可作為源域數(shù)據(jù)與目標(biāo)域數(shù)據(jù)特征分布的類(lèi)似程度。因此,LR被分類(lèi)器判定為b的源域數(shù)據(jù)的初始權(quán)重更大。
原始Tradaboost算法是分類(lèi)模型,子學(xué)習(xí)器為弱分類(lèi)器,本文涉及的電力故障預(yù)測(cè)是回歸問(wèn)題,因此需要子學(xué)習(xí)器換成SVR回歸器代替弱分類(lèi)器。定義訓(xùn)練集為(xi,yi),i=1,…,l,是xi∈Rn,l為數(shù)據(jù)總量,n為影響因素維數(shù),xi∈Rn為輸入值,yi=R為輸出期望值。其目標(biāo)回歸函數(shù)為
f(x)=ωφ(x)+b
(1)
式中,φ(x)為輸入空間到特征空間的非線性映射,ω為權(quán)重向量,b為優(yōu)化參數(shù)。再添加回歸損失函數(shù)ε,如式(2),SVR即可進(jìn)行回歸預(yù)測(cè)。
(2)
如式(2)損失函數(shù)所示,若預(yù)測(cè)值與期望值的絕對(duì)差小于ε,即視預(yù)測(cè)值為正確,反之則認(rèn)為預(yù)測(cè)錯(cuò)誤。SVR算法引入了松弛變量ξi和懲罰系數(shù)C,優(yōu)化目標(biāo)函數(shù)如式(3):
(3)
引入拉格朗日乘子法可得式(3)最優(yōu)解:
(4)
算法的步驟如下。
輸入:SVR回歸器,Ds,Dt,Test,μ,ρ,H。
輸出:預(yù)測(cè)故障發(fā)生的程度,基于目標(biāo)域的強(qiáng)回歸器f(x)。
Step 1 源域樣本權(quán)重初始化。合并源域和目標(biāo)域訓(xùn)練集Ds和Dt,對(duì)訓(xùn)練集數(shù)據(jù)進(jìn)行歸一化。調(diào)用LR算法進(jìn)行Tradaboost源樣本權(quán)重初始化,為源域中同目標(biāo)域數(shù)據(jù)分布類(lèi)似的數(shù)據(jù)賦予更大的初始權(quán)重。
Step 2 初始化源域樣本更新方式?(s),ns為源域樣本總量。
(6)
Step 3 設(shè)置迭代次數(shù)H。Forth=1,2,3,4,…,H。
Step 6 計(jì)算暫定強(qiáng)學(xué)習(xí)器f(x)在目標(biāo)域訓(xùn)練集Dt上的誤差εi。
Step 7 重置Dt樣本權(quán)重更新方式。
(7)
Step 8 計(jì)算暫定強(qiáng)學(xué)習(xí)器f(x)在源域訓(xùn)練集Dt上的誤差εi,更新合并訓(xùn)練集樣本權(quán)重ωi+1。
(8)
ωi+1=ωi+1?(t+1)
(9)
Step 9 得到的源域樣本權(quán)重如小于樣本排除參數(shù)值μ,則排除該樣本,不參與下一次迭代。
Step 10 迭代次數(shù)m>M,結(jié)束循環(huán),輸出最終強(qiáng)學(xué)習(xí)器。
將電力計(jì)量數(shù)據(jù)輸入到LR-Tradaboost算法中,再將目標(biāo)域前20組數(shù)據(jù)和源域全部數(shù)據(jù)合并成訓(xùn)練集對(duì)模型進(jìn)行訓(xùn)練,將目標(biāo)域后7組數(shù)據(jù)作為測(cè)試集驗(yàn)證模型預(yù)測(cè)性能。為驗(yàn)證傳統(tǒng)機(jī)器學(xué)習(xí)模型在電力故障預(yù)測(cè)問(wèn)題上的適用性,將不同方法下的訓(xùn)練結(jié)果進(jìn)行對(duì)比。SVR算法訓(xùn)練集為目標(biāo)域前20組數(shù)據(jù),測(cè)試集為目標(biāo)域后7組數(shù)據(jù)。同時(shí),為驗(yàn)證LR-Tradaboost算法在預(yù)測(cè)性能方面的作用,利用針對(duì)回歸問(wèn)題的Tradaboost-R2算法同LR-Tradaboost算法的訓(xùn)練結(jié)果作以比較,Tradaboost-R2算法的訓(xùn)練集和測(cè)試集與LR-Tradaboost算法相同。選用回歸算法評(píng)價(jià)指標(biāo)均方根誤差RMSE以及R2作為算法訓(xùn)練結(jié)果的評(píng)價(jià)指標(biāo),對(duì)比不同算法測(cè)試集預(yù)測(cè)結(jié)果的均方根誤差以及R2來(lái)對(duì)模型進(jìn)行對(duì)比和評(píng)價(jià),實(shí)現(xiàn)算法預(yù)測(cè)性能的驗(yàn)證。見(jiàn)表1。
表1 電力計(jì)量數(shù)據(jù)發(fā)生異常的真實(shí)值與預(yù)測(cè)值對(duì)比表
為了對(duì)比LR-Tradaboost算法和Tradaboost-R2算法的學(xué)習(xí)效率,在2種算法的訓(xùn)練過(guò)程中,每隔10次迭代過(guò)程,分別計(jì)算2種算法得到的暫定強(qiáng)學(xué)習(xí)器的R2,得到算法的收斂程度。圖1為L(zhǎng)R-Tradaboost算法和Tradaboost-R2算法的回歸收斂速度的對(duì)比圖。由圖1得到,LR-Tradaboost算法在迭代次數(shù)為50時(shí)已經(jīng)收斂,模型分?jǐn)?shù)R2達(dá)到了0.81,之后的迭代過(guò)程中R2不再增加?;诘玫矫黠@的收斂程度變化趨勢(shì)和減少計(jì)算工作量的考慮,本研究采用每10次迭代計(jì)算一次算法R2,實(shí)際上LR-Tradaboost算法的收斂發(fā)生在迭代次數(shù)40到50的閉區(qū)間內(nèi),并非在第50次迭代后達(dá)到收斂。由圖2可得,Tradaboost-R2算法在進(jìn)行50次迭代后,模型分?jǐn)?shù)僅為0.21,且仍處于上升趨勢(shì),事實(shí)上Trada-boost-R2算法在100到110次迭代之間才完成收斂。對(duì)比2種算法的收斂速度,發(fā)現(xiàn)LR-Tradaboost算法的收斂速度幾乎是Tradaboost-R2算法的2倍,證明了LR-Tradaboost算法在利用電力計(jì)量數(shù)據(jù)預(yù)測(cè)電力故障上效果更好,基于LR的優(yōu)化權(quán)重初始化策略有效提高了算法性能及效率。
圖1 算法回歸收斂對(duì)比圖
本研究主要利用電力計(jì)量數(shù)據(jù)結(jié)合優(yōu)化Tradaboost回歸算法實(shí)現(xiàn)電力故障的預(yù)測(cè),提出了LR算法優(yōu)化權(quán)重初始化策略的LR-Tradaboost算法,同Tradaboost-R2算法預(yù)測(cè)結(jié)果和收斂速度作對(duì)比,LR-Tradaboost預(yù)測(cè)誤差比Tradaboost-R2少,而收斂速度LR-Tradaboost幾乎是Tradaboost-R2的2倍,故LR-Tradaboost算法在電力故障預(yù)測(cè)中效果較好。