施文
(國(guó)網(wǎng)陜西省電力公司,陜西西安 710048)
電費(fèi)抄核收數(shù)據(jù)異常診斷是一項(xiàng)十分重要的工程,隨著科學(xué)技術(shù)的迅猛發(fā)展,電力企業(yè)中的抄核收工作人員不僅要提升自身的專(zhuān)業(yè)水平,同時(shí)還要充分利用現(xiàn)代科學(xué)技術(shù)提升自身素養(yǎng)[1]。電力企業(yè)要充分認(rèn)識(shí)到電費(fèi)抄核收數(shù)據(jù)異常診斷在整個(gè)流程中的重要性,并且要投入大量的精力采取有效的措施,促使電費(fèi)抄核收數(shù)據(jù)異常診斷結(jié)果更加準(zhǔn)確。最近幾年,相關(guān)專(zhuān)家也加強(qiáng)了該方面內(nèi)容的研究,例如裴茂林等人]將智能電表設(shè)定為用戶(hù)和電網(wǎng)的信息樞紐[2],通過(guò)電網(wǎng)為用戶(hù)提供用電習(xí)慣以及負(fù)荷特征等相關(guān)信息進(jìn)行數(shù)據(jù)異常診斷。楊茂等人分析風(fēng)電功率特征[3],通過(guò)Copula函數(shù)獲取概率功率曲線,同時(shí)結(jié)合異常數(shù)據(jù)的時(shí)序特征建立數(shù)據(jù)異常診斷模型。以上兩種方法雖然現(xiàn)階段取得了較為滿(mǎn)意的研究成果,但是由于未能進(jìn)行數(shù)據(jù)去噪,導(dǎo)致電費(fèi)抄核收數(shù)據(jù)異常診斷準(zhǔn)確性降低,診斷延時(shí)上升。為此,提出一種基于主元分析算法的電費(fèi)抄核收數(shù)據(jù)異常診斷方法。仿真實(shí)驗(yàn)結(jié)果表明,所提方法不僅可以全面增強(qiáng)電費(fèi)抄核收數(shù)據(jù)異常診斷準(zhǔn)確性,同時(shí)還能夠降低診斷延時(shí)。
在采集電費(fèi)抄核收數(shù)據(jù)的過(guò)程中,許多數(shù)據(jù)存在尖峰或者突變現(xiàn)象,并且噪聲也不是平衡的白噪聲,對(duì)于這種信號(hào)的處理,采樣傳統(tǒng)的傅里葉變換是無(wú)法實(shí)現(xiàn)去噪的。由于傅里葉分析是完全在頻域中進(jìn)行信號(hào)分析,無(wú)法獲取信號(hào)在任意時(shí)間段的變化情況,促使信號(hào)在時(shí)間軸上的隨機(jī)一個(gè)突變都會(huì)影響整個(gè)信號(hào)的圖譜[4-5]。而小波分析不僅能夠同時(shí)在時(shí)域和頻域中對(duì)信號(hào)進(jìn)行分析,還能夠準(zhǔn)確區(qū)分信號(hào)中的突變部分以及噪聲,有效實(shí)現(xiàn)噪聲消除。
對(duì)于函數(shù)φ(t)∈L2R,如果進(jìn)行傅里葉函數(shù),則需要滿(mǎn)足以下的可容性條件:
上式中,φ(t)代表基本小波或者小波母函數(shù),將小波母函數(shù)φ(t)進(jìn)行伸縮或者平移;同時(shí)尺度因子為a;平移因子為b,令經(jīng)過(guò)平移后的函數(shù)為φ(a,b)(t),則有:
上式中,φ(a,b)(t)代表依賴(lài)于a、b的小波基函數(shù)[6]。
將任意L2R空間中的函數(shù)f(t)在小波基下展開(kāi),將展開(kāi)的函數(shù)f(t)稱(chēng)為連續(xù)小波變換,具體的表達(dá)式為:
其中:
當(dāng)實(shí)際采用小波方法進(jìn)行去噪時(shí),小波變換的尺度參數(shù)不需要進(jìn)行連續(xù)取值,而是采用一種方式將連續(xù)小波及其變換進(jìn)行離散化處理[7]。通常情況下,將尺度a 按照冪級(jí)數(shù)進(jìn)行離散化處理,對(duì)位移b進(jìn)行均勻離散取值,經(jīng)過(guò)離散后可以表示為:
其中:
通過(guò)公式(6)能夠得到第m個(gè)倍頻的局部信息;f(t)的小波分解和重構(gòu)可以根據(jù)Mallat 塔式算法進(jìn)行計(jì)算。任意尺度的逼近信號(hào)均可以表示成下一程度的逼近信號(hào)和細(xì)節(jié)信號(hào)之和,即:
通過(guò)二進(jìn)離散小波對(duì)信號(hào)進(jìn)行三層分解,具體可以表示為:
在實(shí)際應(yīng)用的過(guò)程中,有用信號(hào)可以表示為低頻信號(hào)或者是部分較為平穩(wěn)的信號(hào),而噪聲則可以表示為高頻信號(hào),所以在降噪的過(guò)程中需要進(jìn)行以下處理:首先對(duì)初始信號(hào)進(jìn)行小波分解;其次對(duì)小波分解的高頻系數(shù)利用門(mén)限值等形式進(jìn)行量化處理;最后對(duì)信號(hào)進(jìn)行重構(gòu),即可達(dá)到降噪的目的。設(shè)定噪聲的一維信號(hào)為:
上式中,f(i)代表真實(shí)信號(hào);e(i)代表噪聲;s(i)代表含有噪聲的信號(hào)。通常情況下,一維的降噪過(guò)程可以劃分為以下的步驟為:
(1)信號(hào)的小波分解:
選取小波分解,同時(shí)確定分解的層次N;然后對(duì)各個(gè)層次的高頻系數(shù)進(jìn)行量化處理。
(2)高頻系數(shù)的閾值量化處理:
選取合適的閾值對(duì)1~N從層的高頻系數(shù)進(jìn)行量化處理。
(3)小波重構(gòu):
通過(guò)小波分解的第N層系數(shù)和經(jīng)過(guò)量化處理后的第1~N層的高頻系數(shù),進(jìn)而實(shí)現(xiàn)小波的重構(gòu)。
在上述步驟中,關(guān)鍵是閾值的選擇和量化的處理,這會(huì)直接關(guān)系到信號(hào)的質(zhì)量,閾值選擇方法主要包含以下幾種形式,分別為:通過(guò)stein的無(wú)偏似然估計(jì)、啟發(fā)式等。
在數(shù)據(jù)曲線中,非反射點(diǎn)的閾值是其損耗的經(jīng)驗(yàn)值,它主要是由不同的連接技術(shù)以及工藝決定的。
針對(duì)信號(hào)f 進(jìn)行閾值處理時(shí),主要包含軟硬閾值兩種方法。其中硬閾值是將信號(hào)變換的絕對(duì)值和閾值進(jìn)行對(duì)比,小于或者等于閾值的點(diǎn)變?yōu)榱?,而大于閾值的點(diǎn)則保持不變[8]。通過(guò)研究發(fā)現(xiàn),軟閾值的去噪效果明顯優(yōu)于硬閾值。
主元分析在數(shù)據(jù)預(yù)處理方面具有十分明顯的優(yōu)勢(shì),尤其是在處理復(fù)雜數(shù)據(jù)的應(yīng)用方面。它主要是將其和其它多元技術(shù)進(jìn)行結(jié)合。首先針對(duì)子系統(tǒng)中的隨機(jī)信號(hào)進(jìn)行壓縮處理,構(gòu)建一個(gè)統(tǒng)一的大系統(tǒng)降維統(tǒng)計(jì)模型—PCA模型;然后提取系統(tǒng)中PCA 模型輸出的統(tǒng)計(jì)特征參數(shù),通過(guò)分析結(jié)果采用人工智能技術(shù)進(jìn)一步判定故障的具體位置以及性質(zhì),并且對(duì)其進(jìn)行一體化處理,將全部變量有效保留在PCA模型中。
主元分析主要是通過(guò)初始變量間的相關(guān)性,采用初始變量的少數(shù)線性組合對(duì)原始變量信息進(jìn)行解釋?zhuān)M(jìn)而有效實(shí)現(xiàn)數(shù)據(jù)降維。通常情況下,通過(guò)主元分析方法獲取的主元變量和初始變量之間存在以下的關(guān)系,即:
(1)通過(guò)不同主元組成初始變量的線性組合;
(2)初始變量數(shù)量明顯高于主元數(shù)量;
(3)主元有效保留了初始變量的大部分信息;
(4)不同主元之間不是相互關(guān)聯(lián)的。
對(duì)于2.1小節(jié)經(jīng)過(guò)小波變換的數(shù)據(jù)進(jìn)行主元分析,采用主元分析算法是在確保電費(fèi)抄核收數(shù)據(jù)信息丟失最少的情況下,對(duì)高維變量空間中的數(shù)據(jù)盡可能采用綜合變量表示,主元個(gè)數(shù)是主元分析模型中十分重要的參數(shù);當(dāng)所使用的主元數(shù)量太少時(shí),會(huì)導(dǎo)致變量中的信息丟失,且模型的誤差增加;當(dāng)采用較多的主元時(shí),又會(huì)將數(shù)據(jù)中的測(cè)量噪聲過(guò)多地引入過(guò)來(lái),增強(qiáng)分析的計(jì)算量和診斷的復(fù)雜性,所以主元個(gè)數(shù)的確定十分重要。
設(shè)定正常狀態(tài)下采集到的電費(fèi)抄核收觀測(cè)數(shù)據(jù)為X,其中共計(jì)含有m個(gè)觀測(cè)變量以及n個(gè)觀測(cè)值,采用m×n的數(shù)據(jù)矩陣代表這些數(shù)據(jù),即:
其中矩陣X能夠分解為以下的形式:
設(shè)定X的方差為:∑=COV(X),其中∑的特征值可以表示為λ1,λ2,…,λm,同時(shí)λ1≥λ2≥…≥λm,結(jié)合矩陣的分解定理能夠獲?。?/p>
通過(guò)相關(guān)系數(shù)矩陣對(duì)電費(fèi)抄核收數(shù)據(jù)主成分進(jìn)行求解,即:
明確數(shù)據(jù)貢獻(xiàn)率的主元數(shù)量,主要通過(guò)方差累積貢獻(xiàn)率進(jìn)行主元數(shù)量確定,具體的計(jì)算式為:
當(dāng)前l(fā) 個(gè)主元的累積貢獻(xiàn)率百分比超過(guò)一個(gè)閾值,利用這個(gè)閾值結(jié)合實(shí)際情況確定主元量。
在上述分析的基礎(chǔ)上,將采集到的電費(fèi)抄核收數(shù)據(jù)設(shè)定為訓(xùn)練樣本,通過(guò)公式(15)選取合適的滯后時(shí)間,為了能夠更好地提取動(dòng)態(tài)變量間的相互關(guān)系,即:
通過(guò)公式(16)進(jìn)行數(shù)據(jù)訓(xùn)練,獲取對(duì)應(yīng)的數(shù)據(jù)陣:
通過(guò)公式(14)對(duì)公式(16)進(jìn)行標(biāo)準(zhǔn)化處理,獲取均值以及標(biāo)準(zhǔn)方差。
在上述分析的基礎(chǔ)上,計(jì)算SPE統(tǒng)計(jì)量和T2統(tǒng)計(jì)量在置信度α的控制限,即:
采集故障數(shù)據(jù)將其設(shè)定為測(cè)試數(shù)據(jù),同時(shí)組建測(cè)試數(shù)據(jù)對(duì)應(yīng)的數(shù)據(jù)向量。同時(shí)將數(shù)據(jù)向量分別分解到不同的主元子空間和殘差子空間中,獲取 和 。同時(shí),采用公式(19)和公式(20)計(jì)算T2的統(tǒng)計(jì)量和SPE統(tǒng)計(jì)量,即:
繪制T2和SPE多變量統(tǒng)計(jì)控制圖,同時(shí)實(shí)時(shí)監(jiān)控系統(tǒng)的運(yùn)行狀態(tài)。
同時(shí)利用主元分析表達(dá)式建立數(shù)據(jù)異常診斷模型,通過(guò)模型實(shí)現(xiàn)電費(fèi)抄核收數(shù)據(jù)異常診斷,即:
綜上所述,完成了電費(fèi)抄核收數(shù)據(jù)異常診斷。
為了驗(yàn)證所提基于主元分析算法的電費(fèi)抄核收數(shù)據(jù)異常診斷方法的綜合有效性,在Win7 系統(tǒng),CPU i55600U@2.6GHz,內(nèi)存16GB3200MHz下進(jìn)行仿真實(shí)驗(yàn)測(cè)試。
由于所提方法在研究初期使用小波變換對(duì)采集到的電費(fèi)抄核收數(shù)據(jù)進(jìn)行去噪處理,利用表1給出所提方法的去噪效果。
表1 所提方法的去噪效果
分析表1中的實(shí)驗(yàn)數(shù)據(jù)可知,所提方法能夠有效提升數(shù)據(jù)的信噪比,同時(shí)有效抑制數(shù)據(jù)的震蕩現(xiàn)象,對(duì)異常數(shù)據(jù)處理效果明顯。
為了驗(yàn)證電費(fèi)抄核收數(shù)據(jù)異常診斷結(jié)果的準(zhǔn)確性,實(shí)驗(yàn)選取平均絕對(duì)誤差和平均誤差設(shè)定為測(cè)試指標(biāo),其中兩項(xiàng)指標(biāo)的取值越低,則說(shuō)明電費(fèi)抄核收數(shù)據(jù)異常診斷結(jié)果準(zhǔn)確性越高,反之則說(shuō)明電費(fèi)抄核收數(shù)據(jù)異常診斷結(jié)果準(zhǔn)確性越低。實(shí)驗(yàn)選取兩種方法作為對(duì)比方法,利用表2~表4給出三種方法的電費(fèi)抄核收數(shù)據(jù)異常診斷結(jié)果準(zhǔn)確性對(duì)比結(jié)果:
分析表2~表4中的實(shí)驗(yàn)數(shù)據(jù)可知,所提方法有效降低了電費(fèi)抄核收數(shù)據(jù)異常診斷結(jié)果的平均絕對(duì)誤差和平均誤差,促使所提方法的電費(fèi)抄核收數(shù)據(jù)異常診斷結(jié)果更加準(zhǔn)確。這主要依賴(lài)于所提方法的研究初期,采用小波變換對(duì)采集到的電費(fèi)抄核收數(shù)據(jù)進(jìn)行去噪處理,有效濾除數(shù)據(jù)中的噪聲,全面提升數(shù)據(jù)異常診斷結(jié)果的準(zhǔn)確性,且所提方法明顯優(yōu)于另外兩種方法。
表2 所提方法的電費(fèi)抄核收數(shù)據(jù)異常診斷結(jié)果準(zhǔn)確性
表3 文獻(xiàn)[2]方法的電費(fèi)抄核收數(shù)據(jù)異常診斷結(jié)果準(zhǔn)確性
表4 文獻(xiàn)[3]方法的電費(fèi)抄核收數(shù)據(jù)異常診斷結(jié)果準(zhǔn)確性
在進(jìn)行電費(fèi)抄核收數(shù)據(jù)異常診斷的過(guò)程中,由于受到各種各樣外界因素的干擾,導(dǎo)致各個(gè)方法均存在診斷延時(shí),以下實(shí)驗(yàn)測(cè)試將電費(fèi)抄核收數(shù)據(jù)異常診斷延時(shí)設(shè)定為測(cè)試指標(biāo),分別選取文獻(xiàn)[2]方法和文獻(xiàn)[3]方法作為對(duì)比方法,利用圖1給出具體的實(shí)驗(yàn)對(duì)比結(jié)果。
分析圖1中的實(shí)驗(yàn)數(shù)據(jù)可知,各個(gè)方法的電費(fèi)抄核收數(shù)據(jù)異常診斷延時(shí)會(huì)隨著測(cè)試樣本數(shù)量的增加而增加,但是和另外兩種方法相比,所提方法的電費(fèi)抄核收數(shù)據(jù)異常診斷延時(shí)明顯更低一些,這是因?yàn)樗岱椒ú蓸有〔ㄗ儞Q對(duì)采集到的電費(fèi)抄核收數(shù)據(jù)進(jìn)行去噪處理,有效濾除無(wú)利用價(jià)值的數(shù)據(jù),減少電費(fèi)抄核收數(shù)據(jù)異常診斷延時(shí)。
圖1 不同方法的電費(fèi)抄核收數(shù)據(jù)異常診斷延時(shí)對(duì)比結(jié)果
為了有效提升傳統(tǒng)方法的電費(fèi)抄核收數(shù)據(jù)異常診斷準(zhǔn)確性,降低電費(fèi)抄核收數(shù)據(jù)異常診斷延時(shí),結(jié)合主元分析算法,提出了一種基于主元分析算法的電費(fèi)抄核收數(shù)據(jù)異常診斷方法。通過(guò)具體的仿真實(shí)驗(yàn)測(cè)試,全面驗(yàn)證了所提方法的有效性和優(yōu)越性。