袁智勇
(江西贛能股份有限公司抱子石水電廠,江西 修水 332400)
水電廠是電力系統(tǒng)的重要組成部分,其運(yùn)行狀態(tài)會(huì)受到電廠的各種影響因素和外界環(huán)境等,所以,對水廠進(jìn)行合理、有效得調(diào)整,使之能夠適應(yīng)不斷變化的外部環(huán)境影響,因此對整個(gè)電網(wǎng)進(jìn)行在線監(jiān)測、狀態(tài)診斷和預(yù)測是十分必要。隨著我國經(jīng)濟(jì)水平的不斷提高以及國家政策對節(jié)能減排力度加大等因素影響下,火力發(fā)電廠在未來將會(huì)有越來越多的機(jī)組出現(xiàn)故障。而傳統(tǒng)方法在分析數(shù)據(jù)時(shí)存在很多問題:如僅依靠經(jīng)驗(yàn)判斷無法準(zhǔn)確的確定某個(gè)具體電廠運(yùn)行情況,數(shù)據(jù)的處理方法比較單一,無法實(shí)現(xiàn)對故障類型進(jìn)行分析,不能準(zhǔn)確地揭示出機(jī)組運(yùn)行過程中所存在問題?;诖?,本文提出了一種針對水電廠運(yùn)行狀態(tài)進(jìn)行故障診斷的方法,該技術(shù)通過對數(shù)據(jù)集和處理方式以及相關(guān)算法分析來實(shí)現(xiàn)。
數(shù)據(jù)挖掘技術(shù)是指從海量的、復(fù)雜多變的非結(jié)構(gòu)化信息中提取有價(jià)值信息的技術(shù),它是基于數(shù)據(jù)挖掘理論和技術(shù)的應(yīng)用,能夠幫助人們發(fā)現(xiàn)隱藏在信息中的有用價(jià)值,從而提高企業(yè)的經(jīng)濟(jì)效益,同時(shí)也能夠幫助人們在復(fù)雜多變環(huán)境中更好地生存和發(fā)展。
數(shù)據(jù)挖掘的任務(wù)分為以下幾點(diǎn):
(1)將復(fù)雜、冗余性強(qiáng)的信息進(jìn)行整理,并在其基礎(chǔ)上對原始決策變量和潛在觀測信號(hào)進(jìn)行預(yù)測,建立了基于粗糙集的水電廠狀態(tài)檢修模型。該方法是根據(jù)決策變量和潛在觀測信號(hào),通過對原始數(shù)據(jù)進(jìn)行去噪,得到一個(gè)最佳估計(jì),從而提高預(yù)測精度。
(2)找出描述并區(qū)分?jǐn)?shù)據(jù)類或概念的模型,以便能夠使用模型預(yù)測類標(biāo)記未知的對象類,并將其分類到一個(gè)新的、可解釋的對象類中,從而達(dá)到描述和區(qū)分?jǐn)?shù)據(jù)變量之間關(guān)系,實(shí)現(xiàn)模型預(yù)測。
(3)聚類是把數(shù)據(jù)劃分到不同組中,進(jìn)行組合而產(chǎn)生的一種數(shù)據(jù)處理技術(shù),它能夠?qū)⒁恍┚哂邢嗤瑢傩缘膶ο蠓诸?,對同一組中不同元素之間關(guān)系進(jìn)行分析,并找出其對應(yīng)的規(guī)律,從而使數(shù)據(jù)能夠更加準(zhǔn)確。
(4)關(guān)聯(lián)分析的任務(wù)是找出數(shù)據(jù)記錄中字段之間的關(guān)系,并利用其對數(shù)據(jù)進(jìn)行處理。通過關(guān)聯(lián)分析可以發(fā)現(xiàn)系統(tǒng)中的問題,并且能夠找到事物之間聯(lián)系,從而提高故障診斷和預(yù)測決策過程的效率,進(jìn)而降低系統(tǒng)的故障率。通過關(guān)聯(lián)分析可以發(fā)現(xiàn)事物之間聯(lián)系,并且能夠利用其進(jìn)行預(yù)測,從而為決策者提供有效信息。
在傳統(tǒng)的數(shù)據(jù)挖掘中,主要是通過對原始信息進(jìn)行抽取,進(jìn)而得到大量具有特定規(guī)律性和預(yù)測價(jià)值的數(shù)據(jù)。而隨著時(shí)間推移以及科技發(fā)展進(jìn)步、技術(shù)不斷完善等因素都會(huì)產(chǎn)生越來越多與之相關(guān)且復(fù)雜關(guān)系較大的異常樣本,這些隨機(jī)變量可能包括許多不同類型,同時(shí)由于一些隨機(jī)過程中不能夠被量化處理過,導(dǎo)致無法得到有效挖掘出規(guī)律性和預(yù)測價(jià)值的數(shù)據(jù)信息。數(shù)據(jù)挖掘的過程如圖1 所示。
圖1 數(shù)據(jù)挖掘過程示意圖
(1)數(shù)據(jù)選擇。數(shù)據(jù)選擇是對原始數(shù)據(jù)進(jìn)行篩選,將有相同屬性的樣本集按照一定規(guī)則排列進(jìn)同一堆中,以獲得不同的結(jié)果。通過對數(shù)據(jù)進(jìn)行處理,得到一組具有良好性能和特點(diǎn)的信息,從而將其分類、歸類,建立模型并對其進(jìn)行分類,得到不同的結(jié)果,最終將故障對象分為一類,從而分析系統(tǒng)中各類信息之間關(guān)系。
(2)數(shù)據(jù)預(yù)處理。數(shù)據(jù)預(yù)處理是將實(shí)際的信息轉(zhuǎn)化為可利用、有效和直觀表達(dá)出來,并能對原始信息進(jìn)行描述的過程,它是數(shù)據(jù)挖掘技術(shù)的一個(gè)重要分支,其主要目的在于利用某種算法對原始信息進(jìn)行處理,并將這些分析結(jié)果轉(zhuǎn)換為可應(yīng)用于工程實(shí)際過程中的有用知識(shí)。
(3)模式發(fā)現(xiàn)。傳統(tǒng)的模式發(fā)現(xiàn)多用于人工神經(jīng)網(wǎng)絡(luò),而現(xiàn)在已經(jīng)有了人工智能,主要是針對模型中不同類型數(shù)據(jù)進(jìn)行處理和分析。在實(shí)際應(yīng)用過程中,可以使用多種算法對這些數(shù)據(jù)信息進(jìn)行挖掘,從而得到有效的結(jié)果,并針對這些數(shù)據(jù)進(jìn)行分析,進(jìn)而獲得決策。
(4)模式評(píng)估。通過某種度量得出真正代表知識(shí)的模式,從而為其提供改進(jìn)依據(jù),并根據(jù)模型的實(shí)際情況來對系統(tǒng)進(jìn)行評(píng)估,得出最優(yōu)結(jié)果。通過數(shù)據(jù)挖掘算法能夠得到一個(gè)有效的模式評(píng)估值。
(5)知識(shí)表示。傳統(tǒng)的模式評(píng)估方法是基于歷史數(shù)據(jù)和模型進(jìn)行判斷,而對于實(shí)際情況來說,往往需要對原始指標(biāo)進(jìn)行一定程度上的簡化處理,而傳統(tǒng)的模式評(píng)估方法是基于歷史數(shù)據(jù)進(jìn)行判斷,這就使得預(yù)測結(jié)果與實(shí)際情況有很大差異,從而導(dǎo)致誤差較大。為了降低這些問題帶來的影響和影響,改進(jìn)了水電廠狀態(tài)檢修系統(tǒng)中常用到一些指標(biāo)來對原始信息進(jìn)行處理分析。
數(shù)據(jù)預(yù)處理模塊將在線監(jiān)測所得的數(shù)據(jù)進(jìn)行前期處理,并將其進(jìn)行預(yù)處理,然后對這些數(shù)據(jù)的特點(diǎn)及規(guī)律性進(jìn)行分析,從而得出結(jié)論。在實(shí)際應(yīng)用中發(fā)現(xiàn):某發(fā)電廠汽輪發(fā)電機(jī)組狀態(tài)監(jiān)測和優(yōu)化系統(tǒng)是基于人工神經(jīng)網(wǎng)絡(luò)技術(shù)、支持向量機(jī)等算法實(shí)現(xiàn)。該方法能夠有效地提高電廠運(yùn)行過程中設(shè)備維護(hù)與檢修效率以及可靠性,通過改進(jìn)后的水電機(jī)組狀態(tài)診斷模型可以為故障原因準(zhǔn)確預(yù)測提供依據(jù),通過數(shù)據(jù)挖掘算法對異常情況進(jìn)行分析,進(jìn)而得出結(jié)論并提出改善措施以降低風(fēng)險(xiǎn)發(fā)生率及損失率。本文引入的數(shù)據(jù)標(biāo)準(zhǔn)化處理方法可以解決度量單位不一致的問題,具體方法如下:
(1)計(jì)算平均的絕對偏差值的方法如式(1)所示:
其中,x1f,…,xnf是f 的n 個(gè)特征值,mf是f 的平均值,具體計(jì)算如公式(2)所示:
(2)計(jì)算標(biāo)準(zhǔn)化的特征值,具體計(jì)算如公式(3)所示:
標(biāo)準(zhǔn)化方法將特征項(xiàng)的平均值轉(zhuǎn)化到0,將標(biāo)準(zhǔn)偏差轉(zhuǎn)化為1。
(3)通過公式(4)產(chǎn)生歸一化結(jié)果。
數(shù)據(jù)挖掘算法主要是利用數(shù)據(jù)中的特征來構(gòu)建相應(yīng)模型,將一些具有不同特點(diǎn)且不相關(guān)、未知量少等問題進(jìn)行分析,從而對這些事物或現(xiàn)象做出預(yù)測和描述。
(1)K-means 算法。K-means 算法是一種面向機(jī)器學(xué)習(xí)的數(shù)據(jù)挖掘方法,它以人工智能技術(shù)為基礎(chǔ),將計(jì)算機(jī)語言作為研究對象,基于其在模式分類、聚類等理論之上建立模型。通過對原始狀態(tài)變量進(jìn)行再處理和參數(shù)估計(jì)來實(shí)現(xiàn)對問題信息的提取。K-means 算法主要是用來解決數(shù)據(jù)挖掘中存在的一些問題。它可以將處理過程進(jìn)行簡化,從而提高分析結(jié)果的效率。K-means 算法的處理流程如下:首先,隨機(jī)地選擇k 個(gè)對象,對其進(jìn)行分析,然后將k 個(gè)對象的函數(shù)作為訓(xùn)練集,并根據(jù)所選擇的方法建立一個(gè)模型,通過K-means 算法處理過程可以得到參數(shù),并將其與實(shí)際對象的函數(shù)進(jìn)行比較,從而得出結(jié)論。通過K-means 算法發(fā)現(xiàn)系統(tǒng)中存在大量的故障信息;其次,對原始數(shù)據(jù)進(jìn)行預(yù)處理和清洗后得到一組新特征點(diǎn)集(即異常指標(biāo));最后,根據(jù)所獲取到的是某一個(gè)特定屬性點(diǎn)集(或參數(shù))與另一個(gè)特定簇之間比較結(jié)果,并計(jì)算出當(dāng)前最優(yōu)閾值及該最佳閾范圍,判斷當(dāng)前最優(yōu)閾值是否滿足該特征點(diǎn)集。通常采用平方誤差準(zhǔn)則,其定義如公式(5)所示:
(2)改進(jìn)的K-means 算法。對于k 均值聚類算法來講,初始質(zhì)心的選擇會(huì)對聚類運(yùn)算結(jié)果產(chǎn)生很大的影響,如果選擇不恰當(dāng),不僅會(huì)增加算法的時(shí)間和空間復(fù)雜度,影響最終結(jié)果的質(zhì)量,而且對算法運(yùn)行時(shí)間和系統(tǒng)性能都有很大的限制。為了使得初始化選擇能夠更加合理,提高算法的運(yùn)行時(shí)間和性能,本文針對原來隨即選取k 個(gè)質(zhì)心的質(zhì)心選擇算法作了一定的優(yōu)化,設(shè)計(jì)了一個(gè)新的質(zhì)心選擇算法,使得每次的算法計(jì)算結(jié)果更優(yōu),從而實(shí)現(xiàn)了改進(jìn)后k 均值聚類法在水電廠狀態(tài)檢修系統(tǒng)中的應(yīng)用,實(shí)現(xiàn)改進(jìn)器的多類診斷,提高了系統(tǒng)性能。
本文從公開發(fā)表的期刊中搜集已經(jīng)確定故障類型的161 組變壓器特征氣體數(shù)據(jù),選擇9 組特征氣體含量和比值編碼作為標(biāo)準(zhǔn)故障樣本,具體如表1 所示。
表1 標(biāo)準(zhǔn)故障樣本數(shù)據(jù)
根據(jù)上述故障可以得到想要的故障診斷,具體的故障類型診斷結(jié)果如表2 所示。
表2 故障類型診斷結(jié)果表格
由此可以看出,采用改進(jìn)的K-means 算法,對氣體數(shù)據(jù)進(jìn)行聚類分析,可以比較有效地將各種類型的故障診斷出來,其結(jié)果可以用來對機(jī)組、變壓器等設(shè)備進(jìn)行故障分析。
電力系統(tǒng)的狀態(tài)檢修工作是一項(xiàng)比較復(fù)雜、系統(tǒng)性很強(qiáng)且綜合性較強(qiáng)的工程,它要求對電廠運(yùn)行和管理全過程進(jìn)行監(jiān)測,以發(fā)現(xiàn)影響設(shè)備安全穩(wěn)定運(yùn)行以及電網(wǎng)正常供電情況下故障隱患。本文主要探討了基于改進(jìn)數(shù)據(jù)挖掘算法的水電廠狀態(tài)檢修系統(tǒng),通過分析其應(yīng)用背景、基本原理和技術(shù),提出了一種基于改進(jìn)數(shù)據(jù)挖掘算法進(jìn)行故障診斷與預(yù)測等方面研究,可以很好地對電廠的智能檢修提供完整有效的指導(dǎo),具有很強(qiáng)的應(yīng)用價(jià)值。