黃 昊, 易靈芝, 詹 俊
1(湘潭大學(xué), 湘潭 411105)
2(湖南優(yōu)利泰克自動(dòng)化系統(tǒng)有限公司, 長沙 410205)
風(fēng)力發(fā)電是目前技術(shù)最成熟、最具規(guī)?;_發(fā)條件的新能源發(fā)電方式之一, 因其清潔、高效、可再生等優(yōu)點(diǎn), 受到世界各國的重視. 風(fēng)電機(jī)組是制約風(fēng)電發(fā)展的主要因素之一, 其良好的發(fā)電性能是保證風(fēng)力發(fā)電企業(yè)生產(chǎn)運(yùn)行管理和發(fā)展戰(zhàn)略規(guī)劃的決定因素[1].
在風(fēng)電迅猛發(fā)展的同時(shí), 風(fēng)機(jī)高額的運(yùn)行維護(hù)成本影響了業(yè)內(nèi)的經(jīng)濟(jì)效益.風(fēng)場一般地處偏遠(yuǎn)、環(huán)境惡劣, 并且機(jī)艙位于50~80 m以上的高空, 給機(jī)組的維護(hù)維修工作造成了困難, 增加了機(jī)組的運(yùn)行維護(hù)成本. 對于20年工作壽命的機(jī)組, 運(yùn)行維護(hù)成本估計(jì)占整個(gè)風(fēng)場收入的10%~15%; 對于海上風(fēng)場, 用于風(fēng)機(jī)運(yùn)行維護(hù)的成本高達(dá)風(fēng)場收入的20%~25%[2,3]. 高額的運(yùn)行維護(hù)費(fèi)用增加了業(yè)內(nèi)的運(yùn)營成本, 大大降低了風(fēng)力發(fā)電的實(shí)際經(jīng)濟(jì)效益.
目前很多企業(yè)通常使用SCADA系統(tǒng)采集多臺(tái)風(fēng)電機(jī)組各部件的狀態(tài)、屬性數(shù)據(jù), 不同機(jī)型記錄的信號范圍和類型可以相差很大, 這樣的SCADA系統(tǒng)融入到整個(gè)風(fēng)電場中為降低損失、提高效益提供幫助[4].考慮到SCADA系統(tǒng)實(shí)際采集到的數(shù)據(jù)復(fù)雜化的特點(diǎn),傳統(tǒng)數(shù)據(jù)預(yù)處理的清洗方法普遍缺乏通用性, 且當(dāng)存在多輸入?yún)?shù)多維度或者缺少歷史訓(xùn)練數(shù)據(jù)時(shí), 大部分用于數(shù)據(jù)預(yù)處理的清洗方法失效[5,6]. 定子溫度的實(shí)測曲線分布雜亂無序, 無法直接用于風(fēng)機(jī)部件的狀態(tài)分析. 在國內(nèi)外風(fēng)電領(lǐng)域中, 應(yīng)用較為廣泛的聚類、統(tǒng)計(jì)分析等數(shù)據(jù)方法, 但其清洗過程較為繁瑣且條件苛刻, 且仍需要針對風(fēng)機(jī)機(jī)組具體的分部件進(jìn)行數(shù)據(jù)處理, 會(huì)顯得力不從心, 加上風(fēng)電機(jī)組所處的環(huán)境導(dǎo)致各種因素的變化無常, SCADA系統(tǒng)所采集的相關(guān)數(shù)據(jù)并不能直接用來進(jìn)行曲線分析, 需要一種有效且通用性強(qiáng)的預(yù)處理算法對其進(jìn)行清洗.
發(fā)電機(jī)是風(fēng)力發(fā)電機(jī)組的核心部件, 負(fù)責(zé)將經(jīng)由風(fēng)速導(dǎo)致的旋轉(zhuǎn)的機(jī)械能轉(zhuǎn)化為電能, 并為電氣系統(tǒng)供電. 發(fā)電機(jī)長期運(yùn)行于環(huán)境變化不定和電磁環(huán)繞中,容易發(fā)生故障. 常見的故障有發(fā)電機(jī)振動(dòng)過大、發(fā)電機(jī)過熱、軸承過熱、轉(zhuǎn)子/定子線圈短路、定子溫度過高等. 據(jù)統(tǒng)計(jì), 在發(fā)電機(jī)所有故障中, 軸承故障率為40%, 定子的故障率為38%, 轉(zhuǎn)子的故障率為10%, 其他故障占12%[7,8].
只有經(jīng)歷過清洗預(yù)處理之后的曲線方能準(zhǔn)確地反應(yīng)發(fā)電機(jī)定子溫度的狀態(tài), 因此在風(fēng)電機(jī)組性能分析中, 對原始的SCADA數(shù)據(jù)進(jìn)行清洗預(yù)處理極其重要.固為了提高對發(fā)電機(jī)定子的溫度狀態(tài)研究的可靠性,本文提出了一種用于曲線分析的改進(jìn)最優(yōu)組方差算法.該算法只需要對發(fā)電機(jī)定子溫度和定子溫度的相關(guān)參數(shù)進(jìn)行分析, 不僅僅改變了傳統(tǒng)算法對多維度參數(shù)的依賴性, 還能夠準(zhǔn)確的發(fā)現(xiàn)定子溫度的非正常點(diǎn), 為發(fā)電機(jī)的維護(hù)提供了準(zhǔn)確的數(shù)據(jù)支持.
本文主要針對部件為發(fā)電機(jī)定子的溫度, 必然需要定子溫度的相關(guān)參數(shù)和定子溫度形成曲線進(jìn)行分析.據(jù)了解[9], 發(fā)電機(jī)定子溫度與電流、線圈繞組及銅耗有關(guān):
其中, ω為該發(fā)電機(jī)的相數(shù)(單相或三相), I為發(fā)電機(jī)電流, R為定子電阻, 發(fā)熱量Q≈P.
根據(jù)式(1)得知, 發(fā)電機(jī)電流I是SCADA系統(tǒng)能夠采集的數(shù)據(jù), 而R即繞組在本文默認(rèn)為固定值, ω為三相. 由此得知, 銅耗P銅與發(fā)電機(jī)電流密切相關(guān), 而定子溫度與銅耗保持絕對的關(guān)系, 即發(fā)電機(jī)定子溫度的狀態(tài)與發(fā)電機(jī)電流I直接相關(guān).
而作為定子溫度的主要相關(guān)因素的發(fā)電機(jī)電流,將和定子溫度形成的數(shù)據(jù)集通過預(yù)處理算法進(jìn)行數(shù)據(jù)清洗. 只需分別將定子溫度與發(fā)電機(jī)電流等相關(guān)參數(shù)通過改進(jìn)的最優(yōu)組方差算法[10]和神經(jīng)網(wǎng)絡(luò)[11–13]工具箱進(jìn)行分析, 不僅改變了傳統(tǒng)分析方法對繁雜數(shù)據(jù)的依賴性, 而且通過現(xiàn)有SCADA采集的數(shù)據(jù)能夠準(zhǔn)確識(shí)別出發(fā)電機(jī)定子非正常溫度, 為發(fā)電機(jī)定子溫度的狀態(tài)監(jiān)測提供可靠的數(shù)據(jù)支持. 實(shí)例分析表明, 使用該方法能夠?qū)Χㄗ訙囟鹊南嚓P(guān)參數(shù)進(jìn)行清洗預(yù)處理, 具有很好的通用性, 有助于實(shí)現(xiàn)風(fēng)力發(fā)電機(jī)定子溫度的狀態(tài)監(jiān)測及后期的準(zhǔn)確診斷與評估, 同時(shí)增強(qiáng)風(fēng)電機(jī)組運(yùn)行穩(wěn)定性、降低維護(hù)成本、提高發(fā)電量和經(jīng)濟(jì)效益,均有重要意義.
最優(yōu)組內(nèi)方差(Optimal Interclass Variance, OIV)算法要解決的問題就是如何快速、準(zhǔn)確地對數(shù)據(jù)集U進(jìn)行清洗, 識(shí)別出發(fā)電機(jī)定子溫度正常和非正常的數(shù)據(jù)集, 再進(jìn)一步保留正常、剔除非正常, 這實(shí)際上是個(gè)數(shù)據(jù)預(yù)處理的問題.
原最優(yōu)組方差(OIV)算法公式為:
其中,yj為j個(gè)點(diǎn)的定子溫度為第1到第γ個(gè)點(diǎn)的定子溫度平均數(shù),γ為常數(shù);為定子溫度平均滑差值,S為方差閾值.
令發(fā)電機(jī)電流區(qū)間t=0, 1, 2,…,W, 其中W是發(fā)電機(jī)電流區(qū)間總數(shù), 電流區(qū)間間隔T默認(rèn)取5A; 在某個(gè)電流區(qū)間內(nèi), 當(dāng)且僅當(dāng)滿足式(3)時(shí)認(rèn)為定子溫度正常, 則有:
式中,Un(t)是第t個(gè)發(fā)電機(jī)電流區(qū)間的正常數(shù)據(jù)集;U1(t)是第t個(gè)發(fā)電機(jī)電流區(qū)間的非正常數(shù)據(jù)集.
最后, 對每個(gè)電流區(qū)間的數(shù)據(jù)處理結(jié)果進(jìn)行歸類整理, 得到發(fā)電機(jī)定子總的正常數(shù)據(jù)集和非正常數(shù)據(jù)集:
輸出曲線反應(yīng)了定子的狀態(tài), 為形象說明OIV算法的思想和求解特點(diǎn), 下面以一臺(tái)風(fēng)電機(jī)組中發(fā)電機(jī)定子的實(shí)測溫度曲線單月份的數(shù)據(jù)集為例來進(jìn)一步說明. 發(fā)電機(jī)定子實(shí)測溫度曲線分布如圖1所示.
取電流區(qū)間間隔T=5 A, 暫時(shí)實(shí)驗(yàn)以方差閾值根據(jù)電流區(qū)間可將原始數(shù)據(jù)集劃分為37個(gè)狀態(tài)量, 有由于每個(gè)狀態(tài)量的求解過程相似, 這里僅以10號狀態(tài)量為例進(jìn)行詳細(xì)說明, 同時(shí)結(jié)合5號、20號區(qū)間繪制散點(diǎn)分布圖供輔助說明.
圖1 定子溫度曲線圖
表1 區(qū)間10處理后的部分?jǐn)?shù)據(jù)
根據(jù)式(3)計(jì)算小于閾值S的最大γ, 通過定義的公式(4)得到10號區(qū)間的閾值S為13.8504, 即計(jì)算小于13.8504的最大γ=84, 對應(yīng)S為13.885 86, 從而由此得到以(84, 13.885 86)為臨界點(diǎn), 可劃分兩個(gè)數(shù)據(jù)集.如圖2所示, 由5、10、20區(qū)間分別通過這種方法共同繪制的散點(diǎn)圖, 可以清晰地看到兩種數(shù)據(jù)集的劃分.
通過分析大量的測試數(shù)據(jù)后, 如圖3所示, 是結(jié)合全部區(qū)間進(jìn)行OIV算法的散點(diǎn)圖, 可以通過灰度值的不同直觀由S閾值劃分的兩種數(shù)據(jù)集.
根據(jù)上述的式(3)、(4), 發(fā)電機(jī)電流范圍0~183 A,以每5 A進(jìn)行區(qū)域分隔, 其中I≥180為U(36)區(qū)域, 通過定義再對正常與非正常進(jìn)行劃分.
圖2 定子溫度5、10、20號分區(qū)圖
圖3 時(shí)候定子溫度曲線圖
為了得到閾值S在這些數(shù)據(jù)中最合適的值, 結(jié)合圖3發(fā)現(xiàn)圖中散點(diǎn)的上限和下限都存在較為分散的數(shù)據(jù)點(diǎn), 方差閾值S在原來OIV算法的基礎(chǔ)上進(jìn)行改進(jìn),設(shè)n1、n2為波動(dòng)的百分比, 方差閾值S則定義為:
并對OIV算法式(3)改進(jìn)為:
通過以上推論得到主要改進(jìn)的公式:
其中,i=1或2,ni∈(–1, 1),S1與S2即為整個(gè)數(shù)據(jù)集的方差閾值上下限.yj為j個(gè)點(diǎn)的定子溫度為第1到第γ個(gè)點(diǎn)的定子溫度平均數(shù),γ為常數(shù).
根據(jù)SCADA系統(tǒng)所采集的數(shù)據(jù), 發(fā)電機(jī)電流是最能影響發(fā)電機(jī)定子溫度的參數(shù), 在未進(jìn)行數(shù)據(jù)清洗的情況下, 輸入?yún)?shù)只有發(fā)電機(jī)電流所測試的MSE結(jié)果為21.6341左右, 這時(shí)考慮到發(fā)電機(jī)外界因素環(huán)境溫度的影響, 進(jìn)行一次輸入?yún)?shù)為發(fā)電機(jī)電流和環(huán)境溫度所測試的MSE結(jié)果為12.5506左右, 相比單輸入?yún)?shù), 數(shù)據(jù)集在精度上得到了明顯的提升.
根據(jù)上文中提到的方法和方差閾值S, 首先通過式(10)、式(11)和式(12)調(diào)整整個(gè)方差閾值上限S2,同時(shí)暫時(shí)將S1定為0, 再根據(jù)為了確定最佳上下限幅值, 通過表2實(shí)驗(yàn)的結(jié)果可以看出,上下限幅值不宜過高, 按照原定的0~1(100%)為最優(yōu)上下限幅值.
表2 設(shè)定上下限幅值后方差閾值實(shí)驗(yàn)結(jié)果
為了更進(jìn)一步地降低MSE值, 開始表3的實(shí)驗(yàn).
表3 調(diào)整方差閾值S下限后的實(shí)驗(yàn)結(jié)果
由表3可見當(dāng)確定了方差閾值的下限, 整體的MSE得到了明顯的下降, 該數(shù)據(jù)集的精度和使用可靠性也提高了不少.
接下來需要對本文中的改進(jìn)OIV算法進(jìn)行測試,首先從SCADA系統(tǒng)采集的數(shù)據(jù)進(jìn)行算法數(shù)據(jù)清洗,采用神經(jīng)網(wǎng)絡(luò), 輸入?yún)?shù)為清洗之后的相關(guān)特征量和前一時(shí)段的發(fā)電機(jī)定子溫度, 輸出為清洗之后的發(fā)電機(jī)溫度參數(shù).
圖4 所得到的發(fā)電機(jī)定子溫度曲線圖
根據(jù)式(9)、(10)、(11)、(12)和表3所提供的信息, 為了建立神經(jīng)網(wǎng)絡(luò)模型, 設(shè)n1=n2=0.5, 經(jīng)過改進(jìn)OIV算法, 得到圖4所示, 提取正常數(shù)據(jù)集.
為了驗(yàn)證本文所提到的數(shù)據(jù)清洗方法OIV算法的精確度, 從風(fēng)電場SCADA系統(tǒng)中下載了2016年1月1日00時(shí)00分00秒至6月31日23時(shí)59分59秒的數(shù)據(jù)進(jìn)行實(shí)驗(yàn)驗(yàn)證, 其中包含了發(fā)電機(jī)電流、環(huán)境溫度、發(fā)電機(jī)定子溫度. 由于數(shù)據(jù)量過于龐大, 在使用前先按照IEC61400-12的標(biāo)準(zhǔn)進(jìn)行十分鐘平均化, 所得結(jié)果如表4所示, 并結(jié)合定子溫度曲線來評估發(fā)電機(jī)定子的狀態(tài).
表4 風(fēng)電場SCADA數(shù)據(jù)經(jīng)10 min平均化后的數(shù)據(jù)
將2015年5月的數(shù)據(jù)作為測試量使用原OIV算法和使用改進(jìn)OIV算法的兩種情況分別進(jìn)行的模型測試實(shí)驗(yàn)結(jié)果見圖5, 見圖6.
對比圖5和圖6可以看出, 改進(jìn)OIV清洗后得到的數(shù)據(jù)集所建立的模型在預(yù)測過程中, 可見改進(jìn)OIV算法的清洗功能的精度高且可靠.
為了確定該模型的可行性, 將此模型進(jìn)行實(shí)時(shí)預(yù)測, 實(shí)時(shí)使用的數(shù)據(jù)量為2017年4月到6月, 如圖7可以看出, 預(yù)測值和真實(shí)值整體的趨勢非常相似, 再通過如圖8的誤差值可以看出, 這實(shí)時(shí)三個(gè)月期間, 存在那么多處誤差高于2℃的時(shí)刻, 并通過SCADA系統(tǒng)實(shí)時(shí)報(bào)備的信息對應(yīng), 溫度偏高、定子異常、溫度數(shù)據(jù)讀取錯(cuò)誤等異常點(diǎn)信息基本上一一對應(yīng), 可見該方法可行.
圖5 進(jìn)行原OIV清洗直接做的測試結(jié)果
圖6 進(jìn)行改進(jìn)OIV清洗之后做的測試結(jié)果
圖7 實(shí)時(shí)2017年4月至6月進(jìn)行的預(yù)測波形圖
圖8 實(shí)時(shí)預(yù)測誤差結(jié)果圖
為解決發(fā)電機(jī)定子溫度的預(yù)測前期數(shù)據(jù)預(yù)處理復(fù)雜的問題, 利用SCADA系統(tǒng)采集相關(guān)數(shù)據(jù), 結(jié)合發(fā)電機(jī)理論中有關(guān)定子的溫度參數(shù), 提出了一種基于風(fēng)電場SCADA數(shù)據(jù)定子溫度的預(yù)處理算法, 并通過實(shí)驗(yàn)和改進(jìn)得到了一個(gè)較為理想的方法, 得到以下結(jié)論.
原有的最優(yōu)組方差(OIV)算法可以清洗非正常數(shù)據(jù)集, 提取正常數(shù)據(jù)集, 但通過實(shí)驗(yàn)表明原有的方差閾值單向區(qū)域的定義和實(shí)驗(yàn)結(jié)果發(fā)現(xiàn)該算法在精度上還不夠, 故將此進(jìn)行了雙向改進(jìn), 定義了S1和S2, 且通過實(shí)驗(yàn)證明了改進(jìn)OIV更適用于定子溫度預(yù)測數(shù)據(jù)預(yù)處理. 對于現(xiàn)有的風(fēng)電場的條件, 結(jié)合SCADA系統(tǒng)采集的數(shù)據(jù), 本文所提到的改進(jìn)最優(yōu)組內(nèi)方差算法(OIV),計(jì)算過程簡單易懂, 通用性強(qiáng). 很好的解決了對于龐大的SCADA數(shù)據(jù)去差取優(yōu)困難的問題, 加快了整個(gè)數(shù)據(jù)預(yù)處理的過程, 結(jié)合神經(jīng)網(wǎng)絡(luò)工具箱的測試功能, 為之后的預(yù)測及故障診斷工作作出一個(gè)很好的基礎(chǔ).