黃 昊,易靈芝,詹 俊
(1.湘潭大學(xué),湖南 湘潭 411105;2.湖南優(yōu)利泰克自動(dòng)化系統(tǒng)有限公司,湖南 長(zhǎng)沙 410205)
基于OIV算法的風(fēng)電機(jī)數(shù)據(jù)預(yù)處理方法探究
黃 昊1,2,易靈芝1,詹 俊2
(1.湘潭大學(xué),湖南 湘潭 411105;2.湖南優(yōu)利泰克自動(dòng)化系統(tǒng)有限公司,湖南 長(zhǎng)沙 410205)
針對(duì)風(fēng)電機(jī)組各部件性能分析過(guò)程繁瑣低效、預(yù)測(cè)精度不高以及經(jīng)濟(jì)效益不足的異常風(fēng)電機(jī)組狀態(tài)問(wèn)題,文章提出一種用于后期預(yù)測(cè)的數(shù)據(jù)預(yù)處理方法,結(jié)合基本的網(wǎng)絡(luò)工具進(jìn)行實(shí)驗(yàn),提高了風(fēng)電機(jī)組中發(fā)電機(jī)定子溫度預(yù)測(cè)的準(zhǔn)確性。
數(shù)據(jù)清洗;OIV算法;建模預(yù)測(cè)
考慮到數(shù)據(jù)采集裝置系統(tǒng)實(shí)際采集到的數(shù)據(jù)復(fù)雜化的特點(diǎn),傳統(tǒng)數(shù)據(jù)預(yù)處理的清洗方法普遍缺乏通用性,大部分用于數(shù)據(jù)預(yù)處理的清洗方法效果不會(huì)很好[1-4]。例如:在風(fēng)力發(fā)電企業(yè)中存在很多粗略報(bào)警,單月多次上風(fēng)機(jī)進(jìn)行盲目維護(hù),此類問(wèn)題在短期內(nèi)不會(huì)導(dǎo)致機(jī)組停機(jī)或者部件損壞,這種方式必然會(huì)影響機(jī)組組件的正常運(yùn)轉(zhuǎn),而傳統(tǒng)方法幾乎無(wú)法對(duì)其加以準(zhǔn)確的檢測(cè)識(shí)別。目前,在國(guó)內(nèi)外風(fēng)電領(lǐng)域的大小企業(yè)中,普遍存在有數(shù)據(jù)但無(wú)法將數(shù)據(jù)處理得很好的情況,導(dǎo)致后期用作預(yù)測(cè)及診斷的誤差甚大。針對(duì)這類事例,為了提高對(duì)風(fēng)電機(jī)組分部件的針對(duì)性可靠分析,建立精度較高的模型,需一種高效且通用性強(qiáng)的數(shù)據(jù)預(yù)處理清洗方法。
已知定子溫度曲線樣本集合U,設(shè)V={Vn,V1}為目標(biāo)集合,其中Vn表示該集合中定子溫度正常的數(shù)據(jù)集,V1表示定子溫度偏高或偏低的數(shù)據(jù)集(定義為異常),且V滿足Vn∩V1=?,Vn∪V1=U。最優(yōu)組內(nèi)方差(Optimal Interclass Variance,OIV)算法要解決的問(wèn)題就是如何快速、準(zhǔn)確地對(duì)數(shù)據(jù)集U進(jìn)行清洗,識(shí)別出放電機(jī)定子溫度正常和異常的數(shù)據(jù)集,再進(jìn)一步保留正常、剔除異常為空,這實(shí)際上就是個(gè)數(shù)據(jù)預(yù)處理方法。
定義1:已知樣本集合U={(x1,y1),(x2,y2),…,(xn,yn)},且滿足yi>yi-1,i∈(2,n),x表示輸入?yún)?shù),y表示定子溫度,n為數(shù)據(jù)點(diǎn)總數(shù)。有方差φ公式:
OIV算法公式為:
為形象說(shuō)明OIV算法的思想和求解特點(diǎn),下面以一臺(tái)風(fēng)電機(jī)組中發(fā)電機(jī)定子的實(shí)測(cè)溫度曲線數(shù)據(jù)集U為例來(lái)進(jìn)一步說(shuō)明。
已知U(10)={(x1,y1),(x2,y2),…,(x167,y167)}中共有167個(gè)定子溫度曲線散點(diǎn)。首先,按照定子溫度由小到大升序排列,使其滿足yi>yi-1,i∈(2,167)的必要條件;然后,依次計(jì)算前i個(gè)坐標(biāo)點(diǎn)中定子溫度的方差值,將計(jì)算結(jié)果形象地稱作滑差值,所得到的數(shù)據(jù)集稱為滑差集;最后,通過(guò)與初始閾值S比較分析,從而實(shí)現(xiàn)數(shù)據(jù)清洗的功能。另外,為了縮小數(shù)據(jù)值范圍,本文中計(jì)算均用標(biāo)準(zhǔn)方差代替方差值。
根據(jù)式(2)計(jì)算小于閾值S的最大γ,通過(guò)S定義的公式得到10號(hào)區(qū)間的閾值S為13.850 4,即計(jì)算小于13.850 4的最大γ=84,對(duì)應(yīng)S為13.885 86,從而由此得到以(84,13.885 86)為臨界點(diǎn),可劃分兩個(gè)數(shù)據(jù)集。如圖1所示,由5號(hào)、10號(hào)、20號(hào)區(qū)間分別通過(guò)這種方法共同繪制的散點(diǎn)圖,可以清晰地看到兩種數(shù)據(jù)集的劃分。
為了驗(yàn)證本文所提到的數(shù)據(jù)清洗方法OIV算法的精確度,從風(fēng)電場(chǎng)數(shù)據(jù)采集裝置系統(tǒng)中下載了2016年5月1日00:00:00至5月31日23:59:59的數(shù)據(jù)進(jìn)行實(shí)驗(yàn)驗(yàn)證,其中包含了發(fā)電機(jī)電流、環(huán)境溫度、發(fā)電機(jī)定子溫度1、發(fā)電機(jī)定子溫度2、發(fā)電機(jī)定子溫度3、發(fā)電機(jī)定子溫度4、發(fā)電機(jī)定子溫度5、發(fā)電機(jī)定子溫度6。
由于數(shù)據(jù)量過(guò)于龐大,在使用前先進(jìn)行了每10分鐘平均化。其中,數(shù)據(jù)中具有6個(gè)發(fā)電機(jī)的定子溫度,6個(gè)發(fā)電機(jī)的定子溫度在無(wú)故障的情況下兩兩關(guān)系保持一致,因此,本文后面將只對(duì)發(fā)電機(jī)定子溫度1與發(fā)電機(jī)電流和環(huán)境溫度進(jìn)行討論與實(shí)驗(yàn)。
根據(jù)數(shù)據(jù)采集裝置系統(tǒng)所采集的數(shù)據(jù),發(fā)電機(jī)電流是最能影響發(fā)電機(jī)定子溫度的參數(shù),在未進(jìn)行數(shù)據(jù)清洗的情況下,輸入?yún)?shù)只有發(fā)電機(jī)電流所測(cè)試的均方誤差(Mean Square Error,MSE)結(jié)果為21.634 1,這時(shí)考慮到發(fā)電機(jī)外界因素環(huán)境溫度的影響,進(jìn)行一次輸入?yún)?shù)為發(fā)電機(jī)電流和環(huán)境溫度所測(cè)試的MSE結(jié)果為12.550 6,相比單輸入?yún)?shù),數(shù)據(jù)集在精度上得到了明顯的提升。
實(shí)驗(yàn)結(jié)果如表1所示,可以看出,上下限幅值不宜過(guò)高,按照原定的100%為最優(yōu)上下限幅值。
由表1得知方差閾值的最佳上限值,經(jīng)過(guò)數(shù)據(jù)預(yù)處理的清洗工作如圖2所示。
圖2 S<δ時(shí)候數(shù)據(jù)集的劃分
在經(jīng)過(guò)OIV算法之后的數(shù)據(jù)集中融入發(fā)電機(jī)定子溫度1的每個(gè)數(shù)列對(duì)應(yīng)前一秒時(shí)間的溫度數(shù)值,通過(guò)矩陣實(shí)驗(yàn)室(Matrix Laboratory,MATLAB)的反向傳播(Back Propagation,BP)工具箱,進(jìn)行完整的發(fā)電機(jī)定子模型建立。并且通過(guò)實(shí)驗(yàn)MSE結(jié)果和表1可以看出,該方法下得到的數(shù)據(jù)集所建立的模型預(yù)測(cè)精度高且過(guò)程可行。
為突出該方法的數(shù)據(jù)處理功能,利用數(shù)據(jù)采集裝置系統(tǒng)采集相關(guān)數(shù)據(jù),結(jié)合發(fā)電機(jī)相關(guān)理論,本文提出了一種用于后期預(yù)測(cè)的數(shù)據(jù)預(yù)處理方法,并通過(guò)實(shí)驗(yàn)得到了證明。
總之,對(duì)于現(xiàn)有的風(fēng)電場(chǎng)的條件,結(jié)合數(shù)據(jù)采集裝置系統(tǒng)采集的數(shù)據(jù),本文所提到的OIV算法,計(jì)算過(guò)程簡(jiǎn)單易懂,通用性強(qiáng)。很好地解決了對(duì)于龐大的數(shù)據(jù)采集裝置數(shù)據(jù)去差取優(yōu)困難的問(wèn)題,加快了整個(gè)數(shù)據(jù)預(yù)處理的過(guò)程,結(jié)合BP工具箱的功能,先建立模型,為之后的預(yù)測(cè)工作提供了一個(gè)很好的思路。
表1 方差閾值S上下限幅值MSE實(shí)驗(yàn)結(jié)果
[1]FENG Y,QIU Y,CRABTREE C J,et al.Monitoring wind tuibine gearboses[J].Wind Energy,2013(5):728-740.
[2]GRAY C S,WATSON S J.Physics of Failure approach to wind turbine condition based maintenance[J].Wind Energy,2010(5):395-405.
[3]蘇勛文,米增強(qiáng),陳盈今,等.基于運(yùn)行數(shù)據(jù)的風(fēng)電機(jī)組建模方法[J].電力系統(tǒng)保護(hù)與控制,2010(9):50-54.
[4]ZHENG H,KUSIAK A.Prediction of [J].Journal of Solar Energy Engineering,2009(3):376-385.
Research on preprocessing method of wind turbine based on OIV algorithm
Huang Hao1,2, Yi Lingzhi1, Zhan Jun2
(1.Xiangtan University, Xiangtan 411105, China; 2.Hunan Youlitaike Automation System Co.,Ltd., Changsha 410205, China)
Aiming at the problem that the performance analysis process of wind turbine unit is cumbersome and inefficient, the prediction accuracy is not high and the economic efficiency is not enough, this paper puts forward the data preprocessing method for post-prediction combining with the basic network tool, which improves the accuracy of generator stator temperature prediction in wind turbine.
data cleaning; OIV algorithm; modeling prediction
黃昊(1991— ),男,江蘇宜興人,碩士研究生;研究方向:新能源技術(shù)與系統(tǒng)。