王 偉,王海云,黃曉芳
(1.新疆大學(xué)電氣工程學(xué)院,新疆 烏魯木齊 830046;2.新疆金風(fēng)科技股份有限公司,新疆 烏魯木齊 830026)
為實現(xiàn)我們國家制定的雙碳目標(biāo),近年來風(fēng)力發(fā)電產(chǎn)業(yè)蓬勃發(fā)展,電網(wǎng)中的認(rèn)可度也越來越高,這一切都離不開風(fēng)電技術(shù)的更新迭代[1-3]。風(fēng)電技術(shù)的進(jìn)步也在不斷提升風(fēng)電機組運行的安全性和經(jīng)濟性[4-6]。風(fēng)電機組所處的運行環(huán)境十分復(fù)雜多變,而且過去的十幾年間風(fēng)機輪轂的高度越來越高,葉片也越來越大,風(fēng)電機組的各個關(guān)鍵部位(例如葉根和偏航)更容易受到載荷的影響,這就給風(fēng)電機組的結(jié)構(gòu)安全以及風(fēng)場的運維帶來了不小的壓力[7-8]。為此需要采用優(yōu)秀的預(yù)測手段對風(fēng)電機組的載荷進(jìn)行監(jiān)測和預(yù)測,以保障風(fēng)電機組安全經(jīng)濟的運行。
近年來,隨著大數(shù)據(jù)技術(shù)和人工智能技術(shù)的發(fā)展,機器學(xué)習(xí)方法能夠從數(shù)據(jù)中“學(xué)習(xí)”總結(jié)出規(guī)律,有很強的處理非線性問題的能力[9]。因此,機器學(xué)習(xí)算法也被用于風(fēng)電機組的載荷分析和預(yù)測中。付德義等[10]基于GH Bladed的仿真數(shù)據(jù),將BP神經(jīng)網(wǎng)絡(luò)應(yīng)用于風(fēng)電機組的載荷適應(yīng)性評估,完成了在不同風(fēng)況條件下對風(fēng)電機組葉根和輪轂等關(guān)鍵部位的極限載荷以及等效疲勞載荷的預(yù)測。周士棟等[11]則是基于風(fēng)機運行的SCADA數(shù)據(jù)搭建了BP神經(jīng)網(wǎng)絡(luò)模型,實現(xiàn)了對風(fēng)機關(guān)鍵部位載荷的預(yù)測。許揚等[12]結(jié)合多因素權(quán)重法和BP神經(jīng)網(wǎng)絡(luò)有效預(yù)測并分析了各種環(huán)境參數(shù)對風(fēng)機關(guān)鍵部位平均載荷和極限載荷的影響。章培成等[13]采用多元線性回歸的算法搭建了風(fēng)機載荷預(yù)測模型,該模型在對風(fēng)場多機位點評估時有著較高的準(zhǔn)確性。上述文獻(xiàn)都對風(fēng)電機組的疲勞載荷、平均載荷以及極限載荷進(jìn)行了預(yù)測方法的研究,但是未涉及風(fēng)電機組實時載荷的預(yù)測,而為了提升風(fēng)機運行的效率,掌握風(fēng)機的實時運行狀態(tài)是最有效的途徑[14-15]。盧曉光等[16]利用數(shù)字孿生技術(shù)創(chuàng)新性地對風(fēng)電機組的載荷進(jìn)行了實時預(yù)測,雖然總體預(yù)測效果良好,但是由于一次性預(yù)測的數(shù)據(jù)點過多即預(yù)測的是超長序列,難免會出現(xiàn)局部數(shù)據(jù)段的實際值和預(yù)測值的誤差較大的問題。因此,本文采用序列預(yù)測工具對風(fēng)電機組載荷較長序列的預(yù)測。Informer模型由北京航空航天大學(xué)于2021年提出,專門設(shè)計用于長序列的預(yù)測。目前已經(jīng)有學(xué)者將Informer模型應(yīng)用于不同領(lǐng)域的工程研究中,例如董浩等[17]將Informer模型應(yīng)用于PM2.5濃度的預(yù)測;劉洪笑等[18]和賀春光等[19]使用Informer模型對用電量進(jìn)行了預(yù)測;張友等[20]則在數(shù)據(jù)不完備的情況下使用Informer模型完成了對離心鼓風(fēng)機故障趨勢的預(yù)測。
基于上述研究現(xiàn)狀,本文創(chuàng)新性地將Informer模型應(yīng)用于風(fēng)電機組葉根載荷的實時預(yù)測,并對預(yù)測結(jié)果進(jìn)行科學(xué)評估,驗證該方法的可行性。同時,由于LSTM和GRU是目前處理序列數(shù)據(jù)常見且效果不錯的的深度學(xué)習(xí)算法,本文采用兩者進(jìn)行對比實驗,以此驗證Informer模型在載荷實時預(yù)測中的更優(yōu)的預(yù)測性能。
葉素-動量理論(Blade element momentum,BEM)是當(dāng)前風(fēng)力機載荷計算最主要的方法[21],包含葉素理論和動量理論2個部分。
葉素理論是指將葉輪的葉片沿展向切割成n個沒有空氣動力相互作用的微段,稱這些微段為葉素,把作用在每個葉素上的力和力矩積分,便可得到葉輪上的力和力矩。與葉根距離為r、厚度為dr的葉素上受到的軸向推力dT和dM分別由如下公式計算得到
(1)
(2)
式中,Nb為葉輪的葉片數(shù);ρ為空氣密度;c為葉素弦長;v0為相對來流的風(fēng)速;CL和CD分別為升、阻力系數(shù);φ為入流角。
動量理論是指基于動量守恒定律,獲得作用于葉輪上的力、力矩和動量、角動量之間的關(guān)系。同樣,與葉根距離為r、厚度為dr的葉素上受到的軸向推力dT和dM分別由如下公式計算得到
(3)
dM=4πρΩv1b(1-a)r3dr
(4)
式中,v1為無窮遠(yuǎn)處來流風(fēng)速;a和b分別是軸向和切向誘導(dǎo)因子;Ω為風(fēng)輪轉(zhuǎn)速。
結(jié)合葉素理論和動量理論便可以求得作用在風(fēng)機葉輪上的力、力矩和功率。
灰色關(guān)聯(lián)度分析法的基本思想是若影響因素與目標(biāo)變量的變化趨勢一致,該影響因素與目標(biāo)變量關(guān)聯(lián)度較高;反之,則關(guān)聯(lián)度較低。將灰色關(guān)聯(lián)度分析法與深度學(xué)習(xí)模型相結(jié)合,通過該分析方法篩選出與目標(biāo)變量強相關(guān)的影響因素作為模型的輸入,從而避免模型因無效輸入太多導(dǎo)致其訓(xùn)練效率過低的問題?;疑P(guān)聯(lián)度分析法的計算公式如下
(5)
(6)
式中,ξi(k)為第i個影響因素的第k條數(shù)據(jù)與目標(biāo)變量第k條數(shù)據(jù)的關(guān)聯(lián)系數(shù);Δi(k)為第i個影響因素與目標(biāo)變量的差序列;Δ(max)和Δ(min)分別為兩級最大差和兩級最小差;ρ為分辨系數(shù),范圍為(0,1),本文取0.5;ri為第i個影響因素與目標(biāo)變量的關(guān)聯(lián)度;N為變量的數(shù)據(jù)個數(shù)。
Informer模型是基于注意力機制的深度學(xué)習(xí)模型,能夠更為準(zhǔn)確地捕捉到長序列中輸入和輸出依賴關(guān)系,因此Informer模型的出現(xiàn)為解決長序列問題提供了新的方法。Informer模型主要由編碼器(Encoder)和解碼器(Decoder)2部分組成,具體結(jié)構(gòu)如圖1所示。
圖1 Informer模型結(jié)構(gòu)示意
注意力機制的計算主要由查詢向量矩陣Query(Q∈RLQ×d)、鍵向量矩陣Key(K∈RLK×d)和值向量矩陣Value(V∈RLV×d)3個向量組成,其中LQ為查詢向量矩陣序列維度;LK為鍵向量矩陣序列維度;LV是值向量矩陣序列維度;d為輸入維度。第i個Query的注意力系數(shù)的概率形式A表為
(7)
第i個Query的稀疏性得分M為
(8)
最終得到稀疏自注意力公式為
(9)
Encoder主要用于捕獲長序列的遠(yuǎn)期依賴關(guān)系,將輸入送至多頭稀疏自注意力模塊,并且中間會通過蒸餾層進(jìn)行蒸餾操作以減少網(wǎng)絡(luò)參數(shù),突出特征,蒸餾原理可表示為
Xj+1=MaxPool{σ[Conv1d([Xj]AB)]}
(10)
式中,MaxPool為最大池化操作;σ為激活函數(shù);Conv1d表示的是序列上的一維卷積操作。
Decoder的作用是進(jìn)行前向計算并預(yù)測長序列輸出。此外,由于Informer使用的是生成式結(jié)構(gòu),能夠一次性生成全部的預(yù)測序列,極大地提高了預(yù)測解碼的效率。Decoder的輸入格式為
Xfeed_de=Concat(Xtoken,X0)∈R(Ltoken+Ly)×d
(11)
式中,Xtoken為開始字符;X0為占位字符;Concat則表示將Xtoken和X0連接合并。
同時,對于序列預(yù)測問題,數(shù)據(jù)間的順序非常重要,為了使數(shù)據(jù)輸入模型之后的順序結(jié)構(gòu)不發(fā)生改變,需要對每個輸入數(shù)據(jù)的位置信息進(jìn)行位置嵌入,嵌入原理由下式表示
(12)
(13)
式中,pos為序列次序;j∈(1,d/2),表示維度。
本文以某4.5 MW的服役直驅(qū)風(fēng)電機組為實驗對象,該風(fēng)電機組的額定風(fēng)速為10.8 m/s;葉輪直徑為155 m。通過基于BEM的風(fēng)機載荷計算軟件OpenFAST對該機組進(jìn)行仿真得到葉根的載荷數(shù)據(jù)。
使用灰色關(guān)聯(lián)度分析法篩選出與葉根載荷變化有較強相關(guān)性的影響因素,以此作為模型預(yù)測的輸入。篩選出的影響因素及其相應(yīng)的關(guān)聯(lián)度由表1給出。
表1 影響因素與葉根載荷關(guān)聯(lián)度
由表1可知,這些影響因素與葉根載荷的關(guān)聯(lián)度都高于0.5,說明對葉根載荷的影響較大,因此將表中10個影響因素作為輸入到Informer預(yù)測模型中的決策變量。
首先是標(biāo)準(zhǔn)化處理,因為不同的變量在量綱上有較大的差異,導(dǎo)致有些變量的方差很大,從而影響到模型的收斂和預(yù)測精度,所以需要對原始數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化處理,消除量綱差異。標(biāo)準(zhǔn)化的計算公式為
(14)
然后將標(biāo)準(zhǔn)化處理過的數(shù)據(jù)按照7∶1∶2的比例劃分為訓(xùn)練集(21 000組)、驗證集(3 000組)和測試集(6 000組),供預(yù)測模型使用。
本文使用深度學(xué)習(xí)框架Pytorch搭建Informer模型,模型的編碼器輸入、輸出長度和預(yù)測長度分別為800、400和300;Batch-size為32;迭代次數(shù)為6;注意力頭數(shù)為8;優(yōu)化器為Adam;激活函數(shù)為gelu;Dropout為0.05;學(xué)習(xí)率選為0.000 1。
基于訓(xùn)練集和驗證集的數(shù)據(jù),訓(xùn)練得出使用過去800個數(shù)據(jù)點預(yù)測未來300個數(shù)據(jù)點的最佳葉根載荷預(yù)測模型后,用于測試集的測試,并對輸出結(jié)果采取逆標(biāo)準(zhǔn)化操作,最后得到葉根三個載荷分量的預(yù)測值。
參照國內(nèi)外研究中常用的預(yù)測精度的衡量方法,本文選用可決系數(shù)R2、平均相對誤差MAPE、均方根誤差RSME以及平均絕對誤差MAE作為模型的評估指標(biāo)。各指標(biāo)的計算公式為
(15)
(16)
(17)
(18)
式中,yi,pre為第i條數(shù)據(jù)的模型預(yù)測值;yi,real為第i條數(shù)據(jù)的實際值;ymean為實際數(shù)據(jù)的均值。這些誤差的數(shù)值越小,模型的準(zhǔn)確度越高;R2的范圍是0~1,R2的值越大,模型預(yù)測的預(yù)測效果越好。
通過Informer模型對風(fēng)電機組葉根Mx彎矩、葉根My彎矩和Mz彎矩未來300個數(shù)據(jù)點的預(yù)測,得到圖2的預(yù)測值與實際值的對比曲線。由圖2可知,Informer模型的預(yù)測值和實際值之間有較好的一致性,說明其對于葉根的實時載荷有較好的預(yù)測精度,也證明了將此長序列預(yù)測工具應(yīng)用于風(fēng)電機組實時載荷預(yù)測的可行性。
圖2 Informer預(yù)測結(jié)果
表2給出了Informer模型和LSTM以及GRU預(yù)測結(jié)果的對比數(shù)據(jù)。由表中數(shù)據(jù)可知,Informer模型的四項評價指標(biāo)相較LSTM模型和GRU模型均有提升;其中Informer模型預(yù)測結(jié)果與實際值的擬合程度均在0.9以上,說明模型有較好的預(yù)測效果,也驗證了Informer模型在載荷實時預(yù)測更優(yōu)的性能。
表2 葉根載荷預(yù)測結(jié)果評估指標(biāo)
本文創(chuàng)新性地將長序列預(yù)測工具Informer模型應(yīng)用于風(fēng)電機組葉根實時載荷的預(yù)測,基于OpenFAST的仿真數(shù)據(jù),通過灰色關(guān)聯(lián)度分析法篩選出對風(fēng)機葉根載荷影響較大的因素作為模型的輸入,給出了模型預(yù)測值和實際值的對比結(jié)果,并通過對結(jié)果的分析證明了該方法的可行性;通過與LSTM和GRU兩種常規(guī)模型預(yù)測結(jié)果的對比,驗證了Informer模型在載荷實時預(yù)測中更優(yōu)的性能。