楊 帆,郭 岑,柯國勇,王德政,葉 昊
(1.清華大學(xué)自動化系,北京 100084;2.新疆金風(fēng)科技股份有限公司,新疆 烏魯木齊 830026;3.北京聯(lián)合大學(xué)城市軌道交通與物流學(xué)院,北京 100101)
風(fēng)能因為具有易于獲取、資源豐富、分布廣泛和運行和維護成本低等特點,近年來獲得了很大的發(fā)展。風(fēng)電場通常建設(shè)若干個風(fēng)電機組(簡稱風(fēng)機)。風(fēng)機發(fā)電時,發(fā)電機轉(zhuǎn)速隨風(fēng)速變化,將風(fēng)能轉(zhuǎn)換為機械能,再將機械能轉(zhuǎn)換為電能。由于風(fēng)能的可利用率低,再加上隨機波動性、不可控性等問題,風(fēng)機的發(fā)電效率亟待提升。因此,需要對風(fēng)機進行技術(shù)改造。為了評估技術(shù)改造的效果,需對其發(fā)電功率進行建模,進而評判機組改造對發(fā)電效率的影響,以指導(dǎo)風(fēng)機發(fā)電效率的優(yōu)化改造。
渦流發(fā)生器被普遍應(yīng)用于改善葉片的氣動性能,進而提高發(fā)電效率。然而,如何評價其性能提升量,始終是一個難題。其主要難點在于提升量一般僅有1%~5%[1],對模型的精確度要求很高。但風(fēng)機的模型過于復(fù)雜,受到環(huán)境影響的因素過多。文獻[2]和文獻[3]研究了環(huán)境參數(shù)對發(fā)電效率的影響,力求獲得準(zhǔn)確的功率-風(fēng)速非線性關(guān)系。Texas A&M大學(xué)和風(fēng)電公司SMART BLADE合作,利用數(shù)據(jù)驅(qū)動法,開發(fā)了兩套建模方法[1]。然而,現(xiàn)實中的風(fēng)速和其他物理量的測量偏差往往很大,使得一般的性能評價方法[4-5]難以奏效。特別是在本文案例所在的場景中,風(fēng)速儀測量誤差較大,且沒有冗余,無法判斷是否老化、需要更換,所以其測量讀數(shù)不可靠。因此,需要尋求不依賴于風(fēng)速測量值的方法。
本文通過從本地和鄰近機組的運行數(shù)據(jù)中適當(dāng)?shù)剡x取相關(guān)變量,以實際風(fēng)場的數(shù)據(jù)為基礎(chǔ),建模得到發(fā)電功率的估計模型;通過比較機組改造前后的功率提升量,評判發(fā)電機組的改造效果。
關(guān)于機組發(fā)電功率的建模,可采用白箱的機理建模和黑箱的數(shù)據(jù)建模。前者需要精確的機理知識。然而風(fēng)機系統(tǒng)本身相當(dāng)復(fù)雜,且不同風(fēng)機的系統(tǒng)部件、工作環(huán)境、使用年限存在一定的差異,因此不適合對單個風(fēng)機進行機理建模。出于可實現(xiàn)性與模型精度兩方面的考慮,采用黑箱方法對風(fēng)機發(fā)電功率進行建模。其輸入為已知、可測或可估計的變量,目標(biāo)輸出為風(fēng)機瞬時功率。通過累積風(fēng)機瞬時功率,可獲得風(fēng)機年發(fā)電量。機組所處地理位置的風(fēng)資源通常是無法改變的(除了上游風(fēng)機對下游風(fēng)機的影響)。因此,主要從葉片氣動性能優(yōu)化、控制策略優(yōu)化等角度入手,提升輸出功率。
黑箱建?;驹砣鐖D1所示。
圖1 黑箱建?;驹韴D
圖1中,黑箱模型可被視為目標(biāo)系統(tǒng)的代理,因此也稱作代理模型。
所謂黑箱,是指內(nèi)部構(gòu)造未知、只能通過外部觀測和試驗認(rèn)識其功能和特性的系統(tǒng)。黑箱方法是指在不打開黑箱的情況下,通過外部觀測和試驗等,找出輸入和輸出關(guān)系,從而研究黑箱的功能和特性,探索其構(gòu)造和機理。黑箱系統(tǒng)的輸入和輸出通過一定的數(shù)學(xué)模型表示。黑箱方法的目的是選擇合適的數(shù)學(xué)模型并計算最優(yōu)模型參數(shù),使所選模型能夠盡可能地模擬原始系統(tǒng)的特征。
需要根據(jù)風(fēng)電機組運行數(shù)據(jù),對各機組建立數(shù)學(xué)模型,并估算指定時間段的發(fā)電量。建模過程中,必須考慮風(fēng)電機組自身特性、輸入輸出的不確定性、外部環(huán)境的影響、不同機組間的耦合,從而在所給數(shù)據(jù)和已知風(fēng)機運行機理知識的基礎(chǔ)上,最大化機組發(fā)電量預(yù)測精度。
在建模過程中,將已有模型數(shù)據(jù)分為訓(xùn)練集和測試集,分別包含一段時間內(nèi)與風(fēng)機輸入和輸出相關(guān)的變量數(shù)據(jù)。訓(xùn)練集用于訓(xùn)練所選模型,即用已知的輸入輸出數(shù)據(jù)建立模型。測試集用于評價所建模型的性能,即通過比較測試集輸出和以測試集輸入為模型輸入情況下的模型輸出之間的誤差,評估模型的精度。
圖2給出了使用訓(xùn)練集訓(xùn)練模型與使用測試集評價模型。
圖2 訓(xùn)練模型與評價模型示意圖
訓(xùn)練集與測試集需要按照一定的準(zhǔn)則進行選取。首先,訓(xùn)練集數(shù)據(jù)要具有全體數(shù)據(jù)的完備信息,即訓(xùn)練集數(shù)據(jù)與數(shù)據(jù)全體的統(tǒng)計特征應(yīng)盡可能相同。由于風(fēng)機本身易受外部環(huán)境的影響,因此系統(tǒng)具有較為明顯的、隨時間變化而變化的特性。
為了使所建模型能夠相對準(zhǔn)確地描述任何時段數(shù)據(jù)輸入與輸出的關(guān)系,需要選擇至少幾個月時長的訓(xùn)練集數(shù)據(jù)。測試數(shù)據(jù)要覆蓋模型工作的不同狀態(tài)和環(huán)境,以充分反映模型對不同條件下輸入的響應(yīng)。對于針對不同時段數(shù)據(jù)建立時段子模型的方法,測試集數(shù)據(jù)應(yīng)與訓(xùn)練集數(shù)據(jù)來自于同一時段,否則無法正確評估模型精度。
另外,為了更好地利用已知數(shù)據(jù),可以采用K-折交叉驗證(K-fold cross-validation)的方式劃分訓(xùn)練集與測試集。K-折交叉驗證的基本思想是將已知數(shù)據(jù)分為K個組,從中選取(K-1)組作為訓(xùn)練數(shù)據(jù)、1組作為測試數(shù)據(jù)。如此重復(fù)K次,最后取K次模型誤差的平均值作為最終的模型誤差。
為了評估風(fēng)機改造后系統(tǒng)性能提升的效果,需要在風(fēng)機建模的基礎(chǔ)上,采用一定的策略實現(xiàn)改造前后風(fēng)機性能的對比。這一階段也稱為模型應(yīng)用。本文采用的策略是:使用改造數(shù)據(jù)對風(fēng)機進行建模,得到改造前的風(fēng)機模型;在改造前的風(fēng)機模型的模型精度滿足一定要求的情況下,將改造后的輸入數(shù)據(jù)輸入到模型中,得到對應(yīng)的改造前輸出的估計;比較改造后系統(tǒng)的實際輸出和改造前風(fēng)機模型產(chǎn)生的輸出估計,得到風(fēng)機改造提升量。
風(fēng)機改造提升量評估方案流程如圖3所示。
圖3 風(fēng)機改造提升量評估方案流程圖
風(fēng)機運行數(shù)據(jù)具有以下特征。
①數(shù)據(jù)量大:單一風(fēng)電機組每年產(chǎn)生數(shù)據(jù)達(dá)600~800 M,為數(shù)據(jù)的讀取和計算帶來困難。
②采樣頻率高:每分鐘8個采樣點,超出風(fēng)機動態(tài)特性的表征需求,并引入過多噪聲。
③數(shù)據(jù)有效維數(shù)低:排除掉風(fēng)機發(fā)電過程的中間變量,如轉(zhuǎn)矩、轉(zhuǎn)速等,單一機組可用于建模的僅為風(fēng)速、環(huán)境溫度等少數(shù)幾個外部變量。
④數(shù)據(jù)精度有限:由于實際測量設(shè)備以及測量環(huán)境所限,外部變量的測量精度有限。特別是風(fēng)速的精度很低,直接影響了所建模型的準(zhǔn)確性。
⑤故障數(shù)據(jù)過多:單一風(fēng)機故障數(shù)據(jù)(無效數(shù)據(jù))過多,去除此類數(shù)據(jù)后可用數(shù)據(jù)量明顯減小。若同時考慮多臺風(fēng)機,某一時刻某風(fēng)機數(shù)據(jù)故障,則去除該時刻所有的風(fēng)機數(shù)據(jù),進行故障數(shù)據(jù)清理后保留的有效數(shù)據(jù)更少。
由于本機組建模數(shù)據(jù)中,僅有風(fēng)速、風(fēng)向角、溫度等變量作為輸入,風(fēng)機有功功率作為輸出??紤]到輸入變量的測量精度以及輸入變量的維數(shù),單一機組建模的效果很差。因此,本文采用相鄰機組數(shù)據(jù)輔助當(dāng)前機組建模的方案。這里所說的相鄰機組,是指風(fēng)速輸入與目標(biāo)機組風(fēng)速輸入相關(guān)性較高的機組,并不一定是地理位置相近的機組。另一方面,地理位置上相近的機組也并不一定可以作為目標(biāo)機組的相鄰機組。這是因為距離較近的風(fēng)機機組,其所處的風(fēng)場情況也可能具有較大差異。
相鄰機組的選擇采用風(fēng)機數(shù)據(jù)相關(guān)分析的方法,每臺風(fēng)機涉及的相關(guān)機組的分布與個數(shù)均由相關(guān)性數(shù)值結(jié)果決定。需要注意的是,雖然相鄰機組是根據(jù)風(fēng)速相關(guān)性分析選出的,但考慮到風(fēng)速測量不準(zhǔn)確,測量的風(fēng)速不作為目標(biāo)機組的直接輸入,而是將相鄰機組的功率和溫度等變量作為風(fēng)速的間接測量量加入目標(biāo)機組的模型輸入中。
加入相鄰機組數(shù)據(jù)后,單一風(fēng)機建模的輸入變量擴充為:多機組的溫度、湍流強度等外部輸入;相鄰機組的轉(zhuǎn)矩等中間變量;相鄰機組的功率等。
基于數(shù)據(jù)的建模方法又稱為回歸方法[6-8],可分為基于線性模型假設(shè)的方法(線性建模方法)和基于非線性模型假設(shè)的方法(非線性建模方法)?;诰€性模型假設(shè)的方法,假定目標(biāo)模型輸入輸出之間的關(guān)系為線性關(guān)系。此類方法適用范圍較廣、計算量較小,因此可以用作風(fēng)機系統(tǒng)建模的基本方法。偏最小二乘(partial least squares,PLS)回歸[9-10]是線性建模方法中發(fā)展成熟且精度較高的方法。本文采用該方法進行建模。
PLS回歸是一種多元分析方法。該方法將原始輸入變量投影到一個正交的隱變量空間,以描述原始數(shù)據(jù)盡可能多的信息,同時去除輸入數(shù)據(jù)的相關(guān)性,最終得到維數(shù)較少但有利于預(yù)測的隱變量,即選定的主元。PLS回歸的數(shù)學(xué)模型為Y=XB+E。其中:Y為具有m個變量、n個樣本點的響應(yīng)矩陣;X為具有p個變量、n個樣本點的預(yù)測矩陣;B為回歸系數(shù)矩陣;E為噪聲校正模型,與Y具有相同的維數(shù)。在通常情況下,變量X和Y需要先標(biāo)準(zhǔn)化再用于計算。標(biāo)準(zhǔn)化方法為減去變量數(shù)據(jù)的平均值并除以標(biāo)準(zhǔn)偏差。
PLS回歸采用得分因子作為原始預(yù)測變量線性組合的依據(jù),所以用于建立預(yù)測模型的得分因子之間必須線性無關(guān)。假如有一組響應(yīng)變量Y和大量的預(yù)測變量X,其中有些變量嚴(yán)重線性相關(guān),使用提取因子的方法從這組數(shù)據(jù)中提取因子,用于計算得分因子矩陣U=XW;再求出合適的權(quán)重矩陣W,并建立線性回歸模型Y=UQ+E。其中:Q為矩陣U的回歸系數(shù)矩陣;E為誤差矩陣。一旦計算出Q,前面的方程就等價于Y=XB+E。其中:B=WQ。它可直接作為預(yù)測回歸模型。
以金紫山風(fēng)場為例,評估其中某臺風(fēng)機的效率提升情況。
金紫山風(fēng)場風(fēng)機分布如圖4所示。
圖4 風(fēng)場風(fēng)機分布圖
由于風(fēng)機運行存在不同的工作狀態(tài),需要分別分析較為獨立工況下的數(shù)據(jù),并分工況建模[8-10]。由于不同風(fēng)場的風(fēng)機系統(tǒng)類型不同,且風(fēng)場環(huán)境也不同,因此對不同風(fēng)場的風(fēng)機進行工況劃分也不同。
圖5為金紫山風(fēng)場風(fēng)機工況劃分標(biāo)準(zhǔn)示意圖。
圖5 風(fēng)場風(fēng)機工況劃分示意圖
圖5中,風(fēng)機工況分為低速段、中速段和高速段三個區(qū)間。由于低速段的風(fēng)機未有效工作,所以去掉相應(yīng)的數(shù)據(jù),只考慮后兩段。因此,以某個風(fēng)速為界,分成兩段,分別表示額定功率以下運行和額定功率運行,各自建立的模型,記作模型Ⅰ和模型Ⅱ。
使用采樣時間為10 min的數(shù)據(jù),這完全可以反映機組運行的動態(tài)規(guī)律。選定目標(biāo)機組為F15,選擇地理位置較為接近的F10、F11、F15、F60、F03進行相關(guān)性分析。分析可知,F(xiàn)10、F11、F15的相關(guān)性較強(相關(guān)系數(shù)高)。因此,為F15機組選擇F10和F11為相鄰機組。從圖4可見,這兩個機組位于目標(biāo)機組的同側(cè)上風(fēng)向。這里也測試了風(fēng)速測量之間的延遲時間[11],均在一個采樣周期內(nèi),因此忽略期間的傳播關(guān)系。
本機和鄰近機組的風(fēng)機建模輸入變量如表1所示。
表1 風(fēng)機建模輸入變量表
從表1中選擇與功率估計相關(guān)的變量作為模型輸入變量,輸出為有功功率。由于發(fā)電機轉(zhuǎn)速、電機發(fā)電量對于本機而言都是中間變量,因此不宜用作輸入。只選取來流風(fēng)向與機頭方向夾角、環(huán)境溫度、湍流強度、空氣密度等外部變量作為輸入。相鄰機組除了這些變量以外,還加入發(fā)電機轉(zhuǎn)速、電機發(fā)電量、有功功率。這些變量是風(fēng)速的間接反映。需要注意的是,本機和相鄰機組的風(fēng)速都未被用作輸入變量。
數(shù)據(jù)預(yù)處理結(jié)果如圖6所示。
圖6 數(shù)據(jù)預(yù)處理結(jié)果
按照各條數(shù)據(jù)中記錄的時間,將相關(guān)機組的數(shù)據(jù)時間對齊,即同步。如果某時刻任意機組的數(shù)據(jù)可用狀態(tài)(state)不為1,說明可能有異常狀況,則刪除該時刻的所有測量數(shù)據(jù)。假設(shè)風(fēng)速數(shù)值與有功功率存在一一對應(yīng)關(guān)系,且實測功率在理論點處的分布為正態(tài)分布,則可據(jù)此去除偏離正常工況較遠(yuǎn)的數(shù)據(jù)。對指定風(fēng)速下的功率值求平均,選取距離均值最近的前95%的點生成標(biāo)準(zhǔn)化參數(shù),用此參數(shù)標(biāo)準(zhǔn)化所有功率值,然后去除±3σ以外的數(shù)據(jù)。
采用PLS回歸建模,主元個數(shù)取10。改造前數(shù)據(jù)為2016年3月1日至11月16日的數(shù)據(jù),改造后數(shù)據(jù)為2016年12月8日至2017年3月4日的數(shù)據(jù)。使用改造前的數(shù)據(jù),每次從中隨機抽取3/4數(shù)據(jù)量的數(shù)據(jù)進行PLS回歸建模,重復(fù)20次,將最后平均得到的模型參數(shù)作為最終模型。模型測試階段,使用所有改造前數(shù)據(jù)作為輸入,計算模型輸出與實際功率之間的誤差。為方便起見,將風(fēng)機F10、F11、F15分別記作G1、G2、G3。
經(jīng)過試驗,得到發(fā)電量的測試誤差為-0.052 9%,證明模型可用。所建立模型I(風(fēng)速11.5 m/s以下)和模型II(風(fēng)速11.5 m/s以上)的主元權(quán)重如表2所示。
表2 模型I和模型II的主元權(quán)重
從模型Ⅰ的結(jié)果可見,與風(fēng)速直接相關(guān)的變量在模型中起主導(dǎo)作用,相鄰機組G1的功率作用最大。而從模型II的結(jié)果可見,本機的環(huán)境參數(shù)影響較大,其中槳距角和湍流強度影響最大。
將模型投入應(yīng)用。風(fēng)速在11 m/s以下的數(shù)據(jù)使用模型I,風(fēng)速在12 m/s以上的數(shù)據(jù)使用模型II,風(fēng)速在額定風(fēng)速附近(11 m/s至12 m/s)的數(shù)據(jù)使用模型I與模型II的輸出平均值。改造后的實際功率輸出與模型輸出的測試誤差如圖7所示。
由圖7可見,改造后的實際輸出約高于比模型輸出5%,說明技術(shù)改造是有效的。
圖7 測試誤差示意圖
模型I和模型II的主元貢獻列表區(qū)別較大,反映了兩種工況的不同規(guī)律。
主元個數(shù)參數(shù)對建模效果有一定的影響。在選擇主元個數(shù)時,建議選擇主元-誤差曲線中對應(yīng)誤差波動較小區(qū)域的主元數(shù)。本例中,主元個數(shù)可取為5。
本文采用PLS回歸方法對風(fēng)電機組的發(fā)電功率進行建模,其輸入包含了與本機相關(guān)性較高的相鄰機組的運行數(shù)據(jù)。將得到的模型應(yīng)用在改造后的機組上,并對真實輸出和模型輸出進行比較,以評估改造的有效性。該方法的最大特點是降低了對風(fēng)速數(shù)據(jù)的依賴性,只在工況劃分時使用,而不作為模型的輸入。金紫山風(fēng)場的建模結(jié)果反映了目標(biāo)風(fēng)機機組的改造提升效果明顯,其測試誤差均在0.2%之內(nèi),提升量在5%左右,這與現(xiàn)實情況相符。
該方法對數(shù)據(jù)質(zhì)量,特別是平穩(wěn)性的要求較高,要求數(shù)據(jù)中不含異常數(shù)據(jù)、沒有模式切換、沒有明顯的非線性。因此,需要對數(shù)據(jù)進行預(yù)處理,去除標(biāo)志位異常的全部數(shù)據(jù)。對于不同風(fēng)速段的數(shù)據(jù),需要分段建模。如果非線性明顯,則可考慮分段多模型或者神經(jīng)網(wǎng)絡(luò)等方法。