佟敏,史昌明,馬善為,崔亞茹,李凱
(1. 國網(wǎng)內蒙古東部電力有限公司電力科學研究院,呼和浩特市,010020;2. 華北電力大學新能源發(fā)電國家工程研究中心,北京市,102206)
二氧化碳排放引起環(huán)境污染、溫室效應等問題日益嚴重,嚴格限制二氧化碳等溫室氣體排放受到世界各國的普遍重視[1]?;茉窗l(fā)電是二氧化碳排放的重要來源。與化石能源相比,生物質能是唯一具有負碳屬性的可再生能源。以生物質發(fā)電替代燃煤發(fā)電被視為一種行之有效的碳減排方法,受到學者們的普遍推崇[2-3]。據(jù)統(tǒng)計,我國生物質發(fā)電的裝機容量處于持續(xù)增長階段[4],截至2021年,生物質發(fā)電裝機容量達 3 319 萬千瓦,但遺憾的是,目前生物質的利用率仍不到其總可利用量的13%[5]。
生物質發(fā)電作為現(xiàn)有應用最廣、規(guī)模最大的生物質能利用方式,在清潔電能替代方面具有極大潛力。與風能[6]、太陽能[7-8]等其它可再生能源發(fā)電相比,生物質發(fā)電受氣候影響小,發(fā)電量穩(wěn)定,而且可以參與電力調度、電網(wǎng)調荷,維持電網(wǎng)的穩(wěn)定運行。然而,實現(xiàn)這一目標的前提是準確預測生物質發(fā)電量。相比燃煤發(fā)電[9-10],生物質發(fā)電發(fā)展較晚,目前生物質發(fā)電研究更多地關注于發(fā)電模式和發(fā)電機組優(yōu)化,鮮有研究注重生物質發(fā)電量的預測。
現(xiàn)階段,關于發(fā)電量預測的研究主要集中于傳統(tǒng)化石能源發(fā)電或者風能和太陽能等不穩(wěn)定可再生能源發(fā)電,學者們開發(fā)了眾多的發(fā)電量預測方法,包括基于能量守恒的“以熱定電”發(fā)電量計算[11]、BP神經(jīng)網(wǎng)絡[12-13]、支持向量機(SVM)[8]、長短期記憶人工神經(jīng)網(wǎng)絡(LSTM)[14]、Elman神經(jīng)網(wǎng)絡[9]、主成分分析(PCA)優(yōu)化神經(jīng)網(wǎng)絡[15]等。其中,神經(jīng)網(wǎng)絡預測模型作為目前研究最廣、發(fā)展最為迅速、智能化程度最高的模型算法,在發(fā)電量預測的準確性、精度、穩(wěn)定性等方面都表現(xiàn)出較大優(yōu)勢。
相比燃煤等化石能源發(fā)電,生物質發(fā)電發(fā)展仍不成熟,生物質發(fā)電的關鍵影響因素尚不清晰,包括物料參數(shù)、鍋爐參數(shù)、汽機參數(shù)、煙氣參數(shù)等眾多參數(shù)均能影響發(fā)電過程?;谏窠?jīng)網(wǎng)絡的生物質發(fā)電模型缺乏理論指導,如果參數(shù)選擇不當,神經(jīng)網(wǎng)絡容易學習干擾信息,不僅會降低神經(jīng)網(wǎng)絡預測的準確性,而且會增加神經(jīng)網(wǎng)絡計算量。值得慶幸的是,在其它應用領域,眾多學者們提出了大量的參數(shù)優(yōu)化方法,包括Pearson相關分析[16]、Spearman相關分析[17]、平均影響值(MIV)分析[18]、互信息(MI)分析[19]、灰色關聯(lián)度分析[20]等。其中,Pearson和Spearman是目前最為普遍的線性相關性分析方法,而互信息分析對于參數(shù)之間的非線性相關性具有較好的鑒別效果,MIV則可直接反應參數(shù)變化對神經(jīng)網(wǎng)絡預測結果的影響程度?;诖?,本文提出采用了Pearson相關分析、Spearman相關分析、平均影響值(MIV)分析和互信息分析對生物質發(fā)電量關鍵影響參數(shù)進行優(yōu)選,以期建立參數(shù)優(yōu)化的BP神經(jīng)網(wǎng)絡模型,從而實現(xiàn)生物質發(fā)電量的準確預測。
BP神經(jīng)網(wǎng)絡作為目前應用最廣泛的神經(jīng)網(wǎng)絡模型,是一種按照誤差反向傳播算法訓練的多層前饋神經(jīng)網(wǎng)絡。通常而言,BP神經(jīng)網(wǎng)絡至少包括輸入層、隱含層和輸出層三種網(wǎng)絡拓撲結構。隱含層也可設置為多層,每層神經(jīng)網(wǎng)絡設有數(shù)量不等的神經(jīng)元,理論上只要隱含層設置足夠多的神經(jīng)元數(shù),即可建立任意非線性映射模型。一般而言,神經(jīng)網(wǎng)絡輸出層設置為目標變量,輸入層設置為目標變量的影響因素,二者的神經(jīng)元節(jié)點數(shù)由訓練樣本決定,隱含層節(jié)點數(shù)沒有通用的設置方法,可以采用如下經(jīng)驗公式確定。
(1)
式中:l——隱含層節(jié)點數(shù);
m——輸出層節(jié)點數(shù);
n——輸入層節(jié)點數(shù);
v——常數(shù),一般取1≤v≤10。
本研究以某生物質直燃發(fā)電廠為研究對象,對電廠實際運行過程中的發(fā)電量進行建模預測。通常,影響生物質直燃發(fā)電量的因素主要包括燃料參數(shù)、鍋爐參數(shù)、汽輪機參數(shù)、環(huán)境參數(shù)等。因此,本文從該電廠收集了發(fā)電量以及相關影響因素參數(shù),包括變壓器損耗X1(kW·h)、電廠用電量X2(kW·h)、秸稈消耗量X3(t)、鍋爐蒸汽產(chǎn)量X4(t)、發(fā)電補水量X5(t)、秸稈熱值X6(kJ/kg)、收到基水分X7(%)、收到基灰分X8(%)、鍋爐主汽壓力X9(MPa)、鍋爐主汽溫度X10(℃)、送風機入口溫度X11(℃)、排煙溫度X12(℃)、飛灰含碳量X13(%)、爐渣含碳量X14(%)、汽輪機主汽壓力X15(MPa)、汽輪機主汽溫度X16(℃)、給水溫度X17(℃)、排汽溫度X18(℃)、凝結水溫度X19(℃)、真空度X20(kPa)、循環(huán)水入口溫度X21(℃)、循環(huán)水出水溫度X22(℃)、當?shù)卮髿鈮篨23(kPa)共計23個參數(shù)。
相關系數(shù)是目前最常用的判斷變量之間相關程度的統(tǒng)計指標,根據(jù)研究對象的不同,相關系數(shù)具有多種定義方式,最常用的相關系數(shù)主要有Pearson相關系數(shù)和Spearman相關系數(shù)。
Pearson相關系數(shù)又稱線性相關系數(shù),一般用于衡量參數(shù)之間的線性相關程度,其定義式如下
(2)
式中:μX——參數(shù)X的平均值;
μY——參數(shù)Y的平均值。
一般而言,Pearson相關系數(shù)的絕對值越接近1,表示參數(shù)之間的線性相關程度越高;絕對值越趨向于0,表示參數(shù)之間的相關程度越差。
Spearman相對系數(shù)又稱秩相關系數(shù),其不關注參數(shù)之間具體值大小,通過對參數(shù)值進行排序,進而統(tǒng)計數(shù)據(jù)排序之間的相關程度,定義式如式(3)所示。
(3)
式中:di——參數(shù)之間的排序差值。
與Pearson相關系數(shù)類似,Spearman相關系數(shù)的值域同樣在-1和1之間,其絕對值的大小表示參數(shù)的相關程度。不同的是,Spearman相關系數(shù)不考慮參數(shù)的真實值的大小,也能在一定程度表示參數(shù)之間的非線性相關性。
互信息(MI)是信息論中提出的信息度量方法,它可以看成一個隨機變量包含另一個隨機變量的信息大小。當變量之間具有某種關聯(lián)關系,變量之間的隨機性越小,互信息就越大?;バ畔⒍x式如式(4)所示。
(4)
式中:p(x,y)——參數(shù)X、Y的聯(lián)合密度分布函數(shù);
p(x)、p(y)——X、Y的邊緣密度分布函數(shù)。
一般而言,互信息滿足對稱性和正定性,即I(X,Y)=I(Y,X),I(X,Y)≥0;當且僅當X、Y獨立,I(X,Y)=0。
平均影響值(MIV)被認為評價參數(shù)的最佳指標之一,其核心思想是利用神經(jīng)網(wǎng)絡模型測試參數(shù)變動對目標參數(shù)的影響。具體計算過程是:首先利用原始數(shù)據(jù)訓練獲得一個神經(jīng)網(wǎng)絡模型,然后利用所獲得的神經(jīng)網(wǎng)絡依次對待評價變量變動±10%時,計算目標參數(shù)的差值,最后取平均值,即為MIV值。
本文從國內某生物質電廠采集了35組不同時間段的生物質發(fā)電量及其影響因素的樣本數(shù)據(jù),部分數(shù)據(jù)如表1所示。
表1 電廠實際運行數(shù)據(jù)Tab. 1 Actual operation data of power plants
對原始數(shù)據(jù)進行直接分析,可以發(fā)現(xiàn)不同時間段生物質燃料特性、燃燒參數(shù)、鍋爐參數(shù)、汽機參數(shù)等均存在一定的波動性且不同參數(shù)的波動情況差異較大,相應的生物質直燃發(fā)電量也存在一定波動性,很難直接看出參數(shù)之間的關聯(lián)性。基于此,首先采用相關分析、互信息分析和MIV分析對發(fā)電量與其影響因素的關聯(lián)性進行分析。需要指出的是,進行MIV分析時,需要先建立神經(jīng)網(wǎng)絡模型,再通過所建立的神經(jīng)網(wǎng)絡模型對影響因素一一測試??紤]到現(xiàn)階段缺乏生物質發(fā)電量的關鍵影響因素的研究指導,因此本研究將全部采集參數(shù)均用于神經(jīng)網(wǎng)絡建模研究,分析結果如表2所示。
表2 發(fā)電量與影響參數(shù)的關聯(lián)分析Tab. 2 Correlation analysis between power generation and influencing parameters
從表1、表2可以看出不同優(yōu)化方法所得的結果差異較大,以相關性大于0.5為發(fā)電量關鍵影響因素判定標準。Pearson相關分析所得關鍵參數(shù)為鍋爐蒸汽產(chǎn)量、發(fā)電補水量、鍋爐主汽壓力、汽輪機主汽壓力;與Pearson相關分析相比,Spearman相關分析則僅僅多了變壓器損耗一個關鍵參數(shù),這可能是因為這兩種相關系數(shù)的原理基本相同導致的分析結果較為相近;MI分析認為秸稈消耗量、鍋爐蒸汽產(chǎn)量和汽輪機排氣溫度為影響發(fā)電量的關鍵因素;MIV分析則獲得了8個關鍵影響因素,分別為電廠用電量、鍋爐蒸汽產(chǎn)量、鍋爐主汽壓力、鍋爐主汽溫度、汽輪機主汽壓力、汽輪機主汽溫度、真空度和當?shù)卮髿鈮骸?/p>
隨機選取25組樣本作為訓練樣本,分別利用上述優(yōu)化參數(shù)建立并訓練神經(jīng)網(wǎng)絡模型,同時利用未優(yōu)化樣本建立神經(jīng)網(wǎng)絡模型作為對比,利用所建立的神經(jīng)網(wǎng)絡模型對剩余10組樣本進行分析測試,結果如圖1所示。從圖1中可以明顯看出,未優(yōu)化神經(jīng)網(wǎng)絡的預測誤差明顯大于優(yōu)化樣本建立的神經(jīng)網(wǎng)絡,不同優(yōu)化方法的預測效果也相同,整體而言MI優(yōu)化方法獲得誤差最小。對未優(yōu)化神經(jīng)網(wǎng)絡、Pearson優(yōu)化神經(jīng)網(wǎng)絡、Spearman優(yōu)化神經(jīng)網(wǎng)絡、MI優(yōu)化神經(jīng)網(wǎng)絡和MIV優(yōu)化神經(jīng)網(wǎng)絡預測的平均相對誤差進行計算,如表3所示,可以看出五種方法預測的平均相對誤差分別為4.59%、2.07%、1.72%、0.66%和3.87%,這進一步證實了MI優(yōu)化效果最佳。
圖1 不同方法建立神經(jīng)網(wǎng)絡模型的發(fā)電量預測測試
表3 不同方法建立神經(jīng)網(wǎng)絡預測發(fā)電量的相對誤差Tab. 3 Relative error of power generation by neural networks with different methods %
從樣本優(yōu)化分析上看,Pearson和Spearman相關分析主要認為鍋爐蒸汽產(chǎn)量、鍋爐主汽壓力、汽輪機主汽壓力對發(fā)電量影響較大,即發(fā)電量主要取決于鍋爐參數(shù)和汽輪機參數(shù);MI分析則認為秸稈消耗量、鍋爐蒸汽產(chǎn)量和汽輪機排氣溫度對發(fā)電量影響最大,即MI充分考慮到了原料因素、鍋爐因素和汽輪機因素對發(fā)電量的影響,這也和實際情況較為相符,因此MI獲得優(yōu)化效果最佳。相比而言,MIV被認為是參數(shù)評價的最佳指標之一,但其優(yōu)化效果最差,這是因為本研究中MIV計算采用的神經(jīng)網(wǎng)絡選擇了全部參數(shù)作為輸入變量,而實際上這些參數(shù)存在一定的干擾因素,使得神經(jīng)網(wǎng)絡建模效果較差。這也證實神經(jīng)網(wǎng)絡過多學習干擾信息,會降低其預測準確度。
基于MI樣本優(yōu)化結果,重新構建并優(yōu)化訓練神經(jīng)網(wǎng)絡,探究隱含層節(jié)點數(shù)對預測誤差的影響。隨機選取25組樣本作為訓練樣本,其余10組樣本作為測試樣本,結果如圖2所示。
圖2 優(yōu)化樣本的BP神經(jīng)網(wǎng)絡預測
從圖2可以看出,對神經(jīng)網(wǎng)絡拓撲結構,即隱含層節(jié)點數(shù)進行優(yōu)化設置,對神經(jīng)網(wǎng)絡平均預測誤差在5%以內波動變化,當隱含層節(jié)點數(shù)為9時,神經(jīng)網(wǎng)絡模型預測誤差可以進一步降低至為0.50%。
基于上述神經(jīng)網(wǎng)絡,進一步對神經(jīng)網(wǎng)絡預測效果進行測試,分別探究秸稈消耗量、蒸汽產(chǎn)量和排氣溫度對發(fā)電量的影響特性。測試方法如下:探究秸稈消耗量對發(fā)電量影響時,控制蒸汽產(chǎn)量和排氣溫度為定值,秸稈消耗量在實際運行的最小值與最大值之間變化,對發(fā)電量進行預測;其它兩個參數(shù)也同樣采用相同的測試方法,測試結果如圖3~圖5所示??梢钥闯?,秸稈消耗量、蒸汽產(chǎn)量與發(fā)電量基本呈非線性正相關關系,排氣溫度與發(fā)電量呈非線性負相關關系,這與電廠實際運行結果基本一致。
圖3 秸稈消耗量對發(fā)電量影響的預測曲線
對發(fā)電量預測值進行曲線擬合,發(fā)現(xiàn)秸稈消耗量和蒸汽產(chǎn)量與發(fā)電量的關系符合BidoseResp函數(shù)模型,排氣溫度與發(fā)電量的關系符合指數(shù)下降模型,三者的擬合度均在0.95以上。對生物質直燃發(fā)電過程分析發(fā)現(xiàn),秸稈消耗量決定了系統(tǒng)的總輸入能量,蒸汽產(chǎn)量反映了系統(tǒng)的有效吸收能量,這兩個參數(shù)間接反映了生物質的燃燒效率和鍋爐效率;而排氣溫度表征了乏汽能量損失,一定可以表征蒸汽輪機的發(fā)電效率。因此,這三個因素共同決定了最終的發(fā)電效率。
圖4 蒸汽產(chǎn)量對發(fā)電量影響的預測曲線
圖5 排氣溫度對發(fā)電量影響的預測曲線
本文提出了一種基于互信息參數(shù)優(yōu)化BP神經(jīng)網(wǎng)絡的生物質發(fā)電量預測方法。生物質直燃發(fā)電量影響因素眾多且關鍵影響因素尚不清晰,通過相關系數(shù)分析、MI分析和MIV分析對影響因素進行優(yōu)選分析發(fā)現(xiàn),雖然不同方法獲得的特征關鍵參數(shù)均不相同,但基于優(yōu)化樣本建立的神經(jīng)網(wǎng)絡模型預測誤差均有所降低,其中MI分析優(yōu)化效果最佳,可使神經(jīng)網(wǎng)絡預測相對誤差從4.59%降至0.66%;通過進一步優(yōu)化神經(jīng)網(wǎng)絡參數(shù),預測相對誤差可降低至0.50%?;趦?yōu)化神經(jīng)網(wǎng)絡模型分析了所篩選關鍵參數(shù)對發(fā)電量的影響規(guī)律,結果表明,秸稈消耗量和蒸汽產(chǎn)量與發(fā)電量呈非線性正相關關系,排氣溫度與發(fā)電量呈非線性負相關關系,這與實際發(fā)電結果一致。