陸婷婷 楊小民 霍國鋒
(華電國際電力股份有限公司奉節(jié)發(fā)電廠,重慶 404600)
目前,大部分電廠煤的發(fā)熱量測定是借助氧彈筒量熱儀測量反應物與生成物的焓差計算,這種實驗測定方法具有很高的精度。但實際測定的煤樣需要經(jīng)采樣、制樣及化驗等處理流程,測定過程復雜,結(jié)果耗時較長,不能很好地滿足煤炭生產(chǎn)、利用等環(huán)節(jié)的需求。為了解決上述問題,越來越多的學者通過建立煤的發(fā)熱量模型,簡單、快速地得到發(fā)熱量數(shù)據(jù),但是精度和通用性還存在一定局限性。本文綜述了目前常用的煤的發(fā)熱量預測方法,并就目前存在的問題進行了分析。
回歸分析是一種數(shù)量統(tǒng)計方法,通過對大量數(shù)據(jù)進行分析處理,評估各個變量之間關系的強度,從而估計因變量與一個或多個自變量之間的關系,建立回歸方程。線性回歸分析方法大致步驟如下:
(1)確定變量。對變量x1,x2,x3…xp作n次檢測,得到檢測值為xi1,xi2,xi3…xip,yi,i=1,2,3 …n。
(2)建立數(shù)學模型。線性回歸的數(shù)學模型可建立為:
式中:i=1,2,3 … n;β0,β1,β2,β3…βp是相關線性回歸系數(shù);ε是均值為0、方差為σ2(σ> 0)的隨機誤差。
(3)相關分析。求線性回歸模型可以利用Excel、MATLAB 及SPSS 等軟件快速準確計算回歸系數(shù)β0,β1,β2,β3...βp的數(shù)值,建立所需的回歸方程。
陸新科[1]依據(jù)所用的煤的特點,忽略揮發(fā)分、硫分對發(fā)熱量的影響,建立了發(fā)熱量關于灰分、全水分的二元線性回歸方程。唐成亮[2]考慮了多種影響因素,建立了燃煤低位發(fā)熱量與工業(yè)分析、元素分析的多元線性回歸方程。該模型的最大偏差為2.8%,平均偏差為0.97%,較傳統(tǒng)經(jīng)驗公式預測準確度較高、誤差較小。
除了最常用的線性回歸法,還有其他建模方法:閔凡飛等[3]利用灰色系統(tǒng)理論對數(shù)據(jù)信息容忍性強等特點,僅使用煤灰分、水分兩種數(shù)據(jù)建立了GM(0, H)灰色預測模型。結(jié)果證明GM(0, H)模型對煤的發(fā)熱量預測具有很高的擬合精度。申國民[4]利用統(tǒng)計方法提出了查表計算法。這種方法省略了計算過程,只需通過灰分、全水分結(jié)果便可查到煤樣的收到基低位發(fā)熱量。
非線性回歸建模類似于線性回歸建模,兩者都是研究自變量和因變量之間的關系。但是非線性模型的建立比線性模型更復雜,因為函數(shù)是通過一系列的反復試驗的近似(迭代)創(chuàng)建的。二次回歸的步驟如下:
(1)建立二次回歸方程。設y為因變量,x1,x2…xn為自變量,a0,a1…an;a0,a12,a23…an-1,n;a11,a22…an,n為未知參數(shù),建立二次回歸方程:
(3)求出未知參數(shù)。以最小化目標函數(shù)為優(yōu)化目標,利用MATLAB 與SPSS 等軟件可以快速求出未知參數(shù)值,從而建立所需的二次回歸方程。
王江榮等[5]通過引入三角模糊數(shù)來彌補工業(yè)指標之間分類界限不明顯的缺點,提出了一種基于三角模糊數(shù)非線性回歸模型。最終模型預測的非線性擬合優(yōu)度值為0.983 8,均方誤差為0.447 3,平均相對誤差為0.020 3。
2.2.1 隨機森林算法
隨機森林算法是一種包含集成學習的機器學習方法,其中包含多棵決策樹,這些決策樹共同組合解出復雜問題,實現(xiàn)高精度的預測輸出。由于整個預測處理流程和數(shù)據(jù)處理方式比較簡單,隨機森林算法擁有訓練時間少、對數(shù)據(jù)依賴性小等優(yōu)點。隨機森林算法的算法流程可分為以下幾步(如圖1):
圖1 隨機森林算法
(1)從訓練集中隨機選擇n個數(shù)據(jù)點,即n個數(shù)據(jù)子集;
(2)構(gòu)建與所選數(shù)據(jù)點(子集)相關聯(lián)的決策樹;
(3)通過測試集對每棵決策樹預測結(jié)果進行投票,去掉票少的決策樹;
(4)重復上述步驟,直至有足夠多可用的決策樹;
(5)取平均值作為預測結(jié)果。
韓學義[6]使用隨機森林算法擬合出的模型中各個元素權重值得出了對煤發(fā)熱量影響最重要的參數(shù)為固定碳含量和灰分,并且證明了固定碳含量對發(fā)熱量的影響具有較強的非線性。為了進一步提高算法實用性,作者還利用隨機森林算法預測了煤中的碳含量,預測結(jié)果的誤差達到了2.3%以下。
2.2.2 人工神經(jīng)網(wǎng)絡
人工神經(jīng)網(wǎng)絡是一種模擬生物神經(jīng)網(wǎng)絡的建模技術,被廣泛地使用在了各種建模困難的場景中。人工神經(jīng)網(wǎng)絡在經(jīng)過訓練后能夠從代表性的數(shù)據(jù)中構(gòu)建出復雜的非線性映射結(jié)構(gòu),與回歸分析相比,人工神經(jīng)網(wǎng)絡具有更強的非線性分析和預測能力。
(1)BP 神經(jīng)網(wǎng)絡
BP神經(jīng)網(wǎng)絡是指反向傳播神經(jīng)網(wǎng)絡,由輸入層、隱含層、輸出層三層組成。其中輸入層用于接收訓練數(shù)據(jù),隱含層用于執(zhí)行計算以確定數(shù)據(jù)關系,輸出層用于得到最終輸出結(jié)果。BP 神經(jīng)網(wǎng)絡能夠不斷調(diào)整隱含層權值來逼近最小誤差,具有強大的自適應、非線性映射能力。構(gòu)建BP 神經(jīng)網(wǎng)絡的流程可分為以下幾步(如圖2):
圖2 BP 神經(jīng)網(wǎng)絡算法
① 輸入層通過預設協(xié)議接收數(shù)據(jù)x;
② 信息前向傳遞傳入隱含層處理;
③ 隱含層依據(jù)權值將數(shù)據(jù)處理后傳給輸出層;
④ 輸出層計算誤差,誤差反向傳遞修改隱含層權值;
⑤ 重復以上步驟,直至輸出誤差在允許范圍內(nèi)。
曹建波等[7]利用七個工業(yè)分析參數(shù)作為輸入,建立了發(fā)熱量的BP 神經(jīng)網(wǎng)絡預測模型,預測的相對誤差最小能夠到達0.039%。
(2)RBF 神經(jīng)網(wǎng)絡
RBF 神經(jīng)網(wǎng)絡是指徑向基神經(jīng)網(wǎng)絡,其結(jié)構(gòu)與BP 神經(jīng)網(wǎng)絡相似,但RBF 神經(jīng)網(wǎng)絡隱含層只有一層,沒有反向傳遞調(diào)整權值過程。RBF 神經(jīng)網(wǎng)絡隱含層采用輸入與中心向量的距離作為基函數(shù),擁有更好的模型泛化能力,網(wǎng)絡收斂速度更快。如圖3。
圖3 RBF 神經(jīng)網(wǎng)絡算法
于海華等[8]利用揮發(fā)分、灰分、分析水為輸入,以格林函數(shù)為激活函數(shù)建立了RBF 神經(jīng)網(wǎng)絡預測模型,最終結(jié)果證明訓練后的RBF 神經(jīng)網(wǎng)絡模型發(fā)熱量預測精度最高能夠達到98%。雷萌等[9]為進一步提高RBF 神經(jīng)網(wǎng)絡預測精度,引入了模糊聚類對輸入樣本分類,并根據(jù)分類結(jié)果分別建立RBF 神經(jīng)網(wǎng)絡模型。這種預處理手段減少了預測的誤差,相對誤差能夠控制在0.5%~2.5%之間。
2.2.3 支持向量機
支持向量機是一種用于分類、回歸的機器學習算法。與神經(jīng)網(wǎng)絡相比,支持向量機收斂速度更快,易于獲得全局最優(yōu)解。為了提升工業(yè)分析數(shù)據(jù)對煤發(fā)熱量的預測精度,譚鵬等[10]建立了基于支持向量機的煤質(zhì)發(fā)熱量預測模型。其所建立的模型可以快速、可靠地預測出煤的發(fā)熱量,平均相對誤差最低可達到2.16%。為了減少參數(shù)對訓練集的依賴,江文豪等[11]在支持向量機中加入遺傳算法進行參數(shù)尋優(yōu),用這些參數(shù)進行訓練的向量機相比常規(guī)的向量機模型擁有更高的預測精度。
從前文及表1、表2 可以總結(jié)出,良好的預測算法應該滿足以下3 個要求:
表1 預測算法總結(jié)
表2 各文獻對比總結(jié)
(1)精確。能夠在可允許誤差范圍內(nèi)準確預測出煤的發(fā)熱量。
(2)快速。預測速度快,能滿足生產(chǎn)使用要求。
(3)簡單。預測算法簡單、收斂快。
(1)預測精度不足。由于煤的發(fā)熱量與工業(yè)分析組分之間是非線性關系,使用線性模型預測的精度普遍不高,并且需要經(jīng)常預測結(jié)果中出現(xiàn)的處理異常值。非線性模型能夠較好擬合發(fā)熱量預測中的非線性性質(zhì),但容易陷入局部最優(yōu),并且為了保證預測精度,過程中還需要大量的維護。
(2)煤種間差距較大,標準不統(tǒng)一。由于煤種、礦區(qū)等的不同,煤的發(fā)熱量并不能簡單的用統(tǒng)一因變量表示。
(1)基于大數(shù)據(jù)的算法改進。無論是因變量的選取還是機器學習的模型訓練,都需要大量的數(shù)據(jù)作為參考。建立煤發(fā)熱量數(shù)據(jù)庫,使用大數(shù)據(jù)分析方法來確定預測自變量選取標準,排除對發(fā)熱量影響較小的自變量,進而統(tǒng)一預測標準,降低預測算法復雜程度。利用數(shù)據(jù)庫還可以對機器學習模型進行不斷的訓練,使預測精度不斷提高。
(2)深度學習算法?;谏疃葘W習的數(shù)據(jù)驅(qū)動算法正在逐漸興起,并且展現(xiàn)出強大的模式識別和預測能力。足夠數(shù)量的樣品測試和訓練可以使一個深度學習模型掌握不同種類煤的特點,預測出不同種類的煤發(fā)熱量。深度學習模型能自動在不同的預測模式之間切換,而不需要像常規(guī)預測建模方法考慮泛化和收斂能力,在精度和通用性上擁有獨特的優(yōu)勢。
(1)非線性的預測方法越來越多,非線性預測模型正逐漸取代傳統(tǒng)的線性模型。一方面是因為隨著生產(chǎn)要求提高,線性模型的預測精度已經(jīng)不能滿足實際需要;另一方面隨著非線性建模理論的完善,非線性模型預測的精度普遍高于線性模型。
(2)機器學習能夠很好地建立非線性模型,還擁有一定泛化能力,能夠自適應不同的樣本數(shù)據(jù)。