白英君,張悅,田慶,羅代強
(1.華北電力大學控制與計算機工程學院,河北 保定 071000;2.華北電力大學河北省發(fā)電過程仿真與優(yōu)化控制工程技術研究中心,河北 保定 071000;3.黔西中水發(fā)電有限公司,貴州 畢節(jié) 551700)
根據(jù)機理模型與數(shù)據(jù)驅動模型的排列組合的順序不同,混合模型基本形成了串聯(lián)和并聯(lián)兩大結構,在并聯(lián)型結構中,兩種模型是可以互換順序的,但是,串聯(lián)型結構中則不然[1-2]。并聯(lián)型結構是以機理模型為混合結構的核心,用于反映過程內部的動態(tài)行為,被控對象的復雜特性導致模型精度受到限制。數(shù)據(jù)驅動子模型預測機理模型與實際數(shù)據(jù)之間的殘差[3]。該結構就是將兩個子模型進行疊加,以提高混合模型整體的精度。Henricus J.L.van Ca[4]提出了并聯(lián)型混合建模法,對混合模型與數(shù)據(jù)驅動模型從精度、外推能力等方面進行對比,說明了混合模型的優(yōu)勢。李景軒[2]運用機理與反向傳播算法(Back Propagation,BP)神經網(wǎng)絡并聯(lián)混合建模方法建立了燃氣機模型。姚源朝[5]采用機理與廣義回歸神經網(wǎng)絡(General Regression Neural Network,GRNN)并聯(lián)型混合模型建立了氣流床氣化爐模型。陳鴻偉[6]提出了一種結合機理建模和支持向量機的并聯(lián)型混合模型用于蒸汽管道的參數(shù)計算方法。徐端[7]提出了多元線性回歸和機理模型并聯(lián)混合的煉鋼連鑄能耗模型?,F(xiàn)在研究較多的以機理模型為主的串聯(lián)結構,這種混合模型適用于底層的詳細機制不確定,但是有海量的運行數(shù)據(jù)來推斷出未知的參數(shù)。大數(shù)據(jù)集含有豐富的過程狀態(tài)信息,雖然沒有直接的物理解釋,但是,可以利用數(shù)據(jù)驅動模型進行參數(shù)尋優(yōu),改善機理模型的預測精度。王廣軍[8]采用神經網(wǎng)絡對難以確定的參數(shù)進行辨識,然后用于電廠鍋爐的機理模型,實現(xiàn)了對鍋爐系統(tǒng)的串聯(lián)混合建模。羅雷濤等[9]以工業(yè)催化重整裝置為研究對象,對脫氯前氫氣純度建立了最小二乘支持向量機與機理串聯(lián)型混合模型。華豐等[10]采用人工神經網(wǎng)絡(Artificial Neural Network,ANN)與機理模型串聯(lián)型混合模型對工業(yè)乙烯裂解爐進行了建模。
混合模型只要對數(shù)據(jù)驅動部分進行足夠的訓練都能夠有很好的模型精度。李景軒[3]等對各種結構對比得出,不同結構的混合模型精度相差不大,但都優(yōu)于單一模型。因此,對于混合模型而言,單純地從精度角度去評判其合理性有失公允,本文以數(shù)據(jù)驅動子模型權值搜索和收斂速度的角度為切入點,構建了一種新的結構,該結構反饋歷史信息參與模型訓練,與其他混合模型的對比,權值收斂速度優(yōu)勢更加明顯。
目前研究最多的并聯(lián)混合結構是圖1(a)中的結構A,圖1(b)中模型是結構A 的最常見的表現(xiàn)形式。應用最為廣泛的串聯(lián)結構是圖1(c)中的結構B。圖1(d)中的結構C在某些情況下等同于結構A[1]。
圖1 串、并聯(lián)型混合結構
數(shù)據(jù)驅動模型是由數(shù)據(jù)確定的,這種特點賦予了混合模型靈活性,可以從數(shù)據(jù)中挖掘出部分未知信息的影響。目前比較常見的數(shù)據(jù)驅動模型有支持向量機(Support Vector Machine,SVM)、多層感知機(Multilayer Perceptron,MLP)、BP 神經網(wǎng)絡、徑向基函數(shù)(Radial Basis Function,RBF)神經網(wǎng)絡、深度神經網(wǎng)絡等。
深度神經網(wǎng)絡非線性擬合效果會更好,但是網(wǎng)絡結構過于復雜,會把機理模型建立起來的可解釋性全部覆蓋,因此不適合本文的混合模型。SVM、MLP、BP、RBF 的預測效果都很不錯,但是由于標準的訓練方法不同,SVM、MLP 的訓練時間比人工神經網(wǎng)絡要長,同時,對于非線性的擬合能力也不如人工神經網(wǎng)絡。BP 神經網(wǎng)絡的結構要比RBF 神經網(wǎng)絡簡單得多,同時,BP 有一個致命的缺陷,就是容易陷入局部極小值,RBF 神經網(wǎng)絡則不然,理論上,RBF神經網(wǎng)絡可以實現(xiàn)以任意精度的逼近任意的非線性函數(shù),且具有全局的逼近能力[11-12],從根本上解決了BP 神經網(wǎng)絡的局部最優(yōu)問題,而且拓撲結構緊湊,收斂速度快,泛化能力好。RBF神經網(wǎng)絡結構如圖2所示。
圖2 RBF神經網(wǎng)絡
建立如圖3 所示的新的并聯(lián)結構D。把機理模型的預測結果與RBF 神經網(wǎng)絡的預測進行線性組合,最終得到混合模型的預測結果。該結構在訓練時神經網(wǎng)絡的權值與線性組合的系數(shù)同時進行調整。
圖3 并聯(lián)型結構D
結構D 和結構A 在結構方面最大的區(qū)別在于對混合模型中的數(shù)據(jù)驅動部分的處理,結構A中數(shù)據(jù)驅動模型相當于時間序列滑動平均模型的預測,誤差的預測只和過程對象輸入信號有關?;瑒悠骄P蜑?/p>
式中:yt是模型輸出;xi,t為第i個變量t時刻的模型輸入;βi是系數(shù)。
結構D 中模型相當于自回歸滑動平均模型,誤差的預測不僅僅和過程對象輸入信號有關,還和輸出自身的歷史信息有關系。所以在D 結構里面,誤差的預測會被限制在一個相對小的范圍。自回歸滑動平均模型為
式中:yt-i是前i個時刻的輸出;αi是系數(shù)。
凝汽器壓力是模型預測的目標。凝汽器壓力的大小受型式、型號、總有效面積、抽真空區(qū)有效面積、傳熱系數(shù)、循環(huán)水流量、清潔系數(shù)等技術參數(shù)的影響,其中最主要的因素是汽輪機排入凝汽器的蒸汽量、冷卻水的進口溫度和冷卻水流量。
建模假定如下:采用集總參數(shù)法,認為凝汽器殼側各處的壓力相同。1)進入凝汽器的蒸汽全部為飽和蒸汽,且全部冷凝成水;2)忽略管中水的蓄熱導致的傳熱的延遲。
在如上假設基礎上可以近似認為,凝汽器凝結成水時釋放出的熱量、通過冷卻管的傳熱量、冷卻水帶走的熱量三者是相等的,于是,蒸汽側在穩(wěn)定工況下熱平衡方程為
式中:Q為凝汽器熱負荷;Dzp為汽輪機排汽進入凝汽器的蒸汽流量;hs為汽輪機排汽的焓;hc為凝結水的焓;K為總傳熱系數(shù);Δtm為對數(shù)平均溫差;A為冷卻面積;Dw為進入凝汽器的冷卻水流量;t2為冷卻水出口溫度;t1為冷卻水入口溫度;cp為冷卻水比定壓熱容,cp=4.181 6×103J(∕kg·℃)。
hs可以根據(jù)變工況下抽汽的熱力參數(shù)值來確定,hc可通過查飽和水對應的溫度下的焓值或根據(jù)經驗公式得到。但通過此方法確定汽輪機低壓缸排汽焓計算復雜,且其本身存在一定的誤差,所以在實際工程計算中,當凝汽式汽輪機在正常的壓力內運行時,hs與hc之間的差值變化很小,通常直接取
式中:tc為凝結水的飽和溫度。
由式(1)可得溫升為
設δt=ts-t2,δt為傳熱端差,ts為排汽壓力對應的飽和蒸汽溫度,可知
凝汽器壓力對應的飽和蒸汽溫度
式(3)、式(6)、式(7)代入上式可得
冷卻面積A結合實際凝汽器設計參數(shù)與其運行規(guī)程,此處給出經驗值。
總傳熱系數(shù)K可以通過美國傳熱學會公式進行求解。
式中:K0為基本傳熱系數(shù),可以通過式(10)求得;ξc為清潔系數(shù);βt為冷卻水入口溫度修正系數(shù);βm為冷卻管材料和壁厚的修正系數(shù);vw為冷卻管內流速;C為取決于冷卻管外徑的計算系數(shù)。
采用Bunk 公式[13]將飽和蒸汽溫度轉化為對應的凝汽器壓力,當t>0℃時
根據(jù)建立的機理模型,可得預測值與實際值之間的誤差,如圖4所示。
圖4 機理模型預測
從圖4 可以看出,機理模型預測的凝汽器壓力與實際壓力在趨勢上保持了一致,但是在某些工況下預測不是十分準確。這主要是由于采用了集總參數(shù)法進行建模,在建模過程中作了較多的假設、簡化和經驗公式。這也從另一方面說明了建立凝汽器模型采用機理和數(shù)據(jù)驅動相結合的方式的必要性。
為了能夠表述一些機理不明或者極其復雜不可描述的因素對凝汽器實際壓力的影響,結構D 采用了RBF 神經網(wǎng)絡對凝汽器壓力進行了數(shù)據(jù)驅動建模,根據(jù)2.1 中機理建??芍?,影響凝汽器壓力的因素有很多,其中最主要的因素是汽輪機排入凝汽器的蒸汽量、冷卻水的進口溫度和冷卻水流量。因此,選擇上述3 個變量為數(shù)據(jù)驅動模型的輸入變量,凝汽器壓力為輸出變量。結構D 取前3 個時刻的歷史值反饋到RBF 的輸入,因此該結構采用了六輸入單隱層單輸出的網(wǎng)絡結構。
RBF 神經網(wǎng)絡隱含層神經元個數(shù)的選擇可以根據(jù)過程數(shù)據(jù)中包含的工況個數(shù)來決定。RBF 隱含層神經元的中心點的選取,可以通過聚類來實現(xiàn),把聚類中心作為核函數(shù)的中心點。
訓練結構D 中RBF 神經網(wǎng)絡時,首先需要對過程數(shù)據(jù)進行濾波,然后把汽輪機排入凝汽器的蒸汽量、冷卻水的進口溫度和冷卻水流量以及誤差的歷史值作為輸入量提供給RBF 神經網(wǎng)絡。然后,RBF的輸出與機理的輸出線性組合得到結構D 的預測值。最后,結構D 的預測值與實際值之間的誤差來修正RBF 的權值與線性組合系數(shù)。同時,當前誤差作為一個歷史值反饋到RBF 輸入,參與到下一次權值修正。
結構D 中兩個模型的組合采用的是最簡單的線性組合,建立步驟如下。
高斯核函數(shù)可表示為
式中:X是神經網(wǎng)絡輸入向量,包含輸入X1和前3 時刻E的反饋;C是核函數(shù)的中心;σ是核函數(shù)的寬度。
采用的線性組合為
式中:g為數(shù)據(jù)驅動模型的預測值;設機理模型為P=f(X),P為機理模型預測值。據(jù)結構D 可知,該模型整體輸出表示為
式中:Y為混合模型預測值;j為第j個隱含層神經元;m為隱含層神經元個數(shù);ωj為第j個隱含層神經元的權值。
損失函數(shù)為
式中E均方誤差,Ym是實際數(shù)據(jù)。
設e=Y-Ym,網(wǎng)絡權值更新為
隱含層神經元中心點更新:
隱含層神經元高斯核寬度更新:
式中:k為迭代次數(shù);η1、η2、η3分別是權值、核函數(shù)中心點、核函數(shù)寬度的學習率。
以某1 000 MW 火電機組凝汽器壓力為例,并聯(lián)型結構A、結構D 和機理模型進行了對比實驗,最后從數(shù)據(jù)驅動子模型權值搜索空間及收斂性的角度進行了仿真實驗。
結構A 數(shù)據(jù)驅動網(wǎng)絡結構和輸入變量同結構D,不同的是結構A網(wǎng)絡輸出為實際數(shù)據(jù)與機理的殘差。因此,并聯(lián)結構A 是以機理模型為主,機理模型的預測值與基于殘差的RBF 神經網(wǎng)絡輸出疊加,得到混合模型輸出,仿真效果如圖5、圖6所示。
圖5 并聯(lián)型結構A與機理預測對比
圖6 并聯(lián)型結構A與機理誤差對比
并聯(lián)結構D 是在數(shù)據(jù)驅動子模型中引入了機理模型的預測以及結構D 輸出的誤差歷史信息,混合模型的整體輸出是機理子模型預測與數(shù)據(jù)驅動子模型預測的加權和。仿真效果如圖7、圖8所示。
圖7 并聯(lián)型結構D與機理預測對比
圖8 并聯(lián)型結構D與機理誤差對比
據(jù)圖4、圖5、圖7 可知,并聯(lián)型結構A 與結構D的預測效果都優(yōu)于單一的機理模型。混合模型在機理模型預測基礎上做了補償和修正,使得混合模型能夠更加真實的反映系統(tǒng)內部的運行機制。表1 從均方誤差的角度證明了,混合模型有較高的精度,但是相差不大。根據(jù)建模對象的不同,不同結構會有不同的精度表現(xiàn),所以單純從精度角度評判混合模型結構沒有找到問題的核心。
表1 機理與混合結構預測誤差對比
結構A 和結構D 中數(shù)據(jù)驅動部分網(wǎng)絡結構和神經元個數(shù)會影響模型的收斂性和準確性。六輸入單隱層單輸出的網(wǎng)絡結構已經確定,本文中隱含層神經元數(shù)量是根據(jù)工況決定的,通過觀察功率和凝汽器壓力的數(shù)據(jù),大致可以確定數(shù)據(jù)中包含的工況為7~10 個。經過大量試算和比較,確定隱含層神經元個數(shù)為8。
從數(shù)據(jù)驅動子模型權值搜索空間及收斂性的角度,設計了如下仿真實驗,并聯(lián)型結構A 與結構D 的RBF 神經網(wǎng)絡權值搜索空間如圖9、圖10 所示,收斂速度如圖11所示。
圖9 并聯(lián)型結構D權值搜索空間
圖10 并聯(lián)型結構A權值搜索空間
圖11 并聯(lián)結構損失函數(shù)對比
據(jù)圖9、圖10、圖11 可知,結構D 的RBF 神經網(wǎng)絡權值搜索空間比并聯(lián)型結構A 要小,權值收斂速度更快。并聯(lián)結構A 數(shù)據(jù)驅動部分在訓練殘差網(wǎng)絡時與機理的輸出是無關的,兩者互不影響,因此,RBF 神經網(wǎng)絡權值搜索范圍大,收斂慢。結構D 的數(shù)據(jù)驅動部分雖然訓練的也是殘差,但是通過與機理模型輸出加權求和,對機理模型進行了校正,同時在數(shù)據(jù)驅動模型部分引入了自回歸信息,這就保證了結構D 的精度不弱于結構A。除此之外,據(jù)式(14)可知,結構D 中機理模型的輸出通過加權系數(shù)ωm+1影響RBF神經網(wǎng)絡的訓練。當機理模型的輸出與實際值已經比較接近的情況下,其加權組合的系數(shù)ωm+1會是一個接近于1 的較大數(shù),同時該結構反饋的歷史信息限制了RBF 神經網(wǎng)絡的權值搜索空間,使得該結構的權值搜索范圍小,更容易獲取到最優(yōu)值,收斂速度快。
采用基于子模型收斂性評價的并聯(lián)型混合建模方法,以某1 000 MW 火電機組為例,建立了凝汽器的機理模型,然后在RBF 神經網(wǎng)絡中引入機理模型的預測,得到并聯(lián)型結構D 的整體輸出。通過對比機理模型、并聯(lián)型結構A 和建立的并聯(lián)型結構D,可以看出,混合模型的精度優(yōu)于單一的機理模型。但是,不同結構的混合模型精度相差無幾,單純從精度角度評判混合模型結構有失公允。從數(shù)據(jù)驅動子模型權值搜索空間和收斂速度進行評判,通過仿真得出,并聯(lián)型結構D 中歷史信息的反饋和機理模型的存在約束了數(shù)據(jù)驅動子模型的權值搜索空間,提高了搜索效率,收斂速度更快。因此,仿真使用并聯(lián)型結構D構建精準度高、收斂速度快的模型是可行的。