張維平,趙文蕾,李國強(qiáng),牛培峰
(1.秦皇島職業(yè)技術(shù)學(xué)院機(jī)電工程系,河北 秦皇島 066100;2.燕山大學(xué)電氣工程學(xué)院,河北 秦皇島 066004)
基于粗糙集與最小二乘支持向量回歸的汽輪機(jī)主蒸汽流量預(yù)測(cè)
張維平1,2,趙文蕾1,李國強(qiáng)2,牛培峰2
(1.秦皇島職業(yè)技術(shù)學(xué)院機(jī)電工程系,河北秦皇島066100;2.燕山大學(xué)電氣工程學(xué)院,河北秦皇島066004)
針對(duì)傳統(tǒng)主蒸汽流量計(jì)算方法的不足,提出了一種新的主蒸汽流量預(yù)測(cè)方法,該方法綜合了粗糙集理論與最小二乘支持向量回歸算法的優(yōu)點(diǎn),利用ROSETTA V1.4.41研究實(shí)驗(yàn)平臺(tái)中的遺傳約簡算法對(duì)輸入變量的屬性進(jìn)行約簡,再利用最小二乘支持向量回歸算法建立主蒸汽流量的預(yù)測(cè)模型。實(shí)驗(yàn)表明,與未經(jīng)粗糙集理論處理過的BP神經(jīng)網(wǎng)絡(luò)、支持向量回歸算法和最小二乘支持向量回歸算法所建模型相比,該方法具有更好的預(yù)測(cè)精度和泛化能力,且建模速度顯著提高。
計(jì)量學(xué);主蒸汽流量;滑壓運(yùn)行曲線;最優(yōu)初壓;最小二乘支持向量機(jī);引力搜索算法
利用調(diào)節(jié)級(jí)后壓力來計(jì)算主蒸汽流量的方法是依據(jù)汽輪機(jī)變工況計(jì)算中的弗留格爾公式。對(duì)于具有n級(jí)的汽輪機(jī)組變工況運(yùn)行時(shí)在未達(dá)到臨界前,機(jī)組前后的參數(shù)和流量之間的關(guān)系為[6]:
式中:G為主蒸汽流量(t/h);T為級(jí)組前(后)的絕對(duì)溫度(K);P為級(jí)組前(后)的絕對(duì)壓力(MPa)。下標(biāo)0指額定值;X指實(shí)際值;1指級(jí)組前的參數(shù);2指級(jí)組后的參數(shù)。
當(dāng)所取的機(jī)組比較多且包含凝汽式機(jī)組的末級(jí)時(shí),因?yàn)榕牌麎毫χ狄h(yuǎn)遠(yuǎn)小于進(jìn)汽壓力值,所以在計(jì)算時(shí)可將排汽壓力值忽略不計(jì)。此時(shí)式(1)變?yōu)椋?/p>
將式(2)變形后可得到實(shí)際的主蒸汽流量GX:
目前,大多數(shù)機(jī)組的數(shù)據(jù)采集系統(tǒng)(DAS)中所顯示的主蒸汽流量是由式(4)計(jì)算得出:
式中:K為常數(shù),取決于系統(tǒng)設(shè)計(jì)時(shí)的主蒸汽流量、調(diào)節(jié)級(jí)后壓力和溫度等參數(shù)。然而,式(4)的計(jì)算結(jié)果也常常會(huì)產(chǎn)生較大的誤差,文獻(xiàn)[7]中的試驗(yàn)結(jié)果表明,該電廠的機(jī)組在350 MW負(fù)荷左右時(shí),計(jì)算得到的主蒸汽流量值與實(shí)驗(yàn)測(cè)得的數(shù)值相差約30~40 t/h,相對(duì)誤差在3%以上。分析其中的主要原因發(fā)現(xiàn),一方面是現(xiàn)場(chǎng)對(duì)于沒有調(diào)節(jié)級(jí)后溫度測(cè)點(diǎn)的機(jī)組采用主蒸汽溫度值來代替,而實(shí)際汽輪機(jī)組在變負(fù)荷運(yùn)行時(shí),主蒸汽溫度與調(diào)節(jié)級(jí)溫度之間并非一一對(duì)應(yīng)的關(guān)系;另一方面,K值無法保持恒定,隨著機(jī)組運(yùn)行狀態(tài)的改變,需要不斷地修正以滿足對(duì)測(cè)量精度的要求,這就給現(xiàn)場(chǎng)應(yīng)用帶來很大的不便。因此,建立一種方便、準(zhǔn)確的主蒸汽流量計(jì)算模型對(duì)電廠具有重要的意義。
在進(jìn)行正式開挖清淤之前,還要進(jìn)行試挖,收集有關(guān)開挖的深度和尺寸等相關(guān)的數(shù)據(jù),確保后期工作符合設(shè)計(jì)的要求。
3.1粗糙集理論
RS理論[8]通常采用信息系統(tǒng)或信息表的形式構(gòu)成知識(shí)表達(dá)系統(tǒng),可以表示為四元有序組K= (U,A,V,ρ)的形式,其中U=(x1,x2,…,xn)為論域,又稱非空有限對(duì)象集;A=C∪D為非空有限屬性集;C為條件屬性集;D為決策屬性集;V=(v1,v2,…,vm)為屬性的值域;ρ:U×A→V為信息函數(shù),反映論域U與屬性集A到值域V的映射。這時(shí)的信息系統(tǒng)又被稱作“決策表”。對(duì)于A中的任何屬性子集B,在U上的等價(jià)關(guān)系可以用下式表達(dá):
如果(x,y)∈I(B),則x,y相對(duì)于B是不可分辨的。設(shè)RB是一個(gè)等價(jià)關(guān)系簇,如果RB=RB{b},則稱屬性b是多余的;如果系統(tǒng)中不存在多余的屬性,則稱B是獨(dú)立的;倘若RB=RA且B是獨(dú)立的,則稱B為A的約簡;A中所有約簡的交集稱作A的核。
屬性約簡算法[9]是粗糙集理論的核心內(nèi)容之一。常用的算法主要有:X.H.Hu算法、Pawlak屬性重要性算法、遺傳算法以及差別矩陣算法等。
3.2最小二乘支持向量機(jī)回歸算法
式中:ω為權(quán)重向量,b為偏置量。目標(biāo)函數(shù)描述為:
式中:ei為松弛變量,γ為正則化參數(shù)。對(duì)于優(yōu)化問題,引入Lagrange因子α,α∈RN×1,由KKT最優(yōu)條件,式(2)的解為:
式中:y=[y1,y2,…,yN]T,I=[1,1,…,1]T,α= [α1,α2,…,αN]T,Ω為一個(gè)N×N的對(duì)稱矩陣。對(duì)于式(8),令H=Ω+2γ-1I,則模型系數(shù)的解為:
3.2RS-LSSVR模型
雖然LSSVR有良好的預(yù)測(cè)精度、泛化能力和魯棒性,但LSSVR無法確定樣本特征值中哪些有用,哪些冗余。在建模過程中,一旦樣本數(shù)據(jù)的維數(shù)過高或數(shù)據(jù)量過大,其訓(xùn)練的復(fù)雜度就會(huì)大大增加,導(dǎo)致訓(xùn)練時(shí)間過長或者出現(xiàn)過擬合現(xiàn)象。而粗糙集理論能夠通過一定的算法挖掘數(shù)據(jù)間潛在的關(guān)系,通過去除數(shù)據(jù)中冗余的信息來簡化輸入樣本的維數(shù),但實(shí)際應(yīng)用中粗糙集方法往往對(duì)噪聲非常敏感,魯棒性差,這個(gè)缺點(diǎn)限制了它在工業(yè)生產(chǎn)中的應(yīng)用范圍。因此,本文結(jié)合LSSVR算法與RS屬性約簡方法的優(yōu)點(diǎn),提出了一種RS-LSSVR混合建模方法來預(yù)測(cè)汽輪機(jī)的主蒸汽流量,圖1給出了RS-LSSVR混合建模的流程圖。首先利用RS理論的屬性約簡算法對(duì)輸入數(shù)據(jù)進(jìn)行處理,消除冗余信息,減少輸入變量的維數(shù),構(gòu)建新的訓(xùn)練樣本與測(cè)試樣本,然后再利用LSSVR算法建立主蒸汽流量的預(yù)測(cè)模型。
3.4基于RS-LSSVR的主蒸汽流量預(yù)測(cè)
本文所需樣本數(shù)據(jù)來自某電廠600 MW超臨界機(jī)組DCS系統(tǒng)中采集的現(xiàn)場(chǎng)運(yùn)行數(shù)據(jù)。根據(jù)主蒸汽流量的物理特性及文獻(xiàn)[3]中給出的相關(guān)分析,選取8個(gè)輸入變量,1個(gè)輸出變量,具體如表1所示。采樣間隔為1 h,每天采集24組數(shù)據(jù),確定360組樣本作為訓(xùn)練集,72組樣本作為測(cè)試集。本文所有仿真實(shí)驗(yàn)均在2009年版本MATLAB軟件中完成,每次實(shí)驗(yàn)均重復(fù)30次,電腦配置為Inter(R)Core(TM)i5 2430M CPU(2.40 GHz)處理器,4.00 GB內(nèi)存,Windows 7.0操作系統(tǒng)。
圖1 RS-LSSVR混合建模流程圖
表1 主蒸汽流量建模初始輸入變量選擇
本文利用ROSETTA V1.4.41研究實(shí)驗(yàn)平臺(tái),采用軟件中提供的遺傳約簡算法來實(shí)現(xiàn)輸入變量的屬性約簡。屬性約簡的的結(jié)果如表2所示。
表2 約簡結(jié)果
從實(shí)際情況分析,主蒸汽流量的大小主要取決于調(diào)節(jié)級(jí)壓力的大小,此外還受一段抽汽壓力、負(fù)荷、一段抽汽溫度以及高壓缸排汽壓力的影響,與汽機(jī)側(cè)的主蒸汽溫度、壓力或高壓缸的排汽溫度關(guān)系并不密切。綜合考慮,本文認(rèn)為第1組屬性約簡的結(jié)果更符合實(shí)際,約簡后的輸入變量維數(shù)減少至5個(gè),分別為負(fù)荷、調(diào)節(jié)級(jí)后壓力、一段抽汽溫度、一段抽汽壓力和高壓缸排汽壓力。圖2給出了屬性約簡后的LSSVR結(jié)構(gòu)圖。
圖2 屬性約簡后的LSSVR結(jié)構(gòu)圖
在利用LSSVR算法建立主蒸汽流量預(yù)測(cè)模型時(shí),選擇RBF核函數(shù),利用網(wǎng)格搜索法確定模型參數(shù),γ=892.3954,σ2=144.4721。為避免計(jì)算時(shí)溢出,所有樣本數(shù)據(jù)都利用式(12)進(jìn)行歸一化處理。
歸一化方法可有效提高算法的收斂速度、縮短模型的訓(xùn)練時(shí)間。經(jīng)變換后,數(shù)據(jù)取值在[0,1]之間,于是得到新的時(shí)間序列xj,在建模分析之后,還需將其還原到原始區(qū)間。圖3給出了基于RSLSSVR的訓(xùn)練集樣本主蒸汽流量回歸預(yù)測(cè)結(jié)果,圖4給出RS-LSSVR模型對(duì)未經(jīng)訓(xùn)練的測(cè)試集數(shù)據(jù)進(jìn)行預(yù)測(cè)的結(jié)果。
圖3 基于RS-LSSVR的訓(xùn)練集樣本主蒸汽流量回歸預(yù)測(cè)
圖4 基于RS-LSSVR的測(cè)試集樣本主蒸汽流量回歸預(yù)測(cè)
從圖3中不難看出,得到的預(yù)測(cè)值與實(shí)際值幾乎完全相等,這表明基于RS-LSSVR的主蒸汽流量預(yù)測(cè)模型具有較高的預(yù)測(cè)精度。與此同時(shí),從圖4中可以看出,測(cè)試樣本的回歸精度也比較高,這表明該模型具有良好的泛化能力。由此可見,該回歸模型的的預(yù)測(cè)效果能夠滿足工程實(shí)際需求,可對(duì)不同工況下的主蒸汽流量進(jìn)行準(zhǔn)確預(yù)測(cè)。
為進(jìn)一步驗(yàn)證RS-LSSVR模型的性能,利用未經(jīng)RS處理的數(shù)據(jù)樣本,通過BP、SVR和LSSVR分別進(jìn)行主蒸汽流量的建模,最后對(duì)不同模型的建模效果進(jìn)行比較與分析。為比較基于不同算法的主蒸汽流量預(yù)測(cè)模型的性能,選用均方根誤差σRMSE和確定系數(shù)R2作為評(píng)價(jià)指標(biāo):
評(píng)價(jià)指標(biāo)σRMSE值越小,表明預(yù)測(cè)誤差越小,預(yù)測(cè)精度越高。而確定系數(shù)R2越接近于1,表明預(yù)測(cè)值與實(shí)際值的擬合精度越高,預(yù)測(cè)效果越好。
在利用BP神經(jīng)網(wǎng)絡(luò)建立主蒸汽流量的預(yù)測(cè)模型時(shí),確定BP的結(jié)構(gòu)為8-5-1,即輸入層有8個(gè)節(jié)點(diǎn),隱含層有5個(gè)節(jié)點(diǎn),輸出層有1個(gè)節(jié)點(diǎn)。BP網(wǎng)絡(luò)隱含層中的神經(jīng)元采用Sigmoid型變化函數(shù),輸出層則采用線性結(jié)構(gòu),輸入輸出數(shù)據(jù)經(jīng)歸一化處理后都限制在[0 1]之間,訓(xùn)練的相對(duì)誤差目標(biāo)值設(shè)為0.000 1;在利用SVR建立主蒸汽流量的預(yù)測(cè)模型時(shí),選用RBF核函數(shù),利用林志仁教授提出的libsvm工具箱來實(shí)現(xiàn)SVR的建模。此外,SVR算法的參數(shù)選擇采用3階交叉驗(yàn)證法來選擇模型的參數(shù),得出的結(jié)果為(c,g)=(1024,9.7651);在利用LSSVR建立主蒸汽流量的預(yù)測(cè)模型時(shí),也選用RBF核函數(shù),采用網(wǎng)格搜索法優(yōu)化模型參數(shù)組合(γ,σ2),其中網(wǎng)格設(shè)置為γ=[2-9,2-9,…,29,210],σ2=[2-9,2-9,…,29,210],得到的結(jié)果為(γ,σ2)= (1000,144.4721)。
表3給出了基于4種建模方法的主蒸汽流量預(yù)測(cè)模型的性能評(píng)價(jià)結(jié)果。圖5和圖6給出了基于4種建模方法的訓(xùn)練集和測(cè)試集樣本的主蒸汽流量回歸預(yù)測(cè)誤差曲線。
表3 4種建模方法性能比較
圖5 基于4種建模方法的訓(xùn)練集主蒸汽流量回歸預(yù)測(cè)誤差
圖6 基于4種建模方法的測(cè)試集主蒸汽流量回歸預(yù)測(cè)誤差
通過比較發(fā)現(xiàn),4種建模方法中,BP神經(jīng)網(wǎng)絡(luò)建模的速度最快,但模型的預(yù)測(cè)精度及泛化能力卻是最差的。SVR的預(yù)測(cè)效果要好于BP神經(jīng)網(wǎng)絡(luò),但由于SVR算法本身就比LSSVR算法要復(fù)雜,再加上采用了3階交叉驗(yàn)證法來確定模型的超參數(shù),所以耗費(fèi)時(shí)間最長。重點(diǎn)來對(duì)比一下LSSVR與RSLSSVR的建模效果,經(jīng)粗糙集理論的屬性約簡算法處理后,輸入變量的維數(shù)由原來的8個(gè)減少為5個(gè),這使得RS-LSSVR的建模時(shí)間比LSSVR縮短了約14.41%。但是,由于采用粗糙集對(duì)輸入樣本空間進(jìn)行特征選擇時(shí),剔除了噪聲數(shù)據(jù)的影響,這使得所建模型的預(yù)測(cè)性能非但沒有下降,反而有所提高。從仿真結(jié)果來看,無論是訓(xùn)練集還是測(cè)試集,基于RSLSSVR的主蒸汽流量回歸預(yù)測(cè)誤差均為最小。
本文主要針對(duì)汽輪機(jī)的主蒸汽流量提出了一種基于RS-LSSVR混合建模的軟測(cè)量方法,相比BP神經(jīng)網(wǎng)絡(luò)、標(biāo)準(zhǔn)的SVR和LSSVR的主蒸汽流量建模效果,基于RS-LSSVR的主蒸汽流量預(yù)測(cè)模型具有更高的預(yù)測(cè)精度、更好的泛化能力和更快的訓(xùn)練時(shí)間。同時(shí)也表明了在汽輪機(jī)主蒸汽流量建模時(shí),輸入變量的特征并非選取越多建模的效果就一定越好。
[1]吳海姬,王雷,司風(fēng)琪,等.基于BP神經(jīng)網(wǎng)絡(luò)的主蒸汽流量計(jì)算模型[J].汽輪機(jī)技術(shù),2007,49(4):269-273.
[2]王雷,張瑞青,肖增弘,等.基于SVM的主蒸汽流量回歸估計(jì)[J].華東電力,2008,36(12):89-92.
[3]周建新,王雷,吳海姬,等.基于支持向量回歸的大容量機(jī)組主蒸汽流量建模[J].熱能動(dòng)力工程,2008,23 (2):122-126.
[4]王偉,陳殿生,魏洪興,等.裝載機(jī)載重測(cè)量的支持向量機(jī)軟測(cè)量建模方法[J].計(jì)量學(xué)報(bào),2008,29(4):329 -333.
[5]陳果,周伽.小樣本數(shù)據(jù)的支持向量機(jī)回歸模型參數(shù)及預(yù)測(cè)區(qū)間研究[J].計(jì)量學(xué)報(bào),2008,29(1):92-96.
[6]孫永平,朱芳梅,王敏.北侖電廠2號(hào)機(jī)組DAS系統(tǒng)主蒸汽流量計(jì)算模型的修改[J].浙江電力,2000,9(3):14-16.
[7]何軍民,李明.湘潭電廠300MW機(jī)組主蒸汽流量計(jì)算模型的修改[J].湖南電力,2005,25(5):17-19.
[8]Zou Z H,Tseng T L,Sohn H,et al.A rough set based approachtodistributorselectioninsupplychain management[J].Expert systems with applications,2011,38(1):106-115.
[9]雷紹蘭,孫才新,周蘭,等.屬性約簡在空間負(fù)荷預(yù)測(cè)中的應(yīng)用[J].重慶大學(xué)學(xué)報(bào),2004,27(3):85-88.
[10]Sunken J A K,Vandewalle J.Least squares support vector machine classifiers[J].Neural Processing Letters,1999,9(3):293-300.
[11]Keerthi S S,Lin C J.Asymptotic behaviors of support vector machines with Gaussian kernel[J].Neural Computation,2003,15(7):1667-1689.
Forecasting of Turbine Main Steam Flow Based on Rough Sets and Least Squars Support Vector Machine Regression
ZHANG Wei-ping1,2,ZHAO Wen-lei1,LI Guo-qiang2,NIU Pei-feng2
(1.Department of Electromechanical Engineering,Qinhuangdao Institute of Technology,Qinhuangdao,Hebei 066100,China;2.Institute of Electrical Engineering,Yanshan University,Qinhuangdao,Hebei 066004,China)
A new prediction method is put forward in view of the shortages of traditional main steam flow calculation method,which combines the advantages both rough set theory and least squares support vector regression algorithm.Therefore,this new method is called RS-LSSVR.In RS-LSSVR,the attributes reduction of input variable by genetic algorithm is carried out on the ROSETTA V1.4.41 research experimental platform,then the main steam flow prediction model is established by LSSVR algorithm.The simulation results show that the method based on RS-LSSVR has better prediction precision and generalization ability compared with BP algorithm,support vector regression algorithm and LSSVR algorithm without treated by the RS theory.Moreover,the modeling speed increases significantly.
Metrology;Main steam flow;Sliding pressure operation curve;Optimal initial steam pressure;Least squares support vector machine;Gravitational search algorithm
TB937
A
1000-1158(2015)01-0043-05
10.3969/j.issn.1000-1158.2015.01.10
2012-12-20;
2013-04-15
河北省自然科學(xué)基金(F2010001318)
作者簡介:張維平(1980-),女,河北保定人,秦皇島職業(yè)技術(shù)學(xué)院講師,博士,主要從事啟發(fā)式智能優(yōu)化算法、熱工過程控制的研究。flamelikezwp@yahoo.com.cn