吳曉陽,張 森,陳先中,尹怡欣
(北京科技大學(xué)自動(dòng)化學(xué)院,北京 100083;北京科技大學(xué)工業(yè)過程知識(shí)自動(dòng)化教育部重點(diǎn)實(shí)驗(yàn)室,北京 100083)
鋼鐵工業(yè)是國民經(jīng)濟(jì)的支柱性產(chǎn)業(yè).高爐是鋼鐵生產(chǎn)過程中的核心設(shè)備,關(guān)系到鋼鐵行業(yè)的工業(yè)產(chǎn)量和能源消耗.維持高爐的穩(wěn)定順行是整個(gè)鋼鐵行業(yè)共同追求的重要目標(biāo)[1].在高爐生產(chǎn)中,爐頂?shù)拿簹饬鞣植贾苯臃从沉嗣簹鉄崮艿睦们闆r,因而影響高爐能耗水平和生產(chǎn)成本,所以準(zhǔn)確的預(yù)測(cè)高爐煤氣流分布狀況將有助于保證高爐的穩(wěn)定順行[2].然而,高爐在運(yùn)行過程中處于“黑箱”狀態(tài),使得高爐操作人員無法直接觀測(cè)煤氣流的分布及其狀態(tài)變化.因此關(guān)于高爐煤氣流分布狀況的預(yù)測(cè)一直是學(xué)術(shù)界和工業(yè)界的熱門研究方向[3].高爐煤氣流分布的預(yù)測(cè)有利于研究高爐料面的變化規(guī)律,從而指導(dǎo)布料操作.隨著檢測(cè)技術(shù)的發(fā)展,包括紅外成像、十字測(cè)溫等先進(jìn)技術(shù)較為成熟的運(yùn)用在高爐煤氣流的實(shí)時(shí)檢測(cè)中,使得煤氣流的預(yù)測(cè)成為了可能.Li等人[4]基于小波概率神經(jīng)網(wǎng)絡(luò)建立一種煤氣流分布辨識(shí)模型.Zhang 等人[5]建立了一種基于低頻特征提取技術(shù)的支持向量回歸模型預(yù)測(cè)高爐煤氣流分布狀況.Shi等人[6]提出了一種基于紅外圖像處理的高爐煤氣流中心分布特征識(shí)別方法,采用模糊C均值聚類和統(tǒng)計(jì)方法對(duì)高爐煤氣流中心的分布特征和相應(yīng)的氣體利用率進(jìn)行了分類.An等人[7]提出一種基于爐頂攝像檢測(cè)的高爐爐喉煤氣流形態(tài)三維模型重建方法.Zhou等人[8]基于時(shí)間序列思想,采用多輸出自回歸移動(dòng)平均模型、主因子分析法、Pearson相關(guān)性分析、赤池信息準(zhǔn)則與模型擬合優(yōu)度等技術(shù),提出一種結(jié)構(gòu)簡單、精度高且易于實(shí)現(xiàn)的十字測(cè)溫中心溫度在線估計(jì)方法.雖然上述模型均可實(shí)現(xiàn)對(duì)高爐煤氣流分布狀況的研究和預(yù)測(cè),但是仍然存在兩個(gè)問題使模型的準(zhǔn)確性無法令人完全信服.
問題1在高爐運(yùn)行過程中,基于十字測(cè)溫裝置和紅外圖像處理技術(shù)所得到的溫度數(shù)據(jù)總是不同程度的帶有異常數(shù)據(jù).異常數(shù)據(jù)產(chǎn)生的原因,既有因高爐內(nèi)部粉塵與高溫煤氣密布等環(huán)境因素產(chǎn)生的環(huán)境噪聲,也有因長期處于高溫高壓環(huán)境下導(dǎo)致的測(cè)量儀器損壞所產(chǎn)生的測(cè)量誤差,而后者的影響更為惡劣.使用濾波等數(shù)據(jù)預(yù)處理手段雖然可以有效去除環(huán)境噪聲但是卻無法完全排除測(cè)量誤差.
問題2傳統(tǒng)高爐煤氣流溫度預(yù)測(cè)模型主要集中在優(yōu)化模型,提高預(yù)測(cè)精度上,而忽視了在工程中的實(shí)用性.大多數(shù)預(yù)測(cè)模型屬于單步預(yù)測(cè),雖然具有很高的精度,但是只能為高爐操作人員提供一分鐘甚至幾十秒的預(yù)測(cè)結(jié)果,而這對(duì)實(shí)際操作的幫助十分有限.
針對(duì)以上所提到的問題,本文基于真實(shí)的高爐十字測(cè)溫?cái)?shù)據(jù),將帶遺忘因子的遞推最小二乘法的自回歸移動(dòng)平均模型(auto-regressive moving average model based on recursive least squares with forgetting factor,F(xiàn)F-ARMAX)和限定記憶的正則化極限學(xué)習(xí)機(jī)(regularized extreme learning machine based on recursive finite memory least squares,RFMLS-RELM)兩種數(shù)據(jù)驅(qū)動(dòng)算法融合建立高爐煤氣流多步預(yù)測(cè)模型.首先,利用時(shí)間序列分析能夠準(zhǔn)確反映動(dòng)態(tài)依存關(guān)系的特性和帶遺忘因子的遞推最小二乘法能夠降低歷史數(shù)據(jù)影響力的特性建立FF-ARMAX模型,通過該模型對(duì)十字測(cè)溫裝置產(chǎn)生的測(cè)量誤差進(jìn)行修正,并且運(yùn)用傅里葉變換法去除內(nèi)部環(huán)境產(chǎn)生的環(huán)境噪聲,以減少原始數(shù)據(jù)與真實(shí)情況之間的差距,提高預(yù)測(cè)結(jié)果的可靠性.然后分別選取十字測(cè)溫裝置中的17個(gè)測(cè)溫點(diǎn)作為輸出變量,如圖1所示,使用經(jīng)過數(shù)據(jù)預(yù)處理的高爐數(shù)據(jù),結(jié)合正則化極限學(xué)習(xí)機(jī)(regularized extreme learning machine,RELM)算法,建立高爐煤氣流多步預(yù)測(cè)模型.考慮到傳統(tǒng)的RELM算法會(huì)隨著訓(xùn)練樣本的不斷增加,而逐漸失去學(xué)習(xí)能力,也就是新的樣本無法對(duì)模型產(chǎn)生影響,即“數(shù)據(jù)飽和”問題,本文運(yùn)用限定記憶遞推最小二乘法(recursive finite memory least squares,RFMLS)優(yōu)化RELM,從而保證模型的預(yù)測(cè)精度和可信度.實(shí)驗(yàn)結(jié)果表明,采用改進(jìn)的RELM算法建立的高爐煤氣流多步預(yù)測(cè)模型可以準(zhǔn)確預(yù)測(cè)高爐煤氣流分布狀況,為高爐操作人員分析爐況提供了有效的幫助和支持.
圖1 十字測(cè)溫裝置Fig.1 The crossing temperature device
傳統(tǒng)高爐煤氣流分布預(yù)測(cè)模型中,模型輸入變量的確定大多根據(jù)經(jīng)驗(yàn)主觀確定,容易造成模型特征冗余或關(guān)鍵特征丟失,影響預(yù)測(cè)精度和建模效率.因此,在建立高爐煤氣流多步預(yù)測(cè)模型之前,首先需要確定影響高爐煤氣流分布的相關(guān)影響因素作為預(yù)測(cè)模型的輸入變量.同時(shí),由于溫度數(shù)據(jù)中存在由采集裝置導(dǎo)致的測(cè)量誤差和生產(chǎn)環(huán)境導(dǎo)致的高頻噪聲.因此需要對(duì)從高爐生產(chǎn)現(xiàn)場(chǎng)采集到的原始數(shù)據(jù)進(jìn)行數(shù)據(jù)預(yù)處理,具體而言就是分別進(jìn)行測(cè)量誤差處理和數(shù)據(jù)去噪處理,使數(shù)據(jù)能夠更加真實(shí)的反映高爐生產(chǎn)信息,從而提升預(yù)測(cè)模型的性能,提高預(yù)測(cè)精度.
本文除采用十字測(cè)溫裝置的測(cè)溫點(diǎn)作為影響因子外,還選擇高爐爐況信息等其他影響高爐煤氣流分布的相關(guān)因素作為影響因子,進(jìn)行煤氣流分布影響因素分析.由于本文需要對(duì)測(cè)溫點(diǎn)進(jìn)行預(yù)測(cè),故選擇十字測(cè)溫裝置的各測(cè)溫點(diǎn)作為預(yù)測(cè)模型的輸出變量.本文選取風(fēng)量(FL)、風(fēng)溫(FW)、風(fēng)壓(FY)、頂壓(DY)、富氧量(O2)、風(fēng)速(FS)、壓差(YC)和17個(gè)測(cè)溫點(diǎn),共計(jì)24 個(gè)變量作為影響因子.選取1000組高爐現(xiàn)場(chǎng)數(shù)據(jù),相關(guān)影響因子的詳細(xì)數(shù)據(jù)信息如表1所示.由于篇幅有限,此處以十字測(cè)溫裝置中的T25測(cè)溫點(diǎn)為例進(jìn)行影響因素分析.分析采用Pearson相關(guān)性分析,分別計(jì)算這23個(gè)影響因子與輸出變量T25之間的相關(guān)程度.Pearson相關(guān)系數(shù)的計(jì)算公式如下:
式中:ai,bi表示第i時(shí)刻兩個(gè)變量的采樣值;表示變量均值;n為采樣總量.
表1 高爐數(shù)據(jù)詳細(xì)信息Table 1 Blast furnace data details
根據(jù)式(1)計(jì)算得到每個(gè)影響因子與輸出變量T25的相關(guān)系數(shù),結(jié)果如圖2所示.
圖2 影響因子與T25的相關(guān)系數(shù)Fig.2 The correlation coefficient between the influence factor and T25
為降低模型復(fù)雜度,需要進(jìn)行數(shù)據(jù)降維,因此選取相關(guān)性大于r0=0.5的影響因子作為模型輸入.如圖2中所示,灰色虛線標(biāo)識(shí)的地方即為r0=0.5處,本文選取Pearson相關(guān)系數(shù)大于0.5的影響因子作為輸入變量.由此得到高爐煤氣流多步預(yù)測(cè)模型以T25為輸出變量所對(duì)應(yīng)的輸入變量為T23,T22,T21,T24,T32,T37,T33和T36.
由于信息采集裝置的老化、失效等問題和高爐內(nèi)部環(huán)境復(fù)雜多變,高爐生產(chǎn)現(xiàn)場(chǎng)采集到的數(shù)據(jù)不可避免存在著各種誤差.有因信息采集裝置所處的惡劣工作環(huán)境導(dǎo)致的儀器老化、損壞等問題而產(chǎn)生的測(cè)量誤差,也有因高爐內(nèi)部本身復(fù)雜多變的環(huán)境而產(chǎn)生的環(huán)境噪聲.并且,使用存在著誤差的高爐數(shù)據(jù)建立預(yù)測(cè)模型會(huì)使預(yù)測(cè)效果變差,所以需要先對(duì)高爐生產(chǎn)數(shù)據(jù)進(jìn)行預(yù)處理.接下來數(shù)據(jù)預(yù)處理將會(huì)分為兩個(gè)部分進(jìn)行,一個(gè)建立FF-ARMAX模型修正測(cè)量誤差,一個(gè)是通過傅里葉變換消除環(huán)境噪聲.
2.2.1 基于FF-ARMAX的測(cè)量誤差處理
十字測(cè)溫裝置的熱電偶因?yàn)樽陨硭幍膼毫迎h(huán)境,極易損壞,導(dǎo)致測(cè)量數(shù)據(jù)出現(xiàn)嚴(yán)重的測(cè)量誤差,本文針對(duì)溫度數(shù)據(jù)在時(shí)序上存在測(cè)量誤差的問題,提出通過建立FF-ARMAX模型對(duì)測(cè)量誤差進(jìn)行修正的方法.時(shí)間序列分析的基本思想是根據(jù)觀察到的歷史數(shù)據(jù),建立能夠比較精確地反映時(shí)間序列中所包含動(dòng)態(tài)依存關(guān)系的數(shù)學(xué)模型[9],所以可以通過分析從高爐現(xiàn)場(chǎng)獲取的輸入輸出時(shí)間序列數(shù)據(jù)之間與輸出時(shí)間序列之間的相互關(guān)系來建立十字測(cè)溫裝置測(cè)量誤差修正模型.時(shí)間序列分析中ARMAX模型的一般結(jié)構(gòu)為
式中:
z-1為延遲算子,即z-1y(k)=y(k-1); ε(k)為零均值高斯白噪聲;np,nq為滯后的階次,k為采樣時(shí)刻.
1) 變量選取.
建立FF-ARMAX模型是為了消除數(shù)據(jù)中存在的測(cè)量誤差,因此需要先確定哪些變量數(shù)據(jù)中存在測(cè)量誤差.由表1可知,變量T25和T29(字體加粗標(biāo)明)的最小值均為-12.5℃,顯然高爐中不可能出現(xiàn)零下溫度,因此這兩個(gè)變量必然存在測(cè)量誤差,需要通過FF-ARMAX模型修正.此處以T25為例.選取T25作為輸出變量,輸入變量的選取采用第2.1節(jié)中的相關(guān)性分析方法,經(jīng)過分析最終選取T23,T22,T21,T24,T32,T37,T33和T36作為輸入變量.
2) 模型定階.
建模過程中增加模型階數(shù)可以提高模型精度,但是模型復(fù)雜度會(huì)增大,提高了建模難度,并易于導(dǎo)致過擬合問題.為此,采用信息準(zhǔn)則作為確定模型階數(shù)的依據(jù),信息準(zhǔn)則通過加入模型復(fù)雜度的懲罰項(xiàng)來避免過擬合的問題.最常用的信息準(zhǔn)則為赤池信息準(zhǔn)則(Akaike’s information,AIC)[10]:
式中:d為模型參數(shù)個(gè)數(shù);v為損失函數(shù);N為訓(xùn)練樣本容量.本文采用MATLAB中的armax(·)函數(shù)和aic(·)函數(shù)進(jìn)行模型定階,確定式(2)-(3)中滯后階次np,nq.滯后階次的選取范圍為np∈[1,5],nq∈[1,5],N=1000,實(shí)驗(yàn)結(jié)果如圖3所示.
圖3 (a) 模型AIC與不同輸入輸出階次的三維立體圖Fig.3 (a) The AIC value corresponding to different order(three-dimensional map)
圖3 (b) 模型AIC與不同輸入輸出階次的俯視圖Fig.3 (b) The AIC value corresponding to different order(top view)
由圖3(a)和圖3(b)可以看出,當(dāng)np=3,nq=3時(shí),AIC函數(shù)值最高,因此模型階次確定為np=3,nq=3.
3) 模型參數(shù)辨識(shí).
由式(2)-(3)可知,需要建立的FF-ARMAX模型表達(dá)式為
式中:
定義數(shù)據(jù)向量和參數(shù)向量:
其中i=1,2,…,NR,NR為輸入變量個(gè)數(shù).
將式(7)和式(8)代入式(5),可得
為了解決“數(shù)據(jù)飽和”問題,本文采用帶遺忘因子的遞推最小二乘算法(the least square method with forgetting factor),其算法公式為
式中 K(k),θ(k),P(k),μ(k)分別為增益矩陣、參數(shù)向量、逆矩陣和遺忘因子.注意到上述算法需要事先給定初值θ(0)=0,P(0)=αI,μ0=0.99,μ(0)=0.95,其中α為足夠大的正數(shù),本文選用104.
4) 實(shí)驗(yàn)結(jié)果.
參數(shù)收斂曲線如圖4所示.圖中曲線表示參數(shù)向量θ中參數(shù)值的變化趨勢(shì),當(dāng)參數(shù)值隨著遞推次數(shù)的增加趨于穩(wěn)定時(shí),認(rèn)為參數(shù)向量達(dá)到穩(wěn)定,F(xiàn)FARMAX模型將通過穩(wěn)定的參數(shù)向量構(gòu)建.從圖4中可以看出,參數(shù)向量θ在經(jīng)過400次迭代后達(dá)到穩(wěn)定.因此,選取迭代400次時(shí)的參數(shù)向量θ代入式(9)中構(gòu)建FF-ARMAX模型.
圖4 參數(shù)收斂曲線Fig.4 Parameter convergence curves
2.2.2 基于傅里葉變換的環(huán)境噪聲處理
本文中采用的數(shù)據(jù)均是高爐生產(chǎn)數(shù)據(jù),這些數(shù)據(jù)中疊加的環(huán)境噪聲會(huì)對(duì)建模與預(yù)測(cè)結(jié)果產(chǎn)生嚴(yán)重的影響,因此建模之前需要?jiǎng)冸x出數(shù)據(jù)中的高頻環(huán)境噪聲[5].為了驗(yàn)證信號(hào)的正確性,需要對(duì)數(shù)據(jù)進(jìn)行頻譜分析,也就是對(duì)數(shù)據(jù)進(jìn)行傅里葉變換,將數(shù)據(jù)由時(shí)間域轉(zhuǎn)換到頻率域,再根據(jù)數(shù)據(jù)的頻率特征剝離數(shù)據(jù)中的噪聲.三角函數(shù)形式的傅里葉變換(Fourier transform,F(xiàn)T)如下:
式中:x(t)表示信號(hào);an,bn表示傅里葉系數(shù);n=0,±1,±2; ω0=
完成對(duì)于數(shù)據(jù)的傅里葉變換后,可以得到數(shù)據(jù)的低頻特征,然后將數(shù)據(jù)輸入合理的數(shù)字濾波器,就可以在保證有效信息不被破壞的情況下,將高頻環(huán)境噪聲除去.數(shù)字濾波器又可以分為FIR數(shù)字濾波器和IIR數(shù)字濾波器,本文采用的是IIR數(shù)字濾波器,也稱為遞歸型的數(shù)字濾波器,即濾波器當(dāng)前的輸出不僅與當(dāng)前和以前的輸入值有關(guān),而且還與以前的各個(gè)輸出值有關(guān)[11].
2.2.3 數(shù)據(jù)預(yù)處理效果
根據(jù)第2.2.1節(jié)中FF-ARMAX模型的建立過程,建立修正模型用于消除T25溫度數(shù)據(jù)中存在的測(cè)量誤差.T25變量的原始數(shù)據(jù)如圖5所示,從圖5中可以看出在T25溫度數(shù)據(jù)中不同位置分布著零下溫度數(shù)據(jù),這印證了表1中T25的數(shù)據(jù)信息中最小值為-12.5℃這一現(xiàn)象.T25變量經(jīng)過FF-ARMAX模型消除測(cè)量誤差,修正結(jié)果如圖6所示.從圖6中可以看出T25原始數(shù)據(jù)中大量存在的-12.5℃數(shù)據(jù)被消除,T25變量數(shù)據(jù)恢復(fù)到正常的高爐溫度范疇,證明了FFARMAX 模型可以有效消除數(shù)據(jù)中存在的測(cè)量誤差.但是,同樣可以發(fā)現(xiàn),消除測(cè)量誤差的高爐數(shù)據(jù)中仍然存在著大量由環(huán)境因素產(chǎn)生的高頻噪聲,如圖6中黑色虛線圈處所示,因此需要去噪處理.根據(jù)第2.2.2節(jié),采用傅里葉變換對(duì)經(jīng)過修正的T25溫度數(shù)據(jù)進(jìn)行數(shù)據(jù)分析,然后采用IIR數(shù)字濾波器進(jìn)行去噪處理,處理結(jié)果如圖7所示.從圖7 中可以看出,經(jīng)過去噪處理,圖6中T25溫度數(shù)據(jù)存在的環(huán)境噪聲被有效去除.
圖5 未經(jīng)過數(shù)據(jù)預(yù)處理的T25原始數(shù)據(jù)Fig.5 T25 data without data preprocessing
圖6 經(jīng)過FF-AMRAX模型修正的T25數(shù)據(jù)Fig.6 T25 data corrected by FF-AMRAX model
圖7 去噪后的T25修正數(shù)據(jù)Fig.7 T25 revised data after denoising
圖8為經(jīng)過FF-ARMAX模型修正和去噪處理的T25溫度數(shù)據(jù)與T25原始溫度數(shù)據(jù)的對(duì)比圖.由圖8可知,經(jīng)過數(shù)據(jù)預(yù)處理后的T25溫度數(shù)據(jù),在保留數(shù)據(jù)變化趨勢(shì)不變的情況下,完全消除了疊加在原始數(shù)據(jù)中的測(cè)量誤差,并且最大限度的消除了數(shù)據(jù)中的環(huán)境噪聲,使數(shù)據(jù)能夠更加真實(shí)的反映高爐的生產(chǎn)過程,為接下來的煤氣流預(yù)測(cè)工作做好了準(zhǔn)備.
圖8 數(shù)據(jù)預(yù)處理結(jié)果Fig.8 Data preprocessing result
由于影響高爐煤氣流分布的因素眾多,并且和其他機(jī)器學(xué)習(xí)算法相比,RFMLS-RELM算法更適用于處理大規(guī)模復(fù)雜實(shí)時(shí)環(huán)境中的大量數(shù)據(jù),對(duì)之前的歷史數(shù)據(jù)依賴性比較小,具有比較好的魯棒性[12].本章首先詳細(xì)介紹RFMLS-RELM算法,然后介紹采用RFMLS-RELM算法所建立的高爐煤氣流模型.
由于高爐內(nèi)部爐況復(fù)雜多變,內(nèi)部情況無法精確判斷,為了應(yīng)對(duì)十字測(cè)溫?cái)?shù)據(jù)在不同時(shí)刻的變化,煤氣流預(yù)測(cè)模型需要實(shí)時(shí)讀入新數(shù)據(jù)進(jìn)行模型訓(xùn)練.但是傳統(tǒng)的極限學(xué)習(xí)機(jī)會(huì)隨著訓(xùn)練樣本的增加,歷史數(shù)據(jù)逐漸占據(jù)訓(xùn)練數(shù)據(jù)的大部分,新數(shù)據(jù)所占比重越來越低,而逐漸失去學(xué)習(xí)能力,即“數(shù)據(jù)飽和”問題.即使是權(quán)值更新的在線貫序極限學(xué)習(xí)機(jī)(an online sequential extreme learning machine algorithm based on incremental weighted average,WOS-ELM)[13-14]也只能給靠給歷史數(shù)據(jù)添加遺忘因子的辦法降低“歷史數(shù)據(jù)”在模型訓(xùn)練過程中的影響,然而此舉并不能完全排除歷史數(shù)據(jù)的影響,也就是說,隨著時(shí)間的推移模型最終還是會(huì)出現(xiàn)“飽和問題”.為此本文提出了一種RFMLS-RELM算法.該算法在模型訓(xùn)練過程中每讀入一個(gè)新樣本就會(huì)去除一個(gè)歷史樣本,隱含層到輸出層的權(quán)值矩陣β的學(xué)習(xí)僅依賴于限定個(gè)數(shù)的最新樣本,從而避免“數(shù)據(jù)飽和”問題的出現(xiàn).
RFMLS-RELM算法推導(dǎo)過程如下:
其中:wi=[wi1wi2… wiN]T是隨機(jī)選擇的輸入權(quán)重,連接第i個(gè)隱藏節(jié)點(diǎn)和輸入節(jié)點(diǎn)的權(quán)值矢量;bi是第i個(gè)隱藏節(jié)點(diǎn)隨機(jī)選擇的偏置向量;βi是連接第i個(gè)隱藏節(jié)點(diǎn)和輸出節(jié)點(diǎn)的權(quán)值矢量;wi·xj表示wi和xj的內(nèi)積;g(wi·xj+bi)是第i個(gè)隱藏節(jié)點(diǎn)的輸出.
式(15)可以轉(zhuǎn)化成矩陣形式:
H稱為隱藏層的輸出矩陣,β為隱含層輸出權(quán)重.為更好的平衡訓(xùn)練誤差和輸出權(quán)重,防止算法陷入“過擬合”,RFMLS-RELM算法引入正則化系數(shù)C[15-16],用于平衡訓(xùn)練誤差和輸出權(quán)重β.因此在求解式(16)中輸出權(quán)重β時(shí),采用如下公式:
設(shè)模型訓(xùn)練數(shù)據(jù)長度為Q,則RFMLS-RELM模型的隱含層輸出矩陣H數(shù)學(xué)表達(dá)式為
其中k表示采樣時(shí)刻,
首先向模型中添加一個(gè)新數(shù)據(jù)yk+Q,則當(dāng)前模型中包含k至k+Q時(shí)刻共計(jì)(Q+1)訓(xùn)練樣本,根據(jù)公式(17)可推導(dǎo)出基于限定記憶的正則化極限學(xué)習(xí)機(jī)的輸出層權(quán)值矩陣為,
設(shè)
由遞推最小二乘法的原理可推導(dǎo)出
以上,式(23)-(24)就是加入新訓(xùn)練樣本時(shí)的遞推公式.接下來推導(dǎo)剔除舊訓(xùn)練樣本時(shí)的遞推公式.
當(dāng)矩陣β剔除舊訓(xùn)練樣本yk時(shí),模型中包含k+1至k+Q時(shí)刻共計(jì)Q個(gè)訓(xùn)練樣本,則有
則式(22)改寫為
同樣由遞推最小二乘法的原理可推導(dǎo)出
以上,式(27)-(28)就是剔除舊訓(xùn)練樣本時(shí)的遞推公式.
基于RFMLS-RELM高爐煤氣流多步預(yù)測(cè)模型的建模過程如下所示:
步驟1確定RFMLS-RELM的網(wǎng)絡(luò)結(jié)構(gòu).
由第2.1 節(jié)的分析可知,以十字測(cè)溫裝置T23,T22,T21,T24,T32,T37,T33和T36作為RFMLS-RELM高爐煤氣流預(yù)測(cè)模型輸入層的輸入變量,即輸入層有8個(gè)節(jié)點(diǎn).以T25作為該預(yù)測(cè)模型的輸出變量,即輸出層有1個(gè)節(jié)點(diǎn).
步驟2建立RFMLS-RELM預(yù)測(cè)模型.
1) 隱含層節(jié)點(diǎn)的激活函數(shù)為Sigmoid函數(shù);
2) 隱含層節(jié)點(diǎn)個(gè)數(shù)和正則化因子通過試湊法,經(jīng)過反復(fù)試驗(yàn)確定,并且對(duì)輸入層到隱含層的權(quán)值矩陣和隱含層的偏置向量進(jìn)行隨機(jī)賦值;
3) 選取訓(xùn)練樣本長度Q,不宜太大;
4) 每當(dāng)有新樣本進(jìn)入到模型當(dāng)中時(shí),先利用式(23)-(24)計(jì)算β(k,k+Q)和,增加新訓(xùn)練樣本的信息;再利用式(27)-(28)計(jì)算β(k+1,k+Q)和剔除舊訓(xùn)練樣本的信息;
5) 不斷迭代直至獲得理想的權(quán)值矩陣β.
步驟3多步預(yù)測(cè).
將經(jīng)過數(shù)據(jù)預(yù)處理的十字測(cè)溫?cái)?shù)據(jù)作為測(cè)試樣本導(dǎo)入已經(jīng)訓(xùn)練好的RFMLS-RELM預(yù)測(cè)模型當(dāng)中,進(jìn)行多步預(yù)測(cè).
步驟4驗(yàn)證基于FF-ARMAX 和RFMLSRELM的高爐煤氣流多步預(yù)測(cè)模型.
如果運(yùn)用該模型所得到的預(yù)測(cè)值與實(shí)際測(cè)量值的相對(duì)誤差(relative errors,RE)達(dá)到要求,則模型建立完畢.如果不符合要求,則返回步驟2重新建立模型.
引言中提到傳統(tǒng)高爐煤氣流溫度預(yù)測(cè)模型未能解決的兩個(gè)問題:
1) 由十字測(cè)溫裝置本身產(chǎn)生的測(cè)量誤差疊加在溫度數(shù)據(jù)中,這些異常值嚴(yán)重影響了高爐煤氣流預(yù)測(cè)模型的性能,而傳統(tǒng)的去噪手段無法有效排除數(shù)據(jù)中這類由測(cè)量誤差產(chǎn)生的異常值;
2) 傳統(tǒng)高爐煤氣流溫度預(yù)測(cè)模型的重點(diǎn)主要集中在優(yōu)化模型,提高模型預(yù)測(cè)精度上,而忽視了在工程中的實(shí)用性.它們大多屬于單步預(yù)測(cè),雖然具有很高的精度,但是只能為高爐操作人員提供一分鐘甚至幾十秒的預(yù)測(cè)結(jié)果,而這對(duì)實(shí)際操作的幫助十分有限.
針對(duì)上述問題,本文基于真實(shí)的高爐十字測(cè)溫?cái)?shù)據(jù),將FF-ARMAX和RFMLS-RELM兩種算法融合建立高爐煤氣流在線多步預(yù)測(cè)模型.為解決問題1),采用FF-ARMAX模型消除數(shù)據(jù)中由測(cè)量誤差產(chǎn)生的異常值.為檢驗(yàn)?zāi)P拖惓V档男ЧO(shè)置檢測(cè)實(shí)驗(yàn).實(shí)驗(yàn)內(nèi)容為:將經(jīng)過處理的數(shù)據(jù)與未經(jīng)過處理的原始數(shù)據(jù)分別導(dǎo)入一個(gè)基于RFMLS-RELM算法的高爐煤氣流溫度預(yù)測(cè)模型,根據(jù)其預(yù)測(cè)結(jié)果判斷FF-ARMAX 模型對(duì)異常值消除效果.為解決問題2),本文采用RFMLS方法對(duì)RELM算法進(jìn)行優(yōu)化,提出了一種全新的算法-RFMLS-RELM.接下來首先建立基于RFMLS-RELM算法的高爐煤氣流溫度預(yù)測(cè)模型(單步預(yù)測(cè)模型),檢驗(yàn)該算法在預(yù)測(cè)煤氣流溫度上的性能.然后與傳統(tǒng)預(yù)測(cè)模型進(jìn)行比較,證明RFMLS-RELM預(yù)測(cè)模型在預(yù)測(cè)煤氣流溫度上的優(yōu)勢(shì).最后建立基于RFMLS-RELM算法的高爐煤氣流溫度多步預(yù)測(cè)模型,借此解決問題2).
以上所有實(shí)驗(yàn)均在具有AMD Ryzen5 1600X 3.6 GHz和8 GB內(nèi)存的計(jì)算機(jī)上的MATLAB-2017b中實(shí)現(xiàn).為衡量實(shí)驗(yàn)結(jié)果的優(yōu)劣,采用均方根誤差RMSE、標(biāo)準(zhǔn)差SD及訓(xùn)練時(shí)間和測(cè)試時(shí)間作為各預(yù)測(cè)模型的評(píng)價(jià)標(biāo)準(zhǔn).以RMSE 最小的為最優(yōu)結(jié)果,若RMSE相同,則比較SD,最后比較時(shí)間.
為了驗(yàn)證所提方法,論證FF-ARMAX模型對(duì)異常值處理的有效性,首先進(jìn)行FF-ARMAX模型性能檢驗(yàn)實(shí)驗(yàn).根據(jù)表1可知,T25和T29的原始數(shù)據(jù)中存在異常值.因此以下檢驗(yàn)實(shí)驗(yàn)中,模型的輸入變量中應(yīng)當(dāng)至少包含T25和T29其中一個(gè).
根據(jù)上述分析,此次試驗(yàn)選取武鋼某高爐實(shí)際生產(chǎn)數(shù)據(jù).該數(shù)據(jù)是采樣頻率為60 s的離散時(shí)間序列數(shù)據(jù).實(shí)驗(yàn)?zāi)P偷妮斎胼敵鲎兞?,根?jù)第2.1節(jié)的方法,選取T36為輸出變量,T27,T26,T24,T25,T37,T23,T33 和T29 為輸入變量.實(shí)驗(yàn)?zāi)P筒捎肦FMLS-RELM 算法建立,參數(shù)配置為限定長度Q=50,隱含層節(jié)點(diǎn)L=10,正則化系數(shù)C=210,激勵(lì)函數(shù)為sigmoid函數(shù).為驗(yàn)證FF-AMRAX模型對(duì)異常值的處理效果,實(shí)驗(yàn)數(shù)據(jù)分為兩類:經(jīng)過處理的數(shù)據(jù)和未經(jīng)處理的原始數(shù)據(jù),各選取1000組數(shù)據(jù).其中900組數(shù)據(jù)作為訓(xùn)練數(shù)據(jù),100組數(shù)據(jù)作為測(cè)試數(shù)據(jù).為此需要建立兩個(gè)模型,分別命名為實(shí)驗(yàn)?zāi)P?處理數(shù)據(jù))和實(shí)驗(yàn)?zāi)P?原始數(shù)據(jù)).表2為實(shí)驗(yàn)?zāi)P?處理數(shù)據(jù))和實(shí)驗(yàn)?zāi)P?原始數(shù)據(jù))的預(yù)測(cè)結(jié)果.
表2 實(shí)驗(yàn)?zāi)P?處理數(shù)據(jù))和實(shí)驗(yàn)?zāi)P?原始數(shù)據(jù))的實(shí)驗(yàn)結(jié)果Table 2 Experimental results of experimental models(processing data)and experimental models(raw data)
由表2可知,在訓(xùn)練和測(cè)試時(shí)間上二者相差不多,但是訓(xùn)練和測(cè)試RMSE卻有很大差距.實(shí)驗(yàn)?zāi)P?處理數(shù)據(jù))無論是在訓(xùn)練階段還是測(cè)試階段,它的性能表現(xiàn)都強(qiáng)于實(shí)驗(yàn)?zāi)P?原始數(shù)據(jù)),說明原始數(shù)據(jù)在經(jīng)過FF-ARMAX模型去除異常值后,對(duì)提高預(yù)測(cè)模型預(yù)測(cè)精度有很大幫助.證明了FF-ARMAX模型對(duì)異常值處理的有效性,解決了上文提到的問題1).
4.2.1 RFMLS-RELM性能檢測(cè)為測(cè)試RFMLS-RELM算法在預(yù)測(cè)高爐煤氣流溫度時(shí)的性能,以及檢驗(yàn)RFMLS方法對(duì)傳統(tǒng)ELM算法和RELM 算法的提升作用,本文在建立RFMLSRELM預(yù)測(cè)模型的同時(shí),采用ELM算法、RELM算法、WOS-ELM算法和M-ARMAX算法作為對(duì)比算法分別建立預(yù)測(cè)模型.但是RFMLS-RELM算法在實(shí)際應(yīng)用中的性能表現(xiàn)由參數(shù)配置決定,因此為了確保預(yù)測(cè)模型的性能達(dá)到最佳,本文先進(jìn)行調(diào)參實(shí)驗(yàn),確定預(yù)測(cè)模型最佳參數(shù)配比.
建立預(yù)測(cè)模型需要確定RFMLS-RELM的4個(gè)參數(shù),即正則化系數(shù)C、限定長度Q、隱含層節(jié)點(diǎn)個(gè)數(shù)L和激勵(lì)函數(shù).正則化系數(shù)C分別選取210,215,220,225,230,限定長度Q分別選取50,100,隱含層節(jié)點(diǎn)L分別選取10,20,50,100,激勵(lì)函數(shù)選用sigmoid函數(shù).
根據(jù)上述分析筆者對(duì)RFMLS-RELM預(yù)測(cè)模型進(jìn)行調(diào)參實(shí)驗(yàn),預(yù)測(cè)模型經(jīng)過30次重復(fù)試驗(yàn),取實(shí)驗(yàn)結(jié)果的RMSE和方差作為預(yù)測(cè)模型的實(shí)驗(yàn)結(jié)果,針對(duì)不同參數(shù)配置的RFMLS-RELM預(yù)測(cè)模型的實(shí)驗(yàn)結(jié)果如表3所示.由表3可知,當(dāng)Q=50,L=50,C=215時(shí),預(yù)測(cè)結(jié)果的RMSE均值最小.故本文選取限定長度Q=50,隱含層節(jié)點(diǎn)L=50,正則化系數(shù)C=215,激勵(lì)函數(shù)選用sigmoid函數(shù)的參數(shù)配置作為RFMLSRELM預(yù)測(cè)模型的最終配置.
表3 RFMLS-RELM模型的調(diào)參實(shí)驗(yàn)結(jié)果Table 3 Results of the adjustment experiments of RFMLS-RELM
在確定RFMLS-RELM預(yù)測(cè)模型的參數(shù)配置后,進(jìn)行不同預(yù)測(cè)模型的性能對(duì)比.各預(yù)測(cè)模型的設(shè)置如下:
1) ELM模型:建立預(yù)測(cè)模型需要確定隱含層節(jié)點(diǎn)個(gè)數(shù)L和激勵(lì)函數(shù).經(jīng)過試驗(yàn),最終確定L=10,激勵(lì)函數(shù)為sigmoid函數(shù).
2) RELM模型:建立預(yù)測(cè)模型需要確定正則化系數(shù)C、隱含層節(jié)點(diǎn)個(gè)數(shù)L和激勵(lì)函數(shù).經(jīng)過試驗(yàn),最終確定L=10,C=230,激勵(lì)函數(shù)為sigmoid函數(shù)建立RELM預(yù)測(cè)模型.
3) WOS-ELM模型:建立預(yù)測(cè)模型確定遺忘因子λ、隱含層節(jié)點(diǎn)個(gè)數(shù)L和激勵(lì)函數(shù).經(jīng)過試驗(yàn),最終確定L=10,λ=0.9,激勵(lì)函數(shù)為sigmoid函數(shù).
4) M-ARMAX模型:該模型的建立過程與第2.2節(jié)中FF-ARMAX 模型的建立過程相似,因此MARMAX模型無需參與調(diào)參實(shí)驗(yàn),M-ARMAX模型的階次選擇過程和系統(tǒng)辨識(shí)過程使用第2.2節(jié)中的結(jié)果,即np=3,nq=3,參數(shù)向量θ一致.
不同預(yù)測(cè)模型實(shí)驗(yàn)對(duì)比結(jié)果如表4所示.由表4可知,ELM與RELM的訓(xùn)練和測(cè)試RMSE大致相同,說明在預(yù)測(cè)煤氣流溫度的問題上兩者性能接近.然而,在訓(xùn)練時(shí)間和測(cè)試時(shí)間上,RELM均值和方差更小,這說明正則化系數(shù)雖然沒能提升ELM的性能,但是成功解決了ELM因過度追求訓(xùn)練誤差而導(dǎo)致訓(xùn)練時(shí)間過長的問題.WOS-ELM的訓(xùn)練和測(cè)試RMSE均低于ELM和RELM,說明遺忘因子λ的加入對(duì)ELM算法有顯著提升.M-ARMAX作為一種常見的系統(tǒng)建模方法,在性能上與ELM和RELM相似,但是不太穩(wěn)定(測(cè)試RMSE的SD高于ELM,說明測(cè)試結(jié)果變動(dòng)較大),但是訓(xùn)練時(shí)間遠(yuǎn)大于兩者,因此在實(shí)際應(yīng)用中不具備競(jìng)爭(zhēng)力.
最后,RFMLS-RELM的訓(xùn)練和測(cè)試RMSE是所有預(yù)測(cè)模型中最好的,證明RFMLS方法對(duì)RELM算法的性能有很大提升,而且更加穩(wěn)定(SD較RELM更小).雖然訓(xùn)練時(shí)間和測(cè)試時(shí)間更長,但是從性能提升的角度上來說是可以接受的,而且高爐本身就是大滯后系統(tǒng),所以在實(shí)際應(yīng)用中這樣的時(shí)間成本也是可以接受的.圖9為運(yùn)用RFMLS-RELM預(yù)測(cè)模型得到的煤氣流溫度預(yù)測(cè)結(jié)果與實(shí)際數(shù)據(jù)的對(duì)比圖.圖10給出RFMLS-RELM 預(yù)測(cè)煤氣流溫度的相對(duì)誤差.從圖9和圖10可知RFMLS-RELM能夠很好的預(yù)測(cè)煤氣流溫度.為了進(jìn)一步比較各預(yù)測(cè)模型的性能,圖11給出了RFMLS-RELM和4種對(duì)比模型的煤氣流溫度預(yù)測(cè)值與真實(shí)值的對(duì)比結(jié)果,圖12給出預(yù)測(cè)誤差的對(duì)比結(jié)果.由圖11 可以看出,相比其他預(yù)測(cè)模型RFMLSRELM具有更好的預(yù)測(cè)效果,并且能夠更好的預(yù)測(cè)煤氣流溫度的變化趨勢(shì).從圖12 可以看出,RFMLSRELM預(yù)測(cè)模型的誤差明顯小于其他4種預(yù)測(cè)模型,由此可知RFMLS-RELM具有較高的預(yù)測(cè)精度.
表4 不同預(yù)測(cè)模型實(shí)驗(yàn)對(duì)比結(jié)果Table 4 Comparison of experimental results of different prediction models
圖9 RFMLS-RELM模型預(yù)測(cè)結(jié)果Fig.9 Prediction results of RFMLS-RELM model
圖10 RFMLS-RELM預(yù)測(cè)誤差Fig.10 Prediction errors of RFMLS-RELM model
圖11 不同預(yù)測(cè)模型的預(yù)測(cè)結(jié)果Fig.11 Prediction results of different prediction models
圖12 不同預(yù)測(cè)模型的預(yù)測(cè)誤差Fig.12 Prediction errors of different prediction models
4.2.2 基于RFMLS-RELM算法的多步預(yù)測(cè)模型性能檢測(cè)
根據(jù)第4.2.1節(jié)的實(shí)驗(yàn)可知,采用RFMLS-RELM方法建立的高爐煤氣流預(yù)測(cè)模型具有較好的建模精度,對(duì)高爐煤氣流溫度數(shù)據(jù)具有很高的擬合精度.但是該模型的多步預(yù)測(cè)精度仍然有待考量,為此本文將建立RFMLS-RELM多步預(yù)測(cè)模型與由ELM,RELM,WOS-ELM和M-ARMAX算法建立的多步預(yù)測(cè)模型進(jìn)行對(duì)比,驗(yàn)證RFMLS-RELM模型的多步預(yù)測(cè)效果.以上多步預(yù)測(cè)模型使用的數(shù)據(jù)是采樣周期為60 s的離散時(shí)間序列數(shù)據(jù),因此各多步預(yù)測(cè)模型的預(yù)測(cè)步長也為60 s與高爐實(shí)際生產(chǎn)數(shù)據(jù)采集周期相同.為衡量多步預(yù)測(cè)模型對(duì)高爐煤氣流溫度的預(yù)測(cè)效果,本文采用相對(duì)誤差(relative errors,RE)比較各多步預(yù)測(cè)模型的預(yù)測(cè)效果,計(jì)算每一步的預(yù)測(cè)值與真實(shí)值的RE,當(dāng)RE <10%時(shí),認(rèn)為該步預(yù)測(cè)結(jié)果為有效預(yù)測(cè)結(jié)果.圖13為RFMLS-RELM多步預(yù)測(cè)模型的預(yù)測(cè)結(jié)果,圖14為不同多步模型的預(yù)測(cè)結(jié)果對(duì)比圖.
由圖13可知,RFMLS-RELM單步預(yù)測(cè)模型的預(yù)測(cè)結(jié)果與真實(shí)值非常接近,而多步預(yù)測(cè)模型會(huì)因?yàn)轭A(yù)測(cè)值替代真實(shí)值的緣故,導(dǎo)致每一步預(yù)測(cè)結(jié)果都受到之前預(yù)測(cè)誤差的影響,預(yù)測(cè)誤差不斷疊加,故隨著預(yù)測(cè)步數(shù)的增加而預(yù)測(cè)誤差越來越大.由圖14可知,各多步預(yù)測(cè)模型在第1步至第3步的預(yù)測(cè)結(jié)果與真實(shí)值還比較接近,除了M-ARMAX模型.但是從第4步開始出現(xiàn)較大誤差,且隨著預(yù)測(cè)步數(shù)的增加誤差越來越大,只是不同模型誤差增大的速度不同,RFMLSRELM與WOS-ELM增速較ELM和RELM而言相對(duì)較慢,而M-ARMAX多步預(yù)測(cè)模型的預(yù)測(cè)誤差增速遠(yuǎn)大于其他模型.單純從圖像上,只能看出各多步預(yù)測(cè)模型的大致表現(xiàn),為衡量各模型性能需要詳細(xì)信息.因此表5展示了各多步預(yù)測(cè)模型的詳細(xì)預(yù)測(cè)結(jié)果.
圖13 RFMLS-RELM多步預(yù)測(cè)模型的預(yù)測(cè)結(jié)果Fig.13 Prediction results of RFMLS-RELM multi-step prediction model
圖14 不同多步預(yù)測(cè)模型的預(yù)測(cè)結(jié)果Fig.14 Prediction results of different multi-step prediction models
由表5可知,RFMLS-RELM模型的多步預(yù)測(cè)結(jié)果在第1步至第3步時(shí)還與單步預(yù)測(cè)結(jié)果接近,但是從第4步開始誤差開始不斷加大,直至第8步相對(duì)誤差超過10%.按上文定義,RFMLS-RELM多步預(yù)測(cè)模型的預(yù)測(cè)結(jié)果中有效預(yù)測(cè)結(jié)果為7步.而ELM多步預(yù)測(cè)模型與RELM多步預(yù)測(cè)模型性能表現(xiàn)相近,雖然變化趨勢(shì)不同但是有效預(yù)測(cè)結(jié)果均為5步,而且隨著步數(shù)增長,預(yù)測(cè)結(jié)果越偏離真實(shí)值,到第10步時(shí)甚至有40%以上的誤差,這對(duì)于實(shí)際應(yīng)用而言是不可接受.WOS-ELM多步預(yù)測(cè)模型的預(yù)測(cè)結(jié)果相對(duì)較好,有效預(yù)測(cè)結(jié)果有6步之多,比較接近RFMLS-RELM模型的性能,但是它的誤差增長速度同樣很高,第10步時(shí)同樣也有35%以上的誤差.至于M-ARMAX多步預(yù)測(cè)模型效果較差,有效預(yù)測(cè)結(jié)果只有3 步,而且誤差增長速度很高,第10步時(shí)相對(duì)誤差達(dá)到86%,這證明了該模型不適用于高爐煤氣流溫度多步預(yù)測(cè).
表5 不同多步預(yù)測(cè)模型的詳細(xì)預(yù)測(cè)結(jié)果(預(yù)測(cè)結(jié)果單位均°C)Table 5 Prediction results of different multi-step prediction models
由上述實(shí)驗(yàn)可知,在多步預(yù)測(cè)模型中,由于每一步預(yù)測(cè)結(jié)果都會(huì)參與到接下來的預(yù)測(cè)工作中,導(dǎo)致每一步預(yù)測(cè)產(chǎn)生的預(yù)測(cè)誤差也會(huì)疊加到之后的預(yù)測(cè)結(jié)果中,所以多步預(yù)測(cè)結(jié)果的精度必然會(huì)隨著預(yù)測(cè)步數(shù)的增加而不斷增加.本文所提出的RFMLS-RELM算法,在高爐煤氣流溫度多步預(yù)測(cè)上,相對(duì)其他傳統(tǒng)多步預(yù)測(cè)模型實(shí)現(xiàn)了更好的預(yù)測(cè)效果.雖然無法改變預(yù)測(cè)誤差不斷疊加的問題,但是依然取得較好的結(jié)果,因此RFMLS-RELM多步預(yù)測(cè)模型更適用于高爐煤氣流溫度的多步預(yù)測(cè).
針對(duì)高爐煤氣流傳統(tǒng)預(yù)測(cè)模型的缺陷,本文提出了一種基于FF-ARMAX和RFMLS-RELM的高爐煤氣流多步預(yù)測(cè)模型.在數(shù)據(jù)修正方面,建立FFARMAX模型消除原始數(shù)據(jù)中因十字測(cè)溫裝置失效或損壞導(dǎo)致的測(cè)量誤差,同時(shí)采用傅里葉變換法消除數(shù)據(jù)中疊加的環(huán)境噪聲.最后采用RELM算法進(jìn)行多步預(yù)測(cè),并且運(yùn)用RFMLS優(yōu)化RELM隱含層到輸出層的權(quán)值矩陣,消除了歷史數(shù)據(jù)對(duì)模型的影響,避免了“數(shù)據(jù)飽和”問題的出現(xiàn).對(duì)比試驗(yàn)表明,該算法在應(yīng)用于高爐煤氣流預(yù)測(cè)時(shí),預(yù)測(cè)精度更高,因此該算法適用于對(duì)高爐煤氣流分布狀況的多步預(yù)測(cè).同時(shí)多步預(yù)測(cè)實(shí)驗(yàn)結(jié)果表明,該模型雖然仍舊無法完全解決預(yù)測(cè)誤差隨預(yù)測(cè)步數(shù)的增加而不斷疊加的問題,但相較于其他傳統(tǒng)預(yù)測(cè)模型能夠獲得更多的有效預(yù)測(cè)步數(shù),實(shí)現(xiàn)更高的預(yù)測(cè)精度,為建立更加精確的高爐料面溫度場(chǎng)提供了可能,為高爐操作人員分析爐況提供了有效的幫助和支持.