孫潔,崔婷婷,徐彬,王興楠
(1. 華北理工大學(xué) 電氣工程學(xué)院,河北 唐山 063210;2. 首鋼京唐鋼鐵聯(lián)合有限責(zé)任公司 煉鐵部,河北 唐山 063210)
高爐煉鐵過程是一個(gè)連續(xù)進(jìn)行的動(dòng)態(tài)反應(yīng)過程,具有時(shí)變、非線性、多尺度、大時(shí)滯等特征,因其內(nèi)部高溫、高壓、強(qiáng)腐蝕和強(qiáng)干擾等環(huán)境,很難通過直接測(cè)量獲得內(nèi)部的熱狀態(tài)[1]。鑒于鐵水硅含量和爐溫的相關(guān)性,一般通過鐵水硅含量間接地反映爐內(nèi)溫度的變化[2]。因此,為了有效地控制爐溫,保證高爐的穩(wěn)定運(yùn)行要及時(shí)掌握鐵水硅含量及其變化趨勢(shì)。
20世紀(jì)80年代以來,人工神經(jīng)網(wǎng)絡(luò)(Artificial Neural Network,ANN)成為人工智能領(lǐng)域的研究熱點(diǎn)。其通過對(duì)人類大腦的神經(jīng)元網(wǎng)絡(luò)進(jìn)行抽象來處理問題,根據(jù)不同的連接方式建立不同的網(wǎng)絡(luò),從而構(gòu)建一種簡單的模型[3]。近年來,隨著ANN不斷的深入研究,使得其在許多領(lǐng)域都成功地解決了現(xiàn)代計(jì)算機(jī)都很難解決的實(shí)際問題,尤其是在模式識(shí)別、自動(dòng)控制、智能機(jī)器人、預(yù)測(cè)估計(jì)、醫(yī)學(xué)、生物和經(jīng)濟(jì)等領(lǐng)域均表現(xiàn)出了良好的智能特性[4]。ELM[5,6]是一種新型的單隱含層前饋神經(jīng)網(wǎng)絡(luò),其在2004年由南洋理工大學(xué)的黃廣斌提出,有效地解決了反向傳播算法(Backward Probagation,BP)存在學(xué)習(xí)效率低以及參數(shù)設(shè)定繁瑣等問題。但是ELM的輸入層權(quán)值和隱含層閾值隨機(jī)產(chǎn)生,對(duì)算法的預(yù)測(cè)速度和預(yù)測(cè)精度會(huì)產(chǎn)生影響,針對(duì)ELM存在的問題,許多研究人員做了深入研究,提出了大量的智能算法來優(yōu)化ELM的參數(shù),并都取得了很好的效果[7-10]。根據(jù)對(duì)前人研究成果的分析,提出了利用IGA優(yōu)化ELM的輸入層權(quán)值和隱含層閾值,來進(jìn)行高爐鐵水硅含量預(yù)測(cè),并通過MATLAB仿真與單一的ELM預(yù)測(cè)模型進(jìn)行對(duì)比,來驗(yàn)證IGA-ELM預(yù)測(cè)模型的有效性。
如圖1所示,ELM的結(jié)構(gòu)由輸入層、隱含層和輸出層三部分組成,其算法描述如下:
任意給定n個(gè)不同的樣本(xi,ti),i=1,2,…,n,其中,存在n個(gè)輸入層神經(jīng)元xi=[xi1,xi2,…,xin]T∈Rn,m個(gè)輸出層神經(jīng)元ti=[ti1,ti2,…,tim]T∈Rm,隱含層節(jié)點(diǎn)有k個(gè),則ELM網(wǎng)絡(luò)模型可以表示為:
(1)
在式(1)中,αj=[αj1,αj2,…,αjn]為輸入層節(jié)點(diǎn)連接第j個(gè)隱含層節(jié)點(diǎn)之間的輸入權(quán)值向量,bj為第j個(gè)隱含層節(jié)點(diǎn)的閾值,βj=[βj1,βj2,…,βjn]為第j個(gè)節(jié)點(diǎn)連接輸出節(jié)點(diǎn)的權(quán)值向量,δi=[δi1,δi2,…,δim]T為ELM的預(yù)測(cè)輸出值。
ELM的目的是使輸出誤差為最小值,則公式可以表示為:
(2)
則式(2)簡化為:
Hβ=T
(3)
激勵(lì)函數(shù)g(x)為無限可微時(shí),β可以通過求解最小二乘解獲得,其公式為:
(4)
其解為:
(4)
在式(5)中,H*為矩陣H的Moore-Penrose廣義逆。
圖1 ELM網(wǎng)絡(luò)結(jié)構(gòu)圖
免疫算法是對(duì)生物體免疫機(jī)制的抽象表達(dá),求解的問題是抗原,對(duì)應(yīng)的解是抗體,抗原和抗體的親和度體現(xiàn)了可行解與最優(yōu)解的逼近程度[11]。免疫遺傳算法是將遺傳算法與免疫算法相結(jié)合,其既具有遺傳算法的特性又具有抗體濃度的調(diào)節(jié)機(jī)制,避免了遺傳算法在后期易出現(xiàn)退化現(xiàn)象的問題,增強(qiáng)了算法的收斂速度和搜索性能。圖2所示為IGA-ELM基本流程圖,其運(yùn)算過程如下:
(1)將ELM的連接權(quán)值和閾值作為IGA的抗原進(jìn)行編碼。
(2)初始種群由隨機(jī)產(chǎn)生的M個(gè)抗體構(gòu)成。
(3)將ELM的均方根誤差(Root mean square error,RMSE)作為IGA的適應(yīng)度函數(shù),即:
(6)
在式(6)中,fi為第i個(gè)粒子的適應(yīng)度函數(shù),δi為樣本預(yù)測(cè)值,titi為樣本實(shí)測(cè)值,n為輸入數(shù)據(jù)總數(shù),適應(yīng)度值越小,預(yù)測(cè)精度越高。
(4)判斷算法是否滿足終止條件,若獲得了設(shè)置的最優(yōu)值或到達(dá)了最大迭代次數(shù),則停止迭代,轉(zhuǎn)到步驟(7),否則轉(zhuǎn)到步驟(5)。
(5)將當(dāng)前種群中抗體的親和力進(jìn)行遺傳操作,從而產(chǎn)生子代種群:
a.在進(jìn)行選擇操作時(shí)常用輪盤賭選擇方法,在該方法中,其適應(yīng)度值與個(gè)體被選擇的概率成比例,設(shè)M為群體規(guī)模,個(gè)體i的適應(yīng)度值為fi,則個(gè)體被選擇的概率為:
(7)
b.交叉操作是通過替換重組2個(gè)父代個(gè)體的部分結(jié)構(gòu)而形成新的個(gè)體。交叉運(yùn)算可以增加算法的搜索性能。交叉時(shí)常用實(shí)數(shù)交叉方式,其公式為:
(8)
在式(8)中,r1為(0,1)之間的隨機(jī)數(shù),Smk和Snk分別為第m和第n個(gè)染色體在第k位上的交叉操作。
c.變異操作是變動(dòng)群體中的個(gè)體串的某些基因座上的基因值,通過變異操作可以增加種群的多樣性,其公式為:
(9)
f(k)=r3(1-k/kmax)2
(10)
在式(9)和式(10)中,基因Sij的上下界分別為Smax和Smin,r2和r3為(0,1)之間的隨機(jī)數(shù),k和kmax分別為當(dāng)前和最大的迭代次數(shù),f(k)為變異概率。
(6)更新種群:將子代種群作為當(dāng)前種群,且產(chǎn)生記憶抗體,轉(zhuǎn)到步驟(3)繼續(xù)進(jìn)行迭代。
(7)輸出最優(yōu)權(quán)值和閾值,建立IGA-ELM模型,將該模型用于實(shí)驗(yàn)的訓(xùn)練和預(yù)測(cè)。
實(shí)驗(yàn)數(shù)據(jù)選自某鋼廠1號(hào)高爐,由于高爐內(nèi)反應(yīng)復(fù)雜,眾多變量都和硅含量的變化有著密切的關(guān)系,若模型的輸入變量過多會(huì)使模型變得復(fù)雜,過少又會(huì)降低模型預(yù)測(cè)的精度,因此根據(jù)相關(guān)性分析選取與硅含量變化較大的7個(gè)變量作為模型的輸入變量,分別為:透氣性指數(shù)、爐頂壓力、噴煤率、壓差、熱風(fēng)壓力、爐頂溫度以及前一爐硅含量。
實(shí)驗(yàn)選取400組原始數(shù)據(jù),經(jīng)過剔除異常值、滯后步數(shù)處理以及一段時(shí)間內(nèi)取平均得到270組數(shù)據(jù),隨機(jī)選取200組數(shù)據(jù)進(jìn)行模型的訓(xùn)練,剩余70組數(shù)據(jù)進(jìn)行預(yù)測(cè)。
為了對(duì)模型的預(yù)測(cè)精度進(jìn)行評(píng)價(jià),采用2個(gè)指標(biāo)來進(jìn)行分析,分別為預(yù)測(cè)命中率(Hit rate,HR)和均方根誤差(Root mean square error,RMSE),其中HR越大,RMSE越小,說明模型的預(yù)測(cè)精度越高,公式如下:
(11)
(12)
(13)
圖3所示為ELM模型對(duì)鐵水硅含量預(yù)報(bào)結(jié)果圖,圖4所示為GA-ELM模型對(duì)鐵水硅含量預(yù)報(bào)結(jié)果圖。由圖3和圖4可以看出,在硅含量變化比較平穩(wěn)時(shí),ELM模型和IGA-ELM模型的預(yù)測(cè)效果均較好,但在硅含量波動(dòng)較大時(shí),IGA-ELM模型的預(yù)測(cè)效果明顯優(yōu)于ELM模型,而且隨著爐次的增加,IGA-ELM模型的預(yù)測(cè)值能夠更好地跟蹤實(shí)測(cè)值的變化,說明IGA-ELM模型的學(xué)習(xí)能力和泛化性能均高于ELM模型,而且IGA-ELM模型具有更高的穩(wěn)定性。
圖3 ELM模型鐵水硅含量的預(yù)報(bào)圖 圖4 ELM模型鐵水硅含量預(yù)報(bào)圖
表1所示為不同模型的鐵水硅含量預(yù)報(bào)結(jié)果對(duì)比。由表1可以看出,IGA-ELM模型的預(yù)測(cè)命中率相比于單一的ELM模型提高了10%左右,且其均方根誤差降低了0.011。由此可知,使用免疫遺傳算法優(yōu)化后的IGA-ELM模型的預(yù)測(cè)精度有了明顯的提升。
表1 不同模型的鐵水硅含量預(yù)報(bào)結(jié)果對(duì)比
(1)免疫遺傳算法有效地解決了遺傳算法在后期易出現(xiàn)退化現(xiàn)象,增加了抗體群的多樣性,避免了陷入局部最優(yōu)解,提高了全局尋優(yōu)能力。
(2)使用免疫遺傳算法來優(yōu)化極限學(xué)習(xí)機(jī)的權(quán)值和閾值,使預(yù)測(cè)模型的泛化性能、學(xué)習(xí)能力以及預(yù)測(cè)精度均有所提高,并且增加了模型的穩(wěn)定性,優(yōu)化后的模型可以有效地為高爐實(shí)際操作提供指導(dǎo)。