蔣 珂 蔣朝輝 ,2 謝永芳 潘 冬 桂衛(wèi)華
高爐煉鐵是一個(gè)連續(xù)鼓風(fēng)、周期性加料和間歇性出鐵、在高溫高壓高粉塵等惡劣環(huán)境下發(fā)生復(fù)雜物理化學(xué)反應(yīng)、劇烈的物質(zhì)與相變轉(zhuǎn)化、高強(qiáng)度轉(zhuǎn)移與傳遞的生產(chǎn)過(guò)程[1].全過(guò)程是在爐料自上而下、煤氣自下而上的相互接觸過(guò)程中完成的,高爐煉鐵過(guò)程工藝如圖1 所示[2].固體燃料(焦炭、煤粉等)、含鐵原料(燒結(jié)礦、球團(tuán)礦和塊礦)和溶劑(白云石、石灰石和錳礦等)按一定配比從爐頂裝入爐內(nèi),同時(shí)高爐下部噴煤系統(tǒng)噴吹的煤粉與熱風(fēng)爐加熱高溫?zé)犸L(fēng)中的氧氣在風(fēng)口平臺(tái)發(fā)生燃燒反應(yīng)產(chǎn)生一氧化碳和氫氣等高溫還原性氣體.上升煤氣流與下降爐料間進(jìn)行的一系列傳熱、傳質(zhì)以及干燥、蒸發(fā)、揮發(fā)、分解、還原、軟熔、造渣、滲碳、脫硫等物理化學(xué)變化后生成熔融鐵水,當(dāng)爐缸內(nèi)的鐵水到達(dá)一定容量后,使用開孔機(jī)鉆開出鐵口間歇性地排出熔融鐵水,在撇渣器處實(shí)現(xiàn)渣鐵分離后經(jīng)魚雷罐車運(yùn)至后續(xù)生產(chǎn)工序[3-5].
圖1 高爐三維仿真模擬圖Fig.1 Three-dimensional simulation diagram of the blast furnace cast field
時(shí)延特性是所有流程工業(yè),包括但不限于高爐冶煉過(guò)程的一個(gè)共有屬性,主要是由爐料傳輸反應(yīng)時(shí)間和冶煉單元在空間和時(shí)間分布上的差異所造成的.由于爐料無(wú)法被標(biāo)記跟蹤,導(dǎo)致很難確定高爐上部布料制度改變后多久才能影響到運(yùn)行狀態(tài)和爐缸內(nèi)的鐵水質(zhì)量.此外,在高爐不同的空間位置上分布著不同的冶煉單元,比如高爐中下部連通的熱風(fēng)爐系統(tǒng)和噴煤系統(tǒng),與噴煤和熱風(fēng)相關(guān)的控制變量對(duì)運(yùn)行狀態(tài)和鐵水質(zhì)量的影響也存在一定的時(shí)延,主要是因?yàn)樯仙母邷孛簹饬骱拖陆档臓t料發(fā)生物理化學(xué)反應(yīng)需要一定的時(shí)間.
高爐冶煉過(guò)程時(shí)延的存在,不僅增加了運(yùn)行狀態(tài)在線監(jiān)測(cè)和鐵水質(zhì)量在線建模的難度,也加大了運(yùn)行狀態(tài)和鐵水質(zhì)量調(diào)控的難度.當(dāng)?shù)V源改變或者外界干擾引起高爐冶煉過(guò)程穩(wěn)態(tài)工作點(diǎn)改變時(shí),一般需要依靠經(jīng)驗(yàn)豐富的現(xiàn)場(chǎng)操作者基于經(jīng)驗(yàn)進(jìn)行調(diào)節(jié),逐漸過(guò)渡到新的穩(wěn)態(tài)工作點(diǎn),這種動(dòng)態(tài)調(diào)節(jié)較為粗放,主觀性較強(qiáng),并且高爐冶煉過(guò)程的滯后性使得動(dòng)態(tài)調(diào)整的時(shí)間往往過(guò)長(zhǎng).長(zhǎng)時(shí)間的爐況不穩(wěn)定造成鐵水成分波動(dòng)大、鐵水質(zhì)量不合格,會(huì)給鋼鐵企業(yè)帶來(lái)大量的能源和資源的浪費(fèi).因此,分析和準(zhǔn)確估計(jì)高爐冶煉過(guò)程時(shí)延特性和參數(shù),對(duì)運(yùn)行狀態(tài)和鐵水質(zhì)量的建模和優(yōu)化控制具有重要的意義[6].
高爐的運(yùn)行狀態(tài)需要從原料、操作、出鐵等方面考慮多個(gè)指標(biāo)綜合衡量,鐵水質(zhì)量就是其中一個(gè)重要的指標(biāo)[7-10],因此本文主要聚焦于估計(jì)高爐冶煉過(guò)程的關(guān)鍵過(guò)程變量相對(duì)于鐵水質(zhì)量變量的時(shí)延參數(shù).鐵水溫度和硅含量是表征鐵水質(zhì)量的重要參數(shù),考慮到前期工作研發(fā)的紅外視覺檢測(cè)系統(tǒng)能實(shí)現(xiàn)出鐵口鐵水溫度的實(shí)時(shí)在線檢測(cè)[11],為此,本文工作主要是估計(jì)關(guān)鍵過(guò)程變量相對(duì)于鐵水硅含量的時(shí)延參數(shù),并為鐵水硅含量的實(shí)時(shí)建模和優(yōu)化控制提供重要的參考信息.關(guān)鍵過(guò)程變量與鐵水硅含量的時(shí)延特性具有明顯的多重性和關(guān)聯(lián)性.其中第一重是由于爐料傳輸反應(yīng)的時(shí)間和冶煉單元在空間和時(shí)間分布上的差異所導(dǎo)致的時(shí)延.第二重來(lái)自于高爐現(xiàn)場(chǎng)人工取樣、冷卻再化驗(yàn)過(guò)程和化驗(yàn)信息錄入與審核下達(dá)存在不確定的時(shí)延.除此以外,高爐內(nèi)部發(fā)生多達(dá)數(shù)百種物理化學(xué)反應(yīng)使得各過(guò)程變量之間又互相影響,導(dǎo)致過(guò)程變量的多重時(shí)延又存在關(guān)聯(lián).
現(xiàn)有時(shí)延分析是根據(jù)專家經(jīng)驗(yàn)結(jié)合相關(guān)系數(shù)得到最大相關(guān)性的某一確定滯后時(shí)間.比較常見的做法是單獨(dú)地計(jì)算不同時(shí)延步長(zhǎng)下的過(guò)程變量與質(zhì)量變量的皮爾遜相關(guān)系數(shù),最大相關(guān)系數(shù)所對(duì)應(yīng)的步長(zhǎng)即為時(shí)延時(shí)間[12-14],盡管這種方法有著便于實(shí)現(xiàn)、計(jì)算速度快等優(yōu)點(diǎn),但是,在計(jì)算時(shí)忽略了其他輔助過(guò)程變量對(duì)鐵水硅含量的影響以及過(guò)程變量之間的相互影響,即忽略了時(shí)延之間的關(guān)聯(lián)性,并且皮爾遜相關(guān)系數(shù)只能考慮兩個(gè)變量之間的線性關(guān)系,并不適合非線性強(qiáng)耦合的高爐冶煉過(guò)程.在其他工業(yè)領(lǐng)域,如石油化工過(guò)程,文獻(xiàn)[15]考慮了過(guò)程變量間的聯(lián)合互信息來(lái)確定時(shí)延參數(shù),但是基于互信息的時(shí)延聯(lián)合估計(jì)在輸入維數(shù)高、樣本數(shù)量大的情況下往往運(yùn)算時(shí)間較長(zhǎng),不利于實(shí)際的工程實(shí)踐[15].本質(zhì)上來(lái)說(shuō),無(wú)論是基于相關(guān)系數(shù)還是互信息的時(shí)延參數(shù)估計(jì)方法,都是在尋找與待估計(jì)變量相關(guān)性最大的過(guò)程變量.
現(xiàn)有的方法為過(guò)程變量之間的時(shí)延參數(shù)估計(jì)提供了很好的思路,但考慮到過(guò)程變量與硅含量之間的時(shí)延存在多重關(guān)聯(lián)性,導(dǎo)致傳統(tǒng)的單變量時(shí)延估計(jì)方法難以準(zhǔn)確地估計(jì)出復(fù)雜的高爐冶煉過(guò)程真實(shí)時(shí)延.隨著集散控制系統(tǒng)和工業(yè)互聯(lián)網(wǎng)成功運(yùn)用以來(lái),高爐冶煉系統(tǒng)已積累了海量能反映冶煉過(guò)程的知識(shí)和數(shù)據(jù),這些數(shù)據(jù)中隱含著過(guò)程的多重關(guān)聯(lián)時(shí)延特性.因此,本文從數(shù)據(jù)驅(qū)動(dòng)的角度出發(fā),提出了一種基于時(shí)序關(guān)聯(lián)矩陣的過(guò)程變量多重關(guān)聯(lián)時(shí)延參數(shù)估計(jì)方法,采用多元時(shí)間序列描述不同時(shí)延系統(tǒng)的多重關(guān)聯(lián)特性,運(yùn)用時(shí)基標(biāo)識(shí)不同時(shí)延的反饋信息,改變多元時(shí)間序列和時(shí)基,來(lái)尋找隱藏在數(shù)據(jù)中的真實(shí)時(shí)延參數(shù).具體而言,以變量在某段時(shí)間穩(wěn)定運(yùn)行的數(shù)據(jù)為對(duì)象,根據(jù)過(guò)程變量的時(shí)延序列重構(gòu)對(duì)應(yīng)的時(shí)序關(guān)聯(lián)矩陣,并引入灰色關(guān)聯(lián)度來(lái)量化時(shí)序關(guān)聯(lián)矩陣的多重關(guān)聯(lián)相關(guān)性.
此外,考慮到單個(gè)變量的時(shí)延參數(shù)的取值ci為預(yù)估時(shí)延區(qū)間內(nèi)采樣周期整數(shù)倍個(gè)數(shù),不失一般性,若估計(jì)N個(gè)過(guò)程變量相對(duì)于硅含量的時(shí)延參數(shù),可能的時(shí)序關(guān)聯(lián)矩陣將會(huì)有種可能.窮舉計(jì)算所有可能時(shí)延組合下的時(shí)序關(guān)聯(lián)矩陣的相關(guān)性是非常耗時(shí)的,因此在保證精度的前提下,以盡量小的計(jì)算開銷,快速估計(jì)出最優(yōu)的時(shí)延參數(shù)是十分必要的.基于此,本文提出了一種雙尺度協(xié)同搜索策略的動(dòng)態(tài)多群粒子群算法用來(lái)快速搜尋具有最大相關(guān)性的時(shí)序關(guān)聯(lián)矩陣,將多重關(guān)聯(lián)時(shí)延參數(shù)估計(jì)問(wèn)題轉(zhuǎn)化為求解一系列時(shí)序關(guān)聯(lián)矩陣的最大相關(guān)性的優(yōu)化問(wèn)題.最后,根據(jù)估計(jì)的時(shí)延參數(shù)在時(shí)序上重新配準(zhǔn)過(guò)程變量和硅含量時(shí)間序列來(lái)恢復(fù)真實(shí)的數(shù)據(jù)分布,提高了建模數(shù)據(jù)的準(zhǔn)確性和一致性.數(shù)值仿真的結(jié)果和高爐冶煉過(guò)程定性的分析結(jié)果和定量的硅含量在線預(yù)測(cè)結(jié)果也進(jìn)一步驗(yàn)證本文所提方法的可行性和有效性.
高爐冶煉過(guò)程測(cè)量數(shù)據(jù)的準(zhǔn)確性和有效性是過(guò)程建模、優(yōu)化控制與性能評(píng)估的核心,作為一種典型的具有多重關(guān)聯(lián)時(shí)延特性的生產(chǎn)過(guò)程,時(shí)延特性反映了冶煉過(guò)程的動(dòng)態(tài)因果關(guān)系.因此,若不考慮高爐冶煉過(guò)程的多重關(guān)聯(lián)時(shí)延問(wèn)題,則關(guān)鍵過(guò)程變量與鐵水硅含量之間實(shí)際的因果關(guān)系將被打亂.本文的主要工作是充分挖掘大量歷史數(shù)據(jù)的分布規(guī)律,從中估計(jì)出過(guò)程變量相對(duì)于硅含量的多重關(guān)聯(lián)時(shí)延參數(shù).
為了實(shí)時(shí)監(jiān)測(cè)高爐冶煉過(guò)程的運(yùn)行狀態(tài),假設(shè)在高爐四周安裝了如圖2(a)所示的多個(gè)傳感器,其中x0表示硅含量,xi表示第i個(gè)過(guò)程變量.假設(shè)樣本實(shí)時(shí)且均勻地在時(shí)間軸上采樣M次,若不考慮過(guò)程變量與硅含量之間的多重關(guān)聯(lián)時(shí)延,那么在第t時(shí)刻與硅含量對(duì)應(yīng)的過(guò)程變量為如圖2(b)所示時(shí)間序列數(shù)據(jù),即:
圖2 高爐煉鐵過(guò)程中變時(shí)滯問(wèn)題描述Fig.2 Illustration of variable time-delay problem in the blast furnace ironmaking process
但是,由爐料傳輸反應(yīng)時(shí)間和冶煉單元在空間和時(shí)間分布上的差異可知,不同的過(guò)程變量與鐵水硅含量之間有著不同的時(shí)延,假設(shè)鐵水硅含量與各過(guò)程變量之間真實(shí)的多重關(guān)聯(lián)時(shí)延為Γ',即:
因此本文的目的就是基于高爐冶煉過(guò)程保存的大量的生產(chǎn)運(yùn)行數(shù)據(jù)估計(jì)出最優(yōu)的多重關(guān)聯(lián)時(shí)延序列 Γ,使 得根據(jù)估計(jì)出來(lái)的時(shí)延參數(shù),在時(shí)序上重構(gòu)過(guò)程變量與硅含量之間的對(duì)應(yīng)關(guān)系,消除時(shí)延后的時(shí)間序列數(shù)據(jù)如圖2(c)所示,即:
為了準(zhǔn)確地估計(jì)各輔助過(guò)程變量的時(shí)延參數(shù),本文提出了一種基于時(shí)序關(guān)聯(lián)矩陣的過(guò)程變量多重關(guān)聯(lián)時(shí)延估計(jì)方法.引入灰色關(guān)聯(lián)分析來(lái)定量描述時(shí)序關(guān)聯(lián)矩陣的多重關(guān)聯(lián)相關(guān)性,并提出一種基于雙尺度協(xié)同搜索策略的動(dòng)態(tài)多群粒子群算法用來(lái)快速尋找最優(yōu)時(shí)延參數(shù).
高爐冶煉過(guò)程中保存著大量的生產(chǎn)運(yùn)行數(shù)據(jù),這些數(shù)據(jù)隱含著過(guò)程變量與硅含量之間時(shí)延特性.為了分析時(shí)延的多重關(guān)聯(lián)性,需要將待估計(jì)的所有過(guò)程變量歸納到一起進(jìn)行綜合考慮.定義鐵水硅含量為零時(shí)延參考變量,基于時(shí)延參數(shù)在時(shí)序上重構(gòu)過(guò)程變量數(shù)據(jù)形成對(duì)應(yīng)的多元時(shí)間序列,重構(gòu)的過(guò)程變量與硅含量組成能反映不同時(shí)延特性的時(shí)序關(guān)聯(lián)矩陣.
假設(shè)在高爐冶煉過(guò)程中,從上到下在豎式容器四周安裝了N個(gè)傳感器,在時(shí)間軸上采樣M次可以得到過(guò)程變量形成的原始時(shí)序數(shù)據(jù)矩陣X:
原始時(shí)序數(shù)據(jù)矩陣中元素的下標(biāo)代表過(guò)程變量,上標(biāo)代表采樣時(shí)刻.其中x0為零時(shí)延參考變量鐵水硅含量的時(shí)間序列數(shù)據(jù),xi為第i個(gè)過(guò)程變量的時(shí)間序列數(shù)據(jù).
為了避免多重關(guān)聯(lián)時(shí)延估計(jì)過(guò)程中量綱對(duì)結(jié)果的影響,需要將原始時(shí)序數(shù)據(jù)矩陣X進(jìn)行歸一化處理,公式如下:
假設(shè)估計(jì)的零時(shí)延參考變量(鐵水硅含量)與各過(guò)程變量的多重關(guān)聯(lián)時(shí)延參數(shù)用時(shí)延序列表示,即:
原始時(shí)序數(shù)據(jù)矩陣中各過(guò)程變量的采樣周期記為T,則第i個(gè)過(guò)程變量相對(duì)于零時(shí)延參考變量的時(shí)延參數(shù)需要滿足:
式中,D是時(shí)基序列,di是第i個(gè)過(guò)程變量的時(shí)基,是一個(gè)無(wú)量綱的整數(shù),這樣可以保證過(guò)程變量的多重關(guān)聯(lián)時(shí)延參數(shù)為采樣周期的整數(shù)倍,這是為了確保過(guò)程變量在時(shí)序上重構(gòu)的可行性.
經(jīng)過(guò)歸一化處理后的原始時(shí)序數(shù)據(jù)矩陣中隱藏著高爐冶煉過(guò)程的時(shí)延特性.為了估計(jì)出不同過(guò)程變量的多重關(guān)聯(lián)時(shí)延參數(shù),在時(shí)空維度上重構(gòu)不同時(shí)基序列下的過(guò)程變量與鐵水硅含量組成的時(shí)序關(guān)聯(lián)矩陣,運(yùn)用時(shí)基標(biāo)識(shí)不同時(shí)延的反饋信息.其重構(gòu)過(guò)程如下,首先從零時(shí)延參考變量中選取從第t時(shí)刻開始采樣頻率為T的F個(gè)數(shù)據(jù)構(gòu)成時(shí)間序列
使得序列所含的數(shù)據(jù)至少能包含從高爐頂部布料到爐缸出鐵的一個(gè)完整的冶煉周期,并且從采樣時(shí)刻t開始選取的F個(gè)數(shù)據(jù)需要保證包含零時(shí)延參考變量的一個(gè)過(guò)渡態(tài).
考慮到高爐是一個(gè)豎式的冶煉容器,鐵水硅含量的采樣點(diǎn)在垂直方向上等效于高爐底部,其余的過(guò)程變量xi監(jiān)測(cè)點(diǎn)位于高爐底部及上方,根據(jù)上文定義的多重關(guān)聯(lián)時(shí)延序列可知,相對(duì)于鐵水硅含量,過(guò)程變量xi相對(duì)于零時(shí)延參考變量的滯后系數(shù)為τi,因此取過(guò)程變量xi從t-τi時(shí)刻開始的F個(gè)數(shù)據(jù)生成新的時(shí)間序列x˙i,即從t-diT開始的連續(xù)F個(gè)采樣數(shù)據(jù):
按照上述規(guī)則就可以根據(jù)時(shí)延序列重構(gòu)出新的數(shù)據(jù)矩陣,即根據(jù)過(guò)程變量的時(shí)延參數(shù)在時(shí)空上重構(gòu)的時(shí)序關(guān)聯(lián)矩陣
時(shí)序關(guān)聯(lián)矩陣將過(guò)程變量在不同時(shí)延參數(shù)下的時(shí)間序列數(shù)據(jù)歸納在一起,為了有效地描述多元時(shí)間序列數(shù)據(jù)之間的相關(guān)程度,必須對(duì)時(shí)序關(guān)聯(lián)矩陣的相關(guān)性進(jìn)行量化.灰色關(guān)聯(lián)分析是多元時(shí)間序列關(guān)聯(lián)分析中常用的方法,其通過(guò)灰色關(guān)聯(lián)度來(lái)定量描述多組變量之間的變化趨勢(shì),多組變量之間的關(guān)聯(lián)度越高,灰色關(guān)聯(lián)度越大,反之亦然[16].此外,灰色關(guān)聯(lián)分析對(duì)數(shù)據(jù)數(shù)量和分布規(guī)律沒有要求[17].因此,本文采用灰色關(guān)聯(lián)度來(lái)衡量多個(gè)時(shí)間序列數(shù)據(jù)之間的相關(guān)程度,即表示相互影響的過(guò)程變量時(shí)間序列數(shù)據(jù)與鐵水硅含量時(shí)間序列數(shù)據(jù)之間的相關(guān)性.
令重構(gòu)的時(shí)序關(guān)聯(lián)矩陣中的零時(shí)延鐵水硅含量序列為母序列,需要估計(jì)時(shí)延參數(shù)的多元過(guò)程變量為子序列,首先計(jì)算母序列與子序列對(duì)應(yīng)元素之差,用矩陣A表示:
令a=min{aji},b=max{aji},則灰色關(guān)聯(lián)系數(shù)矩陣可用γ表示:
式中,ρ是分辨系數(shù),ρ越小表示分辨能力越大,根據(jù)現(xiàn)有參考文獻(xiàn)可知ρ=0.5 計(jì)算的灰色關(guān)聯(lián)系數(shù)矩陣更能反映實(shí)際的多元變量之間的相關(guān)關(guān)系[18].灰色關(guān)聯(lián)系數(shù)矩陣描述的是多元子序列(過(guò)程變量) 與母序列(零時(shí)延硅含量) 在不同采樣時(shí)刻之間的相關(guān)程度,為了描述子序列與母序列之間的總體關(guān)聯(lián)程度,將灰色關(guān)聯(lián)系數(shù)矩陣中的元素按列求取均值,即子序列相對(duì)于母序列的灰色關(guān)聯(lián)度定義為:
為了定量描述重構(gòu)的時(shí)序關(guān)聯(lián)矩陣各過(guò)程變量與鐵水硅含量之間的多重關(guān)聯(lián)程度,采用灰色關(guān)聯(lián)度之和R來(lái)描述多元過(guò)程變量與硅含量之間的總體相關(guān)性,其中R表示為:
灰色關(guān)聯(lián)度之和R能在一定程度上度量時(shí)序關(guān)聯(lián)矩陣中多元時(shí)間序列之間的相關(guān)性,R的值越大表明多元時(shí)間序列相關(guān)性越強(qiáng),此時(shí)對(duì)應(yīng)的多重關(guān)聯(lián)時(shí)延 Γ 即為高爐冶煉過(guò)程的真實(shí)多重關(guān)聯(lián)時(shí)延 Γ'.
根據(jù)式(6)可知,每個(gè)過(guò)程變量xi相比于零時(shí)延參考變量硅含量都有一個(gè)時(shí)延參數(shù).考慮到高爐四周安裝的傳感器和控制點(diǎn)位置不同,導(dǎo)致過(guò)程變量相對(duì)于鐵水硅含量的時(shí)延參數(shù)是不一樣的.如高爐頂部上料系統(tǒng)檢測(cè)數(shù)據(jù)的時(shí)延明顯就要比高爐中下部熱風(fēng)爐系統(tǒng)檢測(cè)數(shù)據(jù)的時(shí)延要長(zhǎng).加上入爐礦源和冶煉參數(shù)的變化,每個(gè)過(guò)程變量的時(shí)延參數(shù)也處于動(dòng)態(tài)變化的過(guò)程中,因此需要對(duì)各過(guò)程變量時(shí)延取值范圍的上下界進(jìn)行適當(dāng)放寬,這樣就可以得到過(guò)程變量xi的取值范圍
由本文所研究的中國(guó)西南某鋼鐵廠2#2650 m3高爐的冶煉工藝特點(diǎn)可知,其冶煉過(guò)程是一個(gè)周期性布料,間歇式出鐵的過(guò)程.根據(jù)現(xiàn)場(chǎng)的專家經(jīng)驗(yàn)知識(shí)可知,下降的爐料與上升的熱風(fēng)在爐內(nèi)發(fā)生1~2 h 物理化學(xué)反應(yīng)后會(huì)打開爐缸下方的出鐵口間歇性地排出鐵水,考慮到這種情況下投入的爐料可能沒有完全完成一個(gè)冶煉周期,因此對(duì)基于專家經(jīng)驗(yàn)確定的時(shí)延區(qū)間進(jìn)一步放寬到 1~4 h.再考慮到時(shí)延的多重性,即鐵水硅含量現(xiàn)場(chǎng)采樣、冷卻后離線化驗(yàn)和信息錄入還存在 1~1.5 h 的滯后,綜合考慮認(rèn)為高爐冶煉過(guò)程中各過(guò)程變量相對(duì)于零時(shí)延參考變量硅含量的時(shí)延區(qū)間預(yù)估為1~6 h.根據(jù)過(guò)程變量xi時(shí)延區(qū)間的取值范圍可以計(jì)算出對(duì)應(yīng)的時(shí)基區(qū)間為考慮到di只能取整數(shù),記di的取值范圍為因此過(guò)程變量xi時(shí)基的可能取值個(gè)數(shù)為:
需要注意的是,本文所有過(guò)程變量的時(shí)延區(qū)間都設(shè)置為一樣的范圍,過(guò)程變量xi時(shí)延區(qū)間下限為所有過(guò)程變量中時(shí)延最小值,上限為所有過(guò)程變量中時(shí)延最大值.盡管這樣會(huì)放寬高爐中部或者底部檢測(cè)到的部分過(guò)程變量的時(shí)延區(qū)間范圍,增加時(shí)序關(guān)聯(lián)矩陣的數(shù)量,但能在一定程度上避免由于專家經(jīng)驗(yàn)的主觀性導(dǎo)致部分過(guò)程變量時(shí)延區(qū)間預(yù)估不準(zhǔn),進(jìn)而導(dǎo)致時(shí)序關(guān)聯(lián)矩陣不全和估計(jì)的多重關(guān)聯(lián)時(shí)延序列不準(zhǔn)確的問(wèn)題.
時(shí)序關(guān)聯(lián)矩陣的數(shù)量與過(guò)程變量和時(shí)基個(gè)數(shù)呈爆炸式增長(zhǎng),利用窮舉計(jì)算的方法雖能保證得到最優(yōu)的時(shí)基序列,但是該方法具有很大的計(jì)算開銷和時(shí)間復(fù)雜度.為此,本文提出一種基于雙尺度協(xié)同搜索策略的動(dòng)態(tài)多群粒子群來(lái)快速搜尋高爐冶煉過(guò)程真實(shí)的多重關(guān)聯(lián)時(shí)延,也就是基于時(shí)延參數(shù)重構(gòu)的具有最大相關(guān)性的時(shí)序關(guān)聯(lián)矩陣,將多重關(guān)聯(lián)時(shí)延估計(jì)問(wèn)題轉(zhuǎn)化為求解一系列時(shí)序關(guān)聯(lián)矩陣的最大灰色關(guān)聯(lián)度之和的優(yōu)化問(wèn)題.
粒子群算法(Particle swarm optimization,PSO)是一種經(jīng)典的智能優(yōu)化算法,具有結(jié)構(gòu)簡(jiǎn)單、調(diào)整參數(shù)少、收斂速度快等優(yōu)點(diǎn)[19],因此本文采用粒子群算法來(lái)搜索最優(yōu)的多重關(guān)聯(lián)時(shí)延參數(shù).粒子群算法將群體中的鳥抽象為沒有質(zhì)量和體積的粒子,每個(gè)粒子包含兩個(gè)向量: 位置向量和速度向量.位置向量代表了粒子在搜索空間的位置,即優(yōu)化問(wèn)題的一個(gè)備選解[20],速度向量代表了粒子在搜索過(guò)程中的運(yùn)動(dòng)狀態(tài).備選解的好壞由適應(yīng)度函數(shù)來(lái)評(píng)價(jià).在本文所研究的多重關(guān)聯(lián)時(shí)延參數(shù)估計(jì)問(wèn)題中,相對(duì)于零時(shí)延參考變量硅含量有N個(gè)過(guò)程變量的時(shí)延參數(shù)需要估計(jì).因此,粒子群需要在N維空間中搜索最優(yōu)時(shí)基序列,評(píng)價(jià)時(shí)基序列好壞的適應(yīng)度函數(shù)為重構(gòu)的時(shí)序關(guān)聯(lián)矩陣的灰色關(guān)聯(lián)度之和R.假設(shè)N維空間中第i個(gè)粒子的位置向量表示為其中其對(duì)應(yīng)的速度向量表示為其中第i個(gè)粒子的速度和位置更新的數(shù)學(xué)描述如下:
式中,pbesti是第i個(gè)粒子在當(dāng)前迭代次數(shù)之前的個(gè)體歷史最優(yōu)位置向量,gbest是種群中所有粒子在當(dāng)前迭代次數(shù)之前的全局最優(yōu)位置向量.ω是速度的慣性權(quán)重,c1和c2分別表示第i個(gè)粒子向pbesti和gbest靠近的權(quán)值系數(shù),r1和r2表示在區(qū)間 [ 0, 1] 內(nèi)均勻分布的隨機(jī)數(shù).
由式(20)和式(21)可以看出,經(jīng)典的PSO 算法中粒子主要通過(guò)向全局最優(yōu)粒子學(xué)習(xí)來(lái)更新自己的速度和位置,當(dāng)全局最優(yōu)粒子陷入局部最優(yōu)時(shí)進(jìn)化停滯,導(dǎo)致算法將過(guò)早收斂.因此為了解決PSO算法易于過(guò)早收斂的缺點(diǎn),本文提出了一種基于雙尺度協(xié)同搜索策略的動(dòng)態(tài)多群粒子群優(yōu)化算法(Dynamic multi-swarm particle swarm optimization based on double-scale collaborative search strategy,DMS-PSO-CS).首先,為了平衡粒子群的全局搜索能力和局部搜索能力,將粒子群分為兩個(gè)尺度,即探索性子群和探測(cè)性子群.大尺度的探索性子群主要聚焦全局搜索能力,能快速定位到最優(yōu)解的區(qū)域,具有一定的空間勘探能力.小尺度的探測(cè)性子群主要聚焦于局部精細(xì)搜索能力,能在最優(yōu)解附近進(jìn)行精確的搜索,具有較強(qiáng)的開采能力.其中,雙尺度的粒子主要是通過(guò)粒子的慣性權(quán)重和最大速度來(lái)描述.較大的慣性權(quán)重可以提升粒子的跳躍能力,增強(qiáng)全局探索能力,而較小的慣性權(quán)重則可以精確搜索當(dāng)前區(qū)域,增強(qiáng)局部探測(cè)能力.另一方面,粒子的最大速度vmax決定了粒子在迭代過(guò)程中的最大移動(dòng)距離,較大vmin能獲得較強(qiáng)的全局搜索能力但容易錯(cuò)過(guò)最優(yōu)解,反之能獲得較強(qiáng)的局部精細(xì)搜索能力但容易陷入局部最優(yōu)解.
大尺度探索性子群的權(quán)重調(diào)整策略和最大速度分別為:
式中,ωl和vl,max分別為探索性粒子的慣性權(quán)重和最大速度,ωmax和ωmin分別為權(quán)重的上限和下限,kmax為最大的迭代次數(shù).需要注意的是探索性子群的慣性權(quán)重是跟迭代次數(shù)有關(guān)的周期性振蕩函數(shù).大尺度探索性子群的速度向量更新公式如下:
式中,lbest是探索性子群的全局最優(yōu)位置,位置向量通過(guò)式(21)更新.
小尺度探測(cè)性子群的權(quán)重調(diào)整策略和最大速度分別為:
式中ωs和vs,max分別為探測(cè)性粒子的慣性權(quán)重和最大速度,m ax(vmax) 和 m in(vmax) 分別為最大速度的上限和下限.需要注意的是探測(cè)性子群的慣性權(quán)重是跟迭代次數(shù)有關(guān)的單調(diào)遞減函數(shù),最大速度是跟迭代次數(shù)有關(guān)的線性下降函數(shù).
其次,為了增加探測(cè)性子群的多樣性,將探測(cè)性子群分為多個(gè)動(dòng)態(tài)小子群,避免子群最優(yōu)粒子陷入局部最優(yōu)導(dǎo)致整個(gè)子群提前收斂的問(wèn)題.并且,為了能快速地搜索到全局最優(yōu)解,提出了一種探索性子群和探測(cè)性子群協(xié)同搜索策略,小尺度探測(cè)性子群粒子的位置更新不僅要根據(jù)上一時(shí)刻粒子本身的速度和粒子歷史時(shí)刻最優(yōu)位置決定,還要考慮到探測(cè)性子群的局部最優(yōu)位置與探索性子群局部最優(yōu)位置之間的關(guān)系.具體來(lái)說(shuō),當(dāng)探索性子群局部最優(yōu)位置的適應(yīng)度函數(shù)優(yōu)于探測(cè)性子群的局部最優(yōu)位置對(duì)應(yīng)的適應(yīng)度函數(shù)值,探測(cè)性子群的粒子在更新的時(shí)候就會(huì)有選擇地向探索性子群局部最優(yōu)粒子方向靠近,精細(xì)搜索該區(qū)域提高收斂精度.小尺度探測(cè)性子群的速度向量更新公式如下:
式中,sbestj為探測(cè)性子群中第j個(gè)小子群的全局最優(yōu)位置,f(·) 為粒子的適應(yīng)度函數(shù).將探測(cè)性子群分為多個(gè)小子群能增加空間搜索的廣泛性,避免跟隨全局最優(yōu)粒子的位置而提前收斂,位置向量通過(guò)式(21)更新.
最后,迭代一定次數(shù)后對(duì)粒子群進(jìn)行隨機(jī)打亂和重組,這種隨機(jī)重組策略可以看作粒子間周期性的信息交換,重組后能改變粒子的鄰域拓?fù)浣Y(jié)構(gòu),使得原本處于探索狀態(tài)的粒子對(duì)搜索空間進(jìn)行探測(cè),處于探測(cè)狀態(tài)的粒子對(duì)搜索空間進(jìn)行探索.該策略能夠增強(qiáng)粒子群的搜索空間,很大程度上避免算法陷入局部最優(yōu).綜上所述,基于雙尺度協(xié)同搜索策略的動(dòng)態(tài)多群粒子群優(yōu)化算法流程如下:
算法 1.雙尺度協(xié)同搜索策略的動(dòng)態(tài)多群粒子群優(yōu)化算法
將本文所提的基于雙尺度協(xié)同搜索策略的動(dòng)態(tài)多群粒子群算法用來(lái)尋找最優(yōu)時(shí)基序列,需要注意的是,考慮到時(shí)基di只能取整數(shù),因此每個(gè)粒子的位置向量都被限制為正整數(shù).基于雙尺度協(xié)同搜索策略的動(dòng)態(tài)多群粒子群算法尋找最優(yōu)時(shí)基序列流程如圖3 所示,具體步驟如下:
圖3 基于DMS-PSO-CS 算法的時(shí)延參數(shù)估計(jì)框架Fig.3 Time-delay parameter estimation framework based on DMS-PSO-CS algorithm
步驟 1.根據(jù)專家經(jīng)驗(yàn)和高爐冶煉過(guò)程機(jī)理分析,從高爐歷史數(shù)據(jù)庫(kù)中挑選出與鐵水硅含量相關(guān)的過(guò)程變量組成原始數(shù)據(jù)集X=[x0,x1,···,xi,···,xN],其中為零時(shí)延參考變量鐵水硅含量,xi為第i個(gè)對(duì)硅含量有影響的過(guò)程變量;
步驟 2.對(duì)采集的數(shù)據(jù)進(jìn)行相關(guān)數(shù)據(jù)預(yù)處理,包括異常值剔除、缺失值處理、歸一化處理,預(yù)處理之后的數(shù)據(jù)集記為
步驟 3.分析各過(guò)程變量相對(duì)于鐵水硅含量的時(shí)延預(yù)估區(qū)間,確定時(shí)延序列τN]中各時(shí)延參數(shù)的取值范圍
步驟 4.隨機(jī)初始化雙尺度協(xié)同搜索粒子群中粒子的參數(shù),根據(jù)粒子的位置參數(shù)構(gòu)造對(duì)應(yīng)的時(shí)序關(guān)聯(lián)矩陣并計(jì)算各粒子對(duì)應(yīng)的適應(yīng)度函數(shù)更新個(gè)體最優(yōu)和子群最優(yōu);
步驟 5.判斷算法是否達(dá)到最大迭代次數(shù),如達(dá)到,則停止尋優(yōu)并輸出全局最優(yōu)時(shí)基序列D,并基于此計(jì)算出時(shí)延序列 Γ;否則,執(zhí)行步驟6;
步驟 6.判斷算法運(yùn)行次數(shù)是否為重組周期的整數(shù)倍,如果是,則對(duì)雙尺度協(xié)同搜索粒子群進(jìn)行隨機(jī)打亂和重組,更新個(gè)體最優(yōu)和子群最優(yōu)并轉(zhuǎn)到步驟7;否則,直接執(zhí)行步驟7;
步驟 7.利用式(21)和(23)、式(21)和(25)分別更新探索性子群粒子和探測(cè)性子群粒子的速度和位置參數(shù),并重復(fù)執(zhí)行步驟 4~6 直到達(dá)到終止條件,輸出全局最優(yōu)時(shí)基序列D,并基于此計(jì)算出時(shí)延序列 Γ.
本文提出的多重關(guān)聯(lián)時(shí)延估計(jì)方法的有效性和可行性首先在一個(gè)數(shù)值仿真的實(shí)例上進(jìn)行了驗(yàn)證,接著在中國(guó)西南某鋼鐵廠2# 高爐上采集的數(shù)據(jù)進(jìn)行了工業(yè)試驗(yàn),基于本文方法估計(jì)出來(lái)的時(shí)延結(jié)果與現(xiàn)場(chǎng)的專家經(jīng)驗(yàn)較為符合,并且時(shí)序配準(zhǔn)后的數(shù)據(jù)也進(jìn)一步提高了后續(xù)硅含量軟測(cè)量模型的性能.
為了體現(xiàn)過(guò)程的非線性和時(shí)序性,數(shù)值仿真中數(shù)據(jù)的生成規(guī)則為:
式中,A∈R4×3是一個(gè)隨機(jī)生成的矩陣,?!蔙3×1是服從正態(tài)分布 N (0, 2) 生成的一個(gè)向量,f(·) 是一個(gè)矩陣函數(shù),其基本元素為非線性的sin、cos、exp 和平方函數(shù),ε∈R4×1和β∈R 是服從正態(tài)分布N(0,0.01) 生成的一個(gè)干擾項(xiàng).對(duì)于生成的1000組數(shù)據(jù),時(shí)延向量被設(shè)置為Γ'=[τ′1,τ′2,τ′3,τ′4]=[1, 2, 3, 4],即將變量x1、x2、x3、x4分別相對(duì)于x0往前推 1、2、3、4 采樣周期.變量時(shí)延區(qū)間設(shè)置為[0,10],因此對(duì)應(yīng)的時(shí)基序列和重構(gòu)的時(shí)序關(guān)聯(lián)矩陣共有個(gè).為了比較本文所提雙尺度協(xié)同搜索動(dòng)態(tài)多群粒子群優(yōu)化算法的性能,經(jīng)典的粒子群算法也被用來(lái)尋優(yōu)比較.其中,兩種算法粒子群規(guī)模都設(shè)置為30 個(gè).但DMS-PSO-CS 算法中,大尺度的探索性子群中粒子個(gè)數(shù)設(shè)置為15 個(gè),小尺度的探測(cè)性動(dòng)態(tài)子群個(gè)數(shù)設(shè)置為3 個(gè),其中粒子個(gè)數(shù)設(shè)置為5 個(gè).根據(jù)文獻(xiàn)[21]的分析可知,PSO算法權(quán)重線性下降時(shí)能取得較好的尋優(yōu)效果[21],其調(diào)整策略為:
式中,ωmax=0.9,ωmin=0.4,c1=c2=2,最大迭代次數(shù)kmax設(shè)置為500.雙尺度子群的ωmax、ωmin、c1、c2與PSO 保持一致,小尺度的探測(cè)性子群的速度上下限設(shè)置為 1 和-1,即 m ax(vmax)=1,min(vmin)=-1,重組周期Re設(shè)置為10.
此外,傳統(tǒng)的單變量時(shí)延估計(jì)方法,皮爾遜相關(guān)系數(shù)(Pearson correlation coefficient,PCC)[22]和互信息相關(guān)系數(shù)(Mutual information coefficient,MIC)[23]也用來(lái)估計(jì)時(shí)延進(jìn)行相應(yīng)的對(duì)比,即,單獨(dú)地計(jì)算不同時(shí)延步長(zhǎng)下的x1~x4與x0的相關(guān)系數(shù),最大相關(guān)系數(shù)所對(duì)應(yīng)的步長(zhǎng)即為時(shí)延時(shí)間.基于不同方法估計(jì)的時(shí)延結(jié)果見表1.由表1 可以看出,在單變量估計(jì)方法中,基于互信息系數(shù)估計(jì)的時(shí)延結(jié)果明顯優(yōu)于皮爾遜系數(shù)估計(jì)的結(jié)果,這也說(shuō)明了基于線性關(guān)系估計(jì)時(shí)延的方法并不適合具有非線性特點(diǎn)的數(shù)據(jù)模式.相比于單變量時(shí)延估計(jì)方法,基于時(shí)序關(guān)聯(lián)矩陣估計(jì)的時(shí)延參數(shù)與真實(shí)設(shè)置的時(shí)延更加一致,這也說(shuō)明了本文所提方法的有效性.此外,本文所提的雙尺度協(xié)同搜索粒子群算法在同樣的解空間中能找到更準(zhǔn)確的時(shí)延參數(shù),也驗(yàn)證了本文所提優(yōu)化算法在尋優(yōu)能力上的優(yōu)越性.
表1 數(shù)值仿真中基于不同方法估計(jì)的過(guò)程變量時(shí)延值Table 1 The estimated variable time-delay values based on different methods in numerical simulation
1)過(guò)程數(shù)據(jù)分析與預(yù)處理.根據(jù)高爐冶煉過(guò)程的工藝和現(xiàn)場(chǎng)專家經(jīng)驗(yàn)確定了對(duì)鐵水硅含量有影響的過(guò)程變量,其詳細(xì)描述如表2 所示.為了估計(jì)選取的過(guò)程變量與鐵水硅含量的時(shí)延參數(shù),選取了2 # 高爐2020 年8 月1 日至2020 年12 月17 日連續(xù)生產(chǎn)的、24 個(gè)過(guò)程變量的采樣時(shí)間序列數(shù)據(jù),其中過(guò)程變量的采樣周期大概為10 秒一次,鐵水硅含量在一個(gè)班次(8 h)大概有 6~8 個(gè)化驗(yàn)數(shù)據(jù),選取時(shí)間范圍內(nèi)過(guò)程變量有1 160 141 組,鐵水硅含量數(shù)據(jù)有7 282 組.此外,為了定性地分析時(shí)延參數(shù)估計(jì)的結(jié)果準(zhǔn)確性,與硅含量有著一定正相關(guān)關(guān)系的鐵水溫度數(shù)據(jù)也加入分析,其中鐵水溫度數(shù)據(jù)是由前期工作中研發(fā)的出鐵口紅外視覺檢測(cè)系統(tǒng)實(shí)時(shí)在線檢測(cè)的[11].需要說(shuō)明的是,鐵水溫度的檢測(cè)跟硅含量離線取樣基本是在同一垂直位置進(jìn)行的,因此鐵水溫度跟硅含量,在理論上只存在化驗(yàn)過(guò)程的時(shí)延,選取時(shí)間范圍內(nèi)鐵水溫度數(shù)據(jù)有172 352 組.
表2 基于不同方法估計(jì)的過(guò)程變量時(shí)延參數(shù)Table 2 The estimated process variable time-delay values based on different methods
為提高多重關(guān)聯(lián)時(shí)延估計(jì)結(jié)果準(zhǔn)確性,需要對(duì)數(shù)據(jù)集進(jìn)行相關(guān)預(yù)處理,得到標(biāo)準(zhǔn)的和干凈的數(shù)據(jù)提供給后續(xù)的流程.對(duì)于休風(fēng)以及設(shè)備故障等原因造成的缺失數(shù)據(jù)直接刪除,對(duì)于設(shè)備故障或者人工錄入錯(cuò)誤而導(dǎo)致的異常數(shù)據(jù)通過(guò)箱線圖直接剔除[24].對(duì)于采樣頻率不一致導(dǎo)致過(guò)程變量與鐵水硅含量數(shù)據(jù)時(shí)標(biāo)不對(duì)齊的問(wèn)題,首先將過(guò)程變量和硅含量數(shù)據(jù)集通過(guò)時(shí)標(biāo)進(jìn)行匹配,再以小時(shí)為單位進(jìn)行均值化處理,預(yù)處理后的過(guò)程變量數(shù)據(jù)共有111 041 組,帶標(biāo)簽的數(shù)據(jù)共有3 120 組,即為原始時(shí)序數(shù)據(jù)矩陣
2)過(guò)程變量多重關(guān)聯(lián)時(shí)延估計(jì)結(jié)果定性分析.根據(jù)前面數(shù)據(jù)預(yù)處理分析可知,需要估計(jì)出表3 中選取的25 個(gè)過(guò)程變量相對(duì)于硅含量的時(shí)延參數(shù),所以時(shí)延序列的長(zhǎng)度N=25,即粒子的位置向量根據(jù)時(shí)延區(qū)間預(yù)估分析可知考慮到原始時(shí)序數(shù)據(jù)矩陣的采樣周期T=1 h,時(shí)基區(qū)間為di ∈即可取值 1、2、3、4、5、6.
為了定性地分析估計(jì)的時(shí)延參數(shù)的準(zhǔn)確性,將不同方法估計(jì)的結(jié)果與現(xiàn)場(chǎng)專家經(jīng)驗(yàn)進(jìn)行定性的比較,其中DMS-PSO-CS 和PSO 算法中的參數(shù)與數(shù)值仿真中的設(shè)置保持一致.基于不同方法估計(jì)的過(guò)程變量時(shí)延參數(shù)如表3 所示.理論上,鐵水溫度相對(duì)于硅含量只存在化驗(yàn)過(guò)程的時(shí)延,高爐現(xiàn)場(chǎng)從取樣冷卻到化驗(yàn)得到硅含量的百分比含量,一般需要1~1.5h 的時(shí)間間隔,考慮到原始數(shù)據(jù)矩陣是按小時(shí)采樣的,因此過(guò)程變量的時(shí)基只能取小時(shí)的整數(shù)倍,理論上鐵水溫度相對(duì)于零時(shí)延硅含量只存在1h 滯后.基于時(shí)序關(guān)聯(lián)矩陣和單變量估計(jì)方法尋找到的鐵水溫度時(shí)延參數(shù)都為 1 h,符合高爐冶煉現(xiàn)場(chǎng)的實(shí)際情況.根據(jù)現(xiàn)場(chǎng)專家經(jīng)驗(yàn),高爐中下部的煤粉噴吹系統(tǒng)對(duì)調(diào)控的滯后時(shí)間為 2~3 h,而基于互信息和PSO 算法估計(jì)出來(lái)的本小時(shí)實(shí)際噴煤量對(duì)鐵水硅含量影響滯后時(shí)間都為 1 h,顯然不符合現(xiàn)場(chǎng)的專家經(jīng)驗(yàn),盡管基于皮爾遜相關(guān)系數(shù)估計(jì)出來(lái)的本小時(shí)實(shí)際噴煤量的時(shí)延為 2 h,但是其估計(jì)的實(shí)際噴煤量對(duì)鐵水硅含量影響滯后時(shí)間為 1 h,這顯然也是與專家經(jīng)驗(yàn)相違背的,而基于DMS-PSO-CS算法估計(jì)的本小時(shí)和上小時(shí)實(shí)際噴煤量對(duì)鐵水硅含量影響滯后時(shí)間分別為 3 h 和 5 h,這與現(xiàn)場(chǎng)操作者的先驗(yàn)知識(shí)更符合.高爐中下部的熱風(fēng)爐系統(tǒng)一般需要 1 h 的滯后時(shí)間才能作用到高爐調(diào)控上,基于互信息和PSO 算法估計(jì)出來(lái)的熱風(fēng)溫度對(duì)硅含量的滯后時(shí)間分別為 6 h 和 2 h,而熱風(fēng)壓力對(duì)硅含量的影響滯后時(shí)間分別為 1 h 和 5 h,理論上熱風(fēng)壓力與熱風(fēng)溫度都是由熱風(fēng)系統(tǒng)控制的,因此與熱風(fēng)相關(guān)的變量估計(jì)的時(shí)延參數(shù)不應(yīng)相差過(guò)大.相比而言,基于皮爾遜相關(guān)系數(shù)和DMS-PSO-CS 算法估計(jì)出熱風(fēng)溫度和熱風(fēng)壓力的時(shí)延更加符合現(xiàn)場(chǎng)的經(jīng)驗(yàn).總而言之,基于不同的方法估計(jì)出來(lái)的時(shí)延參數(shù)對(duì)于部分變量都有一定的合理性,但總體來(lái)看,本文所提的方法對(duì)于大部分變量估計(jì)的時(shí)延結(jié)果都比較符合現(xiàn)場(chǎng)的專家經(jīng)驗(yàn),這也進(jìn)一步說(shuō)明了本文所提的方法的有效性和可靠性.
表3 基于不同建模策略下的鐵水硅含量軟測(cè)量模型性能Table 3 Soft-sensor model performance of silicon content in molten iron based on different modeling strategies
3)過(guò)程變量多重關(guān)聯(lián)時(shí)延估計(jì)結(jié)果定量分析.為了定量地驗(yàn)證上述多重關(guān)聯(lián)時(shí)延參數(shù)估計(jì)結(jié)果的準(zhǔn)確性,將未經(jīng)時(shí)序配準(zhǔn)的數(shù)據(jù)、基于上述四種方法估計(jì)出時(shí)延后配準(zhǔn)的數(shù)據(jù)分別用于鐵水硅含量軟測(cè)量建模分析.本文的軟測(cè)量模型選用了主流的數(shù)據(jù)驅(qū)動(dòng)模型: 支持向量回歸機(jī)(Support vector regression,SVR)[6]、隨機(jī)權(quán)神經(jīng)網(wǎng)絡(luò)(Random vector functional-link network,RVFLN)[9]和深度網(wǎng)絡(luò)(Deep network stacked by denoising autoencoder,SDAE)[25].考慮到本文的主要工作聚焦于鐵水硅含量軟測(cè)量建模前期的多重關(guān)聯(lián)時(shí)延參數(shù)估計(jì),因此軟測(cè)量模型都是基本的模型結(jié)構(gòu)并沒有根據(jù)過(guò)程或者數(shù)據(jù)的特點(diǎn)進(jìn)行相應(yīng)改進(jìn).由于支持向量機(jī)和隨機(jī)權(quán)神經(jīng)網(wǎng)絡(luò)都采用有監(jiān)督的訓(xùn)練方式,因此采用2 820 組帶標(biāo)簽的樣本訓(xùn)練模型,300 組樣本用于測(cè)試模型的性能.而深度網(wǎng)絡(luò)采用半監(jiān)督的訓(xùn)練方式,即深度模型預(yù)訓(xùn)練階段,先用111 041 組過(guò)程變量無(wú)監(jiān)督的訓(xùn)練模型參數(shù),模型微調(diào)階段,在預(yù)訓(xùn)練好的深度網(wǎng)絡(luò)后加一層回歸層,并用2 820組帶標(biāo)簽的硅含量數(shù)據(jù)有監(jiān)督的微調(diào)網(wǎng)絡(luò)參數(shù).計(jì)算機(jī)配置如下: Windows 10 (64-b)操作系統(tǒng),32 GB內(nèi)存,酷睿i7-9700 (3.0 GHz) CPU,Python 編程語(yǔ)言.
為了評(píng)價(jià)不同軟測(cè)量模型的性能,本文采用均方根誤差(Root mean squared error,RMSE)和平均絕對(duì)誤差(Mean absolute error,MAE)進(jìn)行定量衡量,定義如下:
式中,yt代表鐵水硅含量實(shí)際化驗(yàn)值,代表模型預(yù)測(cè)的硅含量值,N為樣本的個(gè)數(shù).統(tǒng)計(jì)指標(biāo)RMSE 和MAE 越小表示模型的性能越好.此外,為了滿足工業(yè)現(xiàn)場(chǎng)的實(shí)時(shí)性需求,模型的訓(xùn)練時(shí)間也用來(lái)評(píng)估其性能.
為了驗(yàn)證不同方法估計(jì)的時(shí)延參數(shù)對(duì)硅含量預(yù)測(cè)性能的影響,實(shí)驗(yàn)組1、2、3、4 和 7 開展相關(guān)的對(duì)比實(shí)驗(yàn).不同對(duì)照組的詳細(xì)的實(shí)驗(yàn)對(duì)比結(jié)果如表3 所示,其中Tr 和Ts 分別代表訓(xùn)練集和測(cè)試集,深度網(wǎng)絡(luò)的訓(xùn)練時(shí)間由無(wú)監(jiān)督預(yù)訓(xùn)練和有監(jiān)督微調(diào)兩部分組成.由表3 可知,相比于過(guò)程變量無(wú)時(shí)延估計(jì)直接建立硅含量軟測(cè)量模型,基于單變量法和時(shí)序關(guān)聯(lián)矩陣確定的時(shí)延都能在一定程度上描述高爐冶煉過(guò)程的時(shí)延特性,提高硅含量預(yù)測(cè)模型的精度.在單變量時(shí)延估計(jì)方面,基于互信息估計(jì)的時(shí)延參數(shù)重構(gòu)后的樣本訓(xùn)練的硅含量模型相比于皮爾遜相關(guān)系數(shù)方法有一定的提升,說(shuō)明了基于非線性關(guān)系估計(jì)出來(lái)的時(shí)延參數(shù)更符合真實(shí)的數(shù)據(jù)分布且有利于提高模型的性能.進(jìn)一步對(duì)比本文所提出的基于時(shí)序關(guān)聯(lián)矩陣和單變量的時(shí)延估計(jì)方法,可以看出,考慮了時(shí)延多重關(guān)聯(lián)特性所確定的時(shí)延參數(shù)更能反映真實(shí)的輸入-輸出因果關(guān)系,這一點(diǎn)體現(xiàn)在實(shí)驗(yàn)組1、2、3、4 性能評(píng)價(jià)指標(biāo)上,也驗(yàn)證了本文所提出的基于時(shí)序關(guān)聯(lián)矩陣估計(jì)過(guò)程變量多重關(guān)聯(lián)時(shí)延的可行性和有效性.此外,基于DMSPSO-CS 算法時(shí)序配準(zhǔn)后的數(shù)據(jù)訓(xùn)練的硅含量軟測(cè)量模型,在測(cè)試集上統(tǒng)計(jì)的RMSE 和MAE,相比于PSO 算法時(shí)序配準(zhǔn)后的數(shù)據(jù)訓(xùn)練的模型,分別降低了0.0036 和0.0032,這也說(shuō)明相比于直接用粒子群算法尋找的最優(yōu)時(shí)延參數(shù),基于本文所提的雙尺度協(xié)同搜索策略的動(dòng)態(tài)粒子群算法尋找到的最優(yōu)時(shí)延參數(shù),能更好地恢復(fù)真實(shí)的輸入輸出時(shí)序?qū)?yīng)關(guān)系.
為了驗(yàn)證不同軟測(cè)量模型對(duì)硅含量預(yù)測(cè)性能的影響,實(shí)驗(yàn)組1、5 和 6 比較了同一批數(shù)據(jù)下相關(guān)的對(duì)比實(shí)驗(yàn).由表3 可以看出,相比于傳統(tǒng)的機(jī)器學(xué)習(xí)算法,深度學(xué)習(xí)算法的性能有一定的提升,其中一個(gè)主要的原因是深度網(wǎng)絡(luò)在無(wú)監(jiān)督預(yù)訓(xùn)練過(guò)程中充分利用了無(wú)標(biāo)簽的過(guò)程變量數(shù)據(jù),此外,這種無(wú)監(jiān)督的訓(xùn)練方式迫使隱含層能學(xué)到有用的特征表示在輸出層更好的重構(gòu)輸入,有助于挖掘數(shù)據(jù)中隱含的關(guān)系,進(jìn)而提高模型的性能.盡管支持向量回歸模型在小樣本數(shù)據(jù)集上有著出色的性能,但是并沒有在硅含量預(yù)測(cè)任務(wù)上表現(xiàn)出明顯的優(yōu)勢(shì),主要原因可能是這種淺層的模型結(jié)構(gòu)并不能很好地描述具有強(qiáng)非線性的高爐冶煉過(guò)程.相比而言,隨機(jī)權(quán)神經(jīng)網(wǎng)絡(luò)的非線性描述能力使得模型的性能有了一定的提升,但網(wǎng)絡(luò)初始化權(quán)重的隨機(jī)性和數(shù)據(jù)噪聲的影響使得模型性能還有進(jìn)一步提高的空間.在模型泛化能力方面,深度網(wǎng)絡(luò)和隨機(jī)權(quán)神經(jīng)網(wǎng)絡(luò)在測(cè)試集上的性能回落相比于訓(xùn)練集均在可接受的范圍內(nèi),說(shuō)明這兩種模型能學(xué)習(xí)到隱藏在數(shù)據(jù)背后的規(guī)律并對(duì)新的樣本展示出較好的預(yù)測(cè)精度.在模型訓(xùn)練時(shí)間方面,隨機(jī)權(quán)神經(jīng)網(wǎng)絡(luò)在這三種算法中有著明顯的優(yōu)勢(shì),展示了其在工業(yè)過(guò)程實(shí)時(shí)性方面的巨大潛力,但模型的預(yù)測(cè)精度是其工業(yè)應(yīng)用需要進(jìn)一步考慮的問(wèn)題.盡管深度網(wǎng)絡(luò)兩階段的訓(xùn)練時(shí)間遠(yuǎn)遠(yuǎn)多于其他兩種方法,但在工業(yè)應(yīng)用現(xiàn)場(chǎng)時(shí),無(wú)監(jiān)督的預(yù)訓(xùn)練完全可以離線完成,只需使用帶標(biāo)簽的樣本有監(jiān)督地在線微調(diào)預(yù)訓(xùn)練好的網(wǎng)絡(luò)結(jié)構(gòu).因此,本文所提的方法在工業(yè)現(xiàn)場(chǎng)也具有一定的應(yīng)用價(jià)值.
考慮到本文的主要目的是估計(jì)高爐冶煉過(guò)程的多重關(guān)聯(lián)時(shí)延參數(shù)并提高后續(xù)建模數(shù)據(jù)的準(zhǔn)確性和有效性,為了更直觀地展示不同方法確定的時(shí)延參數(shù)對(duì)硅含量軟測(cè)量模型的影響,圖4~ 8 分別繪制了實(shí)驗(yàn)組1、2、3、4 和 7 的預(yù)測(cè)細(xì)節(jié)信息,即不同方法配準(zhǔn)后的數(shù)據(jù)訓(xùn)練的軟測(cè)量模型預(yù)測(cè)值曲線和實(shí)際化驗(yàn)曲線以及對(duì)應(yīng)的預(yù)測(cè)誤差.從圖中可以看出,相比于沒有經(jīng)過(guò)時(shí)序配準(zhǔn)的數(shù)據(jù),使用單變量分析和時(shí)序關(guān)聯(lián)分析矩陣進(jìn)行過(guò)程變量時(shí)延參數(shù)估計(jì)后,軟測(cè)量模型的準(zhǔn)確度和跟蹤能力均要顯著優(yōu)于無(wú)時(shí)延估計(jì)的模型,說(shuō)明引入過(guò)程變量的時(shí)延信息能有效提高軟測(cè)量模型的準(zhǔn)確度.但是,相比于基于皮爾遜相關(guān)系數(shù)和互信息系數(shù)分別計(jì)算不同時(shí)延步長(zhǎng)下的最大相關(guān)性確定的時(shí)延參數(shù),考慮了時(shí)延多重關(guān)聯(lián)特性的模型性能明顯更好,模型預(yù)測(cè)誤差大都集中在現(xiàn)場(chǎng)可接受的 [-0.1, 0.1] 范圍之內(nèi).此外,對(duì)比圖4 和圖5 可以看出,經(jīng)過(guò)DMS-PSOCS 算法時(shí)序配準(zhǔn)后的數(shù)據(jù)訓(xùn)練的軟測(cè)量模型數(shù)值和趨勢(shì)跟蹤的更好,樣本預(yù)測(cè)誤差更小,也進(jìn)一步說(shuō)明了本文所提的DMS-PSO-CS 尋優(yōu)算法找到的時(shí)延參數(shù)序列,更能真實(shí)地反映模型輸入跟輸出之間的因果關(guān)系,通過(guò)提高建模數(shù)據(jù)集的質(zhì)量進(jìn)而提高模型的預(yù)測(cè)性能.
圖4 基于DMS-PSO-CS 算法時(shí)延估計(jì)的鐵水硅含量預(yù)測(cè)結(jié)果Fig.4 The prediction details of silicon content in molten iron with time-delay estimation based on DMS-PSO-CS algorithm
圖5 基于PSO 算法時(shí)延估計(jì)的鐵水硅含量預(yù)測(cè)結(jié)果Fig.5 The prediction details of silicon content in molten iron with time-delay estimation based on PSO algorithm
4)粒子群算法尋優(yōu)性能對(duì)比分析.為了快速地尋找到最優(yōu)的時(shí)延序列,本文在原始粒子群優(yōu)化算法基礎(chǔ)上提出了一種雙尺度協(xié)同搜索策略的動(dòng)態(tài)多群粒子群優(yōu)化算法,為了對(duì)比兩種算法在尋優(yōu)性能上的差異,繪制了如圖9 所示的尋優(yōu)迭代曲線圖,其適應(yīng)度函數(shù)為本文優(yōu)化的目標(biāo)函數(shù),即時(shí)序關(guān)聯(lián)矩陣的灰色關(guān)聯(lián)度.由圖9 可以看出,經(jīng)典的PSO算法在第26 次迭代時(shí)就能收斂,但是難以跳出局部最優(yōu)值.而本文所提的DMS-PSO-CS 算法在第18 次迭代的時(shí)候就能達(dá)到相同的尋優(yōu)效果,并且能多次跳出局部最優(yōu)值,迭代到第296 次才收斂.這也說(shuō)明了本文設(shè)計(jì)的雙尺度粒子群能較好地在全局探索和局部探測(cè)能力之間進(jìn)行很好的平衡,在保證當(dāng)前最優(yōu)的情況下通過(guò)周期性信息交換策略增加探索更優(yōu)解的可能.從適應(yīng)度函數(shù)來(lái)看,DMS-PSOCS 算法和原始PSO 算法最終得到的最大灰色關(guān)聯(lián)度分別為18.109 和18.442.從尋優(yōu)結(jié)果上也能看出,本文所提優(yōu)化算法的有效性和可靠性.
圖6 基于MIC 算法時(shí)延估計(jì)的鐵水硅含量預(yù)測(cè)結(jié)果Fig.6 The prediction details of silicon content in molten iron with time-delay estimation based on MIC algorithm
圖7 基于PCC 算法時(shí)延估計(jì)的鐵水硅含量預(yù)測(cè)結(jié)果Fig.7 The prediction details of silicon content in molten iron with time-delay estimation based on PCC algorithm
圖8 無(wú)時(shí)延估計(jì)的鐵水硅含量預(yù)測(cè)結(jié)果Fig.8 The prediction details of silicon content in molten iron without time-delay estimation
圖9 基于不同算法的尋優(yōu)迭代曲線Fig.9 Optimization iteration curve based on different algorithms
高爐冶煉過(guò)程大時(shí)滯特性導(dǎo)致了變量之間存在多重關(guān)聯(lián)時(shí)延,為了有效地估計(jì)變量間的時(shí)延參數(shù),本文從冶煉過(guò)程保存的運(yùn)行生產(chǎn)數(shù)據(jù)出發(fā),提出了一種基于時(shí)序關(guān)聯(lián)矩陣的過(guò)程變量多重時(shí)延參數(shù)估計(jì)方法.引入灰色關(guān)聯(lián)分析來(lái)描述重構(gòu)后的時(shí)序關(guān)聯(lián)矩陣之間的相關(guān)性,將多重關(guān)聯(lián)時(shí)延估計(jì)問(wèn)題轉(zhuǎn)化為求解一系列時(shí)序關(guān)聯(lián)矩陣最大相關(guān)性的優(yōu)化問(wèn)題.為了降低窮舉所有時(shí)序關(guān)聯(lián)矩陣的計(jì)算開銷和時(shí)間復(fù)雜度,提出了一種基于雙尺度協(xié)同搜索策略的動(dòng)態(tài)多群粒子群算法用于快速尋優(yōu),提出的雙尺度粒子能很好地平衡粒子群的全局探索能力和局部探測(cè)能力,粒子之間的周期性重組操作能在一定程度上保證算法多次跳出局部最優(yōu).相比于傳統(tǒng)的單變量時(shí)延估計(jì)方法,考慮了多重關(guān)聯(lián)時(shí)延特性估計(jì)出來(lái)的時(shí)延參數(shù)能提高數(shù)據(jù)的準(zhǔn)確性進(jìn)而提高后續(xù)硅含量預(yù)測(cè)模型的精度.此外,估計(jì)出來(lái)的時(shí)延參數(shù)也能為鐵水質(zhì)量精細(xì)化調(diào)控提供重要的參考信息,避免現(xiàn)場(chǎng)操作者頻繁調(diào)整或者過(guò)調(diào)整.
本文從數(shù)據(jù)的角度出發(fā)提出了一種多重關(guān)聯(lián)時(shí)延估計(jì)方法,但高爐冶煉過(guò)程的動(dòng)態(tài)性也是影響時(shí)延結(jié)果準(zhǔn)確性的一個(gè)重要性因素,因此爐況變動(dòng)下時(shí)延參數(shù)的動(dòng)態(tài)調(diào)整也是下一步需要考慮的問(wèn)題.此外,盡管本文提出的時(shí)延估計(jì)方法能提高數(shù)據(jù)的質(zhì)量進(jìn)而提高后續(xù)硅含量模型的預(yù)測(cè)精度,但是相比于最新的硅含量軟測(cè)量結(jié)果還有進(jìn)一步提升的空間,因此下一步可以考慮將時(shí)延參數(shù)作為軟測(cè)量模型的參數(shù),模型的性能作為時(shí)延參數(shù)準(zhǔn)確性的評(píng)價(jià)指標(biāo),進(jìn)而將后續(xù)的軟測(cè)量建模與時(shí)延估計(jì)有機(jī)結(jié)合起來(lái),在提高模型性能的同時(shí)提高時(shí)延估計(jì)結(jié)果的準(zhǔn)確性和可靠性.