暴子旗,盧才武,章 賽,宋思遠(yuǎn)
(1.西安建筑科技大學(xué)資源工程學(xué)院,陜西 西安 710055;2.西安市智慧工業(yè)感知計算與決策重點實驗室,陜西 西安 710055)
焦炭在高爐內(nèi)的作用主要有供熱劑、還原劑、骨架、滲碳劑等,除骨架作用不可替代外,其他作用均可被噴吹燃料所代替。隨著高爐煉鐵技術(shù)的進(jìn)步,焦比不斷降低,焦炭作為料柱骨架的作用更加突出,反映焦炭作為骨架能力的抗碎強度(M40)、耐磨強度(M10)、反應(yīng)性(CRI)、反應(yīng)后強度(CSR)等四項焦炭質(zhì)量指標(biāo)的好壞對高爐冶煉過程有著極大的影響[1-2],在焦炭生產(chǎn)中如何穩(wěn)定、優(yōu)化焦炭質(zhì)量,是企業(yè)面臨的重要課題[3-4]。
焦炭生產(chǎn)是一個具有多變量、非線性等復(fù)雜問題的大工業(yè)生產(chǎn)過程,在目前的焦炭生產(chǎn)中,焦?fàn)t的自動化程度仍然無法實現(xiàn)焦炭質(zhì)量的穩(wěn)定,生產(chǎn)現(xiàn)場也無法實現(xiàn)焦炭質(zhì)量指標(biāo)的在線測量,對于焦炭質(zhì)量的人工分析則存在很大的滯后性與延遲性,因此,建立一個穩(wěn)定、可靠的焦炭質(zhì)量預(yù)測模型對煉焦生產(chǎn)進(jìn)行指導(dǎo)具有十分重要的意義。
諸多學(xué)者針對焦炭質(zhì)量預(yù)測問題進(jìn)行了研究,周洪等[5]基于BP神經(jīng)網(wǎng)絡(luò)對特大型焦?fàn)t焦炭質(zhì)量進(jìn)行預(yù)測,并對影響模型預(yù)測精度的因素進(jìn)行了詳細(xì)分析,取得了較好的結(jié)果;崔慶安等[6]較早采用支持向量機預(yù)測焦炭質(zhì)量,并將其與ANN模型進(jìn)行對比,結(jié)果表明SVM模型具有更高的泛化性與預(yù)測精度;張偉峰等[7]建立了通過遺傳算法(GA)優(yōu)化BP神經(jīng)網(wǎng)絡(luò)的焦炭質(zhì)量預(yù)測模型,實例證明該模型具有較好的準(zhǔn)確度;都吉東等[8]構(gòu)建了自適應(yīng)差分進(jìn)化算法優(yōu)化的BP神經(jīng)網(wǎng)絡(luò)預(yù)測模型并進(jìn)行仿真,將該模型與BP神經(jīng)網(wǎng)絡(luò)的預(yù)測結(jié)果進(jìn)行對比分析,證明了ADE-BP神經(jīng)網(wǎng)絡(luò)預(yù)測模型具有更好的適應(yīng)性與精確度;張代林等[9]對配煤中焦炭質(zhì)量指標(biāo)進(jìn)行了分析,基于GA-SVR模型對焦炭強度進(jìn)行了預(yù)測,具有較好的準(zhǔn)確性與可靠性。但在預(yù)測模型中,BP神經(jīng)網(wǎng)絡(luò)存在難以選擇合適的網(wǎng)絡(luò)結(jié)構(gòu)、易出現(xiàn)局部極值等問題,而在對預(yù)測模型進(jìn)行優(yōu)化的算法方面,GA算法收斂速度較慢,且參數(shù)交叉率和變異率等的選擇憑借于經(jīng)驗,具有主觀性,影響參數(shù)尋優(yōu)的結(jié)果。
綜上所述,本文采用具有較強泛化能力和學(xué)習(xí)能力的支持向量回歸機作為模型建立的基礎(chǔ),引入Tent混沌映射改進(jìn)的麻雀搜索算法(TSSA)對支持向量回歸機的參數(shù)進(jìn)行優(yōu)化,建立了基于TSSA-SVR模型的焦炭質(zhì)量預(yù)測模型,提高了模型參數(shù)的搜索能力以及預(yù)測模型的精確度,并對實際生產(chǎn)中的焦炭質(zhì)量進(jìn)行預(yù)測,以驗證該模型的可行性與有效性。
f(x)=ωT×φ(x)+b
(1)
式中:φ(x)為原始特征數(shù)據(jù)的非線性映射函數(shù);ω為權(quán)向量;b∈R為閾值。
(2)
(3)
引入拉格朗日函數(shù)和核函數(shù)K(xi,xj)=φ(xi)φ(xj),可轉(zhuǎn)化為對偶形式,見式(4)和式(5)。
(4)
(5)
式中,α為拉格朗日乘子。通過求解對偶優(yōu)化問題,可以得到相應(yīng)的決策函數(shù),見式(6)。
(6)
仿生類算法在解決函數(shù)優(yōu)化問題中,通常利用隨機產(chǎn)生的數(shù)據(jù)作為初始種群信息,而初始種群的分布會對算法的尋優(yōu)精度與收斂速度產(chǎn)生很大的影響。
混沌序列具有隨機性、遍歷性和規(guī)律性等特點,通過其產(chǎn)生的初始種群可以具有較好的多樣性,并提高算法的全局搜索能力?,F(xiàn)有的混沌映射有Tent映射、Logistic映射等。但是,不同的混沌映射對于提高函數(shù)優(yōu)化能力不同。其中,單梁等[11]的研究表明,Tent映射相比Logistic映射具有更佳的遍歷性,可以生成更好的均勻序列。因此,本文引入Tent映射初始化種群,提高算法的全局搜索能力。
TENT混沌映射的表達(dá)式為式(7),即xi+1=(2xi)mod1。
(7)
(8)
變換后表達(dá)式見式(9)。
(9)
式中:N為混沌序列內(nèi)粒子個數(shù);rand(0,1)為在[0,1]之間取值的隨機數(shù)。
麻雀搜索算法(sparrow search algorithm,SSA)是受到生物界麻雀捕食和反捕食行為的啟發(fā),由XUE等[13]于2020年提出的新型仿生類算法。其仿生學(xué)原理及抽象數(shù)學(xué)表達(dá)如下所述。
麻雀覓食過程可將群體抽象為三類:發(fā)現(xiàn)者、加入者以及偵察者。具有較高適應(yīng)度的麻雀作為發(fā)現(xiàn)者,在廣泛范圍進(jìn)行搜索,并引導(dǎo)種群搜索和覓食,加入者則會跟隨發(fā)現(xiàn)者進(jìn)行覓食。而當(dāng)作為預(yù)警者的麻雀意識危險時,會對整個種群發(fā)出信號,促使整個種群立即進(jìn)行反捕食行為。
在SSA算法中,麻雀群體可表示為Xi=[xi1,…,xid,…xiD],i=1,2,…,N,N為麻雀的總數(shù),其中,Xid為第i只麻雀在第d維的位置。
在種群的發(fā)現(xiàn)者位置更新公式見式(10)。
(10)
式中:t、T分別為當(dāng)前迭代次數(shù)與最大迭代次數(shù);α為(0,1)之間的隨機取值;Q為服從標(biāo)準(zhǔn)正態(tài)分布的隨機數(shù);L為元素皆為1的矩陣,大小為1×d;R2(R2∈[0,1])為預(yù)警值;ST(ST∈[0.5,1])為安全值。以R2與ST的值進(jìn)行判定,當(dāng)R2 加入者的位置更新公式見式(11)。 (11) 偵查者一般從種群中隨機取10%~20%,其位置更新公式見式(12)。 (12) 式中:β為步長的調(diào)整參數(shù),是服從均值為0,方差為1的正態(tài)分布隨機數(shù);K為在[-1,1]之間取值的隨機數(shù),表示麻雀移動的方向;e為一個極小的常數(shù),避免出現(xiàn)分母為0的情況;fi為第i只麻雀的當(dāng)前適應(yīng)度值,fg、fw分別為在當(dāng)前種群中的最優(yōu)與最差適應(yīng)度值。當(dāng)fi≠fg時,表示該麻雀處于邊緣位置,正在受到捕食者的威脅;當(dāng)fi=fg時,表示處于種群中心的麻雀意識到了危險,需要向其他麻雀靠攏。 在SSA模型的基礎(chǔ)上引入Tent混沌映射初始化種群,增加了種群的多樣性,提高了算法搜索全局最優(yōu)的能力,混沌麻雀搜索算法的步驟如下所述。 Step1初始化參數(shù),如種群數(shù)量N、最大迭代次數(shù)、發(fā)現(xiàn)者比例PD、偵察者比例SD、目標(biāo)函數(shù)維度D,初始值上下界ub、lb,最大迭代次數(shù)T。 Step2基于Tent混沌序列初始化種群,生成N個D維向量Zi。 Step3計算各只麻雀的適應(yīng)度值,找出當(dāng)前最優(yōu)適應(yīng)度值fb和最差適應(yīng)度值fw,以及相對應(yīng)的位置xb、xw。 Step4從適應(yīng)度值較優(yōu)的麻雀中,選取部分麻雀作為發(fā)現(xiàn)者,并按照式(10)更新位置。 Step5余下麻雀作為加入者,并按照式(11)更新位置。 Step6從麻雀中隨機選擇部分麻雀作為偵查者,并按照式(12)更新位置。 Step7更新整個種群的最優(yōu)位置xb和最優(yōu)適應(yīng)度fb,以及最差位置xw和其適應(yīng)度fw。 Step8判斷是否達(dá)到結(jié)束條件,若是,則結(jié)束循環(huán),輸出最優(yōu)結(jié)果,否則跳轉(zhuǎn)Step4。 本文基于支持向量回歸機對焦炭質(zhì)量進(jìn)行預(yù)測,以配合煤中的水分Md、灰分Ad、揮發(fā)分Vdaf、硫分Std、黏結(jié)指數(shù)G,以及膠質(zhì)層指數(shù)X和Y作為輸入變量,以焦炭質(zhì)量的抗碎強度M40、耐磨強度M10、反應(yīng)性CRI、反應(yīng)后強度CSR等四項指標(biāo)為輸出變量。 SVR模型中的核函數(shù)及其參數(shù)的選取模型的回歸效果起到重要影響,核函數(shù)中的徑向基函數(shù)(RBF)具有學(xué)習(xí)能力強、收斂范圍較寬等優(yōu)點,故本文采用RBF作為核函數(shù),見式(13)。 (13) 參數(shù)選擇對SVR模型的學(xué)習(xí)效果和泛化性能有直接的影響[14],在選取RBF作為核函數(shù)的情況下,影響SVR回歸性能的主要參數(shù)有懲罰系數(shù)c和RBF核函數(shù)的寬度參數(shù)g。c表示SVR預(yù)測模型中誤差與復(fù)雜度之間的權(quán)衡,c越小則對誤差的懲罰越輕,容易導(dǎo)致模型欠擬合;c越大,表示模型越不能容忍誤差,容易使模型對訓(xùn)練數(shù)據(jù)過分學(xué)習(xí),導(dǎo)致過擬合。g表示RBF核函數(shù)的寬度,g值過小,則支持向量影響范圍過小,會導(dǎo)致模型過擬合,g值過大,則支持向量影響過強,導(dǎo)致模型預(yù)測精度低[15]。 基于此,本文引入混沌麻雀搜索算法對SVR的參數(shù)進(jìn)行優(yōu)化,尋找最優(yōu)的(cbest,gbest),而后對焦炭質(zhì)量進(jìn)行預(yù)測,其流程圖如圖1所示,具體步驟如下所述。 圖1 基于TSSA-SVR模型的焦炭質(zhì)量預(yù)測總體流程圖Fig.1 The overall flow chart of coke quality predictionbased on TSSA-SVR model 1) 載入數(shù)據(jù),并對數(shù)據(jù)進(jìn)行歸一化,并把歸一化后的100個樣本按照8∶2的比例分為訓(xùn)練集與測試集。 2) 初始化混沌麻雀搜索算法的各項參數(shù),并基于Tent映射初始化種群。 3) 以式(14)的均方誤差作為適應(yīng)度函數(shù)并計算適應(yīng)度值,以均方誤差小為佳。 (14) 4) 運行混沌麻雀搜索算法,迭代尋優(yōu)得出具有最小適應(yīng)度值的(cbest,gbest)。 5) 將(cbest,gbest)代入到SVR模型中進(jìn)行訓(xùn)練,而后基于訓(xùn)練好的TSSA-SVR模型對焦炭質(zhì)量進(jìn)行預(yù)測。 本文選取河南某焦化廠100組穩(wěn)定生產(chǎn)的焦?fàn)t數(shù)據(jù)進(jìn)行實例驗證,部分實驗數(shù)據(jù)見表1。這些生產(chǎn)數(shù)據(jù)存在維數(shù)高、量綱不統(tǒng)一、范圍較大的特點,所以為了消除不同指標(biāo)間的量綱影響,并且保證數(shù)據(jù)間的可比性,需要對數(shù)據(jù)進(jìn)行歸一化處理。本文將數(shù)據(jù)歸一化至[0,1]之間,利用的公式為式(15)。 表1 部分實驗數(shù)據(jù)Table 1 Partial experimental data (15) 式中:xi為數(shù)據(jù)的樣本值;xmax、xmin分別為每組樣本數(shù)據(jù)中的最大值、最小值;x*為數(shù)據(jù)的歸一化值。 對數(shù)據(jù)進(jìn)行預(yù)處理后,將數(shù)據(jù)導(dǎo)入TSSA-SVM模型中進(jìn)行訓(xùn)練和預(yù)測。在TSSA算法中初始化設(shè)定種群大小N=30,最大迭代次數(shù)T=50,目標(biāo)函數(shù)的維數(shù)D=2。通過TSSA算法獲得四組最優(yōu)參數(shù)(cbest,gbest),見表2,將最優(yōu)參數(shù)帶入預(yù)測模型進(jìn)行計算。 表2 TSSA-SVR模型參數(shù)尋優(yōu)結(jié)果Table 2 Parameter optimization results of TSSA-SVR model 式(14)的均方誤差(MSE)作為算法的適應(yīng)度函數(shù)fitness,以CSR的參數(shù)尋優(yōu)為例,求得適應(yīng)度曲線如圖2所示。由圖2可知,TSSA-SVR模型的適應(yīng)度值始終優(yōu)于標(biāo)準(zhǔn)的SSA-SVR模型,并且迭代較快,誤差較小,證明該算法在全局搜索上具有較優(yōu)的性能。 圖2 適應(yīng)度曲線Fig.2 Fitness curves 為驗證模型預(yù)測結(jié)果的有效性,本文采用平均相對誤差(MRE)和均方誤差(MSE)兩個評價指標(biāo)進(jìn)行驗證。 平均相對誤差(MRE)見式(16)。 (16) 均方誤差(MSE)見式(17)。 (17) 本文選取標(biāo)準(zhǔn)SVR模型、SSA-SVR模型、TSSA-SVR模型等三種模型進(jìn)行仿真實驗并對預(yù)測結(jié)果進(jìn)行分析,預(yù)測指標(biāo)結(jié)果見表3~表6;對比擬合曲線如圖3~圖6所示。 表3 M40預(yù)測結(jié)果Table 3 M40 prediction results 表4 M10預(yù)測結(jié)果Table 4 M10 prediction results 表5 CRI預(yù)測結(jié)果Table 5 CRI prediction results 表6 CSR預(yù)測結(jié)果Table 6 CSR prediction results 由表3~表6可知,TSSA-SVR預(yù)測模型相較于對比模型中效果較優(yōu)的SSA-SVR預(yù)測模型,TSSA-SVR模型對焦炭質(zhì)量各指標(biāo)預(yù)測的MRE值分別下降了0.10%、0.23%、0.39%和0.29%,MSE值則分別下降了0.20、0.07、0.07和0.23。這表明TSSA-SVR預(yù)測模型的預(yù)測精度更高,可以更好地應(yīng)用于焦炭質(zhì)量的預(yù)測。 圖3~圖6為TSSA-SVR模型、SSA-SVR模型、標(biāo)準(zhǔn)SVR模型等三種模型對焦炭質(zhì)量各指標(biāo)的預(yù)測值與真實值之間的擬合圖。 由圖3~圖6可以看出,除個別點外,TSSA-SVR預(yù)測模型的預(yù)測值相比于另外兩個模型都更接近真實值,穩(wěn)定性更好,擬合度更高。 圖3 M40預(yù)測擬合圖Fig.3 M40 prediction fitting diagram 圖4 M10預(yù)測擬合圖Fig.4 M10 prediction fitting diagram 圖5 CRI預(yù)測擬合圖Fig.5 CRI prediction fitting diagram 圖6 CSR預(yù)測擬合圖Fig.6 CSR prediction fitting diagram 針對焦炭質(zhì)量預(yù)測問題,利用基于混沌映射改進(jìn)的麻雀搜索算法(TSSA)對支持向量回歸機(SVR)的參數(shù)進(jìn)行優(yōu)化,建立了TSSA-SVR回歸預(yù)測模型,通過實驗證明了TSSA算法優(yōu)化SVR參數(shù)的優(yōu)越性。在實證中,采用某焦化廠實際生產(chǎn)數(shù)據(jù)進(jìn)行預(yù)測,仿真結(jié)果表明,本文建立的TSSA-SVR模型對焦炭質(zhì)量的預(yù)測精度更高,預(yù)測誤差更穩(wěn)定,并驗證了TSSA-SVR模型在實際問題應(yīng)用中的有效性和可行性。 煉焦生產(chǎn)過程較為復(fù)雜,影響焦炭質(zhì)量的因素眾多,其中包括配合煤的各項指標(biāo),還包括生產(chǎn)中的各項參數(shù),如何分析整合更多的焦炭質(zhì)量影響因素,建立精度更高,效果更穩(wěn)定的焦炭質(zhì)量預(yù)測模型是今后研究的重點。1.4 混沌麻雀搜索算法
2 焦炭質(zhì)量預(yù)測模型的構(gòu)建
3 實例研究
3.1 數(shù)據(jù)來源及預(yù)處理
3.2 仿真分析
4 結(jié) 論