廖東,鄭兆穎,邢相棟,卞衛(wèi)新,張寶婷
(1.廣西北港新材料有限公司,廣西 北海 536000;2.西安建筑科技大學冶金工程學院,陜西 西安 710055;3.陜鋼集團漢中鋼鐵有限責任公司,陜西 漢中 712400)
高爐煉鐵作為現(xiàn)代煉鐵的主要方法,產(chǎn)量占世界生鐵總產(chǎn)量的95%以上。燒結礦是高爐煉鐵主要原料之一,質量對后續(xù)的冶煉工作至關重要,其還原性能對高爐操作和消耗均有重要影響[1-2]。影響燒結礦還原性的因素包括粒度、氣孔率、礦物組成及結構、脈石成分等。傳統(tǒng)燒結礦RI的檢測方法滯后,檢驗過程繁瑣復雜,耗時較長。因此,快速預測燒結礦RI,實時提出改善RI的調控因素,對于獲取高品質燒結礦具有重要的指導作用,已成為目前燒結礦生產(chǎn)的重點研究方向。
聚類分析用來研究影響因素之間不同程度的相似性,達到“物以類聚”的效果。變量聚類作為聚類分析中的一種方法,過程簡單,耗時較短,近年來越來越多地應用于工業(yè)生產(chǎn)數(shù)據(jù)分析和性能指標預測等領域[3]。 陳少飛等[1]利用聚類分析處理高爐煉鐵數(shù)據(jù)離群問題,將 “無效離群點”剔除的同時,最大程度保留了 “有效離群點”,保證了高爐煉鐵數(shù)據(jù)的穩(wěn)定性以及處理的準確性,全面篩選得到能夠反映爐況波動的強相關變量,完成了對高爐爐況變化的詳細劃分。魯杰等[4]關于高爐操作爐型的研究中,對冷卻壁溫度進行聚類分析,解決了指標重復性大的問題,準確合理地表征了高爐操作爐型的狀況及變化原因,為高爐煉鐵大數(shù)據(jù)分析中的聚類算法選擇提供了有利參考。Johanna等[5]根據(jù) k-means聚類分析了粉塵吸入后的數(shù)據(jù),聚類區(qū)分了三種相似程度小的操作條件作為探索性分析,評估了工業(yè)回轉窯加注粉塵前后的運行情況,為回轉窯-電爐工藝注入粉塵提供了理論指導。然而,目前對鐵礦粉燒結領域的有關預測中,更多是集中在燃耗、成品率、轉鼓指數(shù)等技術指標方面[6-9],針對冶金還原性能的預測較少,尚未實現(xiàn)工業(yè)化應用。
因此,基于某鋼廠400 m2燒結機產(chǎn)品檢測數(shù)據(jù),調研分析了60組燒結礦RI及化學成分,采用變量聚類得到影響燒結礦RI的新因子,展開最佳子集回歸,得到最佳子集。基于觀測值的方差膨脹因子(variance inflation factor,VIF)、Durbin-Watson統(tǒng)計量和Grubbs檢驗統(tǒng)計量,對回歸方程進行異常值檢驗,建立預測回歸模型,并利用測試集進行回歸模型誤差驗證,為改善燒結礦RI提供參考。
現(xiàn)代燒結主要用于生產(chǎn)高爐所需的具有一定轉鼓強度和冶金性能的燒結礦。燒結過程示意圖如圖1所示。
圖1 燒結過程示意圖Fig.1 Sintering Process Diagram
燒結原料包括鐵礦石、石灰石、白云石、生石灰、焦粉和其他少量添加物,各組分經(jīng)過輸送系統(tǒng)到混合機充分混合,以獲得化學成分均勻穩(wěn)定的混合料。隨后進入燒結系統(tǒng),包括布料器、點火器、燒結機、風箱、排氣除塵設備等,進行燒結焙燒得到燒結礦。最后燒結礦經(jīng)破碎、篩分、冷卻得到燒結產(chǎn)品。
燒結生產(chǎn)是通過調整燒結過程中的原料參數(shù)配比、操作參數(shù)和設備參數(shù)來優(yōu)化燒結礦性能。其中,混合料的化學成分很大程度地影響了燒結礦還原性。因此,建立合適的燒結礦還原性預測模型對于提高燒結礦質量具有重要意義。
調研60組監(jiān)測燒結礦RI和化學成分的訓練集,選取 TFe、CaO、SiO2、Al2O3、MgO、S、TiO2、R、FeO、MgO/Al2O3、CaO/TFe和SiO2/Al2O3共12種因子作為變量,進行變量聚類分析。利用變量聚類對具有相同特征的聚類變量進行分組,通過指標降維選擇有代表性的指標并生成一些新變量[2]。結合凝聚層次法,將相似的變量組合在一起,減少要分析的變量數(shù)。
最佳子集回歸是根據(jù)所有預測變量集生成最高決定系數(shù)R2的子集模型,能夠有效識別最優(yōu)模型,估計回歸系數(shù),使預測未知響應得到的方差比所有預測變量的完整模型的方差更小[10-11]。將變量聚類的結果作為自變量,RI作為因變量,建立燒結礦RI的預測模型。
為了全面反映變量對RI的影響,利用降維的思想,將 TFe、CaO、SiO2、Al2O3、MgO、S、TiO2、R、FeO、MgO/Al2O3、CaO/TFe 和 SiO2/Al2O3共 12 種因 子通過聯(lián)結法定義聚類之間的距離,利用最長距離法,確保聚類中的所有因子都在最大距離范圍內,并趨向于生成具有類似直徑的聚類。以歐式距離作為相似性統(tǒng)計量,采用最長距離法進行變量聚類,共進行了10步,最終合并了2類。用兩點間的距離定義相似性水平,距離水平越小,表明彼此位置越近,樣本間差異越小,得到的變量聚類分析結果如表1所示,聚類分析樹狀圖如圖2所示。
表1 變量聚類分析結果Table 1 Analysis Results of Variable Clustering
圖2 聚類分析樹狀圖Fig.2 Tree Diagram for Clustering Analysis
由表1可以看出,當點群數(shù)為2時,相似性水平最低,距離水平最高,分別為29.744 6和1.405 11,此時新聚類號中觀測值的個數(shù)為8個因子。由圖2可以看出, 變量聚類得到 TiO2、FeO、Al2O3、MgO、S、R、CaO/TFe和SiO2共8個因子,即燒結礦 RI的新因子。
為了生成最高R2值的子集模型,采用最佳子集回歸,得到回歸模型。根據(jù)3個標準進行模型篩選:①R2達到最大。②預測平方和PRESS達到最小。③Mallows Cp值接近且小于預測變量個數(shù)。④距離偏差S達到最小。計算模型分別如式(1)~(4)所示。
式中,SS誤差為誤差距離平方和;S S合計為總誤差平方和;yi為第i個觀測響應值;為第i個擬合響應值;為平均響應值;ei為第i個殘差值;hi為 X(XTX)-1XT(X 為設計矩陣,XT為設計矩陣的轉置)中第i個對角線元素;SSE為殘差平方和;MSE為平均誤差平方;n為觀測值個數(shù);p為模型中的項數(shù);為指代在含K個自變量的線性回歸模型中第i個y樣本數(shù)據(jù)的擬合值。
以燒結礦RI為因變量,SiO2、Al2O3、MgO、S、TiO2、R、FeO和CaO/TFe為自變量,建立燒結礦RI的最佳子集回歸模型,如表2所示。
由表2可以看出,七變量模型{SiO2、MgO、S、TiO2、R、FeO、CaO/TFe}方差較小,表明數(shù)據(jù)值與擬合值的距離小,模型描述響應的程度高。七變量模型{SiO2、Al2O3、MgO、S、R、FeO、CaO/TFe}Mallows Cp值為8,正好等于模型項數(shù)加預測變量個數(shù),模型相對精確。六變量模型{SiO2、MgO、S、R、FeO、CaO/TFe}R2較高,表明模型擬合數(shù)據(jù)的優(yōu)度高,預測能力出色。六變量模型{SiO2、MgO、TiO2、R、FeO、CaO/TFe}PRESS最低,為690.1,說明擬合值與觀測值之間偏差的度量小,模型的預測能力強,在估計真實回歸系數(shù)和預測未來響應時較為精確且無偏倚。
采用模型對燒結礦RI進行分析時,會遇到許多偏離大部分評價數(shù)據(jù)的異常點,異常值會使得數(shù)據(jù)分布不均勻,若把它們與正常評價數(shù)據(jù)一同進行數(shù)據(jù)分析和模型訓練,將會給模型訓練帶來不利影響[12-13]。為了檢測出這些異常點,需對模型進行VIF、Durbin-Watson 統(tǒng)計量和 Grubbs檢驗[14],計算公式分別如式(5)~(10)所示。
式中,R2(Xj)表示將 Xj的判定系數(shù)作為響應變量,將模型中的其他項作為預測變量。
式中,d為誤差距離;ei-1為第i個殘差;ei為上一個觀測值的殘差;n為觀測值個數(shù)。
Grubbs檢驗統(tǒng)計量的臨界值P的單側、雙側檢驗公式如式(9)和(10)所示。
式中,n為樣本中的觀測值個數(shù);T代表服從自由度為n-2的t分布的隨機變量。
根據(jù)Grubbs檢驗和Grubbs檢驗統(tǒng)計量的P值等診斷統(tǒng)計量,結果如表3所示。
表3 異常觀測值的Grubbs檢驗Table 3 Grubbs Testing of Abnomal Observation Values
顯著性水平0.05表示在實際上不存在異常值時得出存在異常值的風險為5%。由表3可知,Grubbs檢驗統(tǒng)計量的P值為0.044,小于顯著性水平0.05,說明存在異常值。
刪除異常值后, 建立 SiO2、MgO、TiO2、R、FeO和CaO/TFe與燒結礦RI之間的最優(yōu)預測回歸模型,如式(11)所示。
由式(11)可以看出,對燒結礦RI影響權重排序為 CaO/TFe、R、TiO2、SiO2、MgO 和 FeO。
對比刪除異常值前后的回歸結果,分析回歸方程的統(tǒng)計量,結果如表4所示。
表4 刪除異常值前后的回歸結果對比Table 4 Comparison of Regression Results before and after Removing Abnomal Values
由表4可以看出,刪除異常值前,MgO的P=0.054>0.05,TiO2的 P=0.108>0.05,效應均不顯著。刪除異常值后,重新建立回歸模型,MgO的P=0.017<0.05,TiO2的 P=0.028<0.05, 均變成顯著性因子。新模型的R2為99.88%,R2(調整)提高了0.02%,R2(預測)提高了 0.03%,S 降低了 0.222 6,模型預測更為精準。
使用15個測試集對燒結礦RI回歸預測模型進行評價,標準有以下3種:均方根誤差RMSE,平均絕對誤差MAE和平均相對百分比誤差MAPE,如式(12)~(14)。
式中,f(xi)為燒結礦 RDI的預測值,yi為樣本的實際值,n為樣本預測個數(shù)。
利用三種評價標準結合15個測試集數(shù)據(jù)對燒結礦RI預測模型進行評判,結果如表5所示。
表5 預測模型評判Table 5 Judgment on Predictive Model
由表5可以看出,聚類分析方法在燒結礦還原性能預測方面有明顯的優(yōu)勢。模型的均方根誤差的 “邊界值”為0.98,模型的均方根誤差僅為0.975 0,預測值與實際值之間的偏差小。模型的平均絕對誤差的“邊界值”為0.85,模型的平均絕對誤差為0.815 2,所有單個預測值與算術平均值的偏差絕對值的平均值小。模型的平均相對百分比誤差的“邊界值”為0.05,模型的平均相對百分比誤差是0.015 3,絕對誤差和預測值之間的平均值小。模型擬合效果好。
模型的預測值與真實值對比如圖3所示。由圖3可以看出,燒結礦RI回歸模型的預測值與實驗值吻合良好,預測值與實驗值數(shù)據(jù)點更貼近理想45°線,預測結果較為精準。
圖3 模型預測值與真實值對比Fig.3 Comparison of Values by Model Prediction and True Values
圖4 模型相對誤差Fig.4 Relative Errors of Model
(1)選取12個影響燒結礦RI的因子并進行變量聚類,選擇相關性小且具有代表性的SiO2、Al2O3、MgO、S、TiO2、R、FeO 和 CaO/TFe 共 8 個 因子反映對燒結礦RI的影響。
(2)最佳子集回歸得到影響燒結礦RI的最主要因素為 SiO2、MgO、TiO2、R、FeO 和 CaO/TFe 共6個因子,利用 VIF、Durbin-Watson統(tǒng)計量和Grubbs檢驗異常值,建立預測回歸模型,即RI=13.61w(SiO2)-6.47w(MgO)-19.2w(TiO2)+37.03w(R)-2.91w(FeO)-190.9[w(CaO)/w(TFe)]。
(3)模型的R2達到99.88%,模型擬合效果好,相對誤差均在3%以下。模型預測值與實驗值數(shù)據(jù)點更貼近理想45°線,驗證了模型的實用性,能夠快速有效地預測燒結礦RI。