李福民 董鈺澤 劉 頌 劉小杰 米艦君 呂 慶
(1.華北理工大學冶金與能源學院,2.唐山學院人工智能學院,3.唐山鋼鐵集團責任有限公司煉鐵事業(yè)部)
在鐵前生產(chǎn)中,燒結(jié)礦成本占總成本的50%以上[1],因此做好燒結(jié)礦性能的預警工作對于降低生產(chǎn)成本、提高產(chǎn)品質(zhì)量和企業(yè)效益意義重大。鋼鐵智能制造是鋼鐵行業(yè)的發(fā)展趨勢,其核心是通過信息化與智能化等現(xiàn)代計算機技術(shù)手段,對鋼鐵制造流程中的工藝、生產(chǎn)與檢測等進行優(yōu)化與調(diào)整,將傳統(tǒng)工藝的優(yōu)勢與信息化技術(shù)的長處相結(jié)合,提高生產(chǎn)效率、協(xié)同性與準確率,實現(xiàn)生產(chǎn)管理的標準化、精細化和穩(wěn)定化[2]。
目前,國內(nèi)外對燒結(jié)礦性能的預測模型研究[3-12]主要是結(jié)合大數(shù)據(jù)技術(shù)與燒結(jié)工藝理論對燒結(jié)礦質(zhì)量指標與化學成分進行預測,但其中大多數(shù)研究只注重算法的精度與單一指標預測,對燒結(jié)礦復雜的性能指標評價不夠系統(tǒng),且與實際生產(chǎn)情況聯(lián)系不夠緊密,未能對實際生產(chǎn)起到實質(zhì)性指導作用。文章提出了一種燒結(jié)礦性能預警模型,在提升模型穩(wěn)定性與準確性的基礎(chǔ)上對多個燒結(jié)礦重要指標進行系統(tǒng)化預報。
某鋼廠鐵前數(shù)據(jù)庫中原始數(shù)據(jù)量龐大且存在大量空值、重復值與異常值,直接使用原始數(shù)據(jù)建立模型的效果可能并不理想,因此要對原始數(shù)據(jù)進行預處理,并搭建可直接抽取數(shù)據(jù)用于建立預測模型的燒結(jié)數(shù)據(jù)倉庫。文章基于某鋼廠2020年1月至2021年12月鐵前數(shù)據(jù)庫搭建燒結(jié)數(shù)據(jù)倉庫,首先從鋼廠鐵前數(shù)據(jù)庫中導出1 800多萬條鐵前生產(chǎn)數(shù)據(jù),將這些數(shù)據(jù)導入本地SQL Server數(shù)據(jù)庫,并用連接視圖的方法將燒結(jié)物料所對應的時間、名稱、ID號等相關(guān)主鍵關(guān)聯(lián),然后導出預測模型所需的燒結(jié)數(shù)據(jù)表,整合后得到特征參數(shù)68個、數(shù)據(jù)600萬余條。特征參數(shù)名稱如表1所示。
表1 特征參數(shù)名稱
由于特征參數(shù)之間的數(shù)量級相差較大,所以要將數(shù)據(jù)進行規(guī)范化處理,將其縮放入一個特定的區(qū)間,有助于圖形的比較與分析。文章使用Z-score標準化原理,運用Scikit-Learn中的StandardScaler函數(shù)在Python環(huán)境中實現(xiàn)。
將數(shù)據(jù)進行標準化處理后,依據(jù)箱線圖算法與現(xiàn)場經(jīng)驗對數(shù)據(jù)中的空值、重復值與異常值進行消除,最后在SPSS中運用線性差值填補法進行填補,降低數(shù)據(jù)質(zhì)量對模型精度的影響,完成數(shù)據(jù)預處理。
在對燒結(jié)數(shù)據(jù)預處理后,針對燒結(jié)體系的整體業(yè)務將燒結(jié)數(shù)據(jù)倉庫模型設(shè)計為3層,分別為貼源層(ODS)、整合層(UDM)、應用層(RPT)。
從不同數(shù)據(jù)源采集對接原始數(shù)據(jù),數(shù)據(jù)緩沖服務將原始數(shù)據(jù)暫存在本地存儲,通過JDBC、API等形式導入貼源層。貼源層保存著全量數(shù)據(jù)的原始形式或簡單處理后的形式,作為所有上層結(jié)構(gòu)的數(shù)據(jù)源。貼源層結(jié)構(gòu)設(shè)計簡單,一般以數(shù)據(jù)來源或業(yè)務大模塊劃分。
整合層直接面向不同分析需求工藝,將數(shù)據(jù)劃分為歷史數(shù)據(jù)查找、相對狀態(tài)比對、類似結(jié)果分析等主題。為用戶提供統(tǒng)一數(shù)據(jù)歸集和信息視圖,使用戶能夠全面且精確地觸達各個業(yè)務線。整合層設(shè)計以應用直接驅(qū)動為主、數(shù)據(jù)驅(qū)動為輔的原則,多采用反范式化設(shè)計,便于業(yè)務上的理解以及使用的便捷。
應用層的設(shè)計目的是打通數(shù)據(jù)倉庫和燒結(jié)體系自建業(yè)務系統(tǒng)之間的數(shù)據(jù)通道,實現(xiàn)數(shù)據(jù)的可靠存儲、高效流轉(zhuǎn)和充分利用。同時設(shè)計面向燒結(jié)體系內(nèi)改變工藝條件時歷史數(shù)據(jù)分析的工藝指標,讓用戶或相關(guān)系統(tǒng)、應用能夠以最便捷的方式提取指標數(shù)據(jù),實現(xiàn)關(guān)鍵數(shù)據(jù)最高效的分析、應用,完成數(shù)據(jù)倉庫的搭建。
在燒結(jié)數(shù)據(jù)倉庫建立之后,對燒結(jié)礦的質(zhì)量指標與化學成分進行特征選擇與建模預測。燒結(jié)礦性能指標對鐵水成分、產(chǎn)量和煉鐵工藝流程的經(jīng)濟利益具有直接影響,但燒結(jié)礦性能指標的檢測存在大時滯性,不能夠及時地向現(xiàn)場工作人員反饋[13]。為了獲得高精度的應用預測,文章采用RFE-DNN算法來建立燒結(jié)礦質(zhì)量指標與化學成分的預測模型。
遞歸消除特征法(Recursive Feature Elimination,簡稱RFE)使用一個基模型來進行多輪訓練,每輪訓練后,消除若干權(quán)值系數(shù)的特征,再基于新的特征集進行下一輪訓練。首先,在原始特征上訓練模型,每個特征得到一個權(quán)重。之后,那些擁有最小絕對值權(quán)重的特征被踢出特征集。如此往復遞歸,直至剩余的特征數(shù)量達到所需的特征數(shù)量。
深度神經(jīng)網(wǎng)絡(Deep Neural Networks,簡稱DNN)是一個多層神經(jīng)網(wǎng)絡模型,具有深層次、非線性及提取逐層特征等特點[14]。DNN根據(jù)節(jié)點在網(wǎng)絡中的位置可以分為輸入層(input layer)、隱含層(hidden layer)和輸出層(output layer),其基本結(jié)構(gòu)如圖1所示。相較于其他算法模型,DNN擁有不俗的穩(wěn)定性、很強的建模能力及超強的非線性擬合能力與泛化能力。
圖1 DNN基本結(jié)構(gòu)
對燒結(jié)礦化學成分的預測,主要選擇V2O5、CaO/SiO2、TFe和FeO含量的預測[15]。首先在Python環(huán)境下運用RFE對相關(guān)特征參數(shù)做特征分析,得到與V2O5、CaO/SiO2、TFe和FeO的燒結(jié)礦主要化學成分相關(guān)參數(shù)的分布,其次剔除每個目標值相關(guān)系數(shù)最小的10個特征參數(shù),去除了2個冗余度量,得到56個有用維數(shù)作為每種成分預測模型的輸入?yún)?shù),然后對輸入?yún)?shù)與預測參數(shù)進行相關(guān)性分析,得到相關(guān)性排序,前10的參數(shù)如表2所示。然后對V2O5、CaO/SiO2、TFe和FeO依次運用DNN算法建立燒結(jié)礦化學成分預測模型,DNN預測模型預測評價結(jié)果如表3所示。DNN預測V2O5、CaO/SiO2、TFe和FeO的R2分別達到0.965 8、0.824 7、0.846 2和0.871 1,模型能夠?qū)Y(jié)礦化學成分進行精準預測。
表2 燒結(jié)礦化學成分與輸入?yún)?shù)的相關(guān)性排序
表3 基于DNN預測模型評價結(jié)果比較
對燒結(jié)礦質(zhì)量指標的預測,主要是物理性能的轉(zhuǎn)鼓指數(shù)與篩分指數(shù)的預測[16]。首先運用RFE對特征參數(shù)做特征分析,剔除多余數(shù)據(jù),得到46個特征參數(shù),其次根據(jù)特征分析結(jié)果結(jié)合Pearson相關(guān)系數(shù)法做相關(guān)性分析,從46個特征參數(shù)中分別選出相關(guān)性最好的11個和17個特征參數(shù)作為轉(zhuǎn)鼓指數(shù)和篩分指數(shù)回歸模型的輸入?yún)?shù)集,其重要性排序如表4所示。
表4 轉(zhuǎn)鼓指數(shù)與篩分指數(shù)的輸入?yún)?shù)集
然后運用DNN算法建立燒結(jié)礦質(zhì)量指標預測模型,通過模擬實際生產(chǎn)環(huán)境對轉(zhuǎn)鼓指數(shù)和篩分指數(shù)的最優(yōu)回歸模型進行了測試,結(jié)果如表5所示。由表5可知燒結(jié)礦質(zhì)量指標的預測值與實際值變化趨勢基本一致,轉(zhuǎn)鼓指數(shù)和篩分指數(shù)回歸模型的R2分別達到0.899和0.875,模型精度滿足了預測要求,可以用于實際生產(chǎn)預測。
表5 轉(zhuǎn)鼓指數(shù)和篩分指數(shù)回歸模型的測試結(jié)果
在整理某鋼廠鐵前數(shù)據(jù)庫中燒結(jié)物料的預警區(qū)間時,發(fā)現(xiàn)許多燒結(jié)物料的預警區(qū)間為空值(Null)。
由于燒結(jié)物料種類復雜,且每個廠家供應的原料成分配比各不相同,單個物料種類的成分含量對產(chǎn)品質(zhì)量的影響難以測定,所以對部分燒結(jié)物料成分的檢測結(jié)果進行預警還多以傳統(tǒng)經(jīng)驗人工判斷為主,導致部分燒結(jié)物料的預警區(qū)間無法確定,產(chǎn)生預警區(qū)間空值。企業(yè)沒有建立符合生產(chǎn)需求的預警系統(tǒng),導致部分產(chǎn)品質(zhì)量的判斷不及時,并且沒有對原料質(zhì)量偏低的廠家進行記錄,無法對原料的采購做指導參考。針對以上問題,結(jié)合燒結(jié)物料成分的檢驗結(jié)果、傳統(tǒng)人工經(jīng)驗與大數(shù)據(jù)技術(shù),對預警區(qū)間的空值進行填補與整合。
先將SQL Server中的燒結(jié)物料表與生產(chǎn)廠家表進行視圖連接,再運用Spark Streaming框架與傳統(tǒng)工藝經(jīng)驗對數(shù)據(jù)進行時間頻次統(tǒng)一,然后運用箱線圖算法剔除異常值,再通過Python的Groupby函數(shù)對數(shù)據(jù)表進行分類與最大值、最小值處理,極大地壓縮了數(shù)據(jù)表的大小,同時有序歸納數(shù)據(jù),提高了數(shù)據(jù)表的可讀性與可視性。經(jīng)處理后,檢驗結(jié)果形成一個數(shù)據(jù)區(qū)間。最后結(jié)合現(xiàn)場人員的經(jīng)驗與邊界分析對區(qū)間的合理性進行確認,將所得區(qū)間作為預警區(qū)間,填補了預警區(qū)間的空值,完成了燒結(jié)物料預警區(qū)間的整合,處理結(jié)果如表6所示。
表6 處理后某鋼廠燒結(jié)物料預警區(qū)間(部分)
結(jié)合燒結(jié)數(shù)據(jù)倉庫、燒結(jié)礦質(zhì)量指標和化學成分預測模型、燒結(jié)物料預警區(qū)間與鋼廠實際需求,運用JavaScript將燒結(jié)礦性能預警模型可視化。在燒結(jié)物料性能預警界面,對燒結(jié)物料性能進行監(jiān)測,當監(jiān)測結(jié)果超出預警區(qū)間時報警,實時記錄報警的物料信息(設(shè)備編號、物料名稱、檢測項目、生產(chǎn)廠家、檢測結(jié)果和日期),并以月為周期,統(tǒng)計燒結(jié)物料與生產(chǎn)廠家報警次數(shù),使現(xiàn)場工作人員更加直觀、及時地掌握報警信息。
在搜索與修改界面,模型根據(jù)物料名稱與檢測項目的輸入檢索,展示某種物料的生產(chǎn)廠家和該物料檢測項目預警范圍的信息,并可以根據(jù)企業(yè)需求對物料預警范圍進行修改。模型也對歷史報警記錄提供了搜索功能,可以根據(jù)物料信息對歷史報警記錄進行檢索,并在僅搜索物料名稱時展示該物料所有生產(chǎn)廠家的報警次數(shù)排序。
在燒結(jié)礦性能預警界面,根據(jù)實時監(jiān)測數(shù)據(jù),實時預報相關(guān)質(zhì)量指標與化學成分,將預報值與實際值組成折線圖,更加清晰地顯示物料質(zhì)量與成分的波動。
根據(jù)波動頻次、歷史報警記錄與企業(yè)原料采購需求,對燒結(jié)物料的采購提出指導方案。首先計算得到該物料的當月報警率,將化學成分與質(zhì)量指標的報警等比重看待,然后對報警率超出給定標準的廠家的原料進行減采計算,減采率給定指導標準如表7所示。
表7 燒結(jié)物料減采指導標準 %
報警率與減采率的計算公式如下:
p=x/m
(1)
pi=3p2+p/20
(2)
式中:p為報警率;x為該物料當月報警次數(shù);m為所有物料當月總報警次數(shù);pi為減采率。
對于減采的燒結(jié)原料,使用與燒結(jié)原料成分相同或接近且在排序中報警次數(shù)最低的其他廠家燒結(jié)原料進行補充,以此不斷改善生產(chǎn)所需的燒結(jié)原料的品質(zhì),進而提升了燒結(jié)礦的質(zhì)量。
(1)收集某鋼廠鐵前數(shù)據(jù)庫近兩年生產(chǎn)數(shù)據(jù),運用SQL Server視圖連接主鍵的方式得到所需要的燒結(jié)數(shù)據(jù)表,采用Z-score標準化原理,消除不同量綱和數(shù)量級導致的不良影響,得到規(guī)范數(shù)據(jù)。采用箱線圖算法清洗不符合數(shù)據(jù)規(guī)律的空值、重復值與異常值,得到能反映實際生產(chǎn)狀態(tài)的準確數(shù)據(jù),建立了用于模型預測的燒結(jié)數(shù)據(jù)倉庫。
(2)運用RFE特征選擇法對燒結(jié)數(shù)據(jù)倉庫中的燒結(jié)生產(chǎn)參數(shù)進行特征選擇與相關(guān)性分析,并運用DNN算法構(gòu)建燒結(jié)礦化學成分與質(zhì)量指標的預測模型,預測值與實際值的對比結(jié)果和性能指標表明模型的精度滿足了預測要求,可以用于實際生產(chǎn)預測。
(3)根據(jù)某鋼廠燒結(jié)物料預警區(qū)間部分空缺的問題提出了一種預警區(qū)間填補與整合的方法,通過大數(shù)據(jù)技術(shù)確定了燒結(jié)物料的合理性能范圍,并將其整合為燒結(jié)物料預警區(qū)間。
(4)基于燒結(jié)礦性能預測模型與燒結(jié)物料預警區(qū)間建立了燒結(jié)礦性能預警模型,運用JavaScript技術(shù)將模型可視化,結(jié)合企業(yè)需求通過三個界面展示燒結(jié)礦性能的監(jiān)測及預警,通過報警率計算與報警次數(shù)排序給出采購指導方案。