蘇 楠,任 彥,高曉文,楊 靜
(內(nèi)蒙古科技大學信息工程學院,內(nèi)蒙古 包頭 014010)
熱軋板帶鋼在家用電器、車輛制造、船舶制造等多個行業(yè)廣泛應用[1],高品質(zhì)的帶鋼產(chǎn)品越來越受深加工制造者及制造廠商青睞,但下游生產(chǎn)企業(yè)對帶鋼產(chǎn)品的厚度、寬度、凸度等指標要求越來越高。當前軋機普遍采用了自動板型控制系統(tǒng)[2]來解決板型的控制問題提高了熱軋帶鋼產(chǎn)品產(chǎn)出品質(zhì)。熱連軋生產(chǎn)主要包括粗軋、精軋、層流冷卻、卷曲四個部分,其中精軋環(huán)節(jié)決定了最終帶鋼板型的好壞。由于熱軋環(huán)節(jié)設備設定變量較多、執(zhí)行機構(gòu)數(shù)量多且檢測環(huán)節(jié)存在時延,使得板形控制變得更加復雜。板形控制中輥縫與彎輥力直接影響最終產(chǎn)出帶鋼的板形,而軋制力的設定值影響了輥縫與彎輥力設定值的求解[3]。在軋制過程中,軋制參數(shù)相互之間耦合嚴重,軋制力受來料厚度、變形抗力及板帶張力等多種生產(chǎn)過程關鍵參數(shù)的制約。
熱軋生產(chǎn)過程存在參數(shù)種類多、強耦合、非線性等問題,傳統(tǒng)數(shù)學機理模型制約了軋制力控制精度的進一步提高。近些年來,大數(shù)據(jù)技術的蓬勃發(fā)展為解決該問題提供了可能,越來越多的學者將人工智能技術應用于熱軋控制過程中。馬威等采用多層感知器(Multi-Layer Perceptron,MLP)模型對寶鋼1880熱連軋機組軋制力進行預測[4]。吳倩等采用了GA-BP神經(jīng)網(wǎng)絡與敏感性分析對帶鋼厚度進行了預測[5]。王春華等使用支持向量回歸(Support Vector Regression,SVR)模型對軋制力進行了預測[6]。冀秀梅等使用極限學習機在中厚板軋制中對軋制力進行預測[7]。Parvizi Ali等采用人工神經(jīng)網(wǎng)絡對負荷和轉(zhuǎn)矩進行預測[8]。Jingyi Liu等采用多層極限學習機模型對熱連軋軋制力進行預測[9]。
本文以某鋼鐵企業(yè)板材廠熱連軋生產(chǎn)過程為對象開展軋制力預測模型的研究,該廠二級控制系統(tǒng)軋制力采用傳統(tǒng)軋制力機理模型[10]。該模型滿足了當前熱軋生產(chǎn)過程的要求,但是受生產(chǎn)過程環(huán)境變化、檢測干擾等因素的影響,機理模型仍存在預測精度較差、解算耗時、預測結(jié)果波動大等缺點。隨著生產(chǎn)過程增質(zhì)增效的提出,軋制力模型預測精度需進一步提升。
考慮熱軋生產(chǎn)過程不確定性、模型預測精度、生產(chǎn)實時性等因素,本文采用了隨機森林回歸(Random Forest Regressor,RFR)算法建立了軋制力預測模型,利用粒子群算法(Particle Swarm Optimization,PSO)優(yōu)化了RFR模型中的超參數(shù),解決了RFR中超參數(shù)設定復雜的問題。實驗結(jié)果表明,在軋制力預測中RFR模型相較SVR模型和MLP模型預測精度與速度都有所提高。
軋制生產(chǎn)中在采集記錄數(shù)據(jù)時,由于通信系統(tǒng)故障、電磁干擾、數(shù)據(jù)堵塞等原因會使采集數(shù)據(jù)中包含少量的異常值。孤立森林算法是由周志華等提出[11],是一種基于集成學習的連續(xù)數(shù)據(jù)無監(jiān)督異常值檢測方法。該算法無需計算距離或密度,具有運算快、抗噪能力強、穩(wěn)定性好的優(yōu)點,適用于海量數(shù)據(jù)的異常值檢測。該算法通過檢測樣本中的孤立點來確定異常值,算法分為訓練和檢測兩個階段,其具體實現(xiàn)過程如下:
1)訓練階段:使用數(shù)據(jù)集樣本構(gòu)建孤立樹,構(gòu)建過程具體步驟如下所示:
①從原始數(shù)據(jù)中隨機選取m個樣本作為數(shù)據(jù)集;
②從數(shù)據(jù)集中隨機選取一個特征,在該特征最大值與最小值間隨機選取一個切割點p;
③在p點形成一個超平面,將數(shù)據(jù)集進行二分割,數(shù)據(jù)集中小于p的數(shù)據(jù)劃分至左側(cè)子節(jié)點,大于等于的數(shù)據(jù)劃分至右側(cè)子節(jié)點;
④分別在新分割的左右兩側(cè)子節(jié)點數(shù)據(jù)重復②③步驟,直至數(shù)據(jù)不可分或達到最大分割深度;
⑤重復上述過程,構(gòu)建t棵孤立樹。
2)檢測階段:將被測樣本x代入孤立樹中,并計算由根節(jié)點到樣本所在節(jié)點的路徑長度,遍歷t棵樹得出平均路徑長度h(x)。對所有被測樣本點的平均路徑長度做歸一化,得到一個0~1之間的異常分數(shù),越接近1異常的可能性越高。異常值分數(shù)計算公式如下所示
(1)
式中:n表示孤立樹分化的節(jié)點個數(shù),E(h(x)為樣本x的路徑長度的期望值,h(x)表示樣本x的平均路徑長度
(2)
式中:c(n)表示n個樣本構(gòu)建的孤立樹的平均路徑長度。H(i)=ln(i)+γ,γ是歐拉常數(shù)。
在軋制環(huán)節(jié)中影響軋制力的相關因素較多,主要有軋機的軋制速度、精軋入口厚度、精軋出口厚度,精軋入口寬度、精軋出口寬度、軋輥半徑和精軋入口溫度等23個主要參數(shù)。為了降低模型計算復雜程度及提高預測精度,采用相關系數(shù)方法[12]分析影響軋制力的主要參數(shù),選取軋制速度,精軋入口厚度,精軋出口厚度,精軋入口寬度,精軋出口寬度,變形抗力,精軋入口溫度,精軋出口溫度作為軋制力預測模型的輸入。
軋制力數(shù)學機理模型公式為
(3)
式(3)中:P為機理模型計算出的軋制力,kN;km為變形抗力,MPa;αP,βP為前后張力系數(shù);tf,tb為前后張力;Ld為接觸弧長度,mm;BF為精軋目標寬度,mm,QP外摩擦影響系數(shù)。
軋輥與鋼帶的接觸弧弧長
(4)
式(4)中:Rd為工作輥變形半徑,mm;H,h為軋機入口和出口厚度,mm。
摩擦系數(shù)為
(5)
該機理模型已應用于實際的軋制力計算,然而在推導過程中存在一些假設與簡化,因此其預測精度在生產(chǎn)中仍有提升的空間。
隨機森林回歸算法是由Leo Breiman提出的一種由多個決策樹集成的集成學習算法[13]。RFR算法是使用Bagging方法集成CART回歸決策樹的強學習算法。RFR使用Bootstrap重抽樣從原始訓練集中有放回抽取多個子訓練集,并使用每個子訓練集構(gòu)建其決策樹。RFR算法的預測結(jié)果由所有決策樹預測結(jié)果取平均所得。RFR模型結(jié)構(gòu)如圖1所示。
RFR模型的具體實現(xiàn)過程如下:
2)使用CART算法構(gòu)造q棵決策樹(X,Sθ1n),(X,Sθ2n),…,(X,Sθqn)。構(gòu)建過程不進行剪枝操作使每棵決策樹都能在限定范圍內(nèi)最大延伸。單個回歸樹的預測值1=(X,Sθ1n),2=(X,Sθ2n),…,q=(X,Sθqn)。
3)隨機森林回歸模型的輸出可由構(gòu)建的q棵決策樹預測結(jié)果求取平均值得出。如式(6)所示
=1q∑qk=1k=1q∑qk=1(X,Sθkn)
(6)
圖1 隨機森林回歸結(jié)構(gòu)圖
軋制力作為熱連軋板型控制的重要指標,其設定值會影響初始輥縫的設定,因此準確預測軋制力對熱軋的板型控制至關重要。RFR模型需設定決策樹數(shù)量和決策樹的最大深度,決策樹的數(shù)量和深度會影響算法的預測速度和擬合能力,因而存在因非最佳參數(shù)導致RFR模型預測精度受影響。本文采用PSO算法搜尋最優(yōu)的決策樹棵樹q和最大深度n_deep,確保RFR算法具有最優(yōu)的預測速度和預測結(jié)果。
PSO是一種啟發(fā)式群智算法,是由EBERHART和KENNEDY通過模擬鳥群捕食行為所提出[14]。算法將鳥群簡化為一群粒子,每一個粒子都被視為搜索空間中的一個個體,粒子所處位置即對應優(yōu)化問題的解,粒子在空間中的運動即為搜索最優(yōu)解的過程。粒子飛行的速度可由個體歷史最優(yōu)位置和種群歷史最優(yōu)位置動態(tài)調(diào)整,通過不斷迭代與更新得到滿足條件的最終解。
算法流程如下:
1)設置最大迭代次數(shù)m、種群規(guī)模n,隨機初始化速度和位置,粒子的最大速度和位置為整個搜索空間。
2)定義適應度函數(shù),個體最優(yōu)解pbesti為每個粒子根據(jù)適應度值搜尋到的最優(yōu)解,從個體最優(yōu)解中找到當前代數(shù)的全局最優(yōu)解gbesti,與歷史數(shù)據(jù)對比并更新pbesti和gbesti。
3)迭代過程中粒子根據(jù)局部最優(yōu)和全局最優(yōu)解更新粒子速度與位置,更新公式如下所示
(7)
(8)
4)終止條件:①達到最大迭代次數(shù);②滿足相鄰代數(shù)之間誤差小于定值。
基于PSO-RFR模型的軋制力預測流程如圖2所示。
圖2 PSO-RFR軋制力預測流程圖
本文數(shù)據(jù)源于某板材廠2250mm熱軋產(chǎn)線,選取了2019年3月6日到8月20日的SPCC鋼種數(shù)據(jù)進行分析處理。為驗證本文所提方法的合理性及有效性,以2250mm熱連軋生產(chǎn)現(xiàn)場采集的2873組SPCC帶鋼的軋制數(shù)據(jù)為樣本。
經(jīng)過孤立森林異常值處理后得到2675組軋制數(shù)據(jù)。由于模型輸入?yún)?shù)量綱不一致會影響模型預測性能,因此對模型訓練數(shù)據(jù)進行歸一化處理。再使用相關系數(shù)法確定RFR模型的輸入數(shù)據(jù)。熱連軋生產(chǎn)中采集部分相關數(shù)據(jù)見表1。
表1 軋機部分主要參數(shù)
將預處理后的數(shù)據(jù)分為兩部分,將70%的樣本數(shù)據(jù)作為訓練集,將30%的樣本數(shù)據(jù)作為測試集。訓練集用于構(gòu)建預測模型,測試集用于測試構(gòu)建的預測模型的預測能力。
本文采用Python語言,構(gòu)建了基于PSO-RFR的軋制力預測模型。粒子群算法中粒子個數(shù)n=20,粒子代數(shù)m=50,適應度函數(shù)為均方誤差函數(shù)。經(jīng)過粒子群優(yōu)化后得到RFR模型的最佳棵數(shù)q=91與最佳深度n_deep=252,使用該參數(shù)構(gòu)建RFR模型并對軋制力進行預測。
圖3為PSO-RFR軋制力預測值、實測值與機理模型計算值對比圖,為了便于觀察,選取了前50組數(shù)據(jù)進行繪制。由圖中可知,本文提出的PSO-RFR模型相比基于數(shù)學機理模型,本文提出的PSO-RFR模型在軋制力預測中預測精度更優(yōu)。對測試集中802塊樣本數(shù)據(jù)的預測結(jié)果進行分析,發(fā)現(xiàn)預測誤差在±5%內(nèi)的命中率為97.7%。PSO-RFR的預測曲線與實測曲線基本吻合,能夠滿足生產(chǎn)中對軋制力預測的需求。一般而言,測試集在模型構(gòu)建中并沒有參與參數(shù)尋優(yōu),所以測試集的預測結(jié)果更能反映預測模型的預測性能。
圖3 PSO-RFR軋制力預測值、實測值與機理模型計算值對比圖
為了驗證本文所提方法的有效性,將PSO-RFR模型與支持向量回歸(SVR)模型和多層感知器(MLP)模型進行了對比。
SVR軋制力模型懲罰值設為39.23、松弛因子設為1.83、使用多項式核函數(shù)。由圖4可知,黑色虛線所夾區(qū)域中數(shù)據(jù)的誤差范圍在±5%以內(nèi),本文所構(gòu)建PSO-RFR預測模型預測結(jié)果中97.7%落在±5%內(nèi),SVR預測模型的誤差89.8%落在該范圍內(nèi)。通過散點圖與誤差統(tǒng)計體現(xiàn)了PSO-RFR模型在熱連軋軋制力預測中的優(yōu)勢。
圖4 PSO-RFR與SVR軋制力預測對比圖
MLP軋制力模型有2層隱層,激活函數(shù)使用ReLU函數(shù)。由圖5可知,MLP模型的預測效果弱于PSO-RFR模型預測效果。經(jīng)統(tǒng)計MLP模型誤差90.9%落在±5%范圍中,更進一步體現(xiàn)了PSO-RFR模型在軋制力預測中的優(yōu)勢。
圖5 PSO-RFR與MLP軋制力預測對比圖
為評估預測模型的預測性能,選用平均絕對誤差(MAE)、均方根誤差(RMSE)和決定系數(shù)(R2)三項性能指標對所建立的PSO-RFR、MLP、SVR預測模型進行評價,評價結(jié)果如表2所示。R2表明了模型的擬合能力,越接近1表明模型擬合程度越高。PSO-RFR模型的R2指標均優(yōu)于其它兩種預測方法,表明該方法具有較好的擬合能力。MAE與RMSE都小于其它預測方法,表明了PSO-RFR模型改善了小樣本數(shù)據(jù)在軋制力預測中存在的不足,即小樣本數(shù)據(jù)中樣本數(shù)據(jù)分布不均衡導致訓練模型在新數(shù)據(jù)預測時性能變差的問題。PSO-RFR相較于其它兩種方法預測時間最短,相較其它方法適用于高速的連軋生產(chǎn)。本文構(gòu)建的RFR預測模型提高了預報模型的準確率,為熱軋操作者生產(chǎn)控制提供了參考依據(jù)。
表2 三種建模方法的預測結(jié)果對比
軋制力是熱軋環(huán)節(jié)中的重要參數(shù),對最終板形有很大的影響。本文采用孤立森林算法對現(xiàn)場生產(chǎn)數(shù)進行預處理,提出了RFR軋制力預測模型,并采用了PSO算法對RFR模型中超參數(shù)進行優(yōu)化。結(jié)果表明,本文所提模型預測誤差在±5%內(nèi)的命中率為97.7%,單次預測耗時1ms,相較于SVR,MLP模型具有預測精度高、預測時間短的優(yōu)點。該模型能很好地預測軋制力的變化規(guī)律,并滿足生產(chǎn)過程在線預測軋制力的要求。本文的研究對傳統(tǒng)機理模型不能處理非線性、多變量軋制力預測問題提供了新的研究方法。