常家瑋,曾水平
(北方工業(yè)大學(xué) 電氣與控制工程學(xué)院,北京 100144)
鋁電解作為一個復(fù)雜的工業(yè)生產(chǎn)過程,維持電解過程的兩大平衡(能量和物料平衡)是保障其生產(chǎn)高效穩(wěn)定運行的關(guān)鍵因素,然而鋁電解的兩大平衡受多種因素、指標(biāo)的共同影響,耦合關(guān)系復(fù)雜,對氟化鋁添加量和出鋁量的正確決策是維持兩大平衡,保證經(jīng)濟效益最直接、有效的途徑。添加氟化鋁,可以降低分子比,降低電解溫度,提高電流效率;氟化鋁添加過多,則會造成氧化鋁溶解降低,未溶解的氧化鋁堆積在槽底容易產(chǎn)生病槽。出鋁量偏少,鋁水平偏高,電解槽熱損增加,電解溫度偏低,會造成冷槽甚至病槽;出鋁量過多,電解溫度升高,電流效率降低,又容易引發(fā)陽極效應(yīng)。因此,獲取合適的氟化鋁添加量和出鋁量決策值,對于穩(wěn)定生產(chǎn)和提升效益至關(guān)重要。
在目前的實際工業(yè)生產(chǎn)中氟化鋁的添加量主要是通過計算機專家系統(tǒng)進行決策,但由于鋁電解過程是個時變、非線性、強耦合的大時滯復(fù)雜系統(tǒng),專家系統(tǒng)無法根據(jù)槽況的變化情況,較好地對其進行決策[1];出鋁量的決策主要是根據(jù)“鋁水有效值法”進行計算和管理,其測量和計算過程比較繁瑣,操作精度要求高,在非正常槽況下仍然需要車間管理人員依據(jù)經(jīng)驗進行設(shè)置[2]。近年來,各專家學(xué)者也提出了一些氟化鋁添加量或出鋁量的控制策略,如:文獻[1]根據(jù)生產(chǎn)數(shù)據(jù)求解回歸相關(guān)系數(shù),研究了一種氟化鋁添加量決策模型;文獻[3]提出了基于回歸分析、遺傳算法、支持向量機的氟化鋁添加量控制策略;文獻[4]提出了一種在線采集和離線測量相結(jié)合的氟化鋁添加方法;文獻[5]通過模糊控制實現(xiàn)對氟化鋁添加量和出鋁量的控制。關(guān)于神經(jīng)網(wǎng)絡(luò)的運用方面,劉冰[6]和魏玉倩[7]分別使用了RBF 和BP 神經(jīng)網(wǎng)絡(luò)進行了預(yù)測研究,取得了較好的效果。
本文充分考慮鋁電解過程非線性、大時滯、強耦合的特點,利用歷史生產(chǎn)數(shù)據(jù),將特征選擇得到的強特征數(shù)據(jù)作為LSTM 神經(jīng)網(wǎng)絡(luò)的輸入,氟化鋁添加量和出鋁量作為輸出對網(wǎng)絡(luò)進行訓(xùn)練,通過訓(xùn)練、測試和驗證,能夠滿足工業(yè)生產(chǎn)要求。
特征處理作為特征工程的核心內(nèi)容,包括了數(shù)據(jù)清洗、規(guī)一化處理、特征選擇等內(nèi)容。對于鋁電解工業(yè),影響其生產(chǎn)過程的參數(shù)眾多,同時各參數(shù)之間又相互耦合,如電解溫度、氧化鋁濃度、氟化鋁添加量、出鋁量、工作電壓等多達二十幾項指標(biāo),其中一個指標(biāo)的調(diào)整會引起其他參數(shù)均產(chǎn)生相應(yīng)的變化。因此為了避免出現(xiàn)過擬合,使得試驗結(jié)果準(zhǔn)確可靠,數(shù)據(jù)清洗和特征選擇必不可少。
本文數(shù)據(jù)來源于國內(nèi)某鋁廠402 號槽的實際生產(chǎn)日報,包括電流、電壓、下料量、鋁水平、出鋁量、氟化鹽下料量(即氟化鋁添加量)等總計20 維2477 組數(shù)據(jù),經(jīng)過對該批數(shù)據(jù)的檢索和統(tǒng)計,存在數(shù)據(jù)缺失和異常的情況,因此為了降低壞數(shù)據(jù)的不良影響,首先對其進行數(shù)據(jù)清洗。
刪除缺失值較多的三個特征“爐底壓降”、“爐幫”、“伸腿”。同時,本文主要研究的是正常生產(chǎn)階段對氟化鋁添加量和出鋁量的預(yù)測,因此選取了啟停槽中間正常生產(chǎn)階段的數(shù)據(jù),對于存在的缺失值使用KNN 算法進行填補,最后使用箱型圖篩選出異常值,并將低于下限和高于上限的異常值分別使用下限值和上限值進行替代,最終得到所需要的數(shù)據(jù)集。
本數(shù)據(jù)集具有多達17 個參數(shù)指標(biāo),同時各個指標(biāo)的數(shù)量級差異較大,如氟化鋁添加量平均值為26.38,但出鋁量平均值達2184.28,因此必須進行數(shù)據(jù)歸一化處理。本文采用離差標(biāo)準(zhǔn)化算法,該算法將數(shù)據(jù)映射到[0,1]之間。
式中:xmin——原數(shù)據(jù)所在列最小值;xmax——原數(shù)據(jù)所在列最大值。
隨機森林屬于Embedding(嵌入法)特征選擇算法的一種,是基于集成思想對決策樹算法的進一步優(yōu)化改進,它通過Bootstraping(自助)采樣法和Bagging(裝袋)算法生成一片由m 個不同的決策樹組成的“森林”,其隨機的特點體現(xiàn)于:①隨機地為每顆決策樹選取數(shù)據(jù)樣本(隨機有放回地從K 個原始數(shù)據(jù)樣本中重復(fù)抽取k 個數(shù)據(jù)樣本,k<<K);②隨機地為每顆決策樹分配不同的特征(隨機地從原始數(shù)據(jù)樣本的N 個特征中選取n 個特征,n<<N)。正是這兩個特點使隨機森林算法顯著有效地降低壞數(shù)據(jù)對算法結(jié)果的影響,避免出現(xiàn)過擬合等問題。它既能解決回歸問題,又能進行分類預(yù)測,同時可以對各個特征的重要性進行評價,方便了處理特征選擇方面的問題,目前該算法已經(jīng)在特征工程和分類預(yù)測領(lǐng)域得到了廣泛使用[8,9]。
本文使用隨機森林回歸函數(shù),算法輸入為17 個特征當(dāng)日的數(shù)據(jù),輸出為氟化鋁添加量和出鋁量第二天數(shù)據(jù),共計2345 組,訓(xùn)練集和測試集分別占80%和20%,建立由150個樹組成的森林對隨機森林進行訓(xùn)練和預(yù)測。
圖1 特征重要性排序
得到特征重要性排序如圖3 所示,從圖中可以看出當(dāng)天的氟化鋁下料量和出鋁量對次日的影響最大,與實際相符從而驗證了特征選擇結(jié)果的正確性,經(jīng)多次試驗最終選取排名前10 的特征作為選取結(jié)果。
LSTM 神經(jīng)網(wǎng)絡(luò)是德國計算機科學(xué)家Jürgen Schmidhuber 和Sepp Hochreiter 于1997 年 提 出 的 一 種為解決深度學(xué)習(xí)容易出現(xiàn)梯度消失和梯度爆炸問題的優(yōu)化版RNN(循環(huán)神經(jīng)網(wǎng)絡(luò))[10]。其遺忘門決定了刪除先前時刻的信息,輸入門決定了保存當(dāng)前時刻的信息,輸出門決定了輸出到下一時刻的信息,正是這三種門結(jié)構(gòu)對信息的篩選,解決了梯度消失和梯度爆炸問題,同時保證了對重要信息的長期記憶。
本文用于神經(jīng)網(wǎng)絡(luò)訓(xùn)練和測試的數(shù)據(jù)共計2335 組,其中訓(xùn)練集占80%,測試集占20%,10 組數(shù)據(jù)作為驗證數(shù)據(jù),使用Python 經(jīng)訓(xùn)練和測試數(shù)據(jù)多次試驗后,搭建如下LSTM 神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu):
輸入層:氟化鋁下料量、出鋁量、電流、LiF、鐵含量、設(shè)定電壓、下料量、鋁水平、MgF、分子比10 個特征當(dāng)天的數(shù)據(jù)
隱含層:2 層,每層50 個LSTM 神經(jīng)元
輸出層:氟化鋁添加量、出鋁量2 個特征次日的數(shù)據(jù)
表1 其他參數(shù)設(shè)置
第一步,對輸入和輸出數(shù)據(jù)使用離差標(biāo)準(zhǔn)化算法進行歸一化處理;
第二步,對數(shù)據(jù)集進行劃分,將80%數(shù)據(jù)作為訓(xùn)練集,20%作為測試集,最后再選取10 天的數(shù)據(jù)對網(wǎng)絡(luò)預(yù)測效果再次進行驗證;
第三步,使用搭建好的神經(jīng)網(wǎng)絡(luò)對訓(xùn)練集的輸入、輸出數(shù)據(jù)進行訓(xùn)練;
第四步,使用訓(xùn)練好的模型對測試集的輸入數(shù)據(jù)進行預(yù)測;
第五步,將輸出的預(yù)測值與真實值進行反歸一化處理并計算MAE(平均絕對誤差),同時畫出預(yù)測值與真實值的曲線對比圖;式中:n——測試集數(shù)據(jù)行數(shù);
yi——第i 行真實值;
y?i——第i 行預(yù)測值。
第六步,選取訓(xùn)練集和測試集以外連續(xù)10 天數(shù)據(jù)對網(wǎng)絡(luò)進行驗證。
訓(xùn)練集數(shù)據(jù)在迭代48 次之后測試集的損失函數(shù)穩(wěn)定在0.0122~0.127 之間。
圖2 損失函數(shù)衰減圖
使用測試集數(shù)據(jù)進行預(yù)測,得到預(yù)測值與真實值的曲線擬合效果較好,其中氟化鋁添加量的MAE1=2.341,出鋁量的MAE2=32.566,均在鋁電解工業(yè)誤差允許范圍內(nèi),曲線擬合情況如圖3、圖4 所示。
圖3 氟化鋁添加量預(yù)測值與真實值曲線擬合
圖4 出鋁量預(yù)測值與真實值曲線擬合
最后選取連續(xù)10 天數(shù)據(jù)進行驗證得到預(yù)測結(jié)果如表2、表3 所示。
表2 氟化鋁添加量預(yù)測驗證
?
表3 出鋁量預(yù)測驗證
從驗證結(jié)果可以得出:氟化鋁添加量預(yù)測值與真實值相比平均絕對誤差為1.32,最大誤差2.78,最小誤差0.09,該誤差不影響實際生產(chǎn)中參數(shù)的穩(wěn)定[7];出鋁量預(yù)測值與真實值相比平均絕對誤差為25.21,最大誤差51.82,最小誤差6.13,同時相鄰兩天出鋁量的相差未超過50kg,使得生產(chǎn)穩(wěn)定性得以保障[2],因此本算法預(yù)測的氟化鋁添加量和出鋁量符合實際生產(chǎn)要求。
經(jīng)數(shù)據(jù)訓(xùn)練、測試和驗證證明了本文的預(yù)測算法能夠較準(zhǔn)確地預(yù)測氟化鋁添加量和出鋁量,能夠滿足實際生產(chǎn)需要,該算法還需要在實際生產(chǎn)實踐中進行進一步的驗證。