高 鵬 張寧豫 張臣一 吳 劍
(1.東北大學資源與土木工程學院,遼寧沈陽110819;2.難采選鐵礦資源高效開發(fā)利用技術(shù)國家地方聯(lián)合工程研究中心,遼寧沈陽110819;3.東北大學基因礦物加工研究中心,遼寧沈陽110819;4.東北大學信息科學與工程學院,遼寧沈陽110819)
浮選作為選礦中應用最廣泛的一種方法,是利用礦物表面物理化學性質(zhì)的差異來選擇礦物的方法,按照分選方式不同可分為正浮選和反浮選,浮選中常用的藥劑有捕收劑、抑制劑、活化劑和pH值調(diào)整劑等。浮選過程由于工藝復雜,影響因素較多,因此優(yōu)化浮選工藝指標是非常困難的,精礦品位和尾礦品位作為浮選的重要工藝指標與藥劑用量之間存在復雜的非線性關(guān)系,而且特征變量之間的交互效應會影響工藝指標,因此直接通過非線性回歸模型進行預測在克服維數(shù)災禍問題方面存在一定難度,需要對模型進行一些無法驗證的假設(shè),導致預測效果一般,而藥劑消耗成本是選礦成本中重要的一部分,因此藥劑用量的預測是浮選作業(yè)中非常重要的問題。
隨著人工智能和智能制造技術(shù)的發(fā)展,深度學習方法廣泛應用于工業(yè)生產(chǎn)過程中,將深度學習應用于浮選藥劑預測取得了良好的應用效果。本文以某選礦廠為范例,基于統(tǒng)計學習理論對其浮選車間的藥劑消耗與影響因素進行建模,并利用模型進行優(yōu)化及預測,達到管控藥劑用量的目的。
由于浮選作業(yè)中藥劑用量預測的難度較大,獲得有價值的數(shù)據(jù)較難,因此國內(nèi)外相關(guān)研究較少,耿增顯等[1]利用典型案例推理的方法對復雜工業(yè)過程進行建模與控制。李海波等[2]研究了浮選過程混合智能優(yōu)化的控制方法,基于RBF神經(jīng)網(wǎng)絡(luò)模型實現(xiàn)優(yōu)化控制方案。王偉[3]利用遺傳算法和非線性規(guī)劃技術(shù)研究了粗銅浮選過程加藥量的預測和控制。Vazifeh等[4]使用統(tǒng)計學技術(shù)研究了浮選過程中藥劑消耗的問題,N.Aslan[5]使用統(tǒng)計學技術(shù)即二次規(guī)劃問題研究了浮選藥劑消耗的優(yōu)化問題,F(xiàn).Nakhaeie[6]建立的基于人工神經(jīng)網(wǎng)絡(luò)的ANN模型證實前饋神經(jīng)網(wǎng)絡(luò)能以足夠的精度預測工業(yè)CISA浮選柱精礦中銅和鉬的品位。
由于在未來的固定時間內(nèi)(周、月、年),原礦處理量、原礦品位、原礦磁性鐵含量、原礦氧化亞鐵含量、浮選給礦品位、浮選給礦量、浮選精礦品位、浮選尾礦品位、浮選回收率、浮選產(chǎn)率,(X1,X2,???,X10)都是隨機的,無法確定,因此預測未來1周、1月及1年的藥劑用量,不僅是某1 d藥劑消耗乘以相應的天數(shù),本文使用Reject-Accept(R-A)隨機抽樣的方法來生成服從數(shù)據(jù)樣本概率分布特征的隨機數(shù),其核心思想是通過事件出現(xiàn)的頻率特征來模擬估計事件發(fā)生的概率規(guī)律,即通過大量的模擬試驗,生成未來1周、1月及1年的輸出隨機數(shù)矩陣,從而反映1年中輸入特征的變化規(guī)律,最后通過神經(jīng)網(wǎng)絡(luò)模型預測出對應周月年的藥劑消耗量,并通過對多次模擬的結(jié)果取均值,進而得到未來藥劑消耗的總和。
因此,利用數(shù)據(jù)庫中的數(shù)據(jù),采用核概率密度函數(shù)估計生成每個特征的概率密度函數(shù),再利用R-A算法生成不同特征分布的隨機數(shù),利用這些隨機數(shù)生成每種藥劑最終的用量,每次都分別生成7條、30條、365條數(shù)據(jù),進行300次模擬,利用這些特征數(shù)據(jù)預測相應的藥劑消耗,再求和得到周、月、年的藥劑消耗總和。生成周、月、年的特征數(shù)據(jù)后,利用訓練好的神經(jīng)網(wǎng)絡(luò)模型對現(xiàn)有的數(shù)據(jù)進行預測,再對不同天數(shù)藥劑消耗量做預測,即可得到相應的周、月、年的藥劑消耗。
通過基本描述性分析發(fā)現(xiàn),收集到的一些參數(shù)指標變化較小,因此為了研究這些參數(shù)的極限分布,就需要大量的樣本輔助進行統(tǒng)計推斷,因此采用歷史的數(shù)據(jù)作為輔助,建立周、月、年預測模型。隨著礦石的開采,原礦的性質(zhì)也會發(fā)生一定的變化,從而引起浮選藥劑用量的變化,為使該模型能夠滿足現(xiàn)場的長期使用,所以將原礦品位、磁性鐵含量、碳酸鐵含量和亞鐵含量等原礦性質(zhì)作為數(shù)據(jù)處理的指標。本文以原礦碳酸鐵含量數(shù)據(jù)作為范例進行算法預測。
(1)利用555條數(shù)據(jù)作為樣本,采用核概率密度函數(shù)估計的方法,生成該指標的概率密度圖,假設(shè)原礦碳酸鐵的含量數(shù)據(jù)分別為Z1,Z2,…,Zn,概率密度函數(shù)為fZ(z),因此概率密度函數(shù)的估計為:
步驟如下:
步驟1:產(chǎn)生均勻分布的隨機數(shù)Y~fY(y);
步驟2:產(chǎn)生均勻分布隨機數(shù)U~U(0,1);
(3)對原礦碳酸鐵含量,生成M個n維的向量,把其中的第i個帶入就能獲得完整的數(shù)據(jù),再利用完整的數(shù)據(jù)做預測,1≤i≤n,因此采用模型進行預測時,可以得到M個預測值,把這M個預測值進行平均即為藥劑用量的最終預測值。
為了對樣本數(shù)據(jù)進行采樣,按照上節(jié)算法的運算流程,采用核概率密度函數(shù)估計的方法,生成原始輸入變量的概率密度函數(shù)圖,分別獲取X1,X2,???,X10的概率密度函數(shù)fZ1(z),???,fZ10(z),如圖1所示。
在獲得原始輸入變量的概率密度分布后,由于構(gòu)造參考分布時,使用的是均勻分布,故選擇X1,X2,???,X10分別服從如表1所示的均勻分布。
由于在構(gòu)造參考分布時,使用的是均勻分布,故在確定k值的過程中,選取如表2所示的值:
根據(jù)2.2節(jié)的采樣步驟,按照表1與表2的取值范圍開始生成樣本,在取得采樣結(jié)果后,將生成的X1,X2,???,X10數(shù)據(jù)作為神經(jīng)網(wǎng)絡(luò)的輸入樣本,將反浮選天、周、月、年各藥劑總消耗數(shù)據(jù)Y1,Y2,Y3,Y4分別作為模型的輸出目標值,隨后采用前饋神經(jīng)網(wǎng)絡(luò)對數(shù)據(jù)進行擬合預測。
nl表示網(wǎng)絡(luò)的層數(shù),第一層為輸入值,最后一層為輸出值;sl表示第l層神經(jīng)元的個數(shù);f(?)表示的是激活函數(shù);表示第l層到第l+1層的權(quán)重矩陣;表示第l層到第l+1層的偏置;z(l)∈Rsl表示第l層的輸入;表示第l層中第i個神經(jīng)元的輸入;表示第l層的輸出,其中表示第l層中第i個神經(jīng)元的輸出。每個神經(jīng)元的表達式如下:
需要利用數(shù)據(jù)訓練,求出相應的權(quán)重矩陣及偏置向量,采用反向傳播算法給定樣本容量為n的樣本訓練集,目標函數(shù)為:
采用梯度下降算法極小化目標函數(shù)J(W,b)
在把數(shù)據(jù)集填補后,利用前饋神經(jīng)網(wǎng)絡(luò)建模預測藥劑消耗。
通過數(shù)據(jù)驅(qū)動的特征篩選方法及行業(yè)知識,采用10個特征變量預測藥劑用量,10個特征變量分別記為原礦量X1,原礦品位X2,原礦磁性鐵含量X3,原礦碳酸鐵含量X4,原礦亞鐵含量X5,浮選精礦品位X6,浮選尾礦品位X7,浮選精礦回收率X8,浮選精礦產(chǎn)率X9,浮選給礦量X10。預測4種藥劑用量:捕收劑用量Y1,pH調(diào)整劑用量Y2,抑制劑用量Y3,活化劑用量Y4,使用填補后的555條數(shù)據(jù),進行建模研究,并利用隨機數(shù)生成的方法得到未來7 d(1周)、30 d(1月)、365 d(1年)的特征數(shù)據(jù),預測結(jié)果見表3。
如表4所示,通過計算生產(chǎn)數(shù)據(jù)與預測數(shù)據(jù)的誤差表明,預測7 d(1周)的數(shù)據(jù)結(jié)果精度較高,誤差普遍小于5%;預測30 d(1月)和預測365 d(1年)的數(shù)據(jù)相比于生產(chǎn)實際數(shù)據(jù)誤差波動較大,這是由于在實際生產(chǎn)過程中存在不定期的設(shè)備停車檢修和流程考察調(diào)試等無法預測的狀況,所以實際的藥劑用量會根據(jù)現(xiàn)場的情況作出相應的調(diào)整,導致長期的預測結(jié)果與實際結(jié)果存在較大波動。
本文通過對浮選藥劑消耗的研究,采用拒絕采樣算法對工業(yè)生產(chǎn)中的缺失數(shù)據(jù)進行填補,把填補后的數(shù)據(jù)利用前饋神經(jīng)網(wǎng)絡(luò)進行建模,創(chuàng)新性地將統(tǒng)計推斷和深度學習相融合,對短期現(xiàn)場生產(chǎn)實踐的浮選藥劑消耗量預測具有一定的指導意義。