秦 楠 駱 俊 程小舟 劉自杰 孫 晨 張思涵徐瑞玲 陶 陶
(1.中鋼集團(tuán)馬鞍山礦山研究總院股份有限公司;2.安徽工業(yè)大學(xué)計(jì)算機(jī)科學(xué)與技術(shù)學(xué)院;3.中鋼礦院(馬鞍山)智能應(yīng)急科技有限公司)
在全球化的大背景下,礦產(chǎn)品的穩(wěn)定供應(yīng)對(duì)于國家經(jīng)濟(jì)的安全和持續(xù)發(fā)展至關(guān)重要[1-2]。選礦是非煤礦山重要的組成部分,穩(wěn)定選礦生產(chǎn),提高生產(chǎn)效率,降低能耗,提高選礦生產(chǎn)指標(biāo)尤為重要。選礦工藝流程主要包括破碎、篩分、磨礦分級(jí)、選別、尾礦濃縮等,磨礦分級(jí)起著承上啟下的作用。通過合理的磨礦分級(jí),可以有效提高磨機(jī)的臺(tái)時(shí)處理能力,使有用礦物與脈石充分解離,為后續(xù)的選別作業(yè)提供合適的條件。
磨礦分級(jí)一般采用磨機(jī)與水力旋流器閉路流程,通過對(duì)磨機(jī)運(yùn)行狀態(tài)的檢測與控制、工藝參數(shù)的檢測與控制、旋流器生產(chǎn)過程的控制,實(shí)現(xiàn)穩(wěn)定溢流粒度、提高分級(jí)效率的目的。旋流器溢流粒度穩(wěn)定在一定范圍內(nèi),是衡量磨礦分級(jí)效果的關(guān)鍵指標(biāo)?,F(xiàn)階段,溢流粒度的檢測主要通過人工取樣化驗(yàn)和儀表檢測。人工取樣存在滯后性,生產(chǎn)無法實(shí)時(shí)調(diào)節(jié),影響產(chǎn)品質(zhì)量。儀表檢測投資成本高、易出現(xiàn)故障、維護(hù)量大,檢測精度不能滿足指標(biāo)要求。為此,本文提出一種基于改進(jìn)深度森林的機(jī)器學(xué)習(xí)方法,以實(shí)現(xiàn)溢流粒度分布的在線實(shí)時(shí)預(yù)測。
以某選礦廠一段磨礦分級(jí)環(huán)節(jié)為研究對(duì)象,預(yù)測一段磨礦流程中旋流器的溢流粒度分布,工藝流程見圖1。
原礦倉礦石通過下料設(shè)備進(jìn)入給礦皮帶,經(jīng)過給礦皮帶進(jìn)入球磨機(jī),利用皮帶秤計(jì)量礦石的礦量。球磨機(jī)中的磨礦濃度由礦量按比例加水間接控制,球磨機(jī)排出的礦漿經(jīng)內(nèi)部管道進(jìn)入礦漿池,礦漿池加水調(diào)節(jié)礦漿濃度,經(jīng)底流泵打入旋流器,旋流器溢流進(jìn)入后續(xù)選別作業(yè),旋流器返砂進(jìn)入球磨機(jī)二次球磨[3]。設(shè)備包括給礦皮帶、球磨機(jī)、礦漿池、底流泵、旋流器等生產(chǎn)設(shè)備,液位計(jì)、流量計(jì)、皮帶秤、壓力計(jì)、濃度計(jì)、粒度計(jì)等在線檢測設(shè)備。工藝參數(shù)包括磨機(jī)給礦量、磨機(jī)給水量、磨機(jī)濃度、礦漿池液位、補(bǔ)加水流量、旋流器給礦壓力、給礦流量、給礦濃度、溢流濃度、溢流粒度、返砂比。
磨礦過程是一個(gè)機(jī)理復(fù)雜、影響因素多、非線性、大滯后的時(shí)變系統(tǒng),生產(chǎn)設(shè)備眾多,難以建立所有控制參數(shù)的數(shù)學(xué)模型,且礦石硬度和粒度對(duì)球磨機(jī)運(yùn)行特性有較大影響,各環(huán)節(jié)相互作用,相互影響。因此,磨礦分級(jí)作業(yè)控制要求在保證產(chǎn)品質(zhì)量的前提下,最大限度地提高球磨機(jī)的處理能力,降低能耗。
深度森林模型是由南京大學(xué)周志華課題組提出的一種基于隨機(jī)森林[4]的深度學(xué)習(xí)模型。深度森林算法所需參數(shù)較少、魯棒性強(qiáng)、可自動(dòng)調(diào)整復(fù)雜度,對(duì)于高維、大量、復(fù)雜的數(shù)據(jù)處理問題,可以提高模型的預(yù)測能力和泛化能力,從而有效地提高數(shù)據(jù)處理效率和質(zhì)量。本試驗(yàn)基于深度森林算法建立了回歸模型,預(yù)測溢流粒度分布,深度森林模型建立流程見圖2。
本文選取某選礦廠的實(shí)際生產(chǎn)數(shù)據(jù),時(shí)間長度為120 d,數(shù)據(jù)采樣率為1 min1 次,總樣本數(shù)量為172 800,單樣本包含19 個(gè)特征屬性。試驗(yàn)?zāi)P突谏疃壬帜P瓦M(jìn)行改進(jìn),添加了特征提取層以提升模型輸入質(zhì)量和訓(xùn)練速度,改進(jìn)多粒度掃描過程以增強(qiáng)深度森林的特征學(xué)習(xí)能力,模型整體運(yùn)行流程如下。
(1)數(shù)據(jù)預(yù)處理。使用Python 讀取數(shù)據(jù)集D,對(duì)數(shù)據(jù)集中的缺失值使用線性擬合法進(jìn)行填補(bǔ),針對(duì)異常值使用均值濾波進(jìn)行值替換,之后將數(shù)據(jù)集D按7∶3的比例劃分為訓(xùn)練集D1和測試集T1,D1∈Rl×m,其中l(wèi)表示訓(xùn)練集D1的樣本數(shù)大小,m表示特征變量的個(gè)數(shù)。
(2)輸入特征提取。對(duì)訓(xùn)練集D1中的單個(gè)樣本,隨機(jī)打亂n次并保存為一個(gè)二維矩陣,所有樣本對(duì)應(yīng)產(chǎn)生二維矩陣的集合Matrix。使用二維矩陣集合Matrix訓(xùn)練單個(gè)一維卷積神經(jīng)網(wǎng)絡(luò)Conv 和其連接的線性層Linear。其中Conv 的輸入通道數(shù)即為打亂次數(shù)n次,輸出通道數(shù)設(shè)為1,調(diào)整卷積的核大小和步長使之輸出向量大小為m/2,其連接的線性層Linear 的輸出為1,即下一時(shí)刻的溢流粒度。當(dāng)卷積神經(jīng)網(wǎng)絡(luò)Conv和線性層Linear訓(xùn)練完成后,僅使用預(yù)訓(xùn)練的卷積神經(jīng)網(wǎng)絡(luò)Conv 產(chǎn)生的中間向量,其包含的m/2 個(gè)特征作為改進(jìn)深度森林模型的輸入。
(3)設(shè)定訓(xùn)練參數(shù)。設(shè)定深度森林回歸模型中的一些初始參數(shù),如每個(gè)森林中決策樹的數(shù)目n,滑動(dòng)窗的大小di,對(duì)應(yīng)窗口大小的步長stepi和滑動(dòng)次數(shù)上限limiti等。與傳統(tǒng)過程不同,對(duì)多粒度窗口滑動(dòng)過程進(jìn)行人為限制,減少了深度森林生成的時(shí)空復(fù)雜度,避免了內(nèi)存溢出問題,具體設(shè)置見表1。
?
(4)多粒度窗口滑動(dòng)。使用大小為di的滑動(dòng)窗,分別對(duì)訓(xùn)練集D1進(jìn)行拆分,生成不同大小的特征向量gvi。對(duì)滑動(dòng)窗di提取出來的特征向量gvi分別用于訓(xùn)練隨機(jī)森林模型和完全隨機(jī)森林模型,生成2個(gè)不同的局部特征向量并連結(jié),最終生成特征向量gi。
(5)模型生成。將上一階段中生成的特征向量gi用于訓(xùn)練級(jí)聯(lián)森林,gi經(jīng)過級(jí)聯(lián)森林的第ni級(jí)產(chǎn)生一個(gè)增廣特征向量agni,將agni和最初的特征向量連結(jié)為第i個(gè)滑動(dòng)窗第n級(jí)的特征向量gni。計(jì)算特征向量gni的訓(xùn)練誤差,隨著誤差逐漸降低,將當(dāng)前的特征向量作為下一層聯(lián)合森林的輸入,當(dāng)誤差連續(xù)3層不再降低,則終止訓(xùn)練過程,確定級(jí)聯(lián)森林級(jí)數(shù)。
(6)產(chǎn)生預(yù)測結(jié)果。級(jí)聯(lián)森林最后一層作為評(píng)估層,計(jì)算所有森林預(yù)測的平均值,即為最終深度森林回歸預(yù)測的結(jié)果y?。
該模型對(duì)多粒度掃描的過程進(jìn)行了改進(jìn)。傳統(tǒng)深度森林對(duì)多粒度掃描產(chǎn)生的子樣本的全部結(jié)果進(jìn)行拼接作為其輸出,針對(duì)這部分輸出,本研究利用不同的評(píng)價(jià)指標(biāo)評(píng)估子樣本的預(yù)測性能,選擇性能最優(yōu)的前85%子樣本拼接,作為改進(jìn)的輸出結(jié)果(圖3)。改進(jìn)的多粒度掃描方法可有效提高模型的預(yù)測準(zhǔn)確性,在增強(qiáng)深度森林的特征學(xué)習(xí)能力的同時(shí),避免性能較差的子樣本對(duì)模型結(jié)果造成負(fù)面影響[5]。
深度森林模型的復(fù)雜度可根據(jù)檢驗(yàn)集的情況自動(dòng)調(diào)整,通過設(shè)置較少的超參數(shù),模型便可在不同規(guī)模數(shù)據(jù)集上具有優(yōu)異的預(yù)測性能和較高的準(zhǔn)確性。選擇不同的森林模型(本試驗(yàn)采用隨機(jī)森林模型和完全隨機(jī)森林模型各2個(gè)),增加基模型的多樣性,提高集成學(xué)習(xí)效果。試驗(yàn)中利用訓(xùn)練集D1,分別對(duì)每個(gè)森林中決策樹數(shù)量(n_trees)和深度森林模型中決策樹的最大深度(max_depth)2個(gè)參數(shù)調(diào)優(yōu),具體參數(shù)取值見表2。不同決策樹的最大深度下,均方誤差MSE 隨決策樹數(shù)量變化的曲線見圖4。
?
由圖4 可見,n_trees 在0~50 時(shí),MSE 下降速度較快;n_trees 在50~100 時(shí),下降變緩;n_trees 大于150 時(shí),MSE 趨 于 平 緩;綜 上,取n_trees 為150,max_depth為15時(shí),MSE 結(jié)果較好。
改進(jìn)深度森林回歸模型預(yù)測溢流粒度的初始參數(shù)設(shè)置見表3,訓(xùn)練好的改進(jìn)深度森林模型用來預(yù)測測試集數(shù)據(jù)。
?
在改進(jìn)深度森林算法預(yù)測溢流粒度的回歸模型中,max_depth 取15,n_trees 取150,作為改進(jìn)深度森林模型的初始參數(shù)。改進(jìn)深度森林模型對(duì)溢流粒度分布預(yù)測的試驗(yàn)結(jié)果顯示,訓(xùn)練集均方誤差為0.009 71,決定系數(shù)為0.940 51,測試集均方誤差為0.010 53,決定系數(shù)為0.929 64。測試集取前100條數(shù)據(jù),其溢流粒度分布的真實(shí)值和預(yù)測值的比較結(jié)果見圖5。
統(tǒng)一試驗(yàn)條件下,利用決策樹、隨機(jī)森林、深度森林、改進(jìn)深度森林這4種以樹結(jié)構(gòu)為基礎(chǔ)的預(yù)測模型訓(xùn)練樣本數(shù)據(jù),并對(duì)測試集T1進(jìn)行測試,預(yù)測結(jié)果見表4,預(yù)測溢流粒度絕對(duì)誤差對(duì)比見圖6。
?
使用改進(jìn)深度森林算法,在深度森林的基礎(chǔ)上,對(duì)輸入特征進(jìn)行精練,改進(jìn)多粒度掃描過程,增加基模型的多樣性,提高集成學(xué)習(xí)效果。最終改進(jìn)深度森林的訓(xùn)練集的R2達(dá)0.940 51,MSE 為0.009 71,測試集的R2為0.929 64,MSE 為0.010 53,改進(jìn)深度森林模型比決策樹、隨機(jī)森林和深度森林模型訓(xùn)練集損失分別降低了23.1%、15.4%和9.51%,測試集損失分別降低了23.5%、12.8%和6.4%,預(yù)測性能較好,準(zhǔn)確性較高。
由圖6 可見,統(tǒng)一試驗(yàn)條件,選擇測試集前50 條數(shù)據(jù),和決策樹、隨機(jī)森林及傳統(tǒng)深度森林模型相比,改進(jìn)深度森林模型預(yù)測溢流粒度的絕對(duì)誤差總體較低,顯示出改進(jìn)深度森林算法預(yù)測溢流粒度分布情況準(zhǔn)確性較高。
為驗(yàn)證改進(jìn)模型對(duì)比其他方法的效果,試驗(yàn)選取了傳統(tǒng)的數(shù)學(xué)模型和主流的序列預(yù)測模型,在相同的試驗(yàn)條件下對(duì)比改進(jìn)深度森林算法與ARIMA算法、指數(shù)平滑算法、LSTM 模型、RNN模型、Transformer模型的預(yù)測效果。預(yù)測結(jié)果見表5,預(yù)測溢流粒度絕對(duì)誤差對(duì)比見圖7。
?
由表5和圖7可知,對(duì)比數(shù)學(xué)預(yù)測方法ARIMA和指數(shù)平滑,改進(jìn)深度森林模型具有較好的預(yù)測性能,而對(duì)比主流的序列預(yù)測模型,改進(jìn)深度森林模型也具有一定的領(lǐng)先優(yōu)勢??偟膩碚f,改進(jìn)深度森林算法對(duì)本身的結(jié)構(gòu)過程進(jìn)行了一定的優(yōu)化,在多領(lǐng)域算法試驗(yàn)對(duì)比上驗(yàn)證了模型在溢流粒度預(yù)測方面的有效性。
針對(duì)礦業(yè)生產(chǎn)中溢流粒度的預(yù)測問題,將特征提取層引入深度森林模型中,對(duì)深度森林的多粒度窗口滑動(dòng)過程進(jìn)行調(diào)整,改進(jìn)了多粒度掃描的過程。通過選取某選礦廠的真實(shí)生產(chǎn)數(shù)據(jù)進(jìn)行驗(yàn)證,將改進(jìn)模型與多領(lǐng)域的傳統(tǒng)算法進(jìn)行對(duì)比,通過試驗(yàn)驗(yàn)證了所提出的改進(jìn)深度森林模型在溢流粒度預(yù)測方面的優(yōu)異性。