袁叢祥,劉志祥,楊小聰,郭金峰,萬串串,熊 帥,劉偉軍
(1.中南大學資源與安全工程學院, 湖南 長沙 410083;2.礦冶科技集團有限公司, 北京 102628;3.國家金屬礦綠色開采國際聯(lián)合研究中心, 北京 102628;4.中鋼集團馬鞍山礦山研究總院股份有限公司, 安徽 馬鞍山 243000)
隨著我國淺部礦物開采資源的日漸枯竭,未來礦產資源的開發(fā)將聚焦于第二深度空間(1 000~2 000 m),深部硬巖礦山的安全高效開采及造成的環(huán)境危害備受關注[1–2]。充填采礦法不僅能夠減少尾礦的地表堆積,有效緩解日益突出的礦山環(huán)境污染問題,而且能夠控制深部開采面臨的高地應力問題[3–4]。充填體強度的測定和預測已成為學術界和工業(yè)界的研究熱點。國內外學者提出了許多預測充填體強度的方法,例如:非線性多元回歸、彈性力學分析和人工智能等。韓斌等[5]構建了不同養(yǎng)護齡期的充填體強度與料漿體積分數、水泥含量和灰砂比的多元回歸方程。付自國等[6]基于皮爾遜相關性理論,提出了超細尾砂膠結充填體雙變量強度模型,并通過進一步耦合養(yǎng)護齡期,構建了三變量強度模型。魏曉明等[7]通過實時監(jiān)測充填體的三向應力,分析了拱效應和采動應力的運移機制,建立了內部應力預測模型。然而,上述研究僅針對適合特定礦山的充填材料,缺乏一定的泛化能力。
人工智能方法能夠有效處理復雜多因素、非線性問題,諸多學者利用人工智能算法建立了充填體強度預測模型。Orejarena 等[8]構建了人工神經網絡(artificial neural network,ANN)模型預測膠結充填體耐硫酸鹽腐蝕的強度。劉志祥等[9]構建了預測磷石膏和粉煤灰充填體強度的BP(back propagation)神經網絡模型,并利用遺傳算法(genetic algorithm,GA)對其進行優(yōu)化,進一步提高了預測精度。Qi 等[10]構建了遺傳編程(genetic programming,GP)模型預測膠結充填體強度,并與決策樹(decision tree,DT)、梯度提升機(gradient boosting machine,GBM)、隨機森林(random forest,RF)3 種機器學習模型進行對比,驗證了其預測能力更優(yōu)。傳統(tǒng)機器學習算法存在學習能力差、收斂速度慢和穩(wěn)定性差等問題[11–12]。因此集成學習模型及其優(yōu)化混合模型在該領域的應用得到進一步的研究和開發(fā)。De-Prado-Gil 等[13]對比分析了RF、GB、XGB、LightGBM 等集成學習方法在預測自密實再生骨料混凝土的抗壓強度方面的實用性。Qi 等[14]利用粒子群優(yōu)化算法調整集成增強回歸樹(boosting regression tree,BRT)膠結充填體強度預測模型的超參數,得到了預測性能更強的混合PSO-RBT 模型。Xiong 等[15]利用鯨魚優(yōu)化算法(whale optimization algorithm,WOA)優(yōu)化極限梯度提升模型(XGBoost),建立了磷石膏充填體強度預測模型。Lu 等[16]應用梯度提升回歸樹(gradient boosting regression tree,GBRT)算法,提高了對膠結充填體單軸抗壓強度的預測精度,降低了預測誤差。
目前,在應用機器學習,特別是應用集成學習模型預測膠結充填體的單軸抗壓強度方面已經取得了豐碩成果,但對應用極限梯度提升的混合集成學習模型鮮有報道?;诖?,本研究選擇固體質量分數、水泥占比和尾砂占比及養(yǎng)護齡期作為輸入參數,以充填體試塊的單軸抗壓強度作為輸出參數,研究WOA-XGBoost 混合模型對膠結充填體抗壓強度的預測能力,利用WOA 調整XGBoost 模型的超參數,防止過度擬合,實現全局優(yōu)化。通過與XGBoost、RF 和WOA-RF 模型比較,驗證混合模型的預測效果。同時,對輸入參數進行重要性分析,確定影響充填體強度的關鍵因素以及各輸入參數的影響程度,以期為礦山充填材料的設計和配比優(yōu)化提供參考。
試驗選用某鉛鋅礦尾礦庫經晾曬的尾砂作為充填骨料。于現場取樣的強度等級為42.5 的普通硅酸鹽水泥(P.O42.5)作為充填膠結材料,用以改善尾砂膠結充填體的整體性能。使用礦區(qū)普通自來水作為充填水,配制不同濃度的充填料漿。對礦尾砂充填料進行物理化學和力學性質測定,以便分析和預測充填體強度。取樣后,通過激光粒度分析法進行粒度分析,繪制尾砂粒級組成曲線,如圖1 所示。
圖1 尾砂粒級組成曲線Fig.1 Particle size distribution curve of the tailings
圖1 所示分布曲線表明,該鉛鋅礦的尾砂粒度主要分布在38 μm 以上(占比50%),20 μm 以下占比超過36.8%,整體而言,尾砂粒級適中。試驗測得尾砂的物理性質參數和粒徑分布如表1 所示。其中:D10、D50、D60、D90分別代表粒級組成曲線上累積占比為10%、50%、60%和90%時對應的顆粒粒徑。根據Fu 等[17]、李夕兵等[18]的研究,影響尾砂膠結充填體強度的化學成分主要是陽離子。尾砂的化學成分采用常規(guī)化學方法與X 射線衍射法相結合進行測定。采用SIEMENS D500 型X 射線分析儀測定尾砂化學成分,測定結果如表2 所示。
表1 分級尾砂的物理性質和粒徑分布Table 1 Physical property and particle size distribution of classified tailings
表2 尾砂化學成分(陽離子)Table 2 Chemical components of the tailings (cations) %
為避免偶然性,每個測試組制備3 個充填體試塊。為了獲得測試效果更佳的充填體試塊,澆注前在模具內涂抹潤滑油以便于脫模。將充填物料(尾砂和水泥)按比例配料,根據設計的不同質量分數加水攪拌180 s 制漿,并注入7.07 cm×7.07 cm×7.07 cm 的標準三聯(lián)金屬試模中,澆注過程中,采用邊攪拌邊注模的方式,以避免料漿懸浮和產生氣泡。模具澆注滿后,等待料漿自然沉降,試塊經過初凝(1~2 d)、刮平、自立(2~3 d)后進行脫模處理。為模擬井下環(huán)境,放入養(yǎng)護箱中進行低溫環(huán)境養(yǎng)護(養(yǎng)護溫度10 ℃,濕度90%),養(yǎng)護天數分別為7、14、28、60 和90 d。
達到養(yǎng)護齡期后,對不同固體質量分數、水泥占比、尾砂占比和養(yǎng)護天數的試塊進行抗壓強度測試。由于充填體強度較低,一般的壓力試驗機會產生較大的試驗誤差,因此本研究使用MTS815 液壓伺服巖石力學測試系統(tǒng),對所有試塊以0.5 mm/min 勻速加載至試塊發(fā)生破壞,測定試塊的單軸抗壓強度(σc)。為確保試驗結果的準確性,每個養(yǎng)護齡期取3 個試塊的試驗平均值作為該齡期的充填體單軸抗壓強度。試塊單軸抗壓強度測試過程如圖2 所示,試驗方案及測定結果如表3 所示。
表3 尾砂膠結充填體強度測試結果Table 3 Test results for unconfined compressive strength of cemented paste backfill
圖2 試塊測試過程示意圖Fig.2 Schematic diagram of the test process
由表3 的充填體強度試驗結果可知:(1) 水泥是影響充填體膠結的關鍵因素,當固體質量分數一定時,試塊抗壓強度隨著水泥含量的增加而顯著提高,當水泥占比為20%時,試塊的內部結構比較致密且黏結性好,強度達到各養(yǎng)護齡期的最大值;(2) 試塊單軸抗壓強度隨養(yǎng)護天數的增加而增大,且固體質量分數越高,增長幅度越大;(3) 充填體強度與質量分數存在一定的相關性,在相同配比條件下,試塊的單軸抗壓強度隨著料漿濃度的增大而提高。
WOA 是Mirjalili 等[19]提出的一種模擬座頭鯨群體狩獵行為的元啟發(fā)式優(yōu)化算法。與其他算法不同的是,WOA 采用隨機搜索代理的方式來模擬捕獵行為,實現了全局搜索。這種特殊捕獵方法被稱為氣泡網捕食法,即座頭鯨沿著圓圈或“9”字形向上游動并不斷釋放氣泡包圍獵物[20–21]。該行為可以總結為包圍獵物、氣泡網攻擊獵物和隨機搜索獵物3 部分。
(1) 包圍獵物
WOA 預先將狩獵目標或者接近最優(yōu)搜索代理的位置假定為獵物目前最佳候選位置。其余個體會實時更新自己相對于最佳代理的位置,數學表達式為
式中:t為當前迭代次數,X(t) 為當前搜索代理的位置向量,X?(t) 為當前最佳搜索代理的位置向量,A和C為系數矩陣。A和C的計算公式為
式中:r1、r2為 [0,1] 的隨機向量,a在 [0,2]線性遞減。
(2) 氣泡網攻擊獵物(開發(fā)階段)
座頭鯨的氣泡網攻擊行為分為收縮包圍和螺線位置更新兩種機制。這兩種行為同時發(fā)生,鯨魚隨機選擇縮小繞圈或沿螺旋路徑游動,兩種方式發(fā)生概率均為50%。據此實時更新鯨魚的位置,數學表達式為
式中:D′=|X?(t)-X(t)|, 為當前搜索代理與最佳搜索代理位置之間的距離;b為決定螺旋路徑形狀的常數;l為 [-1,1] 內均勻分布的隨機數;p為 [0,1]內的隨機數。
(3) 隨機搜索獵物(搜索階段)
不同于開發(fā)階段,每一次迭代,其余搜索代理根據隨機選擇的搜索代理而非目前最佳搜索代理實時更新搜索代理的位置。迭代過程為
式中:Xrand(t)為隨機搜索代理的位置向量。
WOA 算法通過對開發(fā)和搜索能力的平衡與轉化,突破了其他種群優(yōu)化算法容易陷入局部最優(yōu)的局限,實現了全局搜索的優(yōu)化[19,22]。
XGBoost 模型的理論基礎是分類和回歸樹的理論,能夠非常有效地解決回歸和分類問題,屬于集成學習模型[23]。該算法在梯度提升決策樹(gradient boosted decision tree,GBDT)模型的基礎上,改進了目標函數的計算方法,并減少了運算次數。XGBoost 模型的核心在于通過構建新的決策樹優(yōu)化結構,擬合預測結果的殘差并優(yōu)化為預測分數,將每棵樹的預測分數求和作為預測模型的預測值。
數據集D={xi,yi} 包含n個樣本,每個樣本有m個特征,樣本的預測得分由每棵樹的得分累加得到,表達式為
式中:K為回歸樹的數量,F為回歸樹空間,fk(x) 為第k棵回歸樹,T為葉子節(jié)點(特征)的個數,xi為輸入參數, ωq(x)為結構函數q(x) 將輸入參數xi映射到各葉子節(jié)點T后每棵樹的得分。
XGBoost 模型將目標函數的優(yōu)化問題轉化為求解二次函數的最小值問題,并使用損失函數的二階導數信息來訓練決策樹模型。為了避免集成模型的過度擬合并生成更簡單的樹集合,將模型復雜度作為正則項加入目標函數中。XGBoost 模型的目標函數表示為
式中:yi為第i次迭代的實際值;y?i為對應的預測值;l(yi,y?i) 為預測值與實際值的誤差; ?(fk)為正則項,用于懲罰樹的復雜度。
目標函數的第t次迭代結果為
式中:ft(xi) 表示決策樹對應變量xi第t次迭代的復雜度,C為常數。
使用二階泰勒公式展開損失函數,則目標函數優(yōu)化為
式中: γ 和 λ 分 別控制葉子節(jié)點的個數和分數以調整樹的復雜度,gi和hi分別為均方損失函數的一階導數和二階導數。
XGBoost 模型在高效實現GBDT 算法的基礎上,將運算速度和準確性提升到極致,但逐級生長策略導致不必要的內存消耗[24]。為了更加快速地獲得精確預測結果,本研究通過WOA 優(yōu)化預測模型的3 個重要參數,即:最大決策樹深度(max_depth)、學習率(learning_rate)和L2 正則化系數(reg_lambda)。WOA 優(yōu)化XGBoost 模型步驟如下:
(1) 對試驗數據進行歸一化處理,并隨機劃分為訓練集和測試集;
(2) 初始化鯨魚優(yōu)化算法,設置鯨魚的搜索三維空間以及模型參數;
(3) 設置XGBoost 模型待優(yōu)化參數的范圍,生成鯨魚的初始種群;
(4) 根據所得鯨魚種群,計算每個鯨魚位置的適應度;
(5) 對得到的適應度進行排序,定位目前種群的最佳搜索代理,并將其設置為當前全局最佳位置;
(6) 根據式(1)~式(6)更新鯨魚在各種群中的位置;
(7) 在迭代優(yōu)化過程中,重復步驟(2)~步驟(6),以均方誤差為適應度函數進行迭代,當迭代次數滿足終止條件時,終止迭代并輸出最佳鯨魚位置對應的參數;
(8) 將迭代后的最佳參數(最大決策樹深度、學習率和L2 正則化系數)代入XGBoost 模型,得到訓練后的最佳預測模型,評估模型性能。
WOA 優(yōu)化XGBoost 模型的流程如圖3 所示,優(yōu)化后的超參數:最大決策樹深度為6,學習率為0.036,L2 正則化系數為0.07。
圖3 WOA 優(yōu)化XGBoost 模型流程Fig.3 XGBoost optimization process with WOA
使用該鉛鋅礦充填體配比試驗得到的80 組數據,隨機抽取64 組(80%)作為訓練集,16 組(20%)作為測試集。選擇均方根誤差(δRMSE)、平均絕對誤差(δMAE)、決定系數(R2)作為性能評價指標,評價WOA-XGBoost 預測模型對訓練集和測試集試塊單軸抗壓強度預測的準確性。計算公式為
式中:n為進行測試和訓練的樣本數目,yi、y?i和yˉ 分別為數據的實際值、預測值和實際值的平均值。
δRMSE和δMAE越小,越能體現預測模型對充填體強度預測的準確性。與此相反,采用最小二乘法進行參數估計時,R2越大,回歸效果越顯著,預測模型越精確。
以數據集的均方誤差(δMSE)作為適應度函數,獲得WOA-XGBoost 預測模型不同種群大小的適應度變化曲線,如圖4 所示。通過跟蹤每次迭代的適應度來評估訓練集數據迭代時不同種群規(guī)模的預測效果。該預測模型不同種群大小的性能參數如表4 所示。
表4 WOA-XGBoost 預測模型的性能參數Table 4 Performance metrics of the proposed WOA-XGBoost model
圖4 WOA-XGBoost 預測模型不同種群大小的適應度變化曲線Fig.4 Fitness value versus iteration curves of the WOA-XGBoost model with different population sizes
由圖4 可以看出,各種群的適應度在前3 次迭代中迅速降低,說明鯨魚優(yōu)化算法對極限梯度提升模型的參數優(yōu)化效果顯著。當迭代次數達到14 后,不同種群規(guī)模的適應度趨于穩(wěn)定,特別是種群規(guī)模為100 和125 時,收斂速度明顯提升。當種群規(guī)模達到125 時,模型具有最快的收斂速度,適應度取得最小值0.011,迭代次數為13。
根據表4 記錄的數據,訓練集的各種群決定系數均超過0.99,且均方根誤差不超過0.021 1,呈良好的正相關;測試集的決定系數均超過0.91,證實優(yōu)化后的混合模型的訓練效果良好,產生的誤差相對較低。當種群規(guī)模為125 時,決定系數最大,測試集誤差最小,訓練效果顯著優(yōu)于其他種群規(guī)模,預測模型能夠獲得最佳的性能。
WOA-XGBoost 模型預測試塊強度的訓練集和測試集預測值與實測值結果的對比如圖5 所示。訓練集中各樣本對應的預測值和實測值緊密貼合,測試集只有個別樣本的誤差較大,整體貼合度良好。對比訓練集和測試集的預測表現,證明優(yōu)化后的混合模型的測試集是經過良好訓練的,并且訓練集推廣到測試集后,WOA-XGBoost 模型能夠很好地預測充填體強度,有效降低預測誤差。
圖5 模型訓練集和測試集的預測值與實測值的對比Fig.5 Comparison of the predicted and actual values of the WOA-XGBoost model
為了進一步研究WOA-XGBoost 模型的學習能力和預測效果,以R2、δRMSE和δMAE為評價指標,與XGBoost、RF 和WOA-RF 模型的測試集進行對比,結果見圖6??梢钥闯觯cXGBoost 模型相比,WOAXGBoost 模型的δRMSE、δMAE分別降低了49%和31%,R2達到0.965 0,提高7%,證明了WOA-XGBoost 模型對預測試塊強度的可行性及準確性。
圖6 模型的性能評價參數的對比Fig.6 Comparison of performance metrics with mentioned models
圖7 顯示了4 種模型的訓練集和測試集對試塊單軸抗壓強度的預測值與實測值回歸分析結果。通過數據點相對于等值線(預測值等于實測值)的偏離程度衡量試塊強度的預測誤差,XGBoost 模型和WOA-RF 模型的訓練集數據預測值與擬合線較為貼合,但測試集數據點比較分散,且強度越高,離散越明顯,個別樣本位于誤差超過20%的區(qū)域。RF 模型數據的預測值和實測值普遍存在一定的偏差。相比而言,WOA-XGBoost 模型的多數數據點完美地集中在擬合線附近,鮮有偏離的數據點,表明預測值的誤差較小。對比分析回歸結果可知,經過WOA 優(yōu)化的XGBoost 模型經過良好訓練后,能夠進一步提高試塊強度的預測精度。綜上,圖6 的評價數據與圖7 的數據散點分布相互印證,證明了WOAXGBoost 預測模型強大的泛化能力和精確的預測性能。
圖7 模型的單軸抗壓強度預測能力對比Fig.7 Comparison of the compressive strength predictive ability of the developed methods
根據表3 顯示的試驗結果,固體質量分數、水泥占比、尾砂占比和養(yǎng)護天數等輸入參數都對充填體的單軸抗壓強度有一定影響,為了獲得各參數的影響程度,需對各參數作進一步的重要性分析。XGBoost 模型可以自動計算并輸出所建立預測模型中的各輸入參數的重要性,取10 次計算的平均值作為參數的重要性得分,結果如圖8 所示。
圖8 各輸入參數的重要性得分Fig.8 Importance scores of the input parameters
從圖8 可以看出:水泥占比(重要性得分為0.402)是影響充填體強度的決定性因素,輸入參數的重要性得分由大到小依次為水泥占比、尾砂占比、養(yǎng)護天數、固體質量分數,與抗壓強度試驗結果一致,進一步驗證了所建立的WOA-XGBoost 模型的合理性。
(1) 基于某鉛鋅礦的充填料漿配比試驗,提出了WOA-XGBoost 混合預測模型,該模型具有較快的收斂速度,有效降低了預測充填體強度的誤差。模型訓練集的R2為0.999 8,測試集的R2為0.965 0,證明WOA-XGBoost 模型經過訓練后,具有良好的預測精度和泛化能力。
(2) 與單一XGBoost 模型相比,WOA-XGBoost 模型測試集的R2提高了7%,δRMSE和δMAE分別降了低49%和31%,表明WOA 能夠有效地優(yōu)化XGBoost 的超參數。相比于XGBoost、RF 和WOA-RF 模型,WOA-XGBoost 模型的預測性能更優(yōu)。
(3) 養(yǎng)護天數、尾砂占比、水泥占比和固體質量分數的重要性評分依次為0.117、0.384、0.402 和0.097,揭示了水泥含量對于充填體強度起決定性作用,并且4 個輸入參數均為所提出模型的敏感參數,因此在設計充填材料時應予以充分考慮。