翟中華,魏澤洋,覃逸峰,黃河念,王鏡宇,黃承民,張斌弛,張子健,于佳龍
(中國(guó)礦業(yè)大學(xué)(北京)力學(xué)與建筑工程學(xué)院,北京市海淀區(qū),100083)
巖石巷道爆破掘進(jìn)是煤巷建設(shè)中廣泛使用的一種掘進(jìn)方式,但由于影響爆破設(shè)計(jì)的因素眾多,且存在眾多可定性描述但難以定量分析的影響因素,尤其是由于巖性的多變使得爆破參數(shù)需要實(shí)時(shí)調(diào)整和變化,而在實(shí)際工程中參數(shù)的實(shí)時(shí)調(diào)整對(duì)現(xiàn)場(chǎng)技術(shù)人員的工程經(jīng)驗(yàn)要求較高。完全由公式計(jì)算出的爆破參數(shù)往往不能滿足爆破需要。隨著計(jì)算機(jī)技術(shù)的發(fā)展,將機(jī)器學(xué)習(xí)引入爆破研究中具有重要意義。唐躍[1]基于交叉驗(yàn)證理論通過(guò)支持向量機(jī)模型參數(shù)尋優(yōu)中,得到最優(yōu)爆破塊度預(yù)測(cè)模型;馬鑫民等[2]基于綜合分析法確定影響煤礦巖巷爆破效果關(guān)鍵指標(biāo),提出基于GA-SVM融合技術(shù)的爆破效果預(yù)測(cè)模型,實(shí)現(xiàn)爆破效果的合理預(yù)測(cè);張欽禮等[3]設(shè)計(jì)了9組爆破參數(shù)正交試驗(yàn),利用RBF神經(jīng)網(wǎng)絡(luò)模型對(duì)試驗(yàn)結(jié)果進(jìn)行預(yù)測(cè),使用爆破綜合期望指數(shù)得到最優(yōu)爆破參數(shù);岳中文等[4]建立PSO-SVM模型進(jìn)行關(guān)鍵參數(shù)尋優(yōu),驗(yàn)證了模型在不同核函數(shù)上的預(yù)測(cè)準(zhǔn)確率,結(jié)果表明RBF核函數(shù)的預(yù)測(cè)效果最佳;崔年生等[5]采用進(jìn)化徑向基神經(jīng)網(wǎng)絡(luò)方法優(yōu)化爆破參數(shù),得出了一套適用于多銅礦巖臺(tái)階爆破的最優(yōu)爆破參數(shù),取得了良好的爆破效果;XU Shida等[6]提出了一種結(jié)合主成分分析(PCA)和支持向量機(jī)(SVM)模型來(lái)預(yù)測(cè)爆破振動(dòng),結(jié)果證明了PCA-SVM模型在爆破估計(jì)方面的優(yōu)越性;LIU Kaiyun等[7]將遺傳算法(GA)與改進(jìn)的支持向量回歸(ISVR)算法耦合對(duì)爆破參數(shù)進(jìn)行優(yōu)化,根據(jù)應(yīng)用結(jié)果得到ISVR模型可行和可靠;岳中文等[8]利用主成分分析(PCA)提取主成分作為模型的輸入變量,結(jié)合遺傳算法(GA)獲得支持向量機(jī)(SVM)的最優(yōu)超參數(shù),建立了露天礦爆破振動(dòng)速度預(yù)測(cè)模型,此模型具有更高的精確度;張耿城等[9]通過(guò)隨機(jī)森林算法(Random Forest)選擇出對(duì)于爆破效果影響更大的相關(guān)參數(shù),創(chuàng)立了基于支持向量機(jī)的露天礦爆破效果預(yù)測(cè)模型,預(yù)測(cè)結(jié)果比BP神經(jīng)網(wǎng)絡(luò)建立的模型更精確、誤差更小;HASANIPANAH M[10]等建立了一種支持向量機(jī)(SVM)模型用于預(yù)測(cè)爆破作業(yè)中的峰值粒子速度(PPV),并比較了SVM和經(jīng)驗(yàn)方程的結(jié)果。
我國(guó)大多數(shù)煤礦地質(zhì)條件復(fù)雜,爆破影響參數(shù)多且難以準(zhǔn)確記錄,這導(dǎo)致數(shù)據(jù)收集難度很大。神經(jīng)網(wǎng)絡(luò)算法在面對(duì)大樣本數(shù)據(jù)時(shí)能取得更好的效果,但對(duì)小樣本的數(shù)據(jù)預(yù)測(cè)容易過(guò)擬合。支持向量機(jī)(Support Vector Machine,簡(jiǎn)稱 SVM)具有很強(qiáng)的非線性建模能力和小樣本推廣能力強(qiáng)等優(yōu)點(diǎn),針對(duì)小樣本、非線性及高維問(wèn)題時(shí)表現(xiàn)出很多獨(dú)特的優(yōu)勢(shì),在優(yōu)化爆破參數(shù)方面更加適用。筆者采用誤差分析法選取重要變量作為模型輸入?yún)?shù),解決了爆破參數(shù)選擇問(wèn)題。使用SVM在解決非線性分布時(shí),需要通過(guò)核函數(shù)對(duì)其進(jìn)行升維,但是對(duì)于這一過(guò)程,不同的核函數(shù)選型及超參數(shù)選擇對(duì)數(shù)據(jù)模型影響很大,對(duì)此筆者采用了網(wǎng)格搜索和麻雀搜索優(yōu)化算法兩種超參數(shù)尋優(yōu)方法尋找最優(yōu)超參數(shù),以此得出一個(gè)可以根據(jù)現(xiàn)場(chǎng)情況智能得出最佳爆破參數(shù)的預(yù)測(cè)模型。
SVM是一類按監(jiān)督學(xué)習(xí)方式對(duì)數(shù)據(jù)進(jìn)行二元分類的廣義線性分類器,其決策邊界是對(duì)學(xué)習(xí)樣本求解的最大邊距超平面。
對(duì)于一個(gè)樣本集F(xi,yi),i=1,2,…,n,(其中x作為已知參數(shù)是一個(gè)多維向量稱為特征,y作為輸出變量,也稱為標(biāo)簽),存在一個(gè)空間超平面(ω·x)+b=0可以將不同標(biāo)簽的數(shù)據(jù)分開(kāi),求解這個(gè)超平面即是最終目的。經(jīng)過(guò)數(shù)學(xué)演算其可以變化為一個(gè)最小值問(wèn)題:
再引入拉格朗日乘數(shù)法即可對(duì)其求解。但在實(shí)際上很多數(shù)據(jù)往往是線性不可分的,需要對(duì)其使用核函數(shù)進(jìn)行升維以找到一個(gè)超平面。根據(jù)周志華[11]的研究,如果特征的數(shù)量大到和樣本數(shù)量差不多,則選用線性核的SVM;如果特征的數(shù)量小,樣本的數(shù)量正常,則選用高斯核函數(shù);如果特征的數(shù)量小,而樣本的數(shù)量很大,則需要手工添加一些特征從而變成第一種情況。實(shí)際已有數(shù)據(jù)中爆破參數(shù)特征數(shù)量遠(yuǎn)小于樣本數(shù),由此可以選出高斯核函數(shù)(RBF)作為實(shí)驗(yàn)用核函數(shù)。
基于高斯核函數(shù)對(duì)于核函數(shù)參數(shù)選擇十分敏感,為了取得適應(yīng)度更佳的模型,需要對(duì)其參數(shù)(c,gamma)進(jìn)行優(yōu)化調(diào)整。c為懲罰系數(shù),即為對(duì)于誤差的寬容度;gamma為影響參數(shù),定義了單個(gè)樣本對(duì)于整個(gè)超平面的影響大小。筆者采用了目前主流的兩種參數(shù)優(yōu)化方式:網(wǎng)格搜索、群智能優(yōu)化算法。
網(wǎng)格搜索方法即將待求參數(shù)視作高斯坐標(biāo)軸,設(shè)定起點(diǎn),終點(diǎn),布局,以此來(lái)形成一張“網(wǎng)”,再以網(wǎng)格的數(shù)值代入核函數(shù)中,用其建立模型并計(jì)算出預(yù)測(cè)準(zhǔn)確率,根據(jù)其得出的準(zhǔn)確率結(jié)果。由準(zhǔn)確率結(jié)果即可直觀得出最優(yōu)解數(shù)值,同時(shí)還可以對(duì)結(jié)果較為優(yōu)異的區(qū)域進(jìn)行放縮,以此來(lái)進(jìn)一步提高準(zhǔn)確率,但這一方法運(yùn)用于數(shù)據(jù)量大的模型中往往需要較大的運(yùn)算能力,并且部分計(jì)算機(jī)編程語(yǔ)言不能發(fā)揮出計(jì)算機(jī)全部的計(jì)算能力,會(huì)導(dǎo)致計(jì)算機(jī)運(yùn)算速度過(guò)慢。所以選擇適合的步距和范圍,對(duì)于搜索區(qū)域進(jìn)行一定次數(shù)的縮放可以減少運(yùn)算時(shí)間,并且爆破數(shù)據(jù)量較小,這使得網(wǎng)格搜索十分適用于此類問(wèn)題的SVM調(diào)參。
不同的群智能優(yōu)化算法基本上可分為兩部分:使用隨機(jī)算子對(duì)空間進(jìn)行粗略的全局隨機(jī)搜索;根據(jù)隨機(jī)搜索的結(jié)果進(jìn)行局部搜索找到全局最優(yōu)解。這類尋優(yōu)算法相較網(wǎng)格搜索運(yùn)算點(diǎn)少,運(yùn)算量低,只需要使用低于其數(shù)倍的時(shí)間就能得出相差不多甚至更佳的解。但其也具有隨機(jī)性、結(jié)果不穩(wěn)定的缺點(diǎn)。麻雀搜索優(yōu)化算法是由薛建凱[12]在2020年提出的一種新型群智能優(yōu)化算法,主要是受麻雀的覓食行為和反捕食行為的啟發(fā)而提出的。使用數(shù)學(xué)模型來(lái)模擬麻雀種群在自然界中捕獵的行為,通過(guò)模擬麻雀的特性來(lái)捕捉全局最優(yōu)解,尋優(yōu)在這一過(guò)程可被看作麻雀通過(guò)叫聲引導(dǎo)群體到達(dá)食物較多的地區(qū),規(guī)避敵害,以此來(lái)找到食物最多的地區(qū)即全局最優(yōu)解。
將優(yōu)化算法與SVM相結(jié)合,對(duì)c和gamma參數(shù)調(diào)優(yōu),以得出最佳的超參數(shù)數(shù)值,兩種超參數(shù)優(yōu)化算法流程如圖1所示。
麻雀搜索優(yōu)化算法主要步驟如下:
(1)收集數(shù)據(jù)對(duì)樣本數(shù)據(jù)進(jìn)行預(yù)處理,進(jìn)行歸一化避免樣本間的歐式距離度量不準(zhǔn),作為輸入集;
(2)初始化種群,迭代次數(shù),初始化發(fā)現(xiàn)者和加入者數(shù)量比例;
(3)計(jì)算初始種群適應(yīng)度,并進(jìn)行排序;
(4)更新發(fā)現(xiàn)者、加入者以及意識(shí)到危險(xiǎn)的麻雀位置,計(jì)算適應(yīng)度,獲得當(dāng)前最優(yōu)值;
(5)如果未達(dá)到目標(biāo)迭代次數(shù)則重復(fù);
(6)達(dá)到則輸出c和gamma。
圖1 SVM超參數(shù)優(yōu)選過(guò)程
網(wǎng)格搜索步驟如下:
(1)收集數(shù)據(jù)對(duì)樣本數(shù)據(jù)進(jìn)行預(yù)處理,進(jìn)行歸一化避免樣本間的歐式距離度量不準(zhǔn),作為輸入集;
(2)設(shè)置預(yù)估搜索范圍、步距,以此來(lái)形成一張“網(wǎng)”,再以網(wǎng)格的數(shù)值代入核函數(shù)中;
(3)計(jì)算出每一個(gè)點(diǎn)位的準(zhǔn)確率,從中選出準(zhǔn)確率最高的點(diǎn);
(4)判斷最高準(zhǔn)確率是否能達(dá)到要求,如果不能達(dá)到要求則回到步驟(2),改變預(yù)估搜索范圍和步距。最高準(zhǔn)確率達(dá)到要求則輸出c和gamma。
為了保證煤礦爆破數(shù)據(jù)的豐富性,通過(guò)現(xiàn)場(chǎng)測(cè)試、問(wèn)卷調(diào)查、文獻(xiàn)查閱等方式共收集到144個(gè)爆破數(shù)據(jù)。為了提高數(shù)據(jù)的有效性,去除了存有異常值和缺失值的數(shù)據(jù)樣本,最終得到可用于模型訓(xùn)練和測(cè)試的127個(gè)樣本,見(jiàn)表1。
為了避免原始樣本數(shù)量級(jí)之間較大的差異,還需對(duì)學(xué)習(xí)樣本中的數(shù)據(jù)集進(jìn)行歸一化處理,否則將導(dǎo)致樣本間的歐式距離不準(zhǔn),使得數(shù)值大的特征占主導(dǎo)作用。歸一化的函數(shù)表達(dá)式為:
(3)
式中:y——數(shù)據(jù)歸一化的結(jié)果;
xi——待處理的樣本數(shù)據(jù);
xmin——樣本數(shù)據(jù)的最小值;
xmax——樣本數(shù)據(jù)的最大值。
將炸藥單耗按數(shù)值大小分為15類,每一類所占區(qū)間為0.2 kg/m3。通過(guò)數(shù)據(jù)歸一化將樣本數(shù)據(jù)的數(shù)量級(jí)和量綱單位進(jìn)一步處理,其中掏槽方式中0為楔形掏槽,0.5為復(fù)合掏槽,1為直眼掏槽,得到經(jīng)過(guò)歸一化后的127組數(shù)據(jù),見(jiàn)表2。
表1 煤礦爆破數(shù)據(jù)原數(shù)據(jù)集
表2 煤礦爆破數(shù)據(jù)經(jīng)整理及歸一化后數(shù)據(jù)集
影響爆破炸藥單耗因素有很多,如巷道高、巷道寬、巖石普氏系數(shù)、炮眼深度、炮眼數(shù)、掏槽方式等。輸入模型的影響因素并非越多越好,部分參數(shù)與目標(biāo)變量相關(guān)性弱,或變化率過(guò)大,對(duì)于預(yù)測(cè)來(lái)說(shuō)不僅會(huì)使數(shù)據(jù)加入過(guò)多的噪點(diǎn),影響其學(xué)習(xí)精度,還會(huì)導(dǎo)致模型復(fù)雜化,造成模型過(guò)擬合。選取合適的輸入?yún)?shù)能在簡(jiǎn)化模型的基礎(chǔ)上提高預(yù)測(cè)準(zhǔn)確率。隨機(jī)森林算法里的誤差分析法可以很好地解決參數(shù)難以選擇的問(wèn)題,誤差分析法通過(guò)對(duì)每一個(gè)預(yù)測(cè)變量隨機(jī)賦值,如果該預(yù)測(cè)變量更為重要,那么其值被隨機(jī)替換后模型預(yù)測(cè)的誤差會(huì)增大,該值越大表示該變量的重要性越大,使用誤差分析法得到的炸藥單耗影響變量的重要性排序,如圖2所示。
圖2 各變量重要性排序
根據(jù)圖2給出的變量重要性,選取導(dǎo)致誤差增大10%以上的變量作為模型的最終輸入變量。最終選取的輸入變量為:巷道凈寬、巷道凈高、普氏系數(shù)、炮眼深度、全斷面炮眼數(shù)、掏槽方式,以爆破炸藥單耗作為輸出參數(shù)。
模型采用Python作為編程語(yǔ)言,并調(diào)取Scikit-Learn庫(kù)作為SVM的運(yùn)行基礎(chǔ),選取高斯核函數(shù)進(jìn)行預(yù)測(cè),使用網(wǎng)絡(luò)搜索和SSA對(duì)超參數(shù)進(jìn)行調(diào)優(yōu)。以通過(guò)誤差分析法確定的6個(gè)指標(biāo)作為模型輸入?yún)?shù),爆破炸藥單耗作為輸出參數(shù),分別帶入經(jīng)過(guò)SSA優(yōu)化算法和網(wǎng)格搜索得到的超參數(shù)c和gamma,建立起基于SVM的煤礦巷道爆破參數(shù)預(yù)測(cè)優(yōu)化模型。然后使用訓(xùn)練集對(duì)模型進(jìn)行訓(xùn)練,最后將測(cè)試集輸入模型中對(duì)模型預(yù)測(cè)性能進(jìn)行檢驗(yàn)。
基于兩種不同的算法對(duì)參數(shù)進(jìn)行優(yōu)化得出參數(shù)后對(duì)訓(xùn)練集進(jìn)行測(cè)試,原數(shù)據(jù)集共128組,按照3∶1的比率分為測(cè)試機(jī)和訓(xùn)練集。兩種參數(shù)優(yōu)化方法在測(cè)試集上得到的預(yù)測(cè)結(jié)果如圖3、圖4所示。不同算法預(yù)測(cè)結(jié)果對(duì)比見(jiàn)表3。由表3可知,兩種方法找到的最優(yōu)參數(shù)c和gamma有著較大的區(qū)別,但最終在訓(xùn)練集上的預(yù)測(cè)效果只相差1個(gè)百分點(diǎn),在測(cè)試集上SSA優(yōu)化算法比網(wǎng)格搜索預(yù)測(cè)效果更好。
表3 不同算法預(yù)測(cè)結(jié)果對(duì)比
注:Std.Dev為標(biāo)準(zhǔn)差 ;散點(diǎn)圖中橫線所包圍的數(shù)據(jù)點(diǎn)為偏差小于1的數(shù)據(jù)點(diǎn),即測(cè)裝藥量偏差小于0.2 kg/m3圖3 基于網(wǎng)格搜索優(yōu)化得出的模型預(yù)測(cè)結(jié)果
為了測(cè)試基于SVM的煤礦巖巷爆破參數(shù)預(yù)測(cè)模型的效果,以安徽省淮北煤礦作為工程背景,現(xiàn)場(chǎng)收集了12組爆破數(shù)據(jù)進(jìn)行上述技術(shù)的應(yīng)用實(shí)踐檢驗(yàn),見(jiàn)表4。
選擇SSA優(yōu)化算法得到的最優(yōu)超參數(shù)c和gamma,利用上述確定的6個(gè)輸入?yún)?shù)建立SVM預(yù)測(cè)模型,使用上述的訓(xùn)練集對(duì)模型進(jìn)行訓(xùn)練,然后將實(shí)際工程中得到的12組爆破數(shù)據(jù)輸入到該預(yù)測(cè)模型中對(duì)炸藥單耗進(jìn)行預(yù)測(cè),得到的預(yù)測(cè)結(jié)果如圖5所示。由圖5可知,在實(shí)際工程得到了12組數(shù)據(jù),SVM模型得到的炸藥單耗預(yù)測(cè)值與實(shí)際值接近,模型準(zhǔn)確率為92.3%?;赟VM的預(yù)測(cè)模型在經(jīng)過(guò)SSA優(yōu)化算法調(diào)參后在預(yù)測(cè)爆破參數(shù)方面表現(xiàn)出很好的效果。
圖4 基于SSA優(yōu)化算法得出的模型預(yù)測(cè)結(jié)果
表4 實(shí)際工程爆破數(shù)據(jù)集
圖5 SVM工程預(yù)測(cè)結(jié)果
(1)以誤差分析法對(duì)影響煤礦巷道爆破炸藥單耗的多個(gè)因素進(jìn)行重要性排序,最終以巷道凈寬 、巷道凈高、普氏系數(shù)、 炮眼深度 、斷面炮眼個(gè)數(shù)和掏槽眼布置方式6個(gè)指標(biāo)作為模型輸入?yún)?shù),爆破炸藥單耗作為輸出參數(shù),建立起基于SVM的煤礦巷道爆破參數(shù)預(yù)測(cè)優(yōu)化模型。
(2)SVM模型對(duì)煤礦巷道爆破炸藥單耗預(yù)測(cè)適應(yīng)性良好。通過(guò) SSA優(yōu)化算法得到的核函數(shù)參數(shù)最優(yōu)組合分別為c=23.04,gamma=1.15,通過(guò)網(wǎng)格搜索得到的核函數(shù)參數(shù)最優(yōu)組合分別為c=10.83,gamma=1.61。比較兩種參數(shù)優(yōu)化方法得到的預(yù)測(cè)結(jié)果,結(jié)果顯示使用SSA群優(yōu)化算法優(yōu)化得到的參數(shù)在預(yù)測(cè)模型中取得更好的效果。將該模型應(yīng)用于實(shí)際工程中,預(yù)測(cè)準(zhǔn)確率達(dá)到92.3%,預(yù)測(cè)結(jié)果與實(shí)際工程相近,對(duì)于其他爆破參數(shù)或工程具有一定的參考意義。