江 南,盛永清,褚長海
(1.盾構及掘進國家重點實驗室,河南 鄭州 450001;2.武漢地鐵集團有限公司,湖北 武漢 430000)
隨著國民經濟的快速發(fā)展,地鐵隧道,鐵路隧道更多地采用了隧道掘進機進行開挖。隧道開挖前,對施工隧道地區(qū)資料的獲取是必不可少的環(huán)節(jié),結合地質資料,才能根據開挖隧道地層情況調節(jié)相應的掘進參數進行施工作業(yè),但在實際施工中,地質情況復雜多變,地質資料只能提供局部區(qū)域有限地質情況,而實時監(jiān)測和分析開挖面的地質情況可以幫助司機在不利地質條件下采取預防措施,保證安全高效掘進。由于掘進參數可以看作是圍巖與TBM 相互作用結果的動態(tài)反映,當前有許多利用掘進參數預測圍巖性質的工作。朱夢琦等提出基于集成CART 算法的圍巖等級預測模型,利用TBM 掘進過程中的參數預測圍巖等級并取得了較好的效果。張娜等分別采用分步回歸和聚類分析的方法建立巖機關系模型,該模型能利用監(jiān)測 TBM 掘進參數對巖石抗壓強度、體積節(jié)理數和圍巖等級等參數進行實時感知??傮w來說目前基于各種機器學習算法的圍巖性質預測工作均取得了一定的進展,但是預測模型通常在同一條線路上構建和測試,缺乏模型應用在其他線路的準確率數據而對于TBM 施工真正有效的模型是能運用在新施工線路的模型,這一情況阻礙了圍巖地質判別模型的實際應用與推廣。
青島地鐵1 號線是青島已經投入使用的一條跨海線路,其全長60.11km,總體大致呈南北走向,共設置41 座車站,全部為地下車站。
本文使用的數據為青島地鐵1 號線人民廣場站-衡山路站和衡山路-天目山站兩個區(qū)間的TBM 掘進數據,兩個區(qū)間內的圍巖主要成分為閃長巖,石英二長巖,花崗斑巖,風化程度為微風化到中風化。兩個區(qū)間使用的掘進設備分別為中船重工生產的DS6290-TBM-015 和DS6290--TBM-016。TBM 運行時數據每10s 采集一次,數據中心記錄了TBM 掘進過程中總推進力、刀盤扭矩、刀盤轉速、推進速度和撐靴壓力在內的195 類數據。
本文使用神經網絡,隨機森林,支持向量機3 種機器學習模型分別對圍巖無側限抗壓強度進行預測,并比較不同算法的優(yōu)勢,探究不同模型在跨線路應用上的性能優(yōu)劣。
基于深度神經網絡的分類算法已經在自然語言處理,數字圖像處理,數據挖掘等任務和應用場景上取得了優(yōu)良的效果,顯示出深度神經網絡的在大數據應用上巨大潛力。本文構造的神經網絡先對輸入按字段分別進行全連接,然后總體全連接的方式構建神經網絡,具體網絡結構如圖1所示。
圖1 模型結構圖
其中,fc 表示全連接過程,concat 表示維度拼接過程,數字代表向量維度。本文使用先分組全連接,再進行融合全連接的方式相比于直接在整個輸入向量上做全連接操作的方式參數量和計算量均有一定的減小。
隨機森林就是通過集成學習的思想將多棵樹集成的一種算法,它的基本單元是決策樹,屬于機器學習的集成學習方法。在隨機森林中,每棵決策樹都是一個分類器,對于一個輸入樣本,每課樹都會產生一個分類結果。而隨機森林集成了所有的分類投票結果,將投票次數最多的類別指定為最終的輸出。在節(jié)點特征變量選擇上,本文使用Gini 不純度作為決策指標,避免了信息增益易偏向于取值較多的屬性的問題。
設數據集D={(x1,y1),(x2,y2),…,(xn,yn)}的屬性空間X?Rm中某一特征變量Xj,j=1,2,…,m有q個取值,則Gini不純度定義如下
式中pi——特征變量值為i的概率。
本文將圍巖的無側限抗壓強度分成了7 個類別,屬于多分類問題,而標準的SVM 是基于二元分類問題設計的算法,無法直接處理多分類問題。利用標準SVM 的計算流程有序地構建多個決策邊界以實現(xiàn)樣本的多分類,通常的實現(xiàn)為“一對多(one-against-all)”和“一對一(oneagainst-one)”。一對多SVM 對m 個分類建立m個決策邊界,每個決策邊界判定一個分類對其余所有分類的歸屬;一對多SVM 通過對標準SVM的優(yōu)化問題進行修改可以實現(xiàn)一次迭代計算所有決策邊界。
本文使用的軟硬件環(huán)境如表1 所示。
表1 模型使用硬件與軟件版本情況
為了檢驗本文所提出算法有效性,本文采用正確率為評價指標,計算如下
式中Nr——無側限抗壓輕度預測正確的樣本數;
Nt——無側限抗壓強度預測的總樣本數。
目前基于TBM 掘進參數的圍巖地質判別模型往往在同一條線路上訓練與測試,缺乏跨區(qū)間的模型研究與應用。本文使用3 種不同的機器學習算法對跨區(qū)間的模型研究與應用開展研究,如表2 所示。表2 的結果表明基于掘進參數的地質無側限抗壓強度的跨區(qū)間應用價值較低。
表2 模型在不同區(qū)間上的準確率
盡管基于掘進參數的圍巖抗壓強度預測模型在同一區(qū)間上達到了一定準確率,但想要將模型推廣到不同區(qū)間,則難以達到足以指導TBM 掘進工作的準確率。3 種不同的機器學習模型都出現(xiàn)了同樣的情況。原因在于本文選取的青島地鐵兩個區(qū)間雖然相鄰,但圍巖分布狀況仍然存在較大差異,這種地質上的差異造成掘進數據的差異,最終影響了模型的跨區(qū)間應用。這種模型跨區(qū)間應用能力弱的問題不能簡單歸于過擬合問題,因為模型準確率在訓練集和測試集差異較小,只在跨區(qū)間應用時準確率下降。
本文分別使用了分組的全連接神經網絡算法、隨機森林算法、支持向量機算法構建圍巖的實時抗壓強度預測模型,并研究模型的跨線路,跨區(qū)間應用問題。有如下結論。
1)幾組實驗下的神經網絡模型表現(xiàn)對比隨機森林或支持向量機算法無明顯優(yōu)勢。
2)本文構建的圍巖的無側限抗壓強度的預測模型僅在本區(qū)間能取得較好的預測準確率,難以跨區(qū)間使用。
綜上所述,基于機器學習模型的圍巖無側線抗壓強度預測模型目前是難以應用在不同區(qū)間,問題主要在于,未掘進區(qū)間的地質分布和掘進過區(qū)間的地質分布可能完全不同,即使這兩個區(qū)間相鄰,模型可能完全沒有訓練過這種地質,判別自然失準。在更長掘進線路上訓練模型是有可能會持續(xù)提升模型判別精度,但此時掘進機設計壽命也即將結束,模型的應用價值降低。研究人員不應僅僅滿足于追求預測模型在某一條線路上的預測準確率,畢竟能在不同地理位置、不同地質狀況的均取得較高預測準確度的模型才具有實際工程應用價值。