涂同珩,朱明清,程茂林
(中交第二航務(wù)工程局有限公司技術(shù)中心,湖北 武漢 430040)
雙輪銑槽機是一種大型樁工機械設(shè)備,主要應(yīng)用于地下連續(xù)墻的成槽施工,該設(shè)備能適用于多種地層的開挖,其開挖效率比傳統(tǒng)地連墻施工中所用的液壓抓斗、沖擊循環(huán)鉆等成槽施工設(shè)備高出數(shù)倍,同時,其施工精度高、可成槽深度大。因此,該設(shè)備對于成槽深度大、垂直度要求高以及巖層抗壓強度較大的地連墻工程的施工具有突出優(yōu)勢[1]。
BC40 雙輪銑槽機通過2 個銑輪向內(nèi)轉(zhuǎn)動對巖土體進行銑削破碎,銑削產(chǎn)生的碎渣混合在泥漿中通過中間的泥漿泵輸送到槽外。該設(shè)備數(shù)字化程度高,自身安裝有多部傳感器,并通過設(shè)備終端實時顯示關(guān)鍵施工數(shù)據(jù)[2]。
在成槽深度較大的工程施工中,銑槽機會穿越多種地層,需要機手根據(jù)地層的差異對設(shè)備進行調(diào)整,甚至還需要針對某些地層更換特定齒具。因此,在大型地連墻施工過程中,探明銑槽機的工作地層對提升成槽效率和質(zhì)量十分重要。
在銑槽機施工前,施工人員一般會根據(jù)地勘資料對成槽斷面的地層分布進行大致分析。地質(zhì)勘探可以得到探孔地質(zhì)情況的準(zhǔn)確信息,但探孔通常分布稀疏,大多數(shù)成槽部位與探孔相隔甚遠(yuǎn),依賴地勘資料分析得到的地連墻槽段地層信息和實際情況往往存在較大差異。
在銑削過程中,銑槽機會實時顯示銑輪轉(zhuǎn)速、驅(qū)動馬達(dá)液壓油壓力、鋼絲繩牽引力等數(shù)據(jù),不難推想,銑槽機工作地層的變化會影響到這些設(shè)備參數(shù),如果這種影響足夠明顯,那這些設(shè)備參數(shù)的變化也許能反映銑槽機工作的地層的變化。本文將對采集到的銑槽機施工數(shù)據(jù)進行分析,通過多種數(shù)據(jù)處理和有監(jiān)督學(xué)習(xí)方法,對銑槽機工作地層的識別進行系統(tǒng)研究,旨在得到一種能根據(jù)銑槽機施工數(shù)據(jù)對工作地層進行識別的預(yù)測模型,實現(xiàn)對銑槽機工作地層的實時識別,為工程計量、設(shè)備狀態(tài)調(diào)節(jié),甚至設(shè)備智能輔助決策提供依據(jù)。
本文以南京仙新路過江通道南錨碇地連墻工程為背景,研究該工程中雙輪銑槽機的工作地層識別方法。該項目地連墻深約60 m,壁厚1.5 m,基礎(chǔ)規(guī)模大,施工難度高。成槽部位自上而下地層分布有雜填土、淤泥質(zhì)粉質(zhì)黏土、粉質(zhì)黏土、強風(fēng)化礫巖、中風(fēng)化礫巖、微風(fēng)化礫巖等。
如圖1 所示,該工程地勘探孔分布較為稀疏,絕大部分槽段與探孔相距較遠(yuǎn),對施工人員掌握槽段地層分布十分不利。探孔均不在地連墻成槽范圍內(nèi),意味著數(shù)據(jù)樣本的地層標(biāo)記會有一定的誤差,要求訓(xùn)練模型要具備較強的魯棒性。該項目具有一定代表性,可以豐富銑槽機工作地層識別方法的研究層次與深度。
圖1 南京仙新路過江通道南錨碇地連墻地勘探孔分布Fig.1 Exploration holes floor plan of the diaphragm wall in the south anchorage of Nanjing Xianxin Road Bridge
銑槽機施工數(shù)據(jù)采樣頻率為1 Hz,采集數(shù)據(jù)包括左右輪液壓油壓力、轉(zhuǎn)速、進給速度、附加載荷等22項參數(shù)。
地連墻開挖槽段與項目地勘探孔接近的區(qū)域較少,且沒有一處重疊區(qū)域,直接根據(jù)地勘資料對地層進行標(biāo)記必然存在較大誤差。為盡可能提高地層標(biāo)記的精度,本文僅選取了距離地勘探孔最近的槽段進行標(biāo)記,并且將地勘資料中地層交界處上下深度0.5 m范圍內(nèi)的樣本剔除。
根據(jù)地勘資料,槽段入巖部分為強風(fēng)化礫巖、中風(fēng)化礫巖和微風(fēng)化礫巖,巖層以上的地層包括雜填土、淤泥質(zhì)粉質(zhì)黏土、粉質(zhì)黏土等。對銑槽機施工而言,巖層以上的地層相對巖層開挖較為容易,設(shè)備調(diào)整難度低[3],因此,本文將巖層以上部分統(tǒng)一標(biāo)記為覆蓋層。
銑槽機各類數(shù)據(jù)具有實際物理意義,其中,有部分?jǐn)?shù)據(jù)不適合作為地層識別的特征。
不同區(qū)域的地層深度分布情況存在差異,因此與深度相關(guān)的數(shù)據(jù)屬于無關(guān)特征。齒輪箱油壓用于和外部環(huán)境水壓保持平衡,此2 類特征值變化趨勢幾乎相同。據(jù)分析,此2 類特征與深度近似成線性關(guān)系,因此,左齒輪箱油壓、右齒輪箱油壓、環(huán)境壓力都屬于無關(guān)特征。
齒輪箱溫度與環(huán)境溫度、齒輪速度、潤滑情況等多種因素有關(guān),其分布特性與地層關(guān)聯(lián)程度低,方位數(shù)據(jù)與地層無關(guān),這些參數(shù)都被作為無關(guān)特征棄用。
本文利用Orange3 數(shù)據(jù)可視化平臺對銑槽機樣本數(shù)據(jù)進行分析。圖2所示為4類地層樣本的二維特征分布圖,圖中的坐標(biāo)軸變量是經(jīng)過可預(yù)測性分析選出的分離度最高的1 組二維特征??梢钥闯觯采w層樣本與其他3 類巖層樣本之間界限較為明顯,而3 類風(fēng)化程度不同的巖層樣本存在大量重疊。說明覆蓋層與巖層樣本的二分類比較容易,而巖層分類難度較大。
圖2 4地層樣本二維特征分布Fig.2 Two-dimensional feature distribution of samples from four types of stratum
利用Free Viz 模塊對強風(fēng)化、中風(fēng)化、微風(fēng)化巖層多維特征進行分析,如圖3 所示,3 類巖層樣本的多維特征依然存在大量重疊,尤其是中風(fēng)化巖層。其樣本分布幾乎與另外2 類巖層全部重疊。歸一化后計算樣本類內(nèi)距離Sw為9.703,類間距離Sb為1.314,Sw比Sb大得多,可分性較差。
圖3 巖層樣本特征多維分布Fig.3 Multi-dimensional feature distribution of samples from rock stratum
預(yù)處理之前劃分訓(xùn)練集和測試集。在實際施工過程中,各槽段一般是分開成槽的,因此測試集與訓(xùn)練集應(yīng)取不同槽段數(shù)據(jù)。本文為貼近工程實際,在與地勘探孔最接近的幾個槽段中選取了部分槽段的樣本作為訓(xùn)練集,其他槽段樣本作為測試集。為減少樣本不均衡帶來的影響,訓(xùn)練集和測試集中各地層樣本數(shù)量相同。
圖4 為某槽段左輪轉(zhuǎn)速的部分時間序列,該槽段左輪轉(zhuǎn)速方差為2.711,可以看出曲線呈現(xiàn)劇烈波動,除了轉(zhuǎn)速,銑槽機數(shù)據(jù)中還有許多特征都存在明顯波動,這種波動可能會嚴(yán)重影響地層識別效果。
圖4 左輪轉(zhuǎn)速時間序列Fig.4 Time series of left wheel rotating speed
2.2.1 移動平均濾波
移動平均(Moving Average,MA)是在指定時間段內(nèi),對時間序列取平均值,移動平均濾波可以減少時間序列的變動,減少信號噪聲,使數(shù)據(jù)更平滑。移動平均包括簡單移動平均、加權(quán)移動平均和指數(shù)移動平均等,本文采用5 期簡單移動平均,其數(shù)值計算式如下:
式中:MA(n)t為時間序列t時刻的n期移動平均數(shù);yt-i為時間序列t-i時刻的值。
2.2.2 時間序列矩陣
各類特征的變動可能有其內(nèi)部規(guī)律,將各類特征在一段時間內(nèi)的時間序列組成時間序列矩陣,也許可以提升地層識別效果。本節(jié)取11 類特征的近5期特征值組成11×5特征矩陣。
2.2.3 處理方法對比
本節(jié)采用隨機森林分類器對移動平均濾波和時間序列特征矩陣兩種處理方法得到的樣本數(shù)據(jù)進行對比識別。隨機森林是一種集成學(xué)習(xí)方法,其內(nèi)部包括多個決策樹,每個決策樹對樣本進行隨機抽樣,各自獨立學(xué)習(xí),對于每個決策樹的識別結(jié)果以投票形式得到隨機森林的預(yù)測結(jié)果。該方法可集成大量決策樹,適用分類場景廣泛[4]。
本節(jié)對比了幾種平滑處理方法下隨機森林的識別效果。由于覆蓋層樣本特征分布與3 類巖層樣本明顯不同,3類巖層的識別難度更大,因此僅測試對3類巖層的識別效果。如表1所示,5期移動平均相對于無平滑處理的方法對3 類巖層的識別正確率提高17.7個百分點,而以時間序列矩陣作為特征的模型正確率僅提高2.55 個百分點,此外,無平滑處理的隨機森林模型識別正確率極低,說明樣本特征值的劇烈變動嚴(yán)重影響了地層識別效果。
表1 平滑處理方法效果對比Tab.1 Effects of smoothing methods
離群點是指在同一場景的樣本數(shù)據(jù)中,極端遠(yuǎn)離樣本一般分布區(qū)域的樣本,具體到特征,則反映為離群點特征值極端偏離特征值的期望或中位數(shù),這在盒須圖中能得到直觀反映[5]。
以如圖5 盒須圖所示的特征為例,樣本左液壓油壓力極端值偏離上下四分位較遠(yuǎn),除了液壓油壓力,還有很多特征存在類似分布特點,樣本應(yīng)進行離群點檢測過濾。
圖5 各地層左液壓油壓力分布Fig.5 Distribution of left hydraulic oil pressure in each stratum
本文采用單分類支持向量機(One Class SVM)對樣本進行離群點檢測,One Class SVM 的基本思想是在樣本特征映射的高維空間尋找1 個超球面,超球面盡可能多地包裹樣本,同時球面半徑盡可能小,球面外的樣本就被檢測為離群點。
一般在實際的樣本識別中,待測樣本都是實時產(chǎn)生的,因此,本文僅對訓(xùn)練集進行離群點檢測過濾,然后在過濾后的訓(xùn)練集上訓(xùn)練分類器,對測試集直接測試。
為了測試離群點過濾對地層識別的影響,采用上節(jié)中表現(xiàn)最優(yōu)的5 期移動平均預(yù)處理方法和隨機森林分類器,分別在未經(jīng)過離群點過濾和經(jīng)過離群點過濾的訓(xùn)練集上訓(xùn)練識別模型。模型測試效果如表2 所示,One Class SVM 離群點檢測有效提高了模型在3類巖層上的識別正確率。
表2 離群點過濾效果Tab.2 Outlier filtering effect
本文確定了移動平均濾波和離群點過濾的數(shù)據(jù)預(yù)處理方法,在基礎(chǔ)的隨機森林分類器上測試的巖層識別正確率為57.69%,這種性能顯然是不能滿足需求的,因此對于分類器的設(shè)計還需要更深入的研究。
本文在地層特征分布特性的研究中,發(fā)現(xiàn)覆蓋層樣本特征相較于3 類巖層具有突出的分布特性,這說明覆蓋層樣本具有很好的可分性,并且覆蓋層與3 種風(fēng)化層程度不同的巖層的樣本訓(xùn)練過程會有明顯差別,因此本文先對3 類巖層進行分類研究,再研究覆蓋層的分類。
巖層樣本特征分布較為復(fù)雜,3 種風(fēng)化程度的樣本重疊程度很高,因此,除了隨機森林,本文還研究了其他多種分類方法,旨在盡可能提高地層識別的表現(xiàn)。
3.1.1 降噪自動編碼器
降噪自動編碼器(Denoising Autoencoder,DAE)是一種深度學(xué)習(xí)模型,網(wǎng)絡(luò)結(jié)構(gòu)分為輸入層、隱含層和輸出層,如圖6所示。DAE 通過對輸入特征隨機置零的方式加入人工噪聲,并對其編碼成隱含層,再對隱含層譯碼得到輸出層,通過迭代不斷減小輸出層與輸入層的重構(gòu)誤差來訓(xùn)練模型[6]。經(jīng)測試優(yōu)化,確定了如表3所示的訓(xùn)練參數(shù)。
圖6 DAE訓(xùn)練過程Fig.6 Training process of DAE model
表3 DAE主要訓(xùn)練參數(shù)Tab.3 Main training parameters of DAE
本文訓(xùn)練DAE 模型,得到樣本的隱含層特征,再利用簡單的神經(jīng)網(wǎng)絡(luò)分類器對DAE 隱含層特征進行分類。
3.1.2 基于樹結(jié)構(gòu)的機器學(xué)習(xí)管道優(yōu)化工具
基于樹結(jié)構(gòu)的機器學(xué)習(xí)管道優(yōu)化工具(Treebased Pipeline Optimization Tool,TPOT)是一種能自動優(yōu)化模型集成結(jié)構(gòu)和超參數(shù)的自動機器學(xué)習(xí)工具,旨在面對多種應(yīng)用場景時,替代繁瑣的人工模型設(shè)計和參數(shù)調(diào)優(yōu)過程,自動提供機器學(xué)習(xí)解決方案。該工具采用樹形結(jié)構(gòu)實現(xiàn)學(xué)習(xí)模型的集成,作為樹結(jié)構(gòu)的節(jié)點,模型之間可以并聯(lián)、級聯(lián),節(jié)點模型的選擇、樹結(jié)構(gòu)的優(yōu)化和模型超參數(shù)的優(yōu)化則通過遺傳編程實現(xiàn)[7]。TPOT 遺傳編程參數(shù)設(shè)置如表4所示。
表4 遺傳編程參數(shù)Tab.4 Parameters of genetic programming
3.1.3 支持向量機
支持向量機(Support Vector Machine,SVM)是一種二分類模型,其基本思想是在特征空間中找到一個能將兩類樣本分隔開的超平面,并且使得超平面與樣本距離最大化[8]。在原始特征空間中,樣本往往線性不可分,因此,SVM 通過核函數(shù)將特征映射到高維空間。理論上,在足夠高維的空間,是一定能找到這樣的超平面的。
為了滿足多分類場景,需要建立集成SVM 學(xué)習(xí)模型,本文采用一對一SVM模型。
經(jīng)測試優(yōu)化,本文選擇多項式核函數(shù)對特征進行高維映射:
3.1.4 測試結(jié)果對比
分別采用以上3種分類方法對3種風(fēng)化地層進行分類,在測試集上的識別正確率如表5 所示。可以看出,多項式核函數(shù)SVM 分類正確率最高,達(dá)到78.30%,而其中強風(fēng)化和微風(fēng)化巖層的分類正確率在90.00%左右,精度損失主要來自中風(fēng)化巖層樣本,這和前文所述中風(fēng)化巖層樣本重疊程度最高的分析是相符的。
表5 3類巖層分類測試結(jié)果Tab.5 Classification test results of three types of rock stratum
3.2.1 4地層直接分類
4 地層直接分類的思路很簡單,就是在3 類巖層樣本分類的基礎(chǔ)上,加入同樣比例的覆蓋層樣本,采用同樣的預(yù)處理和分類方法。在3 類地層的分類研究中,SVM 和DAE 方法的分類正確率較高,因此,這里同樣采用這2種方法。
如表 6 所示,不論是 DAE 還是 SVM,對 4 地層的分類效果都很差。理論上,覆蓋層分類精度應(yīng)高于3 類巖層,則加入覆蓋層樣本的分類結(jié)果應(yīng)好于3 類地層分類,而這一結(jié)果反映了差異性較大的覆蓋層樣本對4地層分類造成了一定的干擾。
表6 4地層直接分類測試結(jié)果Tab.6 Direct classification test results of four types of stratum
3.2.2 覆蓋層與巖層的二分類
由于4 地層直接分類的效果較差,本文將3 類巖層作為同一地層,與覆蓋層樣本一起進行二分類。為了避免樣本不均衡帶來的影響,本文將3 類巖層樣本均等抽樣,使巖層樣本總數(shù)與覆蓋層一致。分別采取了DAE、SVM、TPOT 對覆蓋層和巖層樣本進行分類,在測試集上的分類結(jié)果如表7所示。
表7 覆蓋層與巖層二分類測試結(jié)果Tab.7 Binary classification test results of cover stratum and rock stratum
從結(jié)果中可以看出,3 種方法的識別正確率都高于90.00%,這與特征分析中覆蓋層樣本特征可分性好的特點相符。TPOT 生成的學(xué)習(xí)管道識別正確率最高,該管道包含1 個節(jié)點分類器:梯度提升決策樹。
最后,本文利用以上研究成果對某槽段銑槽機施工完整數(shù)據(jù)進行預(yù)處理,并開展兩級分類測試。首先利用梯度提升決策樹模型分出覆蓋層和巖層,然后通過多項式SVM 模型對識別為巖層的樣本進行風(fēng)化程度識別,識別結(jié)果如表8混淆矩陣所示。
表8 4地層分類混淆矩陣Tab.8 Classification confusion matrix of four types of stratum
從混淆矩陣可以看出,誤差主要來自中風(fēng)化礫巖的漏檢,覆蓋層漏檢率和誤檢率都比較低,強風(fēng)化礫巖和微風(fēng)化礫巖識別靈敏度較好,且此2 類地層的誤檢主要來自中風(fēng)化礫巖樣本。從地質(zhì)特性上來說,中風(fēng)化礫巖力學(xué)特性介于強風(fēng)化礫巖和微風(fēng)化礫巖之間,該地層部分樣本的漏檢說明這些樣本與被識別的地層相似性較高,因此,中風(fēng)化礫巖的漏檢和誤檢對銑槽機依據(jù)預(yù)測地層進行設(shè)備調(diào)整的效果影響有限。
雙輪銑槽機是一種可適用于多種軟硬地層的先進成槽設(shè)備,其設(shè)備調(diào)整狀態(tài)與地層的適應(yīng)程度對成槽效率影響較大,因此,地層信息的掌握對銑槽機施工效率的提升非常重要。本文針對銑槽機提升功效的需求和地層信息難以掌握的問題,依托南京仙新路過江通道南錨碇地連墻工程,對雙輪銑槽機工作地層識別方法進行了研究。首先結(jié)合地勘資料和地勘探孔分布特點對槽段地層進行分析,并通過銑槽機施工數(shù)據(jù)分析出各地層特征分布特點。然后針對樣本特征時間序列變動劇烈和極端值偏離的特點,分別采用了幾種平滑處理和離群點檢測方法,并通過隨機森林對幾種方法的效果進行對比分析。最后對地層分類器進行研究,分別研究了降噪自編碼器、TPOT 和SVM 在巖層樣本數(shù)據(jù)上的訓(xùn)練和識別,并在巖層分類的基礎(chǔ)上研究包含覆蓋層樣本的4 地層分類方法。從對實際完整槽段數(shù)據(jù)的識別結(jié)果可以看出,除中風(fēng)化礫巖漏檢和誤檢較明顯外,總體識別正確率較高。