楊民強
(中鐵十四局集團大盾構工程有限公司, 江蘇 南京 211800)
盾構法擁有較強的先進性與高效性等優(yōu)勢,在城市地下交通系統(tǒng)建設中起到了至關重要的作用[1]。盾構機作為一種集機械技術、電子技術、控制技術、通信技術等多學科融合的重型工程機械[2],是實施盾構法的主要設備,而對于泥水盾構機來說,液壓推進系統(tǒng)又是盾構機的關鍵構成。因其面臨工作負荷大,地質復雜性高,工作環(huán)境惡劣等環(huán)境,所以其系統(tǒng)故障發(fā)生頻率高[3]。盾構機的每次故障都會引起停工檢修,造成巨大的人力物力的損失甚至引發(fā)安全事故,所以如何提前預測盾構機液壓系統(tǒng)數(shù)據(jù)的變化以提供有效的信息預測故障的發(fā)生是大盾構領域一個新興的研究方向。目前,盾構機液壓推進系統(tǒng)都配置了相關的傳感器設備,用來記錄盾構機液壓推進系統(tǒng)運行時的運行參數(shù)值[4], 基于盾構機液壓推進系統(tǒng)傳感器采集的運行數(shù)據(jù)來預測盾構機液壓推進系統(tǒng)未來時刻的待預測參數(shù),從而構建盾構機液壓推進系統(tǒng)待預測參數(shù)的預測模型,對盾構機的數(shù)據(jù)預測方向起重要的作用[5]。
傳統(tǒng)的盾構機液壓推進系統(tǒng)參數(shù)預測的方法可以概括為三類:經(jīng)驗預測方法、巖土力學預測方法和數(shù)值模擬預測法。其中,經(jīng)驗法是在1976年由SAUCER G[6]根據(jù)盾構機物理模型進行了使用,并證明了在盾構機作業(yè)中二維載荷小于三維載荷。之后在2016年,ZHANG Q等[7]基于巖土力學預測法將盾構機推進過程地層結構拓展為多層地層,在此基礎上,預測盾構機與巖土力學性質之間的關系。SU C等[8]基于數(shù)值模擬預測法,通過對盾構機切削過程進行了數(shù)值分析,采用回歸方法對盾構機刀盤扭矩進行研究,分析并且預測了負荷參數(shù)與多種狀態(tài)之間的關系。
本研究以蕪湖長江隧道項目所采用的盾構機液壓推進系統(tǒng)的運行數(shù)據(jù)為研究對象,采用基于時間序列分析ARIMA方法,對盾構機推進過程中的數(shù)據(jù)變化進行預測分析,重點比較了基于K-means聚類的RNN預測方法與線性回歸方法的預測準確率。
本研究以中鐵十四局集團大盾構有限公司某隧道項目中所使用的大型泥水混合式盾構機液壓推進系統(tǒng)為研究對象,該對象具有應用普適性。如圖1所示,為該盾構機液壓推進系統(tǒng)液壓泵組成結構,整個系統(tǒng)包括56個液壓泵,分為A~F共6組。
圖1 盾構機推進系統(tǒng)液壓油泵分組結構
基于該盾構機的挖掘數(shù)據(jù),本研究所獲得的原始數(shù)據(jù)主要有5種類別,如表1所示。
表1中液壓推進系統(tǒng)區(qū)域壓力共分4類:pA,pB,pC,pD,分別代表4組液壓推進系統(tǒng)的液壓泵壓力。pA~pD對應了圖1中A~D組液壓泵。雖然圖1中顯示擁有A~F組的驅動單元,但是在數(shù)據(jù)處理過程中整個刀盤對稱,選取A~D驅動單元的數(shù)據(jù)已經(jīng)足夠體現(xiàn)數(shù)據(jù)變化特性,為減少數(shù)據(jù)運算量,節(jié)省運算時間,本研究只針對驅動單元A~D進行分析。
表1 盾構機數(shù)據(jù)類別
獲得的數(shù)據(jù)為2個月的盾構機液壓推進系統(tǒng)數(shù)據(jù),每類數(shù)據(jù)有25萬數(shù)據(jù)量,因為數(shù)據(jù)量較大且數(shù)據(jù)質量參差不齊,所以針對所獲得的數(shù)據(jù)需要進行數(shù)據(jù)預處理,便于后續(xù)的分析與預測過程。
針對所獲得的數(shù)據(jù)的清洗, 為滿足后續(xù)數(shù)據(jù)分析需要,且所有的數(shù)據(jù)組均為盾構機在正常掘進狀態(tài)下采集,本研究依據(jù)以下2類方法作為預處理原則:
(1) 停機狀態(tài)下的數(shù)據(jù)予以刪除,包括因為拼裝狀態(tài)、停機狀態(tài)、機械故障狀態(tài)和刀盤空轉狀態(tài)等造成的停機;
(2) 因掘進過程中由于人為因素而導致的盾構機液壓推進系統(tǒng)參數(shù)的數(shù)據(jù)大幅改變也視為異常值刪除。
基于上述預處理原則,首先對原始數(shù)據(jù)中的異常值進行了識別與處理,刪除了5種數(shù)據(jù)的異常值與空值。又因為本研究所獲取的原始數(shù)據(jù)采樣頻率為10 s,在該采樣頻率下,數(shù)據(jù)量過大,不能有效的進行分析,因此本研究又采取了降采樣方法,將采樣頻率由10 s變至1 min,得到的挖掘速度數(shù)據(jù)清洗前后時序對比圖如圖2所示。可以看出,數(shù)據(jù)清洗后依然能保有數(shù)據(jù)清洗前的特征,并且數(shù)據(jù)量大幅度減小可以有效的提升分析速度。
圖2 掘進速度數(shù)據(jù)清洗前后對比
基于上述清洗過后的數(shù)據(jù),首先通過皮爾森相關系數(shù)來判定液壓推進系統(tǒng)參數(shù)的相關性[9],該系數(shù)可以定量地描述變量之間的關系。
皮爾森相關系數(shù)r的計算公式為:
(1)
式中,X,Y—— 擬要判定相關性的參數(shù)
n—— 數(shù)據(jù)組的數(shù)量
通過式(1)計算F,pA,pB,pC,pD,T,v,s之間的相關性,如表2所示。
r越接近1相關度越高,由表2可以看出,相同參數(shù)間的相關性系數(shù)為1,與液壓推進系統(tǒng)pA相關度最高的數(shù)據(jù)為掘進速度,與pB相關度最高的也是掘進速度,而刀盤扭矩、掘進速度與貫入度這3個參數(shù)之間相互的相關度都較高。
表2 盾構機液壓推進系統(tǒng)數(shù)據(jù)清洗后相關性分析
因此,基于相關性分析結果,本研究主要從與液壓力相關度較高的掘進速度來進行分析與預測。
自相關指一個信號與其不同時間點自身的互相關,即信號在不同時間點下的相似度與2個時間之差的函數(shù)。因此,自相關可以用來找出并剔除掉本研究所用的數(shù)據(jù)在不同時間點下相似度高的數(shù)據(jù),可以有效的減少無用數(shù)據(jù)。自相關函數(shù)(Autocorrelation Function,ACF)反映了同一序列在不同時序的取值之間的相關性;偏相關函數(shù)(Partial Autocorrelation Function,PACF)是嚴格2個變量之間的相關性。 本研究基于確定ACF與PACF結果來確定選擇模型是自回歸模型(Auto-regresssive,AR)、移動平均模型(Moving Average, MA)還是混合模型(Auto-regresssive Moving Average,ARMA),選擇標準如表3所示。
表3 盾構機液壓推進系統(tǒng)模型判斷標準
掘進速度的自相關與偏相關分析結果如圖3所示。可以看出,ACF和PACF兩圖都是屬于拖尾,因此選擇ARMA模型更為適合本研究的盾構機液壓推進系統(tǒng)分析。
圖3 掘進速度自相關與偏相關圖
ARIMA模型[10]的核心思想就是在ARMA模型建立之前,采用適當階數(shù)的差分運算,對要進行擬合和預測的時間序列進行平穩(wěn)化處理,使得數(shù)據(jù)能夠符合ARMA 模型對時間序列的平穩(wěn)性要求,然后采用ARMA模型對時間序列進行預測。
若時間序列當前值沒有外界干擾量而僅由過去時刻序列值決定,則這種線性關系能夠用自回歸模型(AR)來描述:
xt=δ+φ1xt-1+…+φpxt-p+εt
(2)
式中,δ—— 模型的常數(shù)項
φp——p階回歸項系數(shù)
εt—— 序列殘差
xt—— 當前時刻的序列值
ARMA中的移動平均模型數(shù)學表述為:
xt=ε+ε1+μ1εt-1…+μqεt-q
(3)
由AR模型和MA模型構成的ARMA則為:
xt=φ1xt-1+…+φpxt-p+
δ+εt+μ1εt-1…+μqεt-q
(4)
而基于ARMA模型,做d階差分可得ARIMA模型:
yt=Δdxt=(1-L)dxt
(5)
因此可對yt建模得到:
yt=φ1yt-1+…+φpyt-p+
δ+εt+μ1εt-1…+μqεt-q
(6)
該模型的特征方程為:
Φ(L)Δdxt=δ+Θ(L)εt
(7)
最后,得到 ARIMA(p,d,q)模型[11]。
d取1時,針對預處理后的掘進速度數(shù)據(jù)進行的一階差分時序圖,如圖4所示。
圖4 掘進速度一階差分時序圖
在獲得一階差分數(shù)據(jù)后,接下來對一階差分前的原始數(shù)據(jù)與差分后數(shù)據(jù)做平穩(wěn)性檢驗(ADF檢驗)[12]。ADF檢驗就是判斷序列是否存在單位根,如果序列平穩(wěn),就不存在單位根,否則,就會存在單位根。
因此,ADF檢驗的H0假設就是存在單位根,如果得到的顯著性檢驗統(tǒng)計量小于3個置信度10%,5%,1%,則對應有90%,95%,99%的把握來拒絕原假設,分析結果如表4所示。
表4中的T統(tǒng)計量為ADF 測試結果。根據(jù)上述表格可以看出,原始序列與差分序列的3個置信度相同,而T統(tǒng)計量皆小于3個置信度,因此,序列拒絕原假設,也即差分后序列平穩(wěn)。
表4 原始序列與差分序列ADF檢驗結果對比
接下來對數(shù)據(jù)組進行白噪聲檢驗,所獲得的差分序列的白噪聲檢驗結果為:(array([14.3781688]), array([0.00014953])),其中array([0.00014953])表示p值遠小于0.05,所以可以判斷所選擇的數(shù)據(jù)是穩(wěn)定的。
根據(jù)計算與自相關分析,選擇p值為1,q值為1。
根據(jù)貝葉斯定理有:
(8)
其中,P(y1,…,yn|Mj)為該模型的邊緣概率,假設在不知道任何數(shù)據(jù)的情況下各個模型是同樣合理的,則式中的P(Mj)為定值,因此,最大化后驗概率等價于最大化模型的邊緣概率,可得:
(9)
式中,Θj—— 模型Mj的參數(shù)向量
L—— 似然函數(shù)
gj(θj) ——θj的分布函數(shù)
使用貝葉斯方法來優(yōu)化模型時,不需要考慮參數(shù)的先驗概率,當很多參數(shù)先驗無法求出時,比如本研究中的盾構機液壓推進系統(tǒng)參數(shù),可以使用貝葉斯因子比較2個模型的好壞,進而達到優(yōu)化模型的目的。
K-means的核心思想為:把n個數(shù)據(jù)對象劃分為K個類別,并且使每一類別中的所有數(shù)據(jù)對象到該類的聚類中心點的平方和最小。RNN是一種特殊的神經(jīng)網(wǎng)絡結構,其可以考慮前一時刻的輸入,而且具有對前面數(shù)據(jù)的記憶功能,該方法可以用于處理序列數(shù)據(jù)。本研究所用K-means與RNN預測算法流程如圖5所示。
圖5 基于K-means聚類的RNN預測算法流程[13]
一元線性回歸分析預測法,是根據(jù)自變量X和因變量Y的相關關系,建立X與Y的線性回歸方程進行預測的方法。本研究選用一元線性回歸分析掘進速度數(shù)據(jù),式(10)為一元線性回歸公式:
y=ω0+ωixi
(10)
該方法是引入自變量,將因變量與自變量作一元回歸,并選出與因變量相關度最為密切或者是檢驗最顯著的一元線性回歸方程,建立最終的線性回歸預測方程。
基于上述ARIMA模型,利用K-means方法,提取數(shù)據(jù)的前66%為訓練集,后33%為測試集進行訓練,基于訓練結果及一階差分結果進行預測,圖6為對盾構機液壓推進系統(tǒng)掘進速度進行的預測結果,預測數(shù)據(jù)的時間為2020-10-03~05。在預測初期不能很好的預測結果,但是后期能逐步跟隨實際趨勢,但是預測效果不理想。
圖6 掘進速度基于K-means預測結果
之后基于該模型利用線性回歸方法對數(shù)據(jù)進行預測,預測結果如圖7所示,可以看出,該方法能很好的預測盾構機液壓推進系統(tǒng)數(shù)據(jù)的變化趨勢,而且能清楚的檢測出數(shù)據(jù)內包含的異常值,所以相較于K-means預測方法,更能體現(xiàn)出對工程實際施工過程中的異常檢驗與趨勢預測,更加符合工程應用。
圖7中圓點為異常情況, 該情況下預測結果與實際結果幅值相差較大,可以看出,整體的趨勢預測較為準確,在工程上,對預測結果造成的影響因素有很多,比如巖石層的結構、盾構機的狀態(tài)等,所以很難獲得非常準確的結果,但是基于本研究的方法,能獲得盾構機液壓推進系統(tǒng)參數(shù)的趨勢預測, 且幅值誤差相對較低。
圖7 掘進速度基于線性回歸預測結果
(1) 盾構機液壓推進系統(tǒng)具有施工環(huán)境惡劣、安全性能要求高等特點。本研究基于ARIMA方法,建立了盾構機液壓推進系統(tǒng)的預測模型,基于相關性分析及平穩(wěn)性檢驗,獲得了被用來預測的有效數(shù)據(jù)組,之后對相關模型進行搭建及模型優(yōu)化。
(2) 本研究分別利用基于K-means聚類的RNN預測方法及線性回歸方法對模型數(shù)據(jù)組進行了預測,可以得到,基于K-means聚類的RNN預測方法對盾構機推進系統(tǒng)的ARIMA模型下的數(shù)據(jù)預測結果不理想,存在著較大的誤差,數(shù)據(jù)趨勢不能預測準確;而基于ARIMA模型的線性回歸預測方法卻能很好的預測出數(shù)據(jù)的變化趨勢,并且能預測出數(shù)據(jù)中的異常值,即可能會引起故障的數(shù)據(jù)。