袁曉潔,薛新華
(四川大學水利水電學院,四川 成都 610065)
在目前很多土木工程大型施工項目中,隧道工程往往是一個重要的行進項目。隧道掘進機(TBM)作為地下隧道工程施工的重要工具,因其具有安全、經濟的優(yōu)勢,同時可以避免露天挖掘和爆破所帶來的風險而廣泛使用[1]。但由于TBM 挖掘工作中對巖體條件極其敏感,往往會導致挖掘工作的效率降低,因此準確地預測TBM 在巖石環(huán)境中的掘進性能非常重要,大多數(shù)的TBM 性能預測模型都是通過預測ROP 實現(xiàn)。
過去有許多學者基于各種因素與TBM 的ROP 之間的相關性研究,建立了ROP 的預測模型。例如,Gao 等[2]基于長短期記憶(LSTM)神經網絡提出的ROP 預測模型;Gong 和Zhao[3]利用非線性回歸分析建立起ROP 的統(tǒng)計預測模型。但是一些研究發(fā)現(xiàn)這些模型存在無法解決非線性和復雜問題的缺點。
隨著計算機科學的發(fā)展,基于人工智能對TBM 的性能預測得到廣泛應用。Benardos 和 Kaliampakos[4]應用人工神經網絡(ANN)建立TBM 推進率的預測模型;Yagiz 和 Karahan[5]將粒子群優(yōu)化(PSO)用于掘進速度的預測;Grima 等[6]利用自適應神經模糊推理系統(tǒng)(ANFIS)進行TBM 性能的模擬。研究表明利用人工智能算法對TBM 性能進行預測在很多情況下都能提供可靠的結果。
國內外學者通過大量研究發(fā)現(xiàn),ROP 受許多因素影響,因此,很難確定所有的相關參數(shù)。實際上,沒有必要將所有的變量作為輸入?yún)?shù),因為一些參數(shù)之間具有較強的相關性。
本文利用兩種人工智能算法,基于三個TBM 隧道項目的185 組數(shù)據(jù),選取與TBM 性能有較強的相關性的三個參數(shù)(UCS、RQD 和DPW)建立ROP 預測模型。根據(jù)四個統(tǒng)計指標對建立的兩種模型的精度進行對比分析。
數(shù)據(jù)處理組合算法(group method of data handing,GMDH),也稱為感應學習算法或自組織算法,是一種模擬大腦進行過程的算法,由Ivakhnenko 于1971 年為預測河流中的魚群而提出[7]。由于數(shù)據(jù)處理組合算法具有前饋神經網絡的結構,因此人們常將它作為前饋神經網絡的一種,稱之為多項式網絡[8]。圖1 所示模型結構是一個典型的4 輸入、單輸出的GMDH 網絡。
圖1 GMDH 模型的典型網絡結構
GMDH 網絡可分為輸入層、隱藏層和輸出層三部分,首先由輸入層(第0 層)各神經元兩兩交叉組合產生第一層神經元。假設GMDH 網絡的第k 層有e 個神經元,那么網絡的下一層(第k+1 層)便會產生Ce2=0.5e2-0.5e 個神經元(見圖2)。由于GMDH 網絡中除輸入層神經元外,輸出層及各隱藏層神經元之間的關系滿足式(1)所示的Ivakhnenko 多項式關系(以圖2 中Pk,m神經元為例):
圖2 神經元的產生
式中:Pk,m、Pk-1,i和Pk-1,j分別表示網絡中第層中第m、i 和j個神經元的輸出值,且P0,i表示網絡第0 層(輸入層)中第i個神經元Xi;C1~C6均為多項式系數(shù)。
GMDH 網絡中根據(jù)各神經元所對應的輸出誤差均方差來進行神經元的篩選。圖3 是被選中的神經元兩兩交叉組合產生下一層神經元的示意圖。
圖3 層內神經元的選擇
重復神經元選擇的步驟,直至下一層神經元的誤差均比上一層的大,則將輸出誤差均方差最小的神經元作為系統(tǒng)的最終輸出。至此,所構造的網絡模型即為最優(yōu)模型。輸入和輸出參數(shù)之間的一般聯(lián)系可以用 Kolmogorov-Gabor 多項式來表示,如下式所示[9]:
多表達式編程(multi expression programming,MEP)是遺傳編程(GP)的一種變體,以其多表達能力而突出,可以采用線性染色體編碼多個解決方案 。
以 函 數(shù) 集F ={*,+,-, /}和 終 端 集T ={x0, x1, x2}為 例,對MEP 的編碼方式進行闡述。圖4(a)左邊的數(shù)字表示基因指數(shù),右邊(b)是MEP 染色體通過從上到下的順序翻譯的表達式,它們對應的基因樹狀圖見圖5。
圖4 樁長30m 時水平承載力與樁徑變化的曲線
圖5 MEP 染色體編碼的表達式
由于MEP 染色體可以編碼多個解決方案,因此通常通過控制MEP 染色體中所有表達的適應度后,選擇出最佳的表達式。一個染色體的適應值通過下列兩個公式求出[10-11]:
其中:式(3)為基因的誤差計算,i 為基因序號,k 為樣本的序號,n 為樣本數(shù)量,Mk,j為基因的運算結果,Ak為樣本對應的實際結果,式(4)為染色體的最終適應值求解公式。
本文選取來自美國皇后區(qū)水隧道項目、伊朗卡拉吉—德黑蘭隧道項目和埃塞俄比亞GilgelGibell 水電項目[12,13]的185組數(shù)據(jù)用于建立預測TBM 掘進速度的模型。鑒于影響ROP的因素較多,本文參考Javad 和 Narges 等[14]的研究,選取與掘進速度有較強相關性的三個參數(shù),即UCS、RQD 和DPW。表1 和表2 分別為數(shù)據(jù)集的皮爾遜相關性分析結果和統(tǒng)計分析指標。從表中可以得出,選取的三個參數(shù)與ROP 的相關性顯著,且具有一個較為廣泛的分布范圍。
表1 參數(shù)的皮爾森相關性分析
表2 實驗數(shù)據(jù)的統(tǒng)計參數(shù)
為了方便對比分析,將收集的185 組數(shù)據(jù)按照3∶1 的比例劃分為訓練集(139 組)和測試集(46 組)兩部分,用于ROP 預測模型的建立和測試。
首先,為評價三個模型的預測精度,本文選擇決定系數(shù)(R2)、平均絕對誤差(MAE)、均方根誤差(RMSE)和相對平方根誤差(RRSE)等統(tǒng)計指標。其計算方程式如下:
式中:n 為數(shù)據(jù)總數(shù);Xm、Xp分別為測量值和預測值;X 為測量值的平均值。
3.2.1 參數(shù)設置
為得到最優(yōu)模型,根據(jù)試錯策略,本文將隱藏層層數(shù)設置為1 層,單層神經元總數(shù)限制在3 個以內。輸入?yún)?shù)為UCS、RQD 和DPW,輸出參數(shù)為TBM 的掘進速度ROP,見圖6。
圖6 GMDH 預測模型網絡結構
3.2.2 GMDH 結果分析
根據(jù)上述GMDH 網絡結構的參數(shù)設置,建立 ROP 預測模型,最優(yōu)模型的具體結果見表3 和圖7。
表3 GMDH 模型中的多項式系數(shù)總結
圖7 GMDH 模型預測結果和測量結果對比
從圖7 中可以得知,訓練集的決定系數(shù)為0.915,測試集為0.904,總的決定系數(shù)為0.913,展現(xiàn)了GMDH 模型預測的可靠性,說明GMDH 模型可以為TBM 的掘進速度提供一個良好的預測精度。
3.3.1 參數(shù)設置
建立MEP 模型首先需要對初始參數(shù)進行選擇,因此參考Wang 和 Yin[14]研究中的最優(yōu)參數(shù)設置,并與試錯法結合,得到表4 中本文的MEP 最優(yōu)參數(shù)設置。
表4 MEP 參數(shù)的最優(yōu)組合設置
3.3.2預測結果分析
結果見圖8。由圖8 的可得,MEP 模型的訓練集和測試集決定系數(shù)分別為0.884 和0.919,總的決定系數(shù)為0.885,說明基于MEP 提出的預測模型不僅精度良好,且適用于其他隧道項目ROP 的預測,可以為實際應用提供參考。
圖8 MEP 模型預測結果和測量結果對比
將基于兩種人工智能算法提出的ROP 預測模型進行對比,統(tǒng)計指標結果見圖9。兩個預測模型的結果表明,GMDH模型的決定系數(shù)(0.913)高于MEP 模型(0.885)。決定系數(shù)作為模型性能的重要決定指標,數(shù)值越接近1,則表明這個模型的相關性能越好。對于MAE、RMSE 和RRSE 等三個指標,值越小則模型的預測性能越優(yōu)。
從圖9 的結果中可以得出,兩種模型的決定系數(shù)都在0.90左右,而另外三個誤差評價指標也都低于0.5,表明兩種方法都可以在預測ROP 方面提供一個較好的精度。這兩種人工智能算法都可以為實際工程的應用提供參考。
圖9 三種ROP 預測模型的統(tǒng)計指標
1)基于GMDH 和MEP 提出的兩個ROP 預測模型都能提供一個較高的預測精度,預測結果與實際測量結果誤差較小,它們的決定系數(shù)分別為0.913 和0.885,且三個誤差評價指標都低于0.5。
2)將GMDH 和MEP 模型進行對比分析,發(fā)現(xiàn)兩種算法都能提供一個計算公式,但GMDH 的預測精度高于MEP,且GMDH 的計算效率更高,因此,在預測TBM 的性能方面GMDH 可能更適用。
3)本文用于建立模型的數(shù)據(jù)集來自三個隧道項目,獲得的誤差較低,如果全部來自同一個項目或局部區(qū)域,可能獲得一個更低的誤差。