張 研,曾建斌,鄧雪沁
(1.桂林理工大學 廣西巖土力學與工程重點實驗室,廣西 桂林 541004; 2.桂林理工大學 土木與建筑工程學院,廣西 桂林 541004)
隧道掘進機(Tunnel Boring Machine,TBM)施工的優(yōu)點在于施工快捷、優(yōu)質(zhì)可靠、安全環(huán)保,尤其適合中長隧道的施工,未來硬質(zhì)巖體的隧道施工將普遍采用此方法[1-2]。為使該方法在工程實際中取得最佳效益,人們越來越重視施工進度及施工成本之間的關系。合理的掘進速度有利于維持圍巖穩(wěn)定性,降低施工造價,這對TBM隧道安全、高效施工具有重要意義[3]。
自20世紀70年代以來,涌現(xiàn)出一系列TBM掘進速度預測模型,包括單因素預測模型、綜合預測模型、巖體分類預測模型、概率模型等[4]。其中,以CSM和NTNU模型為代表的綜合預測模型應用較為廣泛。CSM模型來自室內(nèi)線性切割試驗,但未充分考慮巖體中節(jié)理裂隙帶來的影響;NTNU模型雖然較全面地考慮了各影響因素,但采用的某些指數(shù)不適用于廣泛的巖石試驗,限制了該模型的應用。挪威學者Barton[5]根據(jù)調(diào)研大量地下開挖工程穩(wěn)定性實例提出了Q模型,該模型考慮了6項質(zhì)量評價指標后,將影響掘進機和巖體相互作用的因素考慮進去,通過分析來自隧道施工的大量數(shù)據(jù),對Q模型加以改進,確定了QTBM模型,但該模型列出的部分參數(shù)對掘進速度預測結果無實質(zhì)性影響。Nelson[6]提出的概率模型采用統(tǒng)計分析方法能夠?qū)Σ煌A段的施工時間與費用數(shù)據(jù)進行概率形式的估算,但它在相似性模擬中存在一定的局限性。
近些年,隨著計算機技術的高速發(fā)展,針對上述模型存在的不足,許多學者基于人工智能技術提出了一些新的隧道TBM掘進速度預測模型,它們能夠彌補傳統(tǒng)預測模型的不足。其中,以Acaroglu等提出的模糊邏輯(FL)模型、溫森等提出的Monte Carlo-BP神經(jīng)網(wǎng)絡預測模型以及Mahdevari等基于支持向量回歸(SVR)提出的TBM掘進速度模型為代表[7-9]。但以上模型本身還是存在一些缺陷,導致模型在應用中受到限制,如支持向量回歸核函數(shù)以及參數(shù)難以確定,BP神經(jīng)網(wǎng)絡預測能力對初始訓練樣本的依賴性強[10]。因此,更加準確、合理的智能預測模型亟待提出。
相關向量機方法(Relevance Vector Machine,RVM)是近年來流行的機器學習方法,它具有高精度、參數(shù)自適應獲取和適應小樣本問題等優(yōu)勢,可以建立各種復雜工程問題的預測模型[11]。然而當輸入樣本影響因素(即樣本維數(shù))較多時,會降低RVM模型學習效率,增加計算成本。本文采用主成分分析法(Principal Component Analysis,PCA)提取數(shù)據(jù)特征、降低數(shù)據(jù)維度[12],以降維數(shù)據(jù)作為RVM的輸入量進行預測,可將RVM解決小樣本復雜問題的突出優(yōu)勢體現(xiàn)出來[13]。通過RVM模型建立降維后各因素與TBM掘進速度之間的非線性映射關系,建立基于PCA-RVM的TBM掘進速度預測模型,為掘進速度預測提供了一條新途徑。
主成分分析法的主旨在于降維,通過對初始觀測樣本的一系列處理,保留對樣本總體貢獻率較大的因素,剔除貢獻率較低的因素,以此得到低維度的新變量系統(tǒng)[14]。設總體觀測樣本含有m個樣本,對n個變量進行觀察,構建的主成分分析觀測模型如式(1)所示:
(1)
對輸入數(shù)據(jù)標準化處理可避免因數(shù)據(jù)量綱造成的模型精度問題。假定觀測模型的相關系數(shù)矩陣為R=(rii),將樣本矩陣Xm×n的二維向量設為Xi與Xj,則rij可由標準化后樣本數(shù)據(jù)的協(xié)方差矩陣轉化得到:
(2)
用雅克比方法求特征方程|λE-R|=0的m個非負特征根λ1≥λ2≥…λm≥0。
經(jīng)過主成分分析,初始變量x1,x2,…,xt變換成t個綜合指標因子y1,y2,…,yt,表達式如下:
(3)
tn=y(xn;ω)+ξn
(4)
式中:ω為權值向量,ξn為零均值,方差為σ2的附加高斯噪聲,且相互獨立。故p(tn|x)=N(tn|y(xn),σ2)服從高斯正態(tài)分布,且其分布是由tn、y(xn)的值以及方差σ2所決定的。同時,y(x)的值是由核函數(shù)所決定的。RVM的原理如圖1所示。
圖1 RVM模型工作原理Fig.1 Working principle diagram of the RVM model
本文采用局部線性插值能力較強的高斯核函數(shù)用于TBM掘進速度的預測,其形式為
(5)
式中:xc為核函數(shù)中心,σ為函數(shù)的寬度參數(shù)。
由于前文假設tn相互獨立,則訓練樣本集的似然函數(shù)可采用下式表達:
(6)
式中:t=(t1,t2,…,tN)T為目標向量,參數(shù)向量為ω(ω0,w1,…,ωN)T,Φ為N×(N+1)維由核函數(shù)組成的矩陣,Φ=[φ(X1)φ(x2)…φ(xN)]T,φ(xn)=[1,K(xn,x1),K(xn,x2),…,K(xn,xN)]T。
(7)
式中:α是決定權值ω的先驗分布的N+1維超參數(shù)。因為高斯正態(tài)分布方差倒數(shù)的共軛概率分布服從Γ分布,假定超參數(shù)α和噪聲參數(shù)σ2服從Γ先驗概率分布:
P(αi)=Γ(a,b)
(8)
P(σ2)=Γ(c,d)
(9)
Γ(a,b)=Γ(a)-1baaa-1e-ba
(10)
(11)
為使得到的超參數(shù)相對均勻,通常取a=b=c=d=0。
由貝葉斯原理可以得到后驗分布概率的關系式:
(12)
(13)
式中:P(ω,α,σ2|t)用積分的方法不能求解,因此可以將上式分解為
P(ω,α,σ2|t)=P(ω|t,σ,σ2)P(α,σ2|t)
(14)
經(jīng)變換得出權重ω的后驗分布的表達式:
(15)
其后驗均值和協(xié)方差可以分別表示為
μ=σ-2ΦTt
(16)
∑=(σ-2ΦTΦ+A)-1
(17)
式中:A=diag(α0,α1,…,αN)為對角矩陣。
在更新超參數(shù)迭代學習的過程中,產(chǎn)生的相關向量可反映初始訓練樣本特征,與用來預測的樣本無關[17]。在初始樣本學習的過程中,α和σ2是兩個必要的超參數(shù),運用RVM方法進行學習時,超參數(shù)可自適應獲取。在超先驗的條件下,取P(t|α,σ2)最大。
(18)
可以運用MacKay法求解α和σ2的值,令式(18)為零,通過求超參數(shù)的偏導得到:
(19)
(20)
γi=1-α∑ii
(21)
式中:μi是第i個后驗平均權重,∑ii是第i個對角元素。在求解超參數(shù)的過程中,將趨向無窮大的超參數(shù)去除,以獲取具有稀疏性的相關向量機模型。
設待測樣本為x*,預測值為t*,則待預測的數(shù)據(jù)結果可由下式求解得到:
(22)
由于式(22)中等號右側的被積函數(shù)都服從于高斯正態(tài)分布,故t*也服從高斯正態(tài)分布
(23)
為平衡TBM掘進速度與施工成本的關系,提出一種合理可行的預測模型十分必要。依照前述方法進行主成分分析,得到各主要影響因素之間的關系,利用累計貢獻量這一指標確定需要保留的主要因素,將這一結果輸入到RVM模型,通過模型對樣本進行學習,輸出TBM掘進速度的預測結果。本文以文獻[8]中的5個影響因素作為TBM掘進速度(PR)主要影響因子,分別為完整巖石的單軸抗壓強度(UCS)、巴西試驗劈裂抗拉強度(BTS)、軟弱結構面的平均間距(DPW)、沖擊試驗壓頭的最大荷載與相應的位移的比值(PSI)和隧道軸線與軟弱結構面之間的夾角(α)。以上影響因素可通過巖塊力學性質(zhì)試驗或現(xiàn)場監(jiān)測獲取,操作方便快捷。將文獻[8]中的TBM掘進速度數(shù)據(jù)進行整理,以1~15號數(shù)據(jù)作為學習樣本,16~25號數(shù)據(jù)作為預測樣本,如表1所示。
相關向量機是監(jiān)督式學習的一種,為此需要驗證表1中訓練樣本集與預測樣本集相互獨立且具有聯(lián)合概率分布。KS-檢驗(Kolmogorov-Smirnov test)可通過比較樣本的經(jīng)驗分布函數(shù)和理論分布函數(shù)作擬合適度檢驗。經(jīng)檢驗,在0.05顯著性水平下,每個輸入量顯著地來自正態(tài)分布總體,滿足RVM模型對輸入樣本的要求。
表1 TBM掘進速度數(shù)據(jù)集Tab.1 Data set of TBM penetration rate
對表1中數(shù)據(jù)進行標準化處理,輸出檢驗結果,用KMO來反映各變量的相關程度,用Bartlett球形檢驗來驗證其矩陣是否為單位矩陣。通過計算得到KMO值、Bartlett球形檢驗中sig值分別為0.753和0.016,結果滿足進行因子分析的條件。結合本文所述兩種原理的特征,采用主成分分析法對表1中的各輸入變量進行降維處理,使RVM在處理小樣本問題上的優(yōu)勢充分展現(xiàn)。利用主成分分析法對影響因素進行分析,得到的相關系數(shù)矩陣如表2所列。
表2 相關系數(shù)矩陣Tab.2 Matrix of correlation coefficient
由表2可知:前3個影響因素的相關系數(shù)較大,反映它們之間具有較大的線性相關性。如:UCS與前3個影響因素的相關系數(shù)分別為1.00,0.643和0.575,其線性相關性依次降低;而與后2個影響因素的相關系數(shù)為-0.107和0.035,表現(xiàn)為負相關和幾乎不相關。由此可初步判定:UCS與前3個影響因素相關性較大。為保證原始信息提取充分,確保線性變換后的新數(shù)據(jù)作為輸入樣本不影響相關向量機模型的穩(wěn)定性,需進一步進行主成分分析。用軟件進行主成分分析得到的總方差解釋如表3所列。
表3中,前3個主成分的方差累計貢獻率已達86.137%,所以認為前3個主成分能夠反映全體變量包含的信息。各主成分的方差貢獻率以及累計貢獻率如圖2所示。
表3 總方差解釋Tab.3 Explanation of total variance
因子載荷是第i個變量在第j個主成分的權重,反映了該變量在對應的主成分上的相對重要性。表4中的因子載荷矩陣反映了提取的主成分與不同影響因素之間的密切程度。
表4 因子載荷矩陣Tab.4 Factor load matrix
利用主成分分析法實現(xiàn)了對原始影響因素的降維,提取的3個主成分經(jīng)線性變換公式獲取新的變量表達式:
(24)
第一主成分y1所對應的方差貢獻率最大,是反映與PSI、UCS、BTS有正相關的主成分指標,是巖石的單軸抗壓強度、巴西試驗劈裂抗拉強度和沖擊試驗壓頭的最大荷載與相應位移的比值的綜合反映,代表該主成分與掘進部位巖石的力學性能有較大相關性。第二主成分y2對應的方差貢獻率次之,主要反映影響因子α與該主成分有較大的相關性,而影響因子BTS與該主成分具有較大的負相關性,該指標主要度量隧道軸線與軟弱結構面之間的夾角和巖石抗拉強度。同樣的,第三主成分y3更能反映巖石抗壓強度UCS和結構面間距DPW中包含的信息。
通過主成分分析,以矩陣構成的新模型代替原先的矩陣,有效降低了數(shù)據(jù)維數(shù)。降維后的3個主成分包含了5個影響因素的絕大多數(shù)信息,因此可作為TBM掘進速度預測的輸入量。
采用經(jīng)主成分分析法降維后3個影響因素對應的數(shù)據(jù)集作為輸入值,以掘進速度(PR)作為輸出值。對上述數(shù)據(jù)標準化處理后,選擇局部插值能力較強的高斯核函數(shù)對1~15號共15組樣本數(shù)據(jù)進行掘進速度的驗證。為了獲得更有效的模型,選取最優(yōu)核寬度,分別選取0.16,0.18,0.20,0.22,0.24,0.26,0.28作為高斯核寬度對模型進行對比。初始化程序后對不同高斯核寬度下驗證結果的最大相對誤差進行計算和對比,結果見圖3。顯然,高斯核寬度,迭代次數(shù)為500時,得到的最大相對誤差最小。各樣本掘進速度的實測值、BP神經(jīng)網(wǎng)絡預測值、RVM模型預測值以及PCA-RVM預測值的輸出結果如表5所列。
圖3 掘進速度對應不同高斯核寬度的最大相對誤差Fig.3 Maximum relative errors of different core widths corresponded with excavation rate
由表5可以看出:基于PCA-RVM模型得到的相對誤差均小于其他模型,其相對誤差值最大的21號樣本僅為0.41%,而BP神經(jīng)網(wǎng)絡方法預測值的最大相對誤差高達17.24%,直接采用RVM方法其預測結果的最大相對誤差為2.93%。采用PCA-RVM模型的預測結果均好于其他兩種方式。為了更好地觀察不同模型輸出的預測值,將表4中3種方法的輸出的掘進速度預測值進行對比(見圖4)。
表5 不同方法的預測結果比較Tab.5 Comparison of prediction results by different methods
圖4 不同方法掘進速度預測值對比Fig.4 Comparison of prediction results by different methods
由圖4可見:PCA-RVM模型各預測值幾乎與實際TBM掘進速度重合,而BP神經(jīng)網(wǎng)絡預測結果偏離較大,RVM模型預測值次之。從圖形可直觀地看出BP神經(jīng)網(wǎng)絡預測值中16,19,21號樣本偏離明顯,PCA-RVM模型的預測精度更高。本文還采用平均相對誤差ARE和均方差FMSE來反映各模型預測結果的整體誤差水平與離散程度,其計算公式為
(25)
(26)
表6 不同模型ARE與FMSE對比Tab.6 Comparison of ARE and FMSE by different models
由表6可見:本文提出的PCA-RVM模型計算得到的平均相對誤差為0.24%,均方差為0.005;而BP神經(jīng)網(wǎng)絡預測模型,其平均相對誤差為6.53%,均方差為0.172。由此可見,與BP神經(jīng)網(wǎng)絡和RVM模型相比,基于PCA降維后得到的數(shù)據(jù)集更有利于RVM模型的預測,其預測精度高,離散型小,結果可信。
本文提出一種基于PCA-RVM的TBM掘進速度預測模型。通過PCA將5個影響因素降維成3個獨立主成分變量,采用RVM建立主成分變量與掘進速度間的非線性映射關系,主要結論如下。
(1) 通過PCA對原始數(shù)據(jù)進行降維處理,使得降維后的數(shù)據(jù)基本能夠保證原數(shù)據(jù)信息的完整性;采用RVM建立降維主成分變量與TBM掘進速度間的映射關系,進而預測TBM的掘進速度,其預測結果精確、擬合程度高、離散性小,為TBM掘進速度的準確獲取提供一條新途徑。
(2) 3種模型的預測結果表明,采用PCA-RVM進行TBM掘進速度預測得到的平均相對誤差和均方差均低于BP神經(jīng)網(wǎng)絡及RVM模型,本文提出的模型在回歸預測問題上比BP神經(jīng)網(wǎng)絡和RVM模型更有優(yōu)勢。
(3) 本文模型的提出是建立在獲得工程實際TBM掘進速度數(shù)據(jù)的基礎上,通過廣泛收集樣本數(shù)據(jù),以此建立預測模型,對優(yōu)化模型參數(shù),提高模型的適用性和準確度有重要意義。