劉立強(qiáng),劉 洋,李怡航,張朝鵬,張 茹,艾 婷
(1.雅礱江流域水電開發(fā)有限公司,四川 成都 610051;2.四川大學(xué) 深地科學(xué)與工程教育部重點(diǎn)實(shí)驗(yàn)室,四川 成都 610065)
隨著信息時(shí)代的到來,整個(gè)人類社會(huì)的數(shù)據(jù)量在以驚人的速度增長[1-2],并且數(shù)據(jù)對(duì)于人類社會(huì)的反饋影響也逐漸變得不可忽視.當(dāng)今世界,數(shù)據(jù)已成為與人力資源和自然資源同等重要的戰(zhàn)略資源,各行各業(yè)研究者越來越多地嘗試從海量的數(shù)據(jù)中挖掘出對(duì)自己有價(jià)值的信息[3-4].
巖土工程與地下工程傳統(tǒng)的分析方法基本思想均為由現(xiàn)象到本質(zhì)的探索,數(shù)據(jù)的使用往往局限于各種工程現(xiàn)象與參數(shù)的記錄.在本質(zhì)探索過程中,依賴的更多的是學(xué)者主觀的分析和理論公式推導(dǎo)結(jié)合經(jīng)驗(yàn)修正,最后再利用數(shù)據(jù)做最后的檢驗(yàn).學(xué)者往往將復(fù)雜的工程問題簡化為一些基礎(chǔ)的物理模型,在此基礎(chǔ)上建立數(shù)學(xué)模型,利用數(shù)學(xué)的方式去求解[5].巖土工程作為傳統(tǒng)學(xué)科,通過工程、現(xiàn)場、實(shí)驗(yàn)、科研等方式積累的數(shù)據(jù)量已經(jīng)達(dá)到相當(dāng)驚人的數(shù)字,但對(duì)巖石屬性、參數(shù)等數(shù)據(jù)的記錄在現(xiàn)階段依然采用傳統(tǒng)方式,鮮少形成系統(tǒng)的、完整的信息庫[6-8].可見在巖土工程學(xué)科的傳統(tǒng)分析方法中,數(shù)據(jù)并沒有得到充分的利用,然而隨著現(xiàn)代信息技術(shù)的發(fā)展與巖土工程信息獲取手段的進(jìn)步,工程數(shù)據(jù)背后蘊(yùn)含的數(shù)據(jù)挖掘潛力是巨大的.可見數(shù)據(jù)重要的價(jià)值還有待進(jìn)一步開發(fā).但隨著科技的進(jìn)步,巖土工程與地下工程中對(duì)于數(shù)據(jù)的監(jiān)測與數(shù)據(jù)分析處理也逐漸重視,且目前已經(jīng)在國際上應(yīng)用較廣[9].在國內(nèi)對(duì)于巖土工程的數(shù)據(jù)分析尚處于起步階段,只在大壩等大型水利工程中應(yīng)用較多,但是國內(nèi)研究中對(duì)于巖土工程與數(shù)據(jù)關(guān)聯(lián)性分析技術(shù)甚至大數(shù)據(jù)技術(shù)的結(jié)合鮮有涉及.
隨著測試精度的提升與成本的降低,各項(xiàng)巖土工程中的數(shù)據(jù)監(jiān)測均已逐漸普及,加上計(jì)算機(jī)和網(wǎng)絡(luò)技術(shù)的飛速發(fā)展,巖土數(shù)據(jù)分析逐步呈現(xiàn)大規(guī)模、多維度、全方位的特征.以往監(jiān)測中對(duì)數(shù)據(jù)的簡單匯總、大致分析最后提交報(bào)告的傳統(tǒng)模式已經(jīng)難以滿足現(xiàn)代巖土工程[10].因此,以大數(shù)據(jù)與數(shù)據(jù)關(guān)聯(lián)分析處理手段為主的分析方法將會(huì)成為未來巖土工程安全監(jiān)測的核心工作.利用巖土工程傳統(tǒng)學(xué)科的特色,可充分建立數(shù)據(jù)密集型[11-12]科研方式,特別是在巖石的屬性與參數(shù)之間、參數(shù)與參數(shù)之間的關(guān)系探索,往往受到研究者的經(jīng)驗(yàn)與學(xué)科認(rèn)知的限制,無法充分研究各參數(shù)或變量之間的聯(lián)系,可能兩個(gè)從理論或認(rèn)知上毫無關(guān)系的參數(shù),在大量數(shù)據(jù)的充分驗(yàn)證下,利用計(jì)算機(jī)的客觀性與大數(shù)據(jù)的數(shù)據(jù)發(fā)掘能力初步“證明”兩者的相關(guān)性,然后根據(jù)計(jì)算機(jī)發(fā)現(xiàn)的結(jié)果去推導(dǎo)兩者相關(guān)性的原因,可以更大程度上體現(xiàn)科學(xué)研究的客觀性與真實(shí)性.換言之,在巖土工程中,只要能搜集到充足的跟被測值相關(guān)的數(shù)據(jù),理論上就能進(jìn)行預(yù)測,且數(shù)據(jù)量越大、相關(guān)性越強(qiáng),預(yù)測準(zhǔn)確率越高.這正是大數(shù)據(jù)的核心思想,可作為傳統(tǒng)科學(xué)研究手段的重要補(bǔ)充.
隨著我國水電、交通、采礦等事業(yè)的不斷發(fā)展,對(duì)于地下甚至深地開發(fā)的需求日益提高,巖石賦存環(huán)境的地應(yīng)力越高,巖爆等工程災(zāi)害的發(fā)生概率越大.如雅礱江錦屏二級(jí)水電站(4 800 MW)截彎取直開挖隧洞引水發(fā)電,隧洞最大埋深 2 500 m,7條隧洞平均長度約 17.5 km,開挖洞徑大于 12 m,其大河灣所處地形復(fù)雜,相對(duì)高差達(dá) 1 000~3 000 m,工程地質(zhì)勘察難度大,難以采用傳統(tǒng)方法在 17.5 km 長的7條隧洞上布置深達(dá)千米的地質(zhì)勘探鉆孔,以獲取隧洞高程部位的地質(zhì)信息.而其最大主應(yīng)力 70.1 MPa,高地應(yīng)力巖爆洞段約占整個(gè)隧道的15%,高地應(yīng)力問題以及巖爆的發(fā)生對(duì)工程施工和安全造成了巨大影響.可見盡管監(jiān)測手段如此豐富,但是在巖土工程中仍然事故頻發(fā),造成了巨大的民生、經(jīng)濟(jì)損失,說明目前的監(jiān)測工作仍有許多待解決的問題.數(shù)據(jù)獲取的門檻越來越低,但對(duì)于專業(yè)數(shù)據(jù)的分析人員要求卻越來越高,導(dǎo)致輸入輸出量不匹配,“重采集,輕分析”的現(xiàn)象日益嚴(yán)重,致使監(jiān)測得到的大量數(shù)據(jù)無法發(fā)揮出它們應(yīng)有的巨大價(jià)值.受限于當(dāng)時(shí)巖土工程學(xué)科以及信息技術(shù)的水平,監(jiān)測數(shù)據(jù)分析方法有待創(chuàng)新研究,因此,必須站在新的角度對(duì)工程巖土相關(guān)問題進(jìn)行深入研究[13],亟需新的數(shù)據(jù)分析方法來應(yīng)對(duì)如今地下工程甚至深地工程中越來越多的難題.
因此,本文基于數(shù)據(jù)關(guān)聯(lián)性分析的思想,選取巷道中的圍巖離層變形現(xiàn)象為例,利用SPSS軟件對(duì)其可監(jiān)測到的地質(zhì)、工程數(shù)據(jù)等進(jìn)行關(guān)聯(lián)分析,探索一種忽略探究工程事件發(fā)生機(jī)理,根據(jù)數(shù)據(jù)直接預(yù)測概率的可能.本研究成果可結(jié)合其它相關(guān)技術(shù)進(jìn)一步建立高地應(yīng)力條件下巖爆分析力學(xué)模型,為復(fù)雜度極高的巖土地下工程尤其是錦屏大設(shè)施等深地工程提供巖爆災(zāi)害預(yù)警和預(yù)報(bào),為工程設(shè)計(jì)和施工提供理論基礎(chǔ)和依據(jù).
在巖土工程中,有大量難以準(zhǔn)確測量的參數(shù),如原位狀態(tài)下的巖層力學(xué)性質(zhì)(例如,原位環(huán)境下的巖體泊松比、變形模量、粘聚力、內(nèi)摩擦角等參數(shù)),這些數(shù)據(jù)對(duì)于工程設(shè)計(jì)與施工有著重要的作用,但利用現(xiàn)在的監(jiān)測手段難以獲得準(zhǔn)確的原位數(shù)據(jù).隨著巖土工程監(jiān)測手段的多樣化與數(shù)據(jù)處理算法、模型的發(fā)展,借助大數(shù)據(jù)相關(guān)技術(shù),可以通過巖土工程中數(shù)據(jù)的關(guān)聯(lián)性,利用埋深、地溫、礦物成分、地層條件等參數(shù)去修正與預(yù)測那些難以準(zhǔn)確測得的參數(shù).在大數(shù)據(jù)時(shí)代,將巖土工程的機(jī)遇總結(jié)如下:
1) 傳感器技術(shù)為主的監(jiān)測方式將會(huì)得到巨大的市場空間
隨著IT技術(shù)的飛速發(fā)展和大數(shù)據(jù)時(shí)代的來臨,各項(xiàng)工程數(shù)據(jù)監(jiān)測技術(shù)中,各式各樣的傳感器將是該項(xiàng)技術(shù)的實(shí)施重點(diǎn).未來傳感器不僅要做到更加精準(zhǔn)、更易操作、更加及時(shí),同時(shí)還要做到更加全面,如果能夠監(jiān)測一些理論上十分難以得出的參數(shù),將會(huì)對(duì)理論知識(shí)的推進(jìn)帶來契機(jī).
2) 巖土工程的建設(shè)自動(dòng)化與大數(shù)據(jù)相匹配
巖土工程中的參數(shù)與數(shù)據(jù)不僅錯(cuò)綜復(fù)雜,且現(xiàn)存的存儲(chǔ)機(jī)制尚不完善,各單位間的數(shù)據(jù)共享率十分低下.而現(xiàn)代互聯(lián)網(wǎng)中的云計(jì)算、區(qū)塊鏈等技術(shù)可以很好地解決現(xiàn)在巖土工程中的數(shù)據(jù)共享問題.如果巖土工程的建設(shè)可以實(shí)現(xiàn)自動(dòng)化,就必須依賴于外部大數(shù)據(jù)的計(jì)算結(jié)果進(jìn)行實(shí)時(shí)反饋,實(shí)時(shí)調(diào)整施工與支護(hù)方案,可減少工程危險(xiǎn)區(qū)的施工人員的數(shù)量,甚至能做到“無人化”施工和監(jiān)測.
3) 數(shù)據(jù)分析將是巖土工程的重中之重
加強(qiáng)從業(yè)人員的數(shù)據(jù)分析能力,提高行業(yè)的數(shù)據(jù)分析整體素質(zhì),將有利于平衡數(shù)據(jù)采集與數(shù)據(jù)分析的關(guān)系,使得蜂擁而至的大量數(shù)據(jù)能夠得到可靠且快速的分析,并能及時(shí)反饋給巖土工程施工.由于數(shù)據(jù)的復(fù)雜性、影響參數(shù)過多甚至某些工程現(xiàn)象的作用機(jī)制不明,人們更傾向于利用關(guān)聯(lián)分析來進(jìn)行綜合的大范圍、全方位數(shù)據(jù)處理,通過數(shù)據(jù)本身的聯(lián)系來解決現(xiàn)有問題,而不是通過建立理論知識(shí)與經(jīng)驗(yàn)公式來進(jìn)行計(jì)算粗糙的預(yù)測.
現(xiàn)有的預(yù)測方法大致分為三類:經(jīng)驗(yàn)性預(yù)測、數(shù)學(xué)模型預(yù)測和大數(shù)據(jù)預(yù)測.數(shù)學(xué)模型預(yù)測和大數(shù)據(jù)預(yù)測均屬于預(yù)測的高級(jí)階段,但對(duì)復(fù)雜系統(tǒng)或內(nèi)在規(guī)律不明的預(yù)測對(duì)象,后者通常更為準(zhǔn)確.目前,常用的分析方法包括成分分析法(因子分析法)、偏相關(guān)分析法、回歸分析法(線性回歸、非線性回歸)、神經(jīng)網(wǎng)絡(luò)預(yù)測法等.
在實(shí)際工程中,為了系統(tǒng)全面反映問題,有時(shí)用于分析的變量較多,且各參數(shù)間重復(fù)信息較多,直接用于分析現(xiàn)實(shí)問題,不僅模型復(fù)雜,還會(huì)因各變量之間存在的多重共線性導(dǎo)致很多衍生問題.為此,人們希望能找到一些既能全面反映原始變量信息,又?jǐn)?shù)量有限的新指標(biāo).成分分析法(或因子分析法)是解決此類問題最有效的方法[14].它們能夠減少分析維度,提取變量信息,從而使問題更直觀、更易于分析和處理.
主成分分析方法通常有以下四個(gè)步驟:
1) 對(duì)原來的p個(gè)指標(biāo)參數(shù)(因素)進(jìn)行標(biāo)準(zhǔn)化,用以消除變量量綱的影響;
2) 用標(biāo)準(zhǔn)化的數(shù)據(jù)矩陣求解相關(guān)矩陣或協(xié)方差矩陣;
3) 求解協(xié)方差矩陣的特征向量與特征值;
4) 確定出主成分,并結(jié)合專業(yè)知識(shí)對(duì)各主成分賦予合理的解釋.
特別是在面對(duì)海量的監(jiān)測數(shù)據(jù)、監(jiān)測變量時(shí),選擇合適的變量建立模型尤為重要,但人為地憑經(jīng)驗(yàn)篩選、去除變量一方面具有較強(qiáng)的主觀性,另一方面會(huì)在一定程度上損失數(shù)據(jù)的價(jià)值[15].而在主成分分析過程中,利用數(shù)據(jù)本身的關(guān)聯(lián)性對(duì)各變量進(jìn)行數(shù)據(jù)篩選,而非人為主觀地對(duì)復(fù)雜的變量進(jìn)行解釋、推測與判斷,可在數(shù)據(jù)的前處理階段,保留最具代表性的主成分,即“用數(shù)據(jù)說話”中通過數(shù)據(jù)本身客觀統(tǒng)計(jì)學(xué)邏輯對(duì)各變量進(jìn)行標(biāo)準(zhǔn)化與分篩.
回歸分析法包括線性回歸和非線性回歸.線性回歸是一種統(tǒng)計(jì)分析方法,運(yùn)用十分廣泛,其主要利用數(shù)理統(tǒng)計(jì)中的回歸分析方法來確定兩個(gè)或多個(gè)變量間相互依賴的定量關(guān)系[16].
當(dāng)因變量與自變量組之間存在多重線性關(guān)系時(shí),用多重線性回歸模型可以很好地刻畫他們之間的關(guān)系:
(1)
通過最小二乘法,可以得到Q值最小的回歸模型就是統(tǒng)計(jì)上的最佳模型:
(2)
在線性回歸之后的檢驗(yàn)中,若自變量間的容差(也稱容忍度)與VIF(方差膨脹因子)超出了臨界值,則預(yù)示著線性回歸中可能存在多重共線性問題,這會(huì)使模型中兩個(gè)自變量的信息發(fā)生重疊,而兩者的信息重疊可能會(huì)使模型在內(nèi)部分析工程中自變量貢獻(xiàn)權(quán)重計(jì)算出現(xiàn)差錯(cuò).為解決多重共線性問題,有許多解決方法,如嶺回歸、逐步回歸、主成分分析、刪除自變量、更換模型等方式,在數(shù)據(jù)量較小時(shí)往往結(jié)合工程分析刪除共線性較大參數(shù)中不符合關(guān)聯(lián)性邏輯的參數(shù),從而篩選出具有統(tǒng)計(jì)學(xué)意義的參數(shù).
非線性回歸模型求解包含以下步驟:
1) 首先為所有未知參數(shù)指定初始值;
2) 按泰勒級(jí)數(shù)展開原方程,只保留一階各項(xiàng)作為線性函數(shù)的逼近,其余項(xiàng)均歸入誤差;
3) 通過最小二乘法對(duì)模型中的各參數(shù)進(jìn)行估算;
4) 用估計(jì)值替代初始值,再次展開方程、線性化,求出新的各參數(shù)估值;
5) 如此反復(fù),直至參數(shù)估計(jì)值收斂為止.
但上述方法計(jì)算復(fù)雜,只能借助計(jì)算機(jī)才能完成,而且在模型比較復(fù)雜時(shí),初始值的設(shè)定對(duì)模型是否能順利求解是有影響的.非線性回歸模型一般可以表示為如下形式:
(3)
式中:f(x,θ)為期望函數(shù),可以為任意形式.
建立回歸模型之后,判斷其是否具有統(tǒng)計(jì)學(xué)意義,需要對(duì)該回歸模型進(jìn)行檢驗(yàn),此處仍采用方差分析的基本思想進(jìn)行判斷,響應(yīng)的假設(shè)為:
H0:β1=β2=…=βp=0
H1:各β不全等于0
(4)
式中:H0為原假設(shè),H1為備擇假設(shè),β為偏回歸系數(shù).
例如在SPSS(Statistical Product Service Solutions)中,若P值(也寫作顯著性Sig.)<α(通常為0.05),則拒絕原假設(shè),說明至少一個(gè)自變量的偏回歸系數(shù)不為0,從而說明因變量Y線性依賴于某個(gè)變量Xi,所建立的回歸模型有統(tǒng)計(jì)學(xué)意義,若檢驗(yàn)結(jié)果為接受H0,則說明所有變量對(duì)因變量的線性關(guān)系是不重要的,該回歸模型不具有意義.
回歸分析中,需要分析現(xiàn)象之間相關(guān)的具體形式,確定其因果關(guān)系,并用數(shù)學(xué)模型來表現(xiàn)其具體關(guān)系,根據(jù)實(shí)測數(shù)據(jù)來求解模型的各個(gè)參數(shù),然后評(píng)價(jià)回歸模型是否能夠很好地?cái)M合實(shí)測數(shù)據(jù);如果能夠很好地?cái)M合,則可以根據(jù)自變量作進(jìn)一步預(yù)測.可見回歸分析的過程是在其數(shù)據(jù)區(qū)間內(nèi),通過參數(shù)之間的關(guān)聯(lián)性建立模型,從純數(shù)學(xué)統(tǒng)計(jì)的角度將工程監(jiān)測數(shù)據(jù)做擬合,而不必過于拘泥于傳統(tǒng)的本構(gòu)模型建立、參數(shù)物理關(guān)聯(lián)等[17],正體現(xiàn)了“用數(shù)據(jù)說話”的思想,用數(shù)據(jù)得出回歸模型,再用模型得出數(shù)據(jù).
神經(jīng)網(wǎng)絡(luò)是在對(duì)人腦組織結(jié)構(gòu)和運(yùn)行機(jī)制理解的基礎(chǔ)上,模擬其行為的一種分析系統(tǒng),其實(shí)質(zhì)即為人工智能AI的研究,利用計(jì)算機(jī)強(qiáng)大的算力來模擬智能生物神經(jīng)網(wǎng)絡(luò)中信息的傳遞過程.
從結(jié)構(gòu)角度,神經(jīng)網(wǎng)絡(luò)分為輸入層、輸出層和隱含層.節(jié)點(diǎn)在輸入層中代表各自的預(yù)測變量,在輸出層中代表目標(biāo)變量;隱含層位于輸入層與輸出層中間,其層數(shù)和節(jié)點(diǎn)數(shù)決定了構(gòu)成神經(jīng)網(wǎng)絡(luò)的復(fù)雜程度.由于巖土工程受力變形的機(jī)制復(fù)雜,難以采用解析的方法獲得作用效應(yīng)的顯式解,一般需要采用數(shù)值分析或試驗(yàn)的手段,且?guī)r土工程的功能函數(shù)非線性程度較高.而神經(jīng)網(wǎng)絡(luò)分析方法可以完全跳過本構(gòu)推導(dǎo)階段,利用神經(jīng)網(wǎng)絡(luò)強(qiáng)大的泛化功能及非線性映射能力,建立神經(jīng)網(wǎng)絡(luò)擬合結(jié)構(gòu)的隱式功能函數(shù),利用參數(shù)間本身的相互關(guān)聯(lián)性體現(xiàn)“用數(shù)據(jù)說話”的思想[18],將大量的數(shù)據(jù)通過神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)層層映射,最終得出理論預(yù)測數(shù)據(jù).圖1為含有一個(gè)隱含層的神經(jīng)網(wǎng)絡(luò)示意圖.
圖1 含有一個(gè)隱含層的神經(jīng)網(wǎng)絡(luò)示意圖Fig.1 Schematic diagram of neural network with a hidden layer
以世界上應(yīng)用較廣的統(tǒng)計(jì)軟件SPSS為例,其內(nèi)置了多種成熟的統(tǒng)計(jì)方法和模型,為用戶提供了全面的統(tǒng)計(jì)方法.在巖土工程中,成分分析法、回歸分析法和神經(jīng)網(wǎng)絡(luò)預(yù)測法可以滿足大多數(shù)中小型工程的數(shù)據(jù)分析、計(jì)算、擬合等工作,也可以用于統(tǒng)計(jì)模型的檢驗(yàn).
下面以巖土工程中常見的巷道問題為例.在巷道工程中,巷道頂板通常采用錨桿支護(hù),其活動(dòng)具有隱蔽性,即在其破壞失穩(wěn)前,通常無明顯征兆,頂板發(fā)生離層、下沉、冒頂?shù)葐栴}往往不易被人察覺,一旦發(fā)生事故,往往具突發(fā)性,工程中難以對(duì)其進(jìn)行適時(shí)防控.大量工程實(shí)踐表明,如果能在巷道中利用可觀測的數(shù)據(jù)對(duì)其頂板離層值進(jìn)行監(jiān)測并同時(shí)進(jìn)行預(yù)測,就能在頂板冒落前進(jìn)行適時(shí)支護(hù)與防控,降低巷道工程災(zāi)害的發(fā)生概率.
(a) 頂板離層 (b) 頂板冒落圖2 巷道頂板活動(dòng)Fig.2 Roof activity of roadway
研究表明,巖石體內(nèi)部的離層是錨固工程破壞失穩(wěn)的直接原因.頂板離層是地應(yīng)力、圍巖體結(jié)構(gòu)及其力學(xué)性質(zhì)、錨桿錨固參數(shù)、巷道斷面等諸因素綜合作用的外在表現(xiàn),因此頂板離層情況是評(píng)價(jià)巷道穩(wěn)定性的綜合指標(biāo)[19].預(yù)測頂板離層值可以為巷道等地下工程的安全性、穩(wěn)定性、可靠性的設(shè)計(jì)與評(píng)估提供有力支撐.
目前對(duì)于頂板離層值的計(jì)算大多依賴于經(jīng)驗(yàn)公式,理論值與實(shí)際值有較多偏差,效果都不盡如人意.借助數(shù)據(jù)關(guān)聯(lián)性分析思想,加上愈加完善成熟的傳感器系統(tǒng)規(guī)模使用為各項(xiàng)巖土工程積累的大量數(shù)據(jù),能夠客觀地根據(jù)監(jiān)測結(jié)果,依靠大數(shù)據(jù)分析,預(yù)報(bào)巖土體內(nèi)部的離層情況,對(duì)巖體的失穩(wěn)破壞甚至瞬時(shí)坍塌及早做出預(yù)警,從而避免事故發(fā)生.
以下預(yù)測數(shù)據(jù)利用全新頂板離層儀、鉆孔成像設(shè)備對(duì)頂板離層進(jìn)行綜合監(jiān)測得到.數(shù)據(jù)樣本的實(shí)際賦存深度為631~900 m,平均深度 850 m,樣品取自某代表性地下工程15-24080工作面(850 m).試樣力學(xué)特性在標(biāo)準(zhǔn)試樣樣本條件下,測試得到的峰值應(yīng)力為 97.12 MPa,峰值應(yīng)力對(duì)應(yīng)的軸向應(yīng)變?yōu)?.55%,體應(yīng)變?yōu)?.69%.
在該工程圍巖離層值的預(yù)測分析中,將監(jiān)測到的離層值與距回采面距離、埋深、錨桿長度、錨桿應(yīng)力、鉆孔應(yīng)力、頂板水以及側(cè)壓系數(shù)因素做關(guān)聯(lián)性分析,并在分析中發(fā)現(xiàn),各自變量間的本身相關(guān)性較強(qiáng),若直接用于回歸分析將導(dǎo)致共線性問題,使模型失效,因此采用主成分提取,從各自變量中提取出完全不存在共線性的成分用于分析.經(jīng)提取后,主成分1、2、3特征值的方差百分比總和超過93%(如表1所示),可以將其作為新的自變量用于圍巖離層值預(yù)測分析.可以看出,主成分1以“距回采面距離”為主,主成分2以錨桿參數(shù)為主,主成分3以“鉆孔應(yīng)力”為主.采用線性回歸與多重線性回歸,其擬合表達(dá)式分別為:
表1 主成分解釋Tab.1 Principal component explanation
ABS(線性回歸)=-0.202x1-1.031x2+0.075x3+16.930
(5)
(6)
式中:ABS為預(yù)測的頂板離層值,x1為主成分1,x2為主成分2,x3為主成分3.因非線性冪次超過2次方,小數(shù)位保留對(duì)結(jié)果影響較大,因此式中保留6位小數(shù).
最終各方法擬合與實(shí)測結(jié)果對(duì)比如圖3所示.
(a) 多重線性回歸法 (b) 多重非線性回歸法 (c) 神經(jīng)網(wǎng)絡(luò)法圖3 不同方法擬合與實(shí)測結(jié)果對(duì)比Fig.3 Comparison of fitting and measured results by different methods
從圖3中可以直觀地看出,線性回歸模型擬合曲線較為平緩,對(duì)于局部變化較大的情況無法很好地?cái)M合.而神經(jīng)網(wǎng)絡(luò)模型和非線性回歸模型則更接近原數(shù)據(jù),且在一些區(qū)間的曲線彎曲程度也大致相仿.在整體效果上,非線性模型曲線與原數(shù)據(jù)曲線最為契合,甚至在距回采面距離>40 m 的區(qū)間幾乎重合,但單純的數(shù)據(jù)擬合效果并不能說明預(yù)測模型的可靠性,在模型預(yù)測結(jié)束后,還需結(jié)合工程實(shí)況與經(jīng)驗(yàn)對(duì)模型的正確性做出評(píng)價(jià)與判斷,避免出現(xiàn)因多因素、多次冪導(dǎo)致的過度擬合情況發(fā)生.受限于此工程頂板離層監(jiān)測儀器,只測量到距離回采面 60 m 內(nèi)的數(shù)據(jù),在實(shí)際工程中,巷道的頂板圍巖離層值會(huì)隨距開采面的距離增大而逐漸減小,并最終趨于0或趨于穩(wěn)定在某一特定值,因此根據(jù)工程經(jīng)驗(yàn),在距回采面距離>60 m 時(shí),頂板圍巖離層值的減小速率應(yīng)逐漸降低,并在變化速率趨于0的同時(shí)其頂板圍巖離層值也降為0.結(jié)合圖3的三種預(yù)測模型曲線,線性回歸在影響因素較多、成分復(fù)雜的工程問題中相對(duì)誤差較大,復(fù)雜模型中的自變量容易存在交叉影響,導(dǎo)致多重共線性問題,如巖層巖石的力學(xué)性質(zhì)與地應(yīng)力、地溫以及孔隙水均有較大相關(guān)性,會(huì)使模型中信息發(fā)生重疊,但由于其模型的計(jì)算量小,對(duì)計(jì)算平臺(tái)的要求低,可在小型工程中做初步的預(yù)估與判斷,在做復(fù)雜模型的預(yù)測時(shí)需逐步分析自變量相關(guān)性并進(jìn)行嶺回歸或逐步分析等方式進(jìn)行.此工程中非線性回歸對(duì)頂板圍巖離層局部實(shí)測數(shù)據(jù)的擬合更為精準(zhǔn),但在曲線首尾段對(duì)于在距回采面距離為0以及即將大于 60 m 的區(qū)間,可以看到模型的趨勢(偏導(dǎo)數(shù))與實(shí)測值并不一致,同時(shí)在多數(shù)工程中,在已知全段監(jiān)測數(shù)據(jù)的情況下,利用多重非線性回歸對(duì)局部缺失數(shù)據(jù)進(jìn)行補(bǔ)全是較為準(zhǔn)確的方式,但在已知局部數(shù)據(jù)的情況下,利用非線性回歸做外延段預(yù)測需要人工判定模型的可靠性,因?yàn)樵跀?shù)理統(tǒng)計(jì)中,只要非線性方程的次冪與系數(shù)足夠多,是可以“完美”擬合任何一段函數(shù)曲線,但無法保證在原有區(qū)間外的趨勢正確.相對(duì)而言神經(jīng)網(wǎng)絡(luò)法在曲線擬合與趨勢預(yù)測方面更加符合此工程的實(shí)測數(shù)據(jù)與工程經(jīng)驗(yàn)判斷,能在總體上更貼合圍巖離層的實(shí)測數(shù)據(jù),還能對(duì)實(shí)測段外的趨勢做出較為正確的判斷,正是因?yàn)樯窠?jīng)網(wǎng)絡(luò)具有自學(xué)習(xí)與聯(lián)想存儲(chǔ)功能,往往能對(duì)工程問題中的復(fù)雜曲線進(jìn)行快速高度擬合,在大型工程中具有高速尋找優(yōu)化解的能力,但是其模型無法解釋本身的推理過程和推理依據(jù),同時(shí)需要數(shù)據(jù)足夠充分,并對(duì)計(jì)算機(jī)的硬件性能有著較高要求.
隨著數(shù)據(jù)量的增多,神經(jīng)網(wǎng)絡(luò)的誤差也會(huì)進(jìn)一步減小,在區(qū)間外的預(yù)測趨勢也可能會(huì)更貼近真實(shí)值(前提是模型、參數(shù)等經(jīng)過調(diào)試與檢驗(yàn)),說明近年新興的神經(jīng)網(wǎng)絡(luò)與人工智能、機(jī)器學(xué)習(xí),確實(shí)在巷道穩(wěn)定性方面有很大的幫助,但是因?yàn)槠鋬?nèi)部邏輯為“黑箱”操作,所以無法得知具體的函數(shù)關(guān)系,無法像傳統(tǒng)分析去建立本構(gòu)模型與控制方程,但這也是其特點(diǎn)之一,即直接根據(jù)數(shù)據(jù)得出結(jié)果,而不受主觀判斷的限制,往往會(huì)得出意想不到而又較為準(zhǔn)確的結(jié)果.在實(shí)際工程中,各模型的使用需結(jié)合工程數(shù)據(jù)的復(fù)雜程度,對(duì)于模型需求的迫切程度,對(duì)于求解的速度要求等方面予以綜合考慮.
隨著可監(jiān)測的工程參數(shù)與數(shù)據(jù)量日益增長,但巖土工程中整體的數(shù)據(jù)分析能力還有很大進(jìn)步空間,可以充分利用數(shù)據(jù)技術(shù)對(duì)復(fù)雜的巖土工程難題提出可行的解決方案.本文基于數(shù)據(jù)關(guān)聯(lián)性分析的思想,選取巷道中的圍巖離層現(xiàn)象為例,對(duì)其可監(jiān)測到的地質(zhì)、工程數(shù)據(jù)等進(jìn)行關(guān)聯(lián)分析,得出如下結(jié)論:
1) 對(duì)7個(gè)監(jiān)測變量進(jìn)行主成分分析以消除變量間的重疊問題,分析出主成分1、2、3特征值的方差綜合超過93%.根據(jù)荷載系數(shù),說明 “距回采面距離”、“錨桿參數(shù)”、“鉆孔應(yīng)力”因素能較好地與頂板離層值建立相關(guān)性且不存在共線性問題.
2) 頂板圍巖變形線性回歸模型對(duì)于局部擬合效果欠佳,但其計(jì)算速度快、模型簡單,可用于工程的初步預(yù)估預(yù)判斷.
3) 非線性回歸模型在已知數(shù)據(jù)區(qū)間內(nèi)的擬合程度較好,但在曲線首尾段對(duì)于在距回采面距離為0以及即將大于 60 m 的區(qū)間,模型的趨勢(偏導(dǎo)數(shù))與實(shí)測值并不一致,利用其做外延段預(yù)測需要人工判定模型的可靠性,避免發(fā)生過度擬合.
4) 神經(jīng)網(wǎng)絡(luò)在此巷道頂板圍巖變形分析中更加符合此工程的實(shí)測數(shù)據(jù)與工程經(jīng)驗(yàn)判斷,其擁有的自學(xué)習(xí)與聯(lián)想存儲(chǔ)功能,能對(duì)工程問題中的復(fù)雜曲線進(jìn)行快速高度擬合,但由于內(nèi)部邏輯為黑箱,無法解釋本身的分析過程.
在實(shí)際工程中,各模型的使用需結(jié)合工程數(shù)據(jù)的復(fù)雜程度、對(duì)于模型需求的迫切程度以及求解速度要求等方面予以綜合考慮.