許振浩,馬文,李術(shù)才,林鵬,梁鋒,許廣璐,李珊,韓濤,石恒
1)山東大學巖土與結(jié)構(gòu)工程研究中心,濟南,250061;2)山東大學齊魯交通學院,濟南,250061;3)中國地質(zhì)科學院,北京,100037;4)自然資源部深地科學與探測技術(shù)實驗室,北京,100094
內(nèi)容提要: 巖性識別是地質(zhì)工作中一項基礎(chǔ)而又重要的工作。傳統(tǒng)的巖性識別方法過于依賴經(jīng)驗和地質(zhì)專業(yè)知識積累,不僅耗時長、專業(yè)性強,還易受主觀因素影響,導致準確率不理想。筆者等首先回顧了傳統(tǒng)的巖性識別方法,之后總結(jié)了最新涌現(xiàn)的智能化識別方法,最后詳細介紹了基于巖石圖像、鏡下圖像、圖像與元素信息融合等的智能識別方法。基于巖石圖像的識別方法對于文中的巖石識別準確率可達90%以上,基于圖像與元素融合的巖性識別方法可以降低圖像相似度高、風化破壞表觀特征等因素對識別準確度的影響。筆者等認為當前巖性智能化識別研究仍處于初級階段。綜合各類數(shù)據(jù)源的優(yōu)勢,利用機器學習深度挖掘巖石元素、礦物、光譜和表觀特征間的內(nèi)在關(guān)聯(lián)性,有利于突破單源信息的局限性,實現(xiàn)巖性快速準確識別。
巖性識別歷來是地質(zhì)學、資源勘查、巖土勘察、巖石力學與工程等領(lǐng)域非常重要而基礎(chǔ)的問題,是一個必不可缺的環(huán)節(jié)(陳興龍等,2013;林鵬等,2021)。準確高效的識別巖性具有重要的應用價值(付光明等,2017)。在地球科學領(lǐng)域,認識地下巖性分布一直是地質(zhì)學中的重要問題。地層巖性識別對礦產(chǎn)、石油等資源勘探提供了強有力的支持(陳興龍等,2013)。同時,巖性識別對巖土與地下工程設計方案優(yōu)化、安全評估與風險評價也具有重要的指導意義(許振浩等,2021)。
目前,巖性識別主要有手標本鑒定、薄片鑒定、元素測試和礦物測試等方法(許振浩等,2021),還包括重磁技術(shù)、地震技術(shù)等其他間接輔助識別手段。手標本鑒定是最簡單直接的巖性識別方法,可在工程中快速提供初步的識別結(jié)果(常麗華等,2009)。薄片鑒定是地質(zhì)學中應用最早且較為普遍的巖石巖性鑒定方法之一,對研究人員的專業(yè)知識和地質(zhì)經(jīng)驗要求較高(趙明,2007)。元素測試是直接通過測試元素種類及含量,建立與巖性信息的相關(guān)模型進行巖性識別的方法;或在獲取元素信息的基礎(chǔ)上,根據(jù)地球化學的規(guī)律求出礦物含量從而進行巖性識別。礦物測試是通過測定礦物種類及含量鑒定巖性的方法。元素測試和礦物測試技術(shù)都需要經(jīng)過實驗獲取數(shù)據(jù),再對數(shù)據(jù)進行處理分析進而得到最終巖性識別的結(jié)果。獲取巖石元素、礦物種類及含量信息的方式很多,其中光譜技術(shù)是目前比較常用的手段,將其應用于巖性識別也是該領(lǐng)域的重要成果之一(佘明軍等,2018)。
X射線熒光分析技術(shù)(XRF)、X射線衍射技術(shù)(XRD)和高光譜技術(shù)等是獲得光譜信息的主要手段,元素與礦物的定性定量識別是利用光譜技術(shù)進行巖性識別的切入點。XRF可對樣品中的元素進行定性和定量分析,利用元素與巖性之間的關(guān)系有效解決工程過程中對大量粉末狀巖屑識別的難題,具有良好的工程適用性。XRD可對樣品中的礦物進行定性和定量的分析,再通過地球化學規(guī)律對樣品巖性進行識別,結(jié)果準確、具有較高的參考價值(李娟等,2017)。高光譜技術(shù)同樣可對巖石樣品中的礦物進行定性定量分析,具有數(shù)據(jù)量豐富、測試速度快、無需制樣等優(yōu)勢。雖然該技術(shù)起步較晚,但是目前的研究也證明了應用高光譜技術(shù)進行巖性識別的可行性與有效性(林鵬等,2021)。
通過巖性識別技術(shù)獲取到的數(shù)據(jù)眾多,如何利用這些數(shù)據(jù)快速準確的確定巖性具有重要的研究意義。隨著技術(shù)的進步,人工智能技術(shù)開始應用于巖性識別方面,基于數(shù)據(jù)挖掘和圖像識別等技術(shù)的巖性智能化識別方法不斷涌現(xiàn)。數(shù)據(jù)挖掘是從大量數(shù)據(jù)中揭示隱含的并具有潛在價值信息的方法。在巖性識別領(lǐng)域,主要通過分析元素數(shù)據(jù)、礦物數(shù)據(jù)及測井數(shù)據(jù)等,從中尋找其與巖石巖性的規(guī)律,包括關(guān)聯(lián)分析、聚類分析、分類分析和異常分析等。圖像識別是利用計算機對圖像進行處理、分析和理解的過程,以識別不同目標為任務,通常會應用深度學習方法。在基于圖像進行巖性智能識別時,選擇巖石圖像或鏡下圖像作為研究對象,并利用提取到的圖像特征與對應巖性關(guān)系形成映射,從而達到自動識別的目的。
人工智能技術(shù)的引入提高了巖性識別的自動化程度,同時有利于提高結(jié)果的客觀性。但是在面對數(shù)據(jù)與巖性之間的復雜關(guān)系時,僅利用巖石單一特征,容易產(chǎn)生錯分及漏分現(xiàn)象,導致巖性識別誤差較大、巖性解譯精度較低等問題。所以如何更好地協(xié)同各種信息,充分實現(xiàn)“1+1>2”的效應成為當今需要關(guān)注的問題(張翠芬等,2017)。總體而言,巖性識別已經(jīng)逐步從傳統(tǒng)識別技術(shù)向智能化識別方法過渡,且已經(jīng)取得了較大進展。但還存在一系列關(guān)鍵問題亟待解決,例如缺少通用測量設備與技術(shù),尚未建立統(tǒng)一數(shù)據(jù)庫,算法模型需要提高泛化能力和魯棒性等。本文在課題組研究的基礎(chǔ)上,通過大量的國內(nèi)外文獻調(diào)研對巖性識別的技術(shù)和數(shù)據(jù)統(tǒng)計與分析方法進行了總結(jié),闡述了課題組在巖性智能識別方面的新進展,并對未來的技術(shù)發(fā)展方向和趨勢進行預測,為巖性智能化識別領(lǐng)域的研究提供參考。
巖性識別技術(shù)主要分為:手標本鑒定、薄片鑒定、元素測試、礦物測試及其他輔助識別技術(shù)。不同的巖性識別技術(shù)適用于不同的應用場景,需基于實際需求,選擇相應的巖性識別技術(shù)。
圖1 巖石圖像;(a)粉砂巖;(b)橄欖巖;(c)花崗巖;(d)輝綠巖;(e)流紋巖;(f)正長巖Fig. 1 Rock images: (a) siltstone; (b) peridotite; (c) granite; (d) diabase; (e) rhyolite; (f) syenite
手標本鑒定主要是根據(jù)巖石的顏色、組構(gòu)、礦物成分及其他特征對巖石進行識別與分類(圖1)(許振浩等,2021)。例如通過不同的結(jié)晶程度、礦物形態(tài)等特征可以對火成巖進行巖性判別(常麗華等,2009)。變質(zhì)巖則可通過其組構(gòu)、成分等進行基礎(chǔ)的分類命名(陳曼云等,2009)。對于沉積巖,可通過巖樣的結(jié)構(gòu)、大地構(gòu)造和顏色等特征進行巖性識別(劉寶珺,1980)。Zhang Guohua等(2018)認為巖石的宏觀描述對于巖性鑒別具有重大意義,結(jié)合顏色、破碎程度等特征更容易對巖石進行鑒別;Rigopoulos等(2015)在對超鎂鐵巖樣的研究中通過巖石結(jié)構(gòu)、破碎形態(tài)等特征對不同巖性進行輔助識別。宏觀判別在地質(zhì)相關(guān)工作中得到了廣泛的應用,但該方法難以對礦物成分進行準確定量,且識別結(jié)果主觀性強,易受地質(zhì)工作者的經(jīng)驗影響(林鵬等,2021)。
薄片鑒定是一種較為傳統(tǒng)的巖性識別技術(shù),該技術(shù)通過將巖石制成巖石薄片,利用偏光顯微鏡觀測樣品薄片中的礦物的晶體特性以及光學特性,確定巖石類型及成因特征,從而實現(xiàn)巖性識別(趙明,2007;許振浩等,2021;陸旭康等,2021)(圖2)。薄片鑒定是地質(zhì)找礦工作中進行巖性識別的重要技術(shù),細致地展現(xiàn)巖石的微觀特征和結(jié)構(gòu)(朱世松等,2020;程國建等,2021),在巖性識別研究方面具有其他技術(shù)無法取代的優(yōu)勢,但受限于實驗條件的苛刻和對巖石樣品薄片加工的要求,薄片鑒定技術(shù)通常是在實驗室內(nèi)進行的。
圖2 巖石薄片鏡下圖像:(a) 粗?;◢弾r;(b) 花崗偉晶巖Fig. 2 Microscopic images of rock thin sections: (a) coarse-grained granite; (b) granite pegmatite
利用薄片鑒定技術(shù),陸旭康等(2021)針對地質(zhì)條件復雜的惠州凹陷A井區(qū)采用薄片鑒定法對71個樣品進行鑒定,準確識別泥巖、粉砂巖、石英砂巖和長石砂巖等巖性,實現(xiàn)了地層的準確劃分;張乃丹(2021)針對乍得Bongor盆地的315個巖芯薄片進行鑒定,分析得到組成潛山的巖性達40多種;梁久紅等(2020)利用薄片鑒定結(jié)合元素分析、宏觀觀察等方法建立頁巖油巖性識別組合技術(shù),對于巖性組合復雜的松遼盆地古龍頁巖油儲層實現(xiàn)了巖性精細識別。薄片鑒定作為一種傳統(tǒng)的巖性識別技術(shù)廣泛應用于巖性定名,但受主觀因素影響較大且費時費力(朱世松等,2020)
巖石巖性與元素組成緊密相關(guān),不同巖性的巖石其元素種類與含量也不同(李春山等,2011)。基于這一理論,可通過對巖石樣品進行元素測試,獲得元素的種類及含量信息,以此為基礎(chǔ)進行巖性識別。
圖3 CIPW標準礦物計算法流程圖(據(jù)路遠發(fā)等,2021)Fig. 3 Flow chart of CIPW Norm Mineral calculation(from Lu Yuanfa et al., 2021&)
圖4 巖石樣品X射線衍射譜圖Fig. 4 X-ray diffraction spectra of rock samples
目前,基于元素信息解釋巖性的方法主要分為兩類:第一類通過元素信息反演礦物信息,再利用反演得到的礦物信息進行巖性識別,利用元素信息反演礦物信息常用的方法有CIPW標準礦物計算(Cross et al., 1902,1912;Barth et al., 1959;Cohen et al., 1991)等,如圖3所示(路遠發(fā)等,2021);第二類基于元素信息與巖性信息建立模型,通過元素信息直接獲得巖性識別結(jié)果。路遠發(fā)(2004)基于地球化學工作中常用的參數(shù)計算及圖解繪制工作,開發(fā)了地球化學工具軟件包Geokit,可進行地球化學散點圖繪制、稀土元素分布模式圖及參數(shù)計算、微量元素比值蛛網(wǎng)圖、CIPW標準礦物計算、Pb—Sr—Nd同位素參數(shù)計算等工作,可實現(xiàn)巖石分類及巖石和礦床成因判別;席輝等(2020)利用第一類方法在鄂爾多斯盆地隴東板塊X井,建立了以礦物為過渡階段的元素與巖性之間的關(guān)系模型,取得了良好的識別效果;尹平等(2017)使用第二類方法,通過研究川渝地區(qū)4口典型井,基于不同巖性巖石主要元素含量也不相同的理論,劃分不同巖性的特征元素組合,建立了川渝地區(qū)巖漿巖和沉積巖巖性分區(qū)識別板塊。通過元素測試可量化巖石的元素成分,提供精確的成分分析和巖性識別結(jié)果,有效地指導科研和工程領(lǐng)域的工作(王超等,2015)。
礦物測試是通過獲取巖石礦物信息直接進行巖石定名,或結(jié)合其他物化信息建立模型,再進行巖性識別的技術(shù),是巖性識別的重要手段之一(劉傳平等,2006;祗淑華等,2015)。礦物測試的技術(shù)和途徑包含多種,常見的有:X射線衍射技術(shù)(XRD)(圖4)、高光譜技術(shù)(圖5)、礦物綜合分析系統(tǒng)(TIMA)等。不同的技術(shù)有其自身的優(yōu)勢或不足,如XRD獲取的礦物數(shù)據(jù)較準確,但需要進行制樣操作且數(shù)據(jù)測試分析速度較慢(佘明軍等,2018);高光譜技術(shù)無需制樣、測試速度快,在測試數(shù)據(jù)量大時優(yōu)勢明顯(林鵬等,2021),但識別準確率相比于XRD仍有較大提升空間(王亞軍等,2015);TIMA通過結(jié)合背散射電子(BSE)和二次電子信息(SEM),利用多個能譜探測儀(EDS)以高計數(shù)率實現(xiàn)對礦物成分、顆粒大小的精確測量(張一帆等,2021;謝小敏等,2021;徐園園等,2022;陳倩等,2022)。因此,要根據(jù)實際需要選擇合適的礦物測試技術(shù)(林鵬等,2021)。
圖5 濁沸石光譜曲線(據(jù)林鵬等,2021)Fig. 5 Turbidite spectral curve(from Lin Peng et al.,2021&)
趙賢正等(2017)通過測井曲線標準化并與X-射線衍射分析實測礦物含量定量關(guān)系擬合,計算無取心段/井礦物含量,從而進行巖性識別,他還提出了在以薄片鑒定和XRD測試的基礎(chǔ)上,結(jié)合測井資料定量計算細粒沉積礦物含量的簡易方法,建立巖性快速識別的模式。黃照強等(2010)利用熱紅外遙感數(shù)據(jù),通過比值法和光譜角制圖法(SAM)實現(xiàn)了對石英、砂巖和硅酸鹽巖類等造巖礦物在西藏岡底斯東段澤當?shù)V田的大尺度識別。礦物分析可為巖性識別提供直觀、精確且定量化的識別依據(jù),綜合考慮礦物識別準確率和速度對于實際工程的影響,XRD技術(shù)和高光譜技術(shù)的綜合應用是一個未來值得深入研究的方向。
除了上述巖性識別技術(shù),重磁技術(shù)、地震技術(shù)、電子探針技術(shù)等可作為巖性識別的輔助技術(shù)。重磁技術(shù)的理論基礎(chǔ)是通過不同地層的各巖石種類物理性質(zhì)的差異,分析不同巖性與對應的磁化率和密度組合特征和邏輯關(guān)系,以先驗信息作為約束條件,實現(xiàn)巖性信息的反演(嚴加永等,2015;付光明等,2017);地震技術(shù)主要通過不同巖性地震屬性的差異預測不同巖性的發(fā)育帶(黃鳳祥等,2016);電子探針技術(shù)通過分析顯微鏡下的微小區(qū)域成分,獲取該區(qū)域全部的元素種類及含量,判識分析速度快且無需標定(吳立新等,2005)。王財富等(2019)在東坪—冷湖地區(qū)開展了CEMP勘探工作,結(jié)合重磁勘探資料開展了侏羅系分布研究和基巖巖性預測;嚴加永等(2015)通過統(tǒng)計磁化率、密度與巖性之間的邏輯對應關(guān)系,構(gòu)建邏輯判別表達式,從而實現(xiàn)三維巖性填圖;黃鳳祥等(2016)利用地震技術(shù)得到均方根振幅屬性對巖性相對敏感的特征,進行基性侵入巖的識別預測;匡立春等(2013)利用電子探針技術(shù)并結(jié)合巖芯觀察和薄片鑒定等方法分析了吉木薩爾凹陷蘆草溝組致密油儲層巖性以致密砂巖、云質(zhì)巖為主。大量的工程研究與應用驗證了這些方法的可行性與有效性。
巖性特征眾多,包括顏色、成分、結(jié)構(gòu)、構(gòu)造等,參數(shù)眾多且各參數(shù)與巖性之間存在著復雜的非線性關(guān)系。為了深度挖掘巖性特征和巖性間的關(guān)系,大量統(tǒng)計分析方法被應用于巖性識別。本部分主要介紹常用的圖解法和當前最熱門的機器學習方法。
圖解法識別三大巖是借助散點圖、線形圖、交互圖等,來分析不同巖性對應的特征參量和邏輯關(guān)系,進而判斷和識別巖性。該方法可以直觀反映巖性分區(qū)情況,是識別巖性簡單有效的方法。本部分主要介紹QAPF圖解分類法和交會圖法。
QAPF圖解分類法是國際地科聯(lián)(IUGS)火成巖分類學會委員會推薦的一個火成巖分類方案。此方法以礦物含量為基礎(chǔ),首先將礦物分為5大類:石英(Q)、堿性長石(A)、斜長石(P)、副長石(F)和鐵鎂礦物組(M);對于暗色礦物(M)等含量小于90%的巖石,需要根據(jù)Q、A、P、F礦物含量比進一步劃分。分類采用雙等邊三角形圖解,如圖6所示(Le Bas et al., 1991;劉穎,2015)。QAPF圖解分類法適用于能夠確定礦物含量的火成巖分類。韓琳等(2010)將元素俘獲譜測井(ECS)元素測井數(shù)據(jù)轉(zhuǎn)化為礦物含量后,結(jié)合QAPF圖實現(xiàn)了對火成巖巖性的劃分;林楠等(2014)將反演出的氧化物含量轉(zhuǎn)化為礦物含量后,采用QAPF圖解分類法確定了火成巖的巖性。
圖6 QAPF雙三角圖解(據(jù)Le Bas et al., 1991)Fig. 6 QAPF double triangular graph(from Le Bas et al., 1991)
交會圖法是一種測井資料解釋方法,將測井數(shù)據(jù)在平面圖上交會,根據(jù)交會點坐標定出關(guān)鍵參數(shù)分布特征(嚴偉等,2011)。交會圖種類眾多,包括GR—RT交會圖、DEN—GR交會圖、中子—密度交會圖以及M—N交會圖等(范宜仁等,1999;黃布宙等,2001;馮沖等,2020)。為了準確識別巖石,通常需要采用多種交會圖(張濤,2008)。寇彧等(2010)依據(jù)含油氣盆地常規(guī)測井曲線編制了DEN—RT、DEN—GR巖性識別交會圖(圖7)。張大權(quán)等(2015)利用準噶爾盆地測井資料建立了GR—DEN、GR—AC等交會圖版。徐德龍等(2012)結(jié)合測井資料建立了GR—BK、GR—NGR、NGR—BK、PHIE—SW交會圖版,實現(xiàn)了中亞地區(qū)油田巖性的準確識別。交會圖法是一種簡單有效的方法,但交會圖法受限于測井曲線數(shù)據(jù),巖性界限劃分沒有具體標準,且存在人為影響較大、工作量大等問題(趙建等,2003;陳嶸等,2009;宮清順等,2012;成大偉等,2016)。
圖7 DEN—RT、DEN—GR交會圖版(據(jù)寇彧等,2010)Fig. 7 DEN—RT, DEN—GR intersection diagram (from Kou Yu et al., 2010&)
機器學習能夠深度挖掘數(shù)據(jù)和巖性的關(guān)系,識別準確率較高,已經(jīng)得到廣泛應用。本部分主要介紹貝葉斯分析法、主成分分析法、聚類分析法、支持向量機、神經(jīng)網(wǎng)絡和集成學習法。
貝葉斯分析法是一種概率計算方法,對于多類別巖性,將先驗信息與樣本信息綜合,計算樣品類別概率,核心公式如下:
(1)
其中,p(x|πt=fj)表示樣品點為巖相fj對應得x的概率密度函數(shù);p(πt=fj)表示巖相類型fj的概率,即先驗概率密度函數(shù)(王芳芳等,2014)。陳軍等(2007)、孫健等(2009)將測井信息作為輸入,使用貝葉斯分析法實現(xiàn)了巖性的自動分類。
主成分分析法是一種數(shù)據(jù)降維統(tǒng)計分析方法,可把原來眾多具有相關(guān)性的巖性參數(shù)降維成互相無關(guān)的少量參數(shù)。在識別巖性時,主成分分析法通常需要和其他方法結(jié)合,如最小二乘法、支持向量機、交會圖法、神經(jīng)網(wǎng)絡等(鐘儀華等,2009;張瑩等,2009;劉愛疆等,2013;馬崢等,2017)。主成分分析法能簡化數(shù)據(jù)維度、有效降低數(shù)據(jù)復雜度(楊兆栓等,2015),在巖性識別上起到了重要作用。
聚類分析是一種將研究對象分為相對同質(zhì)的群組的統(tǒng)計分析方法,包括層次聚類、K-means聚類和模糊聚類等。尋知鋒等(2008)利用層次聚類分析法和K-means聚類分析法對測井數(shù)據(jù)進行了分析,證明了此方法在巖性識別方面的實用價值;王祝文等(2009)依據(jù)常規(guī)測井資料進行了K-means聚類分析,證明了此方法進行巖性識別的有效性;趙武生等(2010)運用聚類方法對巖性測井信息進行了研究,巖性識別的結(jié)果均較為精準。聚類分析用于巖性識別存在一定的不穩(wěn)定性,當樣本數(shù)據(jù)較多時,才會取得良好的效果。
支持向量機是一種快速的線性分類器,在有限的數(shù)據(jù)量下性能較好,因此能夠應用到巖性識別領(lǐng)域。宋延杰等(2007)借助支持向量機建立了巴彥塔拉油田測井參數(shù)與巖性之間的映射關(guān)系,實現(xiàn)了對油藏地質(zhì)中復雜巖性的準確識別;張翔等(2009)提出了一種基于模糊支持向量機的方法并成功運用于巖性識別;牟丹等(2015)依據(jù)巖芯分析和薄片資料、測井曲線,通過支持向量機實現(xiàn)了遼河盆地火山巖識別。支持向量機能夠快速、充分挖掘各參數(shù)與巖性之間的關(guān)系并且在小樣本情況下也能保證較穩(wěn)定的準確率(宋延杰等,2007),但是支持向量機在處理多分類問題、大規(guī)模數(shù)據(jù)時仍存在一定的困難。
神經(jīng)網(wǎng)絡是一種能進行分布式并行信息處理的數(shù)學算法,能解決復雜的多維非線性問題,近年來開始被用于巖性識別。在數(shù)據(jù)挖掘方面,安鵬等(2018)依據(jù)測井參數(shù)和地質(zhì)約束變量建立了預測巖性的深度神經(jīng)網(wǎng)絡模型;Imamverdiyev等(2019)提出了一種依據(jù)常規(guī)測井數(shù)據(jù)的1D—CNN巖性識別模型,結(jié)果表明神經(jīng)網(wǎng)絡能提高巖性識別的自動化程度。在圖像識別方面,Singh等(2010)建立了基于玄武巖巖石薄片圖像的紋理識別神經(jīng)網(wǎng)絡模型;張野等(2018)基于Inception-v3深度卷積神經(jīng)網(wǎng)絡模型,建立了基于巖石圖像的遷移學習模型;許振浩等(2021)采用卷積神經(jīng)網(wǎng)絡提出了一種基于巖石圖像深度學習的巖性智能識別方法(圖8),并均取得了非常好識別效果。
圖8 基于ResNet的遷移學習巖石圖像識別流程圖(據(jù)許振浩等,2021)Fig. 8 The flowchart of transfer learning model of rock images (from Xu Zhenhao et al., 2021&)
利用神經(jīng)網(wǎng)絡識別巖性具有自動化程度高、準確率優(yōu)、能降低人工經(jīng)驗對識別結(jié)果的影響等優(yōu)點。但現(xiàn)有模型存在參數(shù)量大、特征提取能力有限、識別結(jié)果易受數(shù)據(jù)影響等問題。
集成學習是一種將多個識別結(jié)果組合起來提高準確率的一種方法,能夠克服單一模型對數(shù)據(jù)集要求高、泛化能力差以及識別精度低等缺點。段友祥等(2020)利用支持向量機、XGBoost等模型建立了多層集成學習模型,該模型能有效地用于油藏地質(zhì)分析中的巖性識別;鄒琪等(2020)提出了一種基于Stacking集成學習的測井巖性識別方法,巖性識別準確度得到了明顯提升?;诩蓪W習的巖性識別準確率優(yōu)于單一機器學習模型,推動了巖性識別往高準確率方向發(fā)展,具有很強的應用前景。
隨著人工智能技術(shù)的進步,巖性識別的研究方向逐步向智能化識別發(fā)展。本課題組結(jié)合圖像識別技術(shù)提出了基于巖石圖像深度學習的巖性智能識別方法,并結(jié)合對光譜信息的長期理論研究與工程實踐,基于圖像與光譜信息融合開展了前期調(diào)研與探索,形成了初步的技術(shù)積累和儲備。最后,對多源信息集成技術(shù)的發(fā)展提出了展望。在未來的研究中,如何提高巖性識別的自動化程度將成為研究者攻關(guān)的重點和熱點問題。
圖9 巖石檢測方法Fig. 9 Rock detection method
巖石圖像具有采集速度快、成本低等特點,適用于室內(nèi)識別、野外勘查等,本課題組結(jié)合圖像分類和目標檢測技術(shù),提出了一種基于巖石圖像深度學習的巖性識別智能方法。圖像分類技術(shù)可以對巖石類別進行預測,而目標檢測技術(shù)不僅可以獲得巖石的巖性信息,還可以獲得其位置信息。
3.1.1圖像分類
許振浩等(2021)提出的基于巖石圖像分類的巖性智能識別技術(shù)其核心是采用數(shù)據(jù)驅(qū)動的方式,首先給巖石圖像分配一個類別標簽,再采用ResNet建立巖石圖像分類模型。通過輸入大量的圖像,讓模型不斷學習每個類別的特征,從而返回一個將圖像分類的標簽,最終實現(xiàn)對巖性的智能識別。
具體過程如下:①建立數(shù)據(jù)集。包含巖石圖像及每張圖像對應的標簽。②訓練模型。使用訓練集讓模型學習每類巖石的特征(如果加入新類別則需要重新訓練模型)。③測試模型。采用SoftMax分類器預測未學習過的圖像進而評價分類器的質(zhì)量,并將分類器預測的標簽和圖像真實的分類標簽進行對比,具體公式如下:
η=θTx
(2)
(3)
其中,x表示輸入向量,在給定x與參數(shù)θ時,y|x服從以η為變量的指數(shù)分布,公式(2)為廣義線性函數(shù)。p表示標簽為y時每一類別的概率,i表示類別個數(shù)。標簽一致的情況越多,說明分類器的效果越好。經(jīng)過驗證,該方法對于指定巖石的識別準確率可達90%以上。
3.1.2目標檢測
圖像分類技術(shù)可以判別是什么類別的目標。而如果圖像中存在多個目標且需要對其進行定位則需要采用目標檢測技術(shù)。Xu Zhenhao等(2021a)提出的基于巖石目標檢測的巖性智能識別技術(shù)其核心是采用基于Faster R-CNN和YOLO v4的巖石檢測模型在圖像中找出所有巖石目標,并確定它們的類別和位置。
具體流程如圖9所示:①標注數(shù)據(jù)集。標注內(nèi)容包括圖像中的所有巖石類別和位置。②訓練模型。劃分數(shù)據(jù)集后,輸入圖像對巖石檢測模型進行訓練。訓練時,在圖像中生成候選框,可采用滑動窗口法或選擇性搜索法(不同算法生成候選框的方法均不同)。③預測結(jié)果。經(jīng)過訓練的模型,可輸出預測結(jié)果,包括置信概率,邊框坐標和屬于某個類別的概率。通過將預測結(jié)果和真實標簽進行比較構(gòu)建損失函數(shù),損失函數(shù)由分類損失和回歸損失兩部分組成,具體公式如下:
(4)
經(jīng)過驗證,基于Faster R-CNN和YOLO v4的巖石檢測模型對于指定巖石的識別的mAP分別可達99.19%和98.54%。該模型對部分巖石分類完全正確(圖10),精確度達到100%。而對其他大部分巖石識別效果也比較好,精確度可達95%以上。
圖10 巖石檢測結(jié)果(據(jù)Xu Zhenhao et al., 2021a)Fig. 10 Rock detection results (from Xu Zhenhao et al., 2021a)
圖中橫坐標a1~c10分別代表不同巖性:流紋巖、花崗巖、花崗偉晶巖、安山巖、閃長玢巖、正長巖、斜長巖、氣孔狀玄武巖、杏仁狀玄武巖、輝綠巖、輝長巖、橄欖巖、火山角礫巖、火山凝灰?guī)r、礫巖、粉砂巖、泥頁巖、石灰?guī)r、竹葉狀灰?guī)r、白云巖、黑色板巖、千枚巖、十字石片巖、花崗片麻巖、石榴子石麻礫巖、石英巖、蛇紋石化大理巖、云英巖、矽卡巖以及條帶狀混合巖。
鏡下鑒定作為傳統(tǒng)的巖性識別方法,相較于直接采用巖石圖像,其結(jié)果更加準確。但是對研究人員的專業(yè)知識和經(jīng)驗要求更高,且耗時更長。本課題組提出了基于鏡下圖像深度學習的巖性智能識別方法,可以實現(xiàn)實驗室對巖性的精細化識別(Xu Zhenhao et al., 2022)。鏡下圖像分類方法與巖石圖像分類方法相同,主要過程是將鏡下圖像作為輸入并利用ResNet、DenseNet等卷積神經(jīng)網(wǎng)絡構(gòu)建圖像分類模型,使其學習每個類別的不同特征。采用模型中的SoftMax分類器進行預測,通過準確率(acc)和混淆矩陣等指標來評價模型的識別效果。具體方法同巖石圖像分類,此處不再贅述。經(jīng)過驗證,該方法對于文中的巖石識別的準確率可達95%以上,顯示出該方法具有較好的對巖性識別的能力。
現(xiàn)場圖像采集條件復雜多變且存在光照不均等情況,從而影響巖石的成像質(zhì)量。而自然風化也會損壞巖石的部分外觀特征?;趫D像的巖性智能識別方法無法完全扭轉(zhuǎn)現(xiàn)場采集的客觀條件,導致實際應用中存在較大的挑戰(zhàn)。因此,本課題組提出了一種基于多源信息融合的巖性智能識別方法。
3.3.1基于圖像和元素信息融合的巖性識別方法
目前基于圖像的識別方法的相關(guān)研究通常所用巖性種類有限且不同巖性的外觀特征也存在明顯差異?;谝延醒芯亢痛罅繉嶒?,我們發(fā)現(xiàn)以下因素會影響基于圖像的巖性識別結(jié)果的準確性:①相似的巖石成分或紋理特征導致圖像的相似性高;②在特征提取中巖性的細小特征容易丟失;③風化或人類活動會破壞部分可見巖石特征;④由于拍攝條件限制或技術(shù)差異導致成像質(zhì)量較差。針對上述問題,我們提出了一種基于圖像與元素信息融合的巖性識別方法。
如圖11所示,首先利用卷積層對巖石圖像進行特征提取并將特征維度降至一維。再借助全連接層從元素或礦物中提取巖性特征,通過將提取自圖像和元素的一維特征進行拼接后送入全連接層從而實現(xiàn)特征融合。為了提高模型的非線性表達能力,并加快模型收斂速度,我們在卷積層和全連接層中分別使用了ReLU和TanH激活函數(shù),且在激活函數(shù)前使用了批量歸一化處理技術(shù),公式如下:
(5)
圖11 圖像與元素信息融合模型Fig. 11 Image and element information fusion model
Xe、Xi分別代表提取自元素和圖像的巖性特征,Conv和Fc分別代表卷積層和全連接層,TanH 和ReLU為增加模型非線性表達能力的激活函數(shù),Norm為歸一化處理函數(shù)?;赬RF、XRD的元素或礦物含量檢測技術(shù)每次測試速度在2~5 min,而圖像采集速度快(小于1 s),這就導致了圖像和元素信息數(shù)據(jù)量差異大。模型對數(shù)據(jù)的高需求與元素、礦物數(shù)據(jù)采集的高成本間的矛盾限制了該融合模型的識別性能。為此,我們提出了一種分步式模型訓練方法。首先利用圖像訓練模型中的圖像特征提取部分,再訓練整個融合模型(Xu Zhenhao et al., 2021b)。
圖12為圖像識別模型和融合模型在訓練過程中識別準確率變化曲線,其中紅線為模型在測試集上的表現(xiàn),黑線為模型在訓練集上的表現(xiàn)。由圖12紅線可以看出,訓練剛開始時,隨著訓練的進行,識別準確率快速增加,但識別準確率增加速度逐漸降低。當訓練步數(shù)在16000~20000時,圖像識別模型的準確率基本不再變化,說明已經(jīng)接近圖像識別模型的準確度極限,圖像識別模型最大識別準確度為84.99%。在完成參數(shù)共享后利用訓練集二訓練融合模型,融合模型的準確度繼續(xù)上升,最后再次穩(wěn)定,融合模型最大識別準確度為94.62%,比圖像識別模型的準確度高9.63%。
圖12 圖像模型和融合模型訓練過程中準確率變化曲線(據(jù) Xu Zhenhao et al.,2021b)Fig. 12 Change curve of accuracy rate in the training process of image model and fusion model(from Xu Zhenhao et al.,2021b)
3.3.2基于圖像與高光譜融合的巖性識別方法
礦物的光譜特征同其內(nèi)在的理化特性緊密相關(guān)(燕守勛等,2003),奠定了現(xiàn)今礦物光譜分析的基礎(chǔ)。高光譜技術(shù)同傳統(tǒng)的多光譜技術(shù)相比,具有光譜分辨率高、光譜通道數(shù)多、波段連續(xù)等明顯優(yōu)勢(張成業(yè)等,2015),可以實現(xiàn)礦物的精細識別,可以作為巖礦圖像識別的有力補充,改善因單一數(shù)據(jù)源造成的局限性。成像高光譜技術(shù)因其測試速度快、數(shù)據(jù)獲取量大、非接觸式測量的優(yōu)勢在地質(zhì)領(lǐng)域獲得廣泛應用,但現(xiàn)有技術(shù)在巖礦識別時主要依靠光譜數(shù)據(jù),圖像數(shù)據(jù)的利用還不夠充分。張良培等(2016)系統(tǒng)綜述了遙感數(shù)據(jù)融合的進展與前瞻,認為數(shù)據(jù)融合是提升遙感影像應用能力的重要手段,將數(shù)據(jù)融合分為數(shù)據(jù)級融合、特征級融合和決策級融合 3 個層次,與此類似,圖像與光譜數(shù)據(jù)融合亦是未來巖性智能識別重要的發(fā)展方向和研究重點。
在實際應用中,需要結(jié)合工程需要確定具體的融合方法。數(shù)據(jù)級融合是指對圖像和光譜的原始數(shù)據(jù)進行融合,生成新數(shù)據(jù),通過分析新數(shù)據(jù)實現(xiàn)巖礦識別,如圖13(a)。特征級融合首先提取圖像和光譜數(shù)據(jù)特征,之后將所提取的圖像特征和光譜特征進行融合處理,生成新的特征,最后通過分析新生成的特征實現(xiàn)巖礦識別,得到識別結(jié)果,如圖13(b)。決策級融合則分別分析不同的數(shù)據(jù)得到初步?jīng)Q策結(jié)果,再利用決策規(guī)則實現(xiàn)決策結(jié)果的融合,如圖13(c)。相關(guān)人員利用多源信息融合的方法開展巖礦識別的研究與應用,取得了良好的效果。張翠芬等(2017)通過圖像紋理特征與光譜數(shù)據(jù)的協(xié)同識別,將巖性識別精度提升6.9%。韓玲等(2005)也驗證了相比單源光譜信息,綜合紋理—光譜特征可以有效提升識別精度。現(xiàn)有研究表明,融合圖像與光譜信息實現(xiàn)巖性的綜合識別,是提升識別效果的有效手段。目前,隨著光譜研究的日趨成熟和隧道建設規(guī)模的不斷擴大,筆者等認為基于圖譜融合技術(shù)的“天—空—地—隧—孔”聯(lián)合一體化地質(zhì)識別將會成為隧道等工程建設的重要科研方向。
圖13 圖像與光譜融合的巖性識別方法: (a) 數(shù)據(jù)級融合;(b) 特征級融合;(c) 決策級融合Fig. 13 Lithology identification based on fusion of image and spectral data: (a) data level fusion; (b) feature level fusion; (c) decision level integration
不同類型的數(shù)據(jù)反映了目標地質(zhì)體不同屬性的信息,單源數(shù)據(jù)存在局限性,針對單源數(shù)據(jù)進行分析,結(jié)果存在不確定性、多樣性和復雜性。綜合各類數(shù)據(jù)源的優(yōu)勢,實現(xiàn)多源信息的融合識別,可以突破單源信息局限性,是解決此類問題的有效途徑(李樹濤等,2021)。巖石的元素信息、礦物信息、光譜信息和紋理信息同巖石巖性具有較強的內(nèi)在關(guān)聯(lián)性,將關(guān)聯(lián)性較強的數(shù)據(jù)進行融合,基于融合數(shù)據(jù)進行巖礦識別可以有效提升識別精度。
通過采集巖石的XRF數(shù)據(jù)、XRD數(shù)據(jù)、高光譜數(shù)據(jù)和圖像數(shù)據(jù),獲取巖石元素信息、礦物信息、光譜信息和紋理信息,經(jīng)過處理、融合,得到巖石的融合特征,基于融合特征實現(xiàn)對巖石巖性的綜合識別,可以有效提升巖性識別的準確率(圖14)。從表面上看,多源信息融合的概念很直觀,但實際上要真正實現(xiàn)還比較困難的,但由于其在提升識別效果方面存在巨大的潛力,通過多源信息融合實現(xiàn)巖性識別也將成為地質(zhì)工作者研究的熱點。
圖14 多源信息融合Fig. 14 The multi-source information fusion
由于巖性識別在地質(zhì)學、資源勘查、巖石力學與工程等領(lǐng)域中的重要作用,該方面的研究一直備受重視。筆者等基于大量的國內(nèi)外調(diào)研和對智能化識別發(fā)展趨勢的理解,得到主要結(jié)論如下:
(1)近幾年隨著人工智能的快速發(fā)展,涌現(xiàn)出了一批基于圖像、鉆井數(shù)據(jù)和光譜信息等的巖性智能識別方法。巖性智能識別方法識別速度快、準確率高,能降低巖性識別對工程經(jīng)驗、專業(yè)知識的依賴,是未來巖性識別的發(fā)展方向。
(2)基于宏觀巖石圖像和微觀鏡下圖像深度學習的巖性智能識別方法可以自動提取巖石特征,對于指定巖性的識別準確率分別可達90%以上和95%以上,具有較好的泛化能力,可代替部分人工。
(3)基于圖像與元素信息深度融合的巖性智能識別方法及相應的分步式模型訓練方法,可以降低圖像相似度高、風化破壞表觀特征、小尺度巖性特征易丟失等因素對識別準確度的影響,能夠?qū)崿F(xiàn)工程現(xiàn)場巖性的高準確度識別。
(4)綜合各類數(shù)據(jù)源的優(yōu)勢,利用機器學習深度挖掘巖石元素、礦物、光譜和表觀特征間的內(nèi)在關(guān)聯(lián)性,可以突破單源信息的局限性,提高巖性識別準確度,圖像與光譜信息融合等基于多源信息融合的巖性智能識別、“天—空—地—隧—孔”聯(lián)合一體化的巖性與不良地質(zhì)智能識別是未來的發(fā)展方向。