史 蕊,張洪瑞
(中國地質(zhì)科學院 地質(zhì)研究所, 北京 100037)
“大數(shù)據(jù)”時代人類認識和研究世界的思維方式正在發(fā)生著深刻改變,基于大數(shù)據(jù)和人工智能技術(shù)形成的數(shù)據(jù)密集型科學成為繼理論科學、實驗歸納和計算科學之后的第4種科學研究范式(Heyetal., 2009)。地球科學指一切研究地球的科學,主要包括地質(zhì)學、地理學以及其他衍生學科,屬典型的數(shù)據(jù)密集型學科(Bristoletal., 2012)。地質(zhì)數(shù)據(jù)是一種典型的時空大數(shù)據(jù)(吳沖龍等, 2016),將大數(shù)據(jù)與地質(zhì)學更好地結(jié)合,讓已有和即將產(chǎn)生的海量數(shù)據(jù)服務于地球科學,已成為地球科學家們新的探索方向和關注熱點。隨著機器學習、知識圖譜、大數(shù)據(jù)挖掘等技術(shù)相繼引進地質(zhì)學領域(周永章等, 2018, 2021; 耿廳等, 2019; Zuoetal., 2019, 2023; Zhou, 2021; Guoetal., 2022; 賈敬伍等, 2023; 諸云強等, 2023),地質(zhì)大數(shù)據(jù)與人工智能驅(qū)動的科學發(fā)現(xiàn)時代已開啟。在這樣的時代背景下,澳大利亞的“玻璃地球”、歐洲的OneGeology、聯(lián)合國教科文組織全球尺度地球化學國際研究中心的“化學地球”等大科學計劃相繼提出并得到部分國家的支持與實施,推動了全球地學知識共享和地質(zhì)大數(shù)據(jù)整合(周永章等,2021)。近年來,中國科學家倡議發(fā)起的國際大科學計劃“深時數(shù)字地球”(Deep-time Digital Earth,DDE)應運而生,該計劃以整合全球海量數(shù)據(jù)、共享全球地學知識為使命,重建各個歷史時期的地球演化,構(gòu)建地質(zhì)構(gòu)造與工程地質(zhì)條件,精確識別全球資源與能源礦產(chǎn)的宏觀分布規(guī)律,從而更準確地預測地球和人類的未來(Wangetal., 2019, 2021)。
礦床學又稱為經(jīng)濟地質(zhì)學,是研究礦床在地殼中的形成條件、礦床成因和分布規(guī)律的科學,是能夠產(chǎn)生經(jīng)濟價值的重要地質(zhì)學分支(翟裕生等, 2011; 張旗等, 2018)。隨著分析測試技術(shù)的日益提升和研究程度的不斷提高,礦床數(shù)據(jù)的數(shù)量和質(zhì)量顯著增長,形成了龐大的數(shù)據(jù)集合。全球一些重要科研機構(gòu)分別建立了基于各自數(shù)據(jù)優(yōu)勢的礦床數(shù)據(jù)庫。大數(shù)據(jù)發(fā)展趨勢下,礦床學與大數(shù)據(jù)人工智能的融合研究勢如破竹,在礦床成因(周永章等, 2017; 陳華勇等, 2022)、成礦規(guī)律及礦產(chǎn)資源預測與評價(王登紅等, 2015; 吳永亮等, 2017; 羅建民等, 2019; Cheng, 2019; Xiaoetal., 2020; 路英川等, 2021)、成礦過程模擬(袁峰等, 2019)等方面都取得了突破性進展。
礦床學大數(shù)據(jù)屬于數(shù)據(jù)密集型科學,高效安全地存儲、管理、共享分布在不同研究機構(gòu)、文獻和報告中的重要礦床學數(shù)據(jù)是關鍵,而建立支撐科學處理算法的數(shù)據(jù)庫是開展礦床學大數(shù)據(jù)研究的重要基礎。本文介紹了全球已有的主要礦床數(shù)據(jù)庫及其運行情況,為未來DDE計劃整合全球海量礦床數(shù)據(jù)、建設大數(shù)據(jù)平臺提供基礎和借鑒。同時,結(jié)合近年來開展的以礦床學大數(shù)據(jù)驅(qū)動的科學研究典型實例,論述了建設開放、共享、統(tǒng)一的礦床大數(shù)據(jù)平臺的科學價值。
隨著礦床的不斷勘探、開發(fā)以及地球化學理論與方法在礦床學研究中的廣泛應用,礦床學相關數(shù)據(jù)(元素地球化學、同位素地球化學、流體包裹體數(shù)據(jù)、成礦年代學數(shù)據(jù)、蝕變帶及礦物組合數(shù)據(jù)等)爆發(fā)式增長。這些數(shù)據(jù)得到國際科研機構(gòu)的高度重視,多個國家或組織建立了國家層面或全球規(guī)模的礦產(chǎn)資源數(shù)據(jù)庫。最簡單的形式為一張礦床地質(zhì)圖配上說明書或者一本專著,比如伊朗,以專著形式將礦床名稱、經(jīng)緯度位置、規(guī)模、成礦時代、礦床類型等基本信息記錄在表格中(Ghorbani, 2013);再比如加拿大地質(zhì)調(diào)查局出版的《Mineral Deposits of Canada》專著,系統(tǒng)總結(jié)了加拿大12個主要礦床類型以及不同礦床的分布和成因、地質(zhì)省的演化及勘查模型和方法;還有些國家地質(zhì)調(diào)查局和研究機構(gòu)建立了包含礦產(chǎn)、地球物理、地球化學、同位素、年代學等在內(nèi)的綜合地學數(shù)據(jù)庫,如中國的“地質(zhì)云”、澳大利亞的AuScope和英國地質(zhì)調(diào)查局的OpenGeoscience等。下文選擇了幾個主要國家礦床數(shù)據(jù)庫進行重點介紹。
20世紀80年代中國就開始了礦床相關數(shù)據(jù)庫的構(gòu)建工作,如武警黃金地質(zhì)研究所于1986年初步建立了中國金礦資源數(shù)據(jù)庫,整合1 700個大中小型金礦床,實現(xiàn)了數(shù)據(jù)組織、圖件編修及查閱、檢索、統(tǒng)計等功能(董曉輝, 1989)。中國有色金屬工業(yè)總公司礦產(chǎn)地質(zhì)研究院1990年開發(fā)的“全國伴生金、銀礦產(chǎn)數(shù)據(jù)管理系統(tǒng)”實現(xiàn)了全國近600個伴生金、銀礦床的重要數(shù)據(jù)資料計算機管理(馬滋宇, 1990)。臧忠淑(1996)報道了涉及大中型礦床1 902處、小型礦床3 384處的40種礦產(chǎn)的礦床數(shù)據(jù)庫,載入了礦床的產(chǎn)地、坐標、儲量、品位等基本數(shù)據(jù)以及礦床類型、成因、成礦及圍巖時代等地質(zhì)信息。2003~2007年,中國、俄羅斯、蒙古、哈薩克斯坦和韓國合作編圖項目,中國地質(zhì)科學院完成了主要礦種的礦床數(shù)據(jù)庫,其結(jié)構(gòu)特征包括礦床名稱、坐標、礦種、成因類型等22項。中國地質(zhì)調(diào)查局鄭州礦產(chǎn)綜合利用研究所2014年建立了中國重要礦產(chǎn)礦山數(shù)據(jù)庫,包含煤炭、石油、鐵、銅等22種礦產(chǎn)16 061個重要礦產(chǎn)礦山企業(yè)基本信息、礦山儲量情況、礦山開采技術(shù)條件、采礦情況、選礦基本情況、共伴生礦利用情況、尾礦廢石等處置及利用情況、礦山經(jīng)濟指標等多方面礦山生產(chǎn)信息數(shù)據(jù)。
中國地質(zhì)調(diào)查局主持研發(fā)了一套綜合性地質(zhì)信息服務系統(tǒng),“地質(zhì)云1.0”于2017年正式上線,為社會公眾、地質(zhì)調(diào)查技術(shù)人員、地學科研機構(gòu)、政府部門等提供了各類豐富的地質(zhì)信息服務,數(shù)據(jù)來源于多年財政項目和企業(yè)勘查等存量數(shù)據(jù)。2018年“地質(zhì)云2.0”和2021年“地質(zhì)云3.0”分別在原基礎上升級并投入服務。目前,“地質(zhì)云3.0”包含了基礎地質(zhì)、能源礦產(chǎn)、水資源、土地資源、森林資源、草地資源、濕地資源、海洋地質(zhì)、地下空間等11大類數(shù)據(jù)。能源礦產(chǎn)大類下屬的礦產(chǎn)資源數(shù)據(jù)庫提供了黑色金屬、有色金屬、貴金屬、稀有金屬、非金屬和能源礦產(chǎn)等各種礦產(chǎn)的全國分布圖和成礦區(qū)帶分布圖(圖1),可查詢礦產(chǎn)地名稱、礦種、規(guī)模、礦床成因類型、利用現(xiàn)狀和地質(zhì)工作程度等屬性信息,但是噸位、品位、礦床地質(zhì)特征和礦床地球化學測試數(shù)據(jù)等信息比較缺乏。此外,自然資源實物地質(zhì)資料中心完成了中國典型礦床實物地質(zhì)資料波譜數(shù)據(jù)庫建設,該數(shù)據(jù)庫采用成熟的信息提取技術(shù)方法,將巖芯、標本等實體資料數(shù)字化,利用“地質(zhì)云”開展在線服務(史維鑫等, 2020)。
近年來,中國地質(zhì)調(diào)查局全球礦產(chǎn)資源戰(zhàn)略研究中心牽頭建立了基于CRIRSCO (礦產(chǎn)儲量國際報告標準委員會)分類規(guī)范為基礎的全球礦產(chǎn)資源儲量評估體系。目前已通過地質(zhì)云平臺公開發(fā)布鋰、鈷等24種戰(zhàn)略礦種資源儲量評估報告,主要內(nèi)容包括各礦種的資源類型及分布、儲量及資源量、儲量經(jīng)濟性概況和資源潛力等,附圖包括各礦種的全球高級項目及主要國家儲量分布圖(圖2)、典型礦床噸位-成本模型圖,其數(shù)據(jù)來源于公司報告(含年報/儲量報告、勘探報告、公司官網(wǎng)/內(nèi)部報告)、商業(yè)數(shù)據(jù)庫、政府或官網(wǎng)、文獻等多渠道,建立了包含礦業(yè)項目名稱、坐標等基本信息,證實儲量、可信儲量等信息以及選礦產(chǎn)能、資本成本等信息的數(shù)據(jù)庫,準確提供了全球資源儲量信息。
深部地球探測計劃AuScope是澳大利亞2006年提出并啟動的,其目標是在全球尺度上從時間到空間以及從表層到深部,建立國際水平的表征澳洲大陸結(jié)構(gòu)和演化的研究架構(gòu)(熊小松等, 2016),包括AuScope網(wǎng)格和交互(Discovery Portal)、國家?guī)r芯庫(NVCL)、地球化學和演化、地球物理探測成像和深部結(jié)構(gòu)、地球模擬和三維建模以及地球空間架構(gòu)和地球動力學等6個方面。
圖 1 “地質(zhì)云”平臺礦產(chǎn)地質(zhì)數(shù)據(jù)資源 (網(wǎng)站截圖, https://geocloud.cgs.gov.cn/)Fig. 1 Mineral geological data resources of the “Geological Cloud” platform (screenshot of website from https://geocloud.cgs.gov.cn/)
圖 2 全球銅礦及主要國家儲量分布(據(jù)江思宏等, 2022)Fig. 2 Global copper deposits and reserves in major countries (after Jiang Sihong et al., 2022)
AuScope網(wǎng)格和交互是一個網(wǎng)絡大型數(shù)據(jù)存貯管理信息系統(tǒng),它能提供方便且快速的查詢、檢索、下載和利用全澳范圍內(nèi)的遙感影像、鉆孔、礦床、地球物理、地球化學、地質(zhì)年代學等各種探測數(shù)據(jù),還能提供地球科學相關報告和部分地區(qū)的三維地質(zhì)/地球物理模型,并通過接口來確保數(shù)據(jù)的可持續(xù)性。同時,提供了各類在線資源鏈接信息。
礦床學相關的數(shù)據(jù)圖層為Earth Resources,可提供澳大利亞全境礦床數(shù)據(jù)的查詢和下載服務(圖3),具體信息包括礦床名稱、礦種、地質(zhì)年代、精確位置、礦物賦存類型等等。此外,鉆孔數(shù)據(jù)圖層Boreholes中提供了澳大利亞國家?guī)r芯庫獲取的鉆孔樣品,用于建立澳洲大陸1~2 km的礦物和組分的高分辨率圖像庫。
圖 3 AuScope地球資源圖層和數(shù)據(jù) (網(wǎng)站截圖,https://portal.auscope.org.au/)Fig. 3 AuScope earth resource layers and data (screenshot of website from https://portal.auscope.org.au/)
美國地質(zhì)調(diào)查局在20世紀70年代就建立了礦產(chǎn)資源數(shù)據(jù)庫,隨后推出了礦產(chǎn)資源在線空間數(shù)據(jù)庫,可提供包含礦產(chǎn)資源、地質(zhì)、地球物理和地球化學內(nèi)容交互式的地圖和數(shù)據(jù)資源下載服務。其中美國國內(nèi)數(shù)據(jù)庫(圖4)內(nèi)容包含: ① USMIN mineral deposit database: 該數(shù)據(jù)庫是美國正在發(fā)展建設的國家級地理空間數(shù)據(jù)庫,它將成為美國重要的礦山、礦床和礦區(qū)的權(quán)威信息來源。數(shù)據(jù)結(jié)構(gòu)包括礦床名稱、位置、礦床模式、勘探開發(fā)情況、礦山生產(chǎn)數(shù)據(jù)、資源量和儲量、相關文獻和報道等(圖5)。 ② Mineral Resources Data System (MRDS): 這是一套金屬和非金屬礦產(chǎn)的數(shù)據(jù)集,包含礦床名稱、位置、礦種、礦床地質(zhì)特征、開發(fā)利用現(xiàn)狀、儲量、資源量和相關文獻、報道等信息,可提供數(shù)據(jù)的查詢檢索和下載服務。③ US mine features: 主要包括美國西部地區(qū)與采礦有關的探礦坑、礦井和坑道、采石場、露天礦、尾礦堆和尾礦池、礫石以及其他特征數(shù)據(jù)。④ 地球物理探測子系統(tǒng):可提供美國大陸的布格重力異常、剩余重力異常的網(wǎng)格數(shù)據(jù)以及北美的航空輻射測量數(shù)據(jù)。⑤ 地球化學測試分析子系統(tǒng):包括美國國家地球化學數(shù)據(jù)庫NGDB的巖石、土壤、沉積物、礦物的樣品測試分析數(shù)據(jù)和美國鈾資源評價項目NURE中美國各地水樣的地球化學分析數(shù)據(jù)335 547條以及沉積物樣本的地球化學分析數(shù)據(jù)397 625條。
圖 4 美國礦產(chǎn)資源在線空間數(shù)據(jù) (網(wǎng)站截圖, https://mrdata.usgs.gov/general/map-us.html)Fig. 4 U.S. mineral resources online spatial data (screenshot of website from https://mrdata.usgs.gov/general/map-us.html)
圖 5 USMIN礦床數(shù)據(jù)庫(網(wǎng)站截圖, https://www.usgs.gov/centers/gggsc/science/usmin-mineral-deposit-database)Fig. 5 USMIN mineral deposit database (screenshot of website from https://www.usgs.gov/centers/gggsc/science/usmin-mineral-deposit-database)
與此同時,其提供的全球礦產(chǎn)資源在線空間數(shù)據(jù)庫服務既支持在線地圖顯示,也支持Google Earth和GIS平臺顯示,還可以下載ArcGIS Shape file格式、DBF數(shù)據(jù)庫格式和CSV文本表格格式全部數(shù)據(jù)到本地(圖6)。該數(shù)據(jù)庫主要包括: ① 礦產(chǎn)資源數(shù)據(jù)子系統(tǒng):它是描述世界各地金屬和非金屬礦產(chǎn)資源的一組數(shù)據(jù)集。包括礦床名稱、位置、礦種、礦床地質(zhì)特征、儲量、資源量和相關文獻、報道等。然而該系統(tǒng)在2011年停止了更新。② 全球銅礦資源評價子系統(tǒng): 對世界各地的斑巖型和沉積型銅礦資源的礦床、遠景和許可區(qū)進行描述,并對未發(fā)現(xiàn)的銅礦資源進行了定性和定量評價。③ 全球礦床類型子系統(tǒng): 統(tǒng)計了世界各地火山成因塊狀硫化物礦床、沉積型鉛鋅礦床、斑巖型銅礦床、鎳鉻礦床、碳酸巖礦床、稀土礦床、磷酸鹽礦床、鉻鐵礦、鉀鹽礦床等不同類型的礦床信息,包括基于地質(zhì)環(huán)境和礦物學的一般分類、品位和噸位模型以及礦床位置數(shù)據(jù)等。④ 國家地球化學數(shù)據(jù)庫子系統(tǒng):包括巖石、沉積物、土壤和礦物樣品的地球化學分析數(shù)據(jù),大多數(shù)樣品來自美國大陸和阿拉斯加,也有少部分遍布全球的樣品數(shù)據(jù)。
圖 6 全球礦產(chǎn)資源在線空間數(shù)據(jù) (網(wǎng)站截圖, https://mrdata.usgs.gov/general/map-global.html)Fig. 6 Global mineral resources online spatial data (screenshot of website from https://mrdata.usgs.gov/general/map-global.html)
除各國地質(zhì)調(diào)查機構(gòu)建立的礦床相關數(shù)據(jù)庫外,一些學術(shù)機構(gòu)、研究團隊以收集公開發(fā)表數(shù)據(jù)為主,也紛紛建立和發(fā)布了礦床相關的數(shù)據(jù)庫,致力于為公眾提供開放共享服務。國際經(jīng)濟地質(zhì)學家協(xié)會(Society of Economic Geologists,SEG)與Elsevier公司合作,基于Geofacets平臺為SEG成員提供查找、提取和下載科學出版物中可靠、可操作的地圖和數(shù)據(jù)的功能,還提供部分ArcGIS的插件功能如圖層和數(shù)據(jù)疊加分析,實現(xiàn)更深入的工作流無縫集成,為能源和礦業(yè)提供不斷更新的情報信息。 Geofacets數(shù)據(jù)庫擁有超過250萬張的地質(zhì)圖件和圖表等數(shù)據(jù),包括構(gòu)造圖、地層柱狀圖、地震剖面、地質(zhì)剖面、鉆孔數(shù)據(jù)、地球化學測試分析數(shù)據(jù)等等(圖7)。 礦產(chǎn)資源方面的數(shù)據(jù)源主要來自出版物 《Ore Geology Reviews》和《Economic Geology》,涉及地質(zhì)背景和沉積環(huán)境、巖石類型和礦物學以及礦床、地球化學元素含量分析、地球物理電磁震和地形地貌數(shù)據(jù)等多方面,以此為稀土和關鍵礦產(chǎn)資源的勘探開發(fā)和投資決策提供幫助。
圖 7 SEG Geofacets操作界面 (網(wǎng)站截圖, https://www.segweb.org/apps/membership/geofacets.aspx)Fig. 7 SEG Geofacets operation interface (screenshot of website from https://www.segweb.org/apps/membership/geofacets.aspx)
SNL金屬與礦業(yè)數(shù)據(jù)庫涵蓋大量的大宗商品,跟蹤初始勘探、項目開發(fā)和商品生產(chǎn),包括全球超過3.5萬個礦山、項目和加工設施的資產(chǎn)級別信息,3 600多家上市礦業(yè)公司的企業(yè)數(shù)據(jù)和財務指標,歷史和預測商品供應與礦山經(jīng)濟學模型等。2018 年被標準普爾(S&P,簡稱標普)收購,使其一躍成為唯一能提供完整的全球礦業(yè)信息和分析服務以及高質(zhì)量資產(chǎn)級別信息和可靠數(shù)據(jù)的公司,擁有比較齊全的全球礦業(yè)項目數(shù)據(jù)庫,包括企業(yè)和產(chǎn)業(yè)概況、采礦權(quán)申請信息、儲量與資源信息、開采歷史、鉆探結(jié)果、全球并購和融資信息以及生產(chǎn)和礦產(chǎn)經(jīng)濟學數(shù)據(jù)等,涵蓋了9.8萬多家私營礦業(yè)公司和3 700多家上市礦業(yè)公司、3.5萬多個礦業(yè)項目(6 000多個正在運營的礦井)、20多年勘探預算數(shù)據(jù),是覆蓋從全球勘探、發(fā)現(xiàn)、開發(fā)、生產(chǎn)、礦山成本分析、收購活動、工業(yè)和基本金屬市場預測和分析、供應鏈和可持續(xù)發(fā)展全面視圖的平臺(圖8)。
隨著地球科學的發(fā)展,礦床學及相關地質(zhì)數(shù)據(jù)量快速增長,這些數(shù)據(jù)包括各國地質(zhì)調(diào)查局等政府機構(gòu)的基礎地質(zhì)調(diào)查數(shù)據(jù)、國際礦床學會和國際礦產(chǎn)勘查學會等學術(shù)機構(gòu)的研究數(shù)據(jù)、學術(shù)期刊論文和礦業(yè)公司勘探報告以及相關圖件等。基于數(shù)據(jù)驅(qū)動的礦床大數(shù)據(jù)不僅為探索全球尺度的礦產(chǎn)資源潛力評價和成礦預測新模式提供了數(shù)據(jù)基礎,也為全球礦產(chǎn)資源接續(xù)基地定位、資源定量評價提供了數(shù)據(jù)支持。
礦床大數(shù)據(jù)可揭示全球礦產(chǎn)資源的分布規(guī)律與控制機制,刻畫全球礦產(chǎn)成礦規(guī)律。大多數(shù)礦床的形成與地球動力學背景密切相關(如斑巖型銅金鉬礦床與火山弧的俯沖和發(fā)展有關等)。Daveau和Nicoll(2022)利用美國地質(zhì)調(diào)查局礦產(chǎn)資源在線空間數(shù)據(jù)庫,將其中已發(fā)現(xiàn)斑巖銅礦及未發(fā)現(xiàn)銅礦資源數(shù)據(jù)與包含板塊邊界的全球板塊構(gòu)造模型(涵蓋600 Ma至今)進行地理空間和時間分析,提出了一個可更新的、可追溯至600 Ma的全球尺度巖漿弧活動總累積持續(xù)時間的時空模型,既展示了礦床分布規(guī)律又可作為預測斑巖礦床可能性的一個指標。
圖 8 S&P 全球礦業(yè)信息分析服務平臺(網(wǎng)站截圖, https://www.spglobal.com/marketintelligence/en/campaigns/metals-mining#snl-metals-mining)Fig. 8 S&P global mining information analysis and service platform (screenshot of website from https://www.spglobal.com/marketintelligence/en/campaigns/metals-mining#snl-metals-mining)
作者將模型輸出與斑巖銅礦產(chǎn)狀數(shù)據(jù)集進行測試,發(fā)現(xiàn)在整個顯生宙的大多數(shù)地質(zhì)時期,該模型結(jié)果與數(shù)據(jù)控制的一致性都很高(圖9)。例如,在緩沖巖漿弧的情況下準確度可達90%,加入弧的搜索距離后則達到了100%。因此板塊構(gòu)造模型不僅適用于斑巖礦床的成礦規(guī)律總結(jié)和找礦預測,也打開了篩選其他與地球動力學環(huán)境有關的成礦作用潛力(例如造山型金礦、火山成因塊狀硫化物鎳礦和鉑族元素硫化物礦床)的新思路。
Yang 等(2022)根據(jù)前人學術(shù)期刊論文等數(shù)據(jù)總結(jié)了全球喀斯特型鋁土礦床時空分布特征。研究發(fā)現(xiàn),該類礦床主要集中在溫暖特提斯帶及相連中高緯地區(qū),成礦動力學背景與特提斯由南向北單向匯聚過程相關。
圖 9 全球顯生宙和新元古代晚期巖漿弧的板塊模型推導的累積時間與斑巖銅礦疊加圖(據(jù)Daveau and Nicoll, 2022修改)Fig. 9 Plate model-derived cumulative duration of Phanerozoic and Late Neoproterozoic magmatic arcs (modify from Daveau and Nicoll, 2022 )
張洪瑞等(2015, 2022)對全球尺度的碰撞造山與成礦作用進行了綜合對比研究。其團隊基于前人發(fā)表的119條變質(zhì)巖數(shù)據(jù),4 161余套巖漿巖數(shù)據(jù)、28組殼幔包體和61座礦床數(shù)據(jù),創(chuàng)新提出: 熱結(jié)構(gòu)是碰撞造山帶成礦差異性的主要決定因素。冷碰撞帶不發(fā)育巖漿熱液礦床;而熱碰撞帶則盛產(chǎn)巖漿有關礦床。其中,斑巖型銅礦床在歐亞大陸南緣構(gòu)成5 000 km長的巨型礦帶,MVT鉛鋅礦床則構(gòu)成上萬千米長的巨型礦帶(張洪瑞等, 2015; Zhang and Hou, 2018, 2022)。
大量研究表明,大型礦床的產(chǎn)出與巖石圈結(jié)構(gòu)密切相關。Hoggard等(2020)收集前人學術(shù)期刊論文和專著、咨詢公司及協(xié)會數(shù)據(jù)庫、美國地質(zhì)調(diào)查局礦產(chǎn)資源在線空間數(shù)據(jù)庫等數(shù)據(jù)統(tǒng)計分析了全球2 166個賤金屬礦床的空間分布,包括沉積巖容礦Cu礦床(Cu-sed)、碎屑巖容礦鉛鋅礦床(PbZn-CD)、密西西比河谷型Pb-Zn礦床(PbZn-MVT)、斑巖型銅礦床(Cu-por)、巖漿Ni-Cu-PGE礦床和火山塊狀硫化物礦床(VMS)。發(fā)現(xiàn)世界級碎屑巖型鉛鋅礦(PbZn-CD)呈弧線狀分布于地殼地質(zhì)邊界附近,暗示受深部巖石圈尺度構(gòu)造控制(圖10)。在全球范圍內(nèi)約95%的Cu-sed、約90%的PbZn-CD和約70%的PbZn-MVT資源位于170 km LAB厚度等值線兩側(cè)的200 km范圍內(nèi)。其中180~220 km的LAB厚度可能代表了克拉通巖石圈,170 km等值線代表了克拉通邊界(Hoggardetal., 2020)。
Hou等(2015)以中新生代巖漿巖(花崗巖類和長英質(zhì)火山巖)為探針,運用Hf同位素填圖技術(shù),利用230套全巖和4 762套鋯石Hf同位素數(shù)據(jù),構(gòu)建了青藏碰撞帶拉薩地體的三維巖石圈格架(圖11)。結(jié)果顯示,拉薩地體由3個塊體構(gòu)成:南拉薩新生地殼塊、北拉薩新生地殼塊和中拉薩古老再造地殼塊。研究提出,中拉薩古老再造地殼塊反映拉薩地體是一個長期活動的不斷被改造的太古宙-元古宙古老微大陸,裂離自南部岡瓦納大陸。南北拉薩新生地殼塊是特提斯洋向拉薩地體之下俯沖消減、弧巖漿底侵-注入和巖漿弧不斷向拉薩地體拼貼的結(jié)果。同時發(fā)現(xiàn),青藏高原主要成礦系統(tǒng)及其礦帶分布與巖石圈三維架構(gòu)存在明顯的空間對應關系(圖12)。岡底斯斑巖銅礦帶嚴格地位于南拉薩新生地殼塊內(nèi),班怒帶斑巖銅礦位于北拉薩地體新生地殼塊內(nèi),證明含礦巖漿起源于新生下地殼。青藏高原主要大型鉛鋅礦集中分布于中拉薩地體古老地殼域內(nèi)或邊緣,反映古老地殼的熔融產(chǎn)生了含礦花崗巖巖漿并提供了成礦物質(zhì)。青藏高原大型鐵礦或鐵銅礦通常分布于古老地殼塊的同位素邊緣,介于新生地殼與古老地殼接觸帶,暗示巖石圈不連續(xù)控制了殼幔巖漿混合和鐵銅富集。
圖 10 全球沉積巖容礦賤金屬礦床分布與巖石圈厚度關系圖(據(jù)Hoggard et al., 2020)Fig. 10 Global distribution of sediment-hosted base metal deposits as a function of lithospheric thickness (after Hoggard et al., 2020)
圖 11 拉薩地體Hf同位素填圖結(jié)果(據(jù)Hou et al., 2015)Fig. 11 Hf isotope contour map in the Lhasa terrane (after Hou et al., 2015)
圖 12 拉薩地體巖石圈架構(gòu)與主要成礦系統(tǒng)分布(據(jù)Hou et al., 2015)Fig. 12 Lithospheric architecture and distribution of main metallogenic system in the Lhasa terrane (after Hou et al., 2015)
Wu等(2022)綜合5 000套已發(fā)表的中酸性火成巖年代學和地球化學以及2 000套全巖Nd同位素等資料探討斑巖成礦規(guī)律,提煉出能精確判別不同亞類斑巖銅礦的地球化學標志。洪雙等(2021)收集了學術(shù)期刊論文上主要礦床類型的磁鐵礦元素地球化學數(shù)據(jù)7 388條,初步構(gòu)建了基于電子探針(EPMA)和激光剝蝕-電感耦合等離子體質(zhì)譜(LA-ICP-MS)磁鐵礦元素地球化學大數(shù)據(jù)集,研究結(jié)果表明:基于磁鐵礦大數(shù)據(jù)和機器學習算法構(gòu)建的判別模型,能有效區(qū)分主要礦床類型,整體分類準確度高達95%。研究發(fā)現(xiàn)V元素在礦床成因分類過程中起到了較為重要的作用?;诖髷?shù)據(jù)和機器學習建立的判別模型對新的磁鐵礦數(shù)據(jù)進行測試,可給出該數(shù)據(jù)屬于每種礦床類型的概率,能有效判別礦床成因類型。Zhao等(2023)選取全球86個不同成因礦床的4 095套閃鋅礦微量元素數(shù)據(jù)進行了整理和分析。多元統(tǒng)計分析表明,閃鋅礦中Mn-Ge-Sn含量具有良好的成礦類型判別潛力,可用于區(qū)分巖漿熱液礦床和非巖漿熱液礦床。此外,機器學習模型對閃鋅礦微量元素數(shù)據(jù)的礦石類型識別準確率高達93.02%(隨機森林)和92.82%(梯度增強),并通過接收機工作特征驗證了其可靠性。通過對閃鋅礦微量元素數(shù)據(jù)進行機器學習和多元統(tǒng)計分析,可以區(qū)分成礦成因和成礦條件。Cao等 (2023)對全球67個造山帶金礦4 092組黃鐵礦微量元素地球化學數(shù)據(jù)進行了大數(shù)據(jù)和機器學習分析。對不同成礦年齡、不同圍巖、不同構(gòu)造成礦背景的造山帶礦床中黃鐵礦微量元素的差異進行了分析。隨機森林回歸結(jié)果表明,黃鐵礦中硫鐵礦As-Sb含量與改造溫度呈顯著負相關,而Se含量則呈非線性影響。提出造山帶金礦中黃鐵礦As-Sb-Se含量可作為地溫標尺。
對礦床大數(shù)據(jù)進行專業(yè)化處理,可服務于找礦勘查。應用大數(shù)據(jù)和人工智能方法具備分析科學問題的能力,從定量的角度更加精準地研究礦床與控礦要素的關系,提升成礦預測的準確程度。肖克炎等(2015)以大數(shù)據(jù)時代的預測思維方法,結(jié)合重要礦產(chǎn)資源潛力評價具體工作,探索了礦產(chǎn)資源預測評價的基本理論基礎。Zou等(2022)通過提取全球典型斑巖型礦床成礦巖漿巖中鋯石的微量元素大數(shù)據(jù),基于機器學習不同方法,計算成礦潛力指數(shù)。結(jié)果表明,機器學習模型能夠較好地識別出成礦巖體,并通過表征巖漿成礦潛力來縮小找礦勘查范圍,是一種快速有效地評價斑巖成礦潛力的新方法。Lawley等(2022)系統(tǒng)收集了美國、加拿大和澳大利亞的沉積巖容礦鉛鋅成礦系統(tǒng)的地球物理數(shù)據(jù)和“源-運-儲”過程的地質(zhì)數(shù)據(jù),通過梯度提升機 (Gradient Boosting Machine,簡稱GBM)機器學習算法,圈定出成礦的有利地段。其劃定區(qū)域與現(xiàn)有礦區(qū)相比,成功擬合度高達 98%以上,極大提高了找礦勘查效率。胡鵬等(2021)利用標準普爾數(shù)據(jù)庫和各公司年報,開展西非鐵礦資源現(xiàn)狀和潛力評價工作,提出西非地區(qū)未發(fā)現(xiàn)鐵礦床數(shù)量為63個(置信90%),鐵礦石資源量潛力為264. 6億t,找礦資源潛力大。Li等(2022)提出地質(zhì)大數(shù)據(jù)智能找礦原型理論與方法,試圖將邏輯推理轉(zhuǎn)變?yōu)橹R圖譜關聯(lián)規(guī)則,將理論模型轉(zhuǎn)變?yōu)樗惴P椭械耐评硪?guī)則,從而成功地將專家知識與人工智能相結(jié)合,最終設計并初步搭建出地質(zhì)大數(shù)據(jù)智能成礦預測平臺。
然而,數(shù)據(jù)驅(qū)動礦產(chǎn)預測方法主要關注預測變量與礦床空間分布的相關關系,往往沒有充分考慮它們之間的成因聯(lián)系。Zuo等(2023)提出了包括成礦知識嵌入和成礦知識發(fā)現(xiàn)的新一代礦產(chǎn)預測人工智能模型。成礦知識嵌入和成礦知識發(fā)現(xiàn)形成閉環(huán),實現(xiàn)成礦知識、找礦大數(shù)據(jù)和深度學習模型的深度融合,進而提升礦產(chǎn)預測人工智能模型的泛化能力、準確性和可解釋性。
礦床數(shù)據(jù)庫可為國家礦業(yè)政策戰(zhàn)略咨詢提供基礎數(shù)據(jù)。楊曉坤等(2022)采用標準普爾數(shù)據(jù)庫資料和國外礦業(yè)企業(yè)公開披露的數(shù)據(jù),聚焦全球主要鉛鋅礦業(yè)公司的鉛鋅資源狀況,通過分析其主要項目的礦床類型及其分布特征、資源儲量、品位及其勘探、開發(fā)利用情況等,認為國外礦業(yè)巨頭均以資源保障能力獲得行業(yè)競爭力與話語權(quán);同時通過我國礦業(yè)企業(yè)境外鋅資源開發(fā)情況,揭示我國礦業(yè)企業(yè)“走出去”任重道遠。Liu等(2023)通過大量收集和整理世界各上市公司公開報告、政府工作報告和學術(shù)論文,匯編了包含全球146個稀土開發(fā)項目的稀土資源項目數(shù)據(jù)集,通過對數(shù)據(jù)集的分析和估算,從全球稀土項目分布、項目價值分布、稀土供應鏈等方面報道全球稀土開發(fā)的最新進展并開展供應鏈評估。
上述基于數(shù)據(jù)驅(qū)動的礦床學各研究方向?qū)嵗宫F(xiàn)了礦床大數(shù)據(jù)在大尺度-系統(tǒng)性認識上的優(yōu)越性,這些成果有的集中在深入挖掘礦床學本身的各種指標,從而提供大數(shù)據(jù)支撐的、更為可信的研究認識;有的貫徹地球系統(tǒng)科學理念,綜合地質(zhì)、地球化學、地球物理等各個學科中的成礦有關信息,從而對成礦系統(tǒng)成因機制、成礦規(guī)律等得出創(chuàng)新性認識。然而,礦床數(shù)據(jù)庫是礦床大數(shù)據(jù)處理的基礎,從前文所述礦床大數(shù)據(jù)的應用可看出,數(shù)據(jù)(包括文本、表格等不同格式)大部分來源于已發(fā)布的各種文獻,僅有少部分是依托現(xiàn)有礦床數(shù)據(jù)庫數(shù)據(jù)完成,并且這些數(shù)據(jù)庫由不同的專業(yè)機構(gòu)和組織所開發(fā)、運行和維護,缺乏一個統(tǒng)一的平臺對不同數(shù)據(jù)庫的數(shù)據(jù)進行整合、交互處理和可視化,導致數(shù)據(jù)難以在研究人員之間流動,限制了高水平、綜合性研究成果的產(chǎn)出。
“深時數(shù)字地球”(Deep-time Digital Earth, DDE)是國際地質(zhì)科學聯(lián)合會(IUGS)發(fā)起的第一個大型科學計劃,為期10年(2018~2028),由各國地質(zhì)調(diào)查、專業(yè)協(xié)會、學術(shù)機構(gòu)和科學家共同開發(fā)。DDE旨在提供一個開放的平臺,用于連接現(xiàn)有的深時地球數(shù)據(jù)和整合地質(zhì)數(shù)據(jù),用戶可以通過指定時間、空間和主題進行查詢,并使用可提供計算能力、模型、方法和算法的知識引擎處理數(shù)據(jù)以獲得知識發(fā)現(xiàn)。DDE可以幫助科學家進行耗時的數(shù)據(jù)清理和處理,使他們能夠?qū)W⒂谘芯亢桶l(fā)現(xiàn)。目前DDE已建設完成網(wǎng)站平臺,陸續(xù)向公眾發(fā)布巖石學、年代學、礦物學等多個學科數(shù)據(jù)。礦床學作為地球科學重要組成,在DDE框架下礦床學工作組擬整合全球海量礦床數(shù)據(jù),建設覆蓋礦床學各學科知識體系、本體、數(shù)據(jù)、知識(圖譜)、標準的大數(shù)據(jù)平臺,實現(xiàn)全部資源的集成共享與推廣應用,從而推動和促進礦床學科研范式變革。同時,礦床數(shù)據(jù)庫平臺還將與地球物理、地球化學、大地構(gòu)造、古生物和古地理學等其他學科數(shù)據(jù)庫平臺資料互通,促進信息資源開放共享。DDE礦床數(shù)據(jù)庫平臺的核心理念是“開放、共享、統(tǒng)一”,平臺網(wǎng)站為https://deposit.deep-time.org/。該平臺有望為成礦理論、成礦預測、地球演化以及氣候變化等提供技術(shù)及數(shù)據(jù)支撐。
大數(shù)據(jù)正在改變地質(zhì)學家的思維方式,隨著大數(shù)據(jù)時代和人工智能技術(shù)的飛速發(fā)展,目前已經(jīng)建立了一些礦床數(shù)據(jù)庫,如美國地質(zhì)調(diào)查局USMIN 礦床數(shù)據(jù)庫、標準普爾(S&P)公司下屬的SNL金屬與礦業(yè)數(shù)據(jù)庫以及Geofacets數(shù)據(jù)管理平臺等。這些是當今全球不同部門普遍引用的數(shù)據(jù)來源,為全球科研人員提供了地圖和數(shù)據(jù),推動了數(shù)據(jù)驅(qū)動的礦床學研究,在區(qū)域成礦規(guī)律、關鍵控礦要素、成礦預測等方面顯示了無可比擬的優(yōu)越性。
目前已有全球礦床數(shù)據(jù)庫存在數(shù)據(jù)不齊全、數(shù)據(jù)格式不統(tǒng)一、資源量標準不同,個別數(shù)據(jù)庫認可度、知名度以及引用率不高等問題。建立更權(quán)威更齊全的礦床數(shù)據(jù)庫,形成開放、共享、統(tǒng)一的礦床大數(shù)據(jù)平臺,提供可靠數(shù)據(jù)的深度分析和二次開發(fā),服務全球礦產(chǎn)成礦規(guī)律、資源評價與供應評估等勢在必行。