張穎慧,王 濤,*,焦守濤,郭 磊,范潤龍,王楊剛,張建軍
1.自然資源部深地動力學重點實驗室,中國地質科學院地質研究所,北京100037;2.北京離子探針中心,北京100037;3.中國地質調查局發(fā)展研究中心,北京100037
數(shù)據(jù)是現(xiàn)代科學最重要的研究資源和成果。隨著計算機技術和網絡技術的發(fā)展,數(shù)據(jù)存儲、處理、統(tǒng)計分析和共享能力日益增強,“大數(shù)據(jù)”時代已經到來(Lynch,2008)。大數(shù)據(jù)引發(fā)的第二次數(shù)據(jù)革命改變了傳統(tǒng)的科學研究范式,成為繼實驗歸納、模型推演和仿真模擬之后的第四種科研范式——數(shù)據(jù)密集型科學(Hey et al.,2009),大數(shù)據(jù)驅動下的科學研究與知識發(fā)現(xiàn)正逐漸成為當今科學領域的新態(tài)勢(Ahmed,2017;翟明國等,2018;張旗和周永章,2018;周永章等,2018)。與此同時,地球科學也在經歷向地球系統(tǒng)科學轉變的重大轉型。在這樣的時代背景下,由國際地質科學聯(lián)合會(IUGS)組織領導,中國科學家倡議發(fā)起的“深時數(shù)字地球”(Deep-time Digital Earth,DDE)國際大科學計劃應運而生。DDE計劃聚焦于過去數(shù)十億年的地球演化歷史,以整合全球已有海量數(shù)據(jù)、共享全球地學知識為使命,力求建立地球系統(tǒng)科學的新理論體系,重建不同歷史時期的地球演化,構建全球地質構造與工程地質條件,識別全球資源與能源礦產的宏觀分布規(guī)律,更加準確地預測地球與人類的未來。
巖漿巖來源于地球深部,能夠提供很多地幔和地殼的信息,對地學研究非常重要,承擔深時數(shù)字深部地球特別是深部過程研究的重任。地質學者可以從巖漿巖的地點、巖石種類、礦物和化學組成、溫度壓力等推斷出地球深部物質組成、深部地質過程、地質構造環(huán)境和動力學背景等。巖漿巖分布范圍廣(占地殼巖石超過三分之二),樣品眾多,分析、定年相對方便和精確,易于數(shù)據(jù)累積。近幾十年來,日益提高的分析測試水平和不斷深入的研究程度,使得巖石數(shù)據(jù)的數(shù)量和質量急劇提高。如何高效地存儲、管理、共享這些分布在不同文獻、報告、研究機構和專門的數(shù)據(jù)庫中的重要數(shù)據(jù),用大數(shù)據(jù)和人工智能方法加以充分挖掘和利用,是國內外地學工作者共同關心的問題。
本文將介紹國內外已有的巖漿巖相關數(shù)據(jù)庫及其運行情況,為未來DDE計劃整合全球海量巖漿巖數(shù)據(jù)、建設相關數(shù)據(jù)平臺提供經驗和基礎。同時,列舉近年來開展的以巖漿巖大數(shù)據(jù)驅動的科學研究典型實例,結合DDE的相關任務,探索和展望如何利用巖漿巖大數(shù)據(jù)進一步解決四維地球深部圈層物質構成、交換與動力學這一關鍵科學問題。
隨著地質學科的不斷發(fā)展,發(fā)表和積累的巖石特別是巖漿巖基礎數(shù)據(jù)(巖石地球化學、年代學、同位素數(shù)據(jù)等)越來越多。國內外多個國家機構都高度重視這些基礎數(shù)據(jù),各自建立了國家級或全球規(guī)模專業(yè)數(shù)據(jù)庫。例如,美國的EarthChem(巖石學、地球化學、年代學)及其先后納入的PetDB、NAVDAT等幾個專業(yè)巖石數(shù)據(jù)庫,德國Mainz的Max Planck化學研究所B?rbel Sarbas博士研究小組建立和維護后也連入EarthChem的GEOROC巖石地球化學數(shù)據(jù)庫,加拿大薩省大學Bruce Etlinton開發(fā)和維護運營的DateView國際地質年代學和同位素數(shù)據(jù)庫和StratDB巖石地層、構造域和礦床數(shù)據(jù)庫,澳大利亞的EarthBYTE(年代學、地球化學、古地磁、同位素、礦產)綜合地學數(shù)據(jù)庫,以及各國地質調查機構的綜合數(shù)據(jù)庫,如美國地質調查局的全國巖石地球化學和地質年代學數(shù)據(jù)庫,加拿大自然資源部的GeoGratis(地質圖、巖石地球化學、年代學),英國地質調查局的OpenGeoscience(地質圖、地球物理、礦產、古生物、巖石薄片照片等)等。
中國對巖漿巖數(shù)據(jù)庫的重視和研究起步并不晚,中科院、中國地質科學院等研究機構和學者也建立(過)一些巖漿巖相關的數(shù)據(jù)庫,但與其他學科例如比較出色仍在不斷更新和完善的地層古生物數(shù)據(jù)庫(GBDB)相比,中國的巖漿巖數(shù)據(jù)庫在建立后疏于更新和維護,已難以提供基本的服務,現(xiàn)存的數(shù)據(jù)庫(集)大都比較零散缺乏系統(tǒng)性。
現(xiàn)將介紹如下幾個有代表性的巖漿巖相關數(shù)據(jù)庫及其運行情況。
EarthChem (GeochemicalDatabasesforthe Earth,www.earthchem.org)運行一套數(shù)據(jù)系統(tǒng),幫助地球科學家訪問、共享和使用地球化學、巖石學和地質年代學數(shù)據(jù),旨在建立固體地球的地球化學數(shù)據(jù)綜合管理和信息系統(tǒng),加強不同數(shù)據(jù)庫間的協(xié)作,減少重復工作,共享數(shù)據(jù)管理經驗和管理工具(Walker et al.,2005)。EarthChem成立于2005年,2010年與MGDS(Marine Geoscience Data System,海洋地學數(shù)據(jù)系統(tǒng))合作共建IEDA(Integrated Earth Data Applications)綜合地球數(shù)據(jù)應用工程(圖1),并得到美國自然科學基金會(NSF)的資助,目前運行于哥倫比亞大學的拉蒙特—多爾蒂地球觀測中心。EarthChem系統(tǒng)可確保能夠開放和持久的訪問有質量控制的數(shù)據(jù),并為數(shù)據(jù)挖掘和數(shù)據(jù)分析提供高級功能,從而服務于數(shù)據(jù)生命周期中的各種不同目的。
(1)數(shù)據(jù)發(fā)布和保存
EarthChem Library是地球化學數(shù)據(jù)集(分析數(shù)據(jù),實驗數(shù)據(jù),綜合數(shù)據(jù)庫)和與地球化學領域相關的其他數(shù)字資源的開放存取庫。ECL為數(shù)據(jù)保存和訪問提供了一整套服務,包括使用數(shù)字對象標識符(DOI)進行長期歸檔和數(shù)據(jù)注冊。
圖1 EarthChem和其他相關數(shù)據(jù)庫的組織關系圖(摘自余星,2014)Fig.1 Relationship of EarthChem and other relevant databases
Geochron是一個用于管理地質年代學和熱年代學研究數(shù)據(jù)的應用程序。研究人員應首先向Geochron提交地質年代學數(shù)據(jù),然后即可在EarthChem Labrary中一鍵無縫發(fā)布數(shù)據(jù)。目前已有1601件樣品的地質年代學數(shù)據(jù)通過Geochron提交入數(shù)據(jù)庫。
(2)數(shù)據(jù)挖掘與分析
EarthChem包含的數(shù)據(jù)庫主要有PetDB(海底巖石學數(shù)據(jù)庫)、SedDB(全球海洋和陸地沉積物地球化學數(shù)據(jù)庫)、VentDB(海底熱液地球化學數(shù)據(jù)庫),并納入了NAVDAT(北美火山巖和侵入巖數(shù)據(jù)庫)等。除此之外,EarthChem Portal是地球化學數(shù)據(jù)的一站式服務,使用戶能夠同時搜索加入聯(lián)盟的各個不同來源不同數(shù)據(jù)體系的數(shù)據(jù)庫中的完整數(shù)據(jù),包括PetDB,SedDB,NAVDAT,MetPetDB變質巖石學數(shù)據(jù)庫,USGS美國地質調查局全國地球化學數(shù)據(jù)庫,GEOROC海洋和大陸巖石地球化學數(shù)據(jù)庫,以及DARWIN(Data and Sample Research System for Whole Cruise Information in JAMSTEC,日本海洋研發(fā)機構的數(shù)據(jù)和樣品檢索系統(tǒng),合并了GANSEKI,Geochemistry and Archives of ocean floor rocks on Networks for Solid Earth Knowledge Integration,海底巖石地球化學資料網絡存檔,包括實體樣品、對應的分析數(shù)據(jù)、手標本照片、少量顯微薄片照片,旨在實現(xiàn)固體地球知識整合)。EarthChem Portal目前可覆蓋的各個數(shù)據(jù)庫樣品總量有1054728件,化學值30059718條,具有豐富的搜索,可視化和輸出格式選項,可與LEPR數(shù)據(jù)庫和MELTS軟件互操作。
(3)樣品識別和元數(shù)據(jù)保存
SESAR是地球樣品注冊系統(tǒng),是用于編目和保留樣品元數(shù)據(jù)的樣品元數(shù)據(jù)注冊表。SESAR提供各種人工和機器接口與軟件工具,用于注冊樣品元數(shù)據(jù),獲取樣品的唯一標識符(國際地學樣品號IGSN),以及搜索樣品元數(shù)據(jù)目錄。
EarthChem數(shù)據(jù)管理者確保研究人員提供的數(shù)據(jù)或從已發(fā)表的文獻中提取的數(shù)據(jù)在分析數(shù)據(jù)質量(方法,精確度,標準測量),樣品描述(巖石類型,結構,年齡,礦物組成,蝕變),樣品出處(地理空間坐標,位置地名,構造背景),取樣過程(技術,日期,巡航)等方面都得到正確記錄。這些數(shù)據(jù)監(jiān)管程序確保該系統(tǒng)依然是科研和教育的可靠資源。
EarthChem是目前最為常用和活躍的巖漿巖數(shù)據(jù)庫和數(shù)據(jù)檢索工具之一,成立最初是通過建立統(tǒng)一的網絡平臺將PetDB、GEOROC和NAVDAT三個主要的數(shù)據(jù)庫連接起來。2005年,在美國國家自然科學基金支撐下,EarthChem開始建立自己的數(shù)據(jù)管理系統(tǒng),將部分其他數(shù)據(jù)庫的數(shù)據(jù)統(tǒng)一存放于自己的數(shù)據(jù)庫中(圖1),同時,開始研究數(shù)據(jù)的可視化及數(shù)據(jù)分析工具。目前,EarthChem的主要功能包括:數(shù)據(jù)查詢、下載、位置Google Earth導出、在線地圖顯示,并可對查詢結果提供在線的TAS圖解和Harker圖解可視化分析工具。
PetDB(earthchem.org/petdb)是 the Petrological Database of the Ocean Floor(海底巖石學數(shù)據(jù)庫)的簡稱,是對全球海底巖石、礦物和包裹體等的元素化學數(shù)據(jù)、同位素數(shù)據(jù)和礦物學數(shù)據(jù)的綜合(Lehnert et al.,2000)。樣品主要來源于產生于洋中脊,也包括弧后盆地、年輕海山、古老洋殼、地幔捕虜體以及越來越多的陸相火山巖等的海底巖漿巖和少量變質巖,可提供這些樣品的主量元素氧化物含量、微量元素豐度、同位素、年齡和礦物模式含量等共計254個參數(shù)的數(shù)據(jù),并且這些數(shù)據(jù)都有相應的元數(shù)據(jù)支持,提供與數(shù)據(jù)對應的樣品、地理位置、巖石結構、分析測試方法、航次站位和參考文獻等信息(Lehnert et al.,2000)。數(shù)據(jù)來源于學術期刊論文、專著、IODP(包括DSDP和ODP)出版物和學位論文等。
PetDB數(shù)據(jù)庫系統(tǒng)于2000年開始投入使用,至今仍保持不斷更新:最新更新日期為2020年1月16日,采樣站位31958點,樣品112735件,全巖數(shù)據(jù)點1467558條,礦物數(shù)據(jù)2026500條,火山玻璃數(shù)據(jù)791652條,熔融包裹體數(shù)據(jù)279744條,全部獨立數(shù)據(jù)4566014條,參考文獻2942條,最早的來源文獻為1937年有關印度洋卡爾斯伯格洋脊玄武巖的地球化學數(shù)據(jù)報道。PetDB擁有強大的數(shù)據(jù)查詢能力,可以支持各種參數(shù)、各種條件的獨立查詢或組合查詢,一步一步聚焦到用戶需要的樣品或數(shù)據(jù)。常用的查詢條件包括經緯度、地理名稱、構造環(huán)境、樣品特征、航次信息、數(shù)據(jù)可用性、數(shù)據(jù)庫版本、樣品編號等。按經緯度查詢,可以手動輸入選區(qū)的經緯坐標,同時可以在地圖上拉水平展布的任意多邊形框選擇查詢。按地理名稱查詢,根據(jù)樣品所處的位置名稱或地理要素類型來設置查詢條件,地理名稱可以來自不同尺度和地貌單元,如國家、群島、大洋或海的名稱,洋島、洋盆、大洋高原、海山(鏈)、擴張中心、火山和裂谷的名稱等,可以同時設定多個地名進行綜合查詢。按所處的構造環(huán)境和樣品特征分類查詢,如在各個克拉通、斷裂帶、活動帶、造山帶、蛇綠巖、大火成巖省、火山弧、弧后盆地等的內部或組合查詢。如按樣品的巖性分類查詢,區(qū)分超基性、基性、中性、酸性巖漿巖,火山巖和侵入巖,以及巖脈、捕虜體等不同巖性的數(shù)據(jù)。此外,還可以查詢具有指定數(shù)據(jù)項的數(shù)據(jù)條目,按航次信息查詢,按數(shù)據(jù)提供者或來源文獻信息查詢,按樣品編號查詢,甚至按數(shù)據(jù)庫版本進行查詢,查找特定更新階段內新增的數(shù)據(jù),方便在原有的基礎上只追加更新的數(shù)據(jù),而無需重新下載所有數(shù)據(jù)。PetDB擁有詳細的數(shù)據(jù)質量控制信息,明確各個數(shù)據(jù)的分析測試方法,引入了IGSN國際地學樣品統(tǒng)一編號,由SESAR統(tǒng)一管理,可通過EarchChem Portal實現(xiàn)與其他數(shù)據(jù)庫的交互查詢。
PetDB提供了最全面的海底巖石信息,包括巖石類型、礦物組成、化學成分、同位素特征、巖石分布、年齡信息等等。基于這些數(shù)據(jù),全球尺度或區(qū)域尺度的巖石地球化學研究成為可能,區(qū)域對比、綜合研究更加方便。目前已有數(shù)百篇的高質量學術論文引用了PetDB,并且還在不斷增加(余星,2014)。
NAVDAT(NorthAmericanVolcanicandIntrusive Rock Database,www.navdat.org)北美火山和侵入巖石數(shù)據(jù)庫,始于2002年,指導委員會包括堪薩斯大學的J.Douglas Walker,北卡來羅納大學的Allen F.Glazner,科羅拉多大學的G.Lang Farmer,華盛頓卡內基研究所的Richard W.Carlson,以及墨西哥國立自治大學的Luca Ferrari,管理員是堪薩斯大學的Jason Ash。數(shù)據(jù)主要來自北美西部中生代以來巖漿巖的年齡、地球化學和同位素數(shù)據(jù),該地區(qū)長期以來一直是探索巖漿活動、大地構造和成礦之間聯(lián)系的天然實驗室,但所用的一些臨時數(shù)據(jù)庫項目結束后就廢棄了。因此,NAVDAT旨在為北美西部巖漿巖現(xiàn)有的和新的年齡和地球化學數(shù)據(jù)提供永久性的公開的數(shù)據(jù)庫。包括樣品64985件,地球化學值1103584條,文獻1874條。該數(shù)據(jù)庫最新的數(shù)據(jù)截止于2011年,并于2014年停止維護,所有數(shù)據(jù)并入EarthChem。但目前原網站的全部功能均可使用,也可以通過EarthChem Portal訪問全部數(shù)據(jù),其數(shù)據(jù)仍在被最新的研究所引用。
NAVDAT允許在整個大陸范圍內查看巖漿活動的復雜時空分布,并且開發(fā)了許多新的可視化工具,包括時空動畫和時間動畫地球化學圖。強大的地圖界面允許用戶快速在衛(wèi)星圖像上投圖樣品位置,超鏈接形式的地球化學投圖允許用戶快速研究巖漿巖成分的時空分布。同時還開發(fā)了一些可在巖石學界廣泛推廣的工具,包括能夠存檔元數(shù)據(jù)(例如分析技術和標準數(shù)據(jù))的分析數(shù)據(jù)輸入模板,以及用于輕松可視化樣品位置的Google Maps和Google Earth接口。
GEOROC(Geochemistry of Rocks of the Oceans and Continents, georoc.mpch-mainz.gwdg.de/georoc/)海洋和大陸巖石地球化學數(shù)據(jù)庫是由德國Mainz的Max Planck化學研究所的B?rbel Sarbas博士研究小組負責建設和維護的。最近更新2019年9月1日,包括樣品544190件,文獻18050篇,分析數(shù)據(jù)1585790條,單個的數(shù)據(jù)值22951050個。
GEOROC早期以板內洋島火山巖以及匯聚板塊邊緣和大火成巖省的火山巖數(shù)據(jù)為主,后來擴展到收集發(fā)表的各種巖漿巖數(shù)據(jù)(如火山巖、侵入巖、地幔包體),包括主量、微量元素,放射性和非放射性同位素,全巖、玻璃、礦物和包裹體的年齡分析數(shù)據(jù)等。元數(shù)據(jù)包括經緯度、巖石分類和巖性、蝕變程度、分析方法、實驗室和參考文獻等。支持多種查詢檢索:按作者文獻、地質環(huán)境、按地理坐標(經緯度)、按化學元素(包括主量、微量、稀土元素和放射性同位素)含量、按巖石類型查詢等多種查詢方式。還提供專題預編譯數(shù)據(jù),即預先按各種不同專題對數(shù)據(jù)進行整編為csv文件,可供直接下載方便使用。目前GEOROC已接入EarthChem數(shù)據(jù)體系,可通過EarthChem Portal訪問查詢全部數(shù)據(jù)。
DataView(thera2.usask.ca:8085)是加拿大薩省大學Bruce Eglinton教授建立和維護的國際地質年代學和同位素數(shù)據(jù)庫,擁有分布在七大洲的超過106,000條記錄。同時還有StratDB巖石地層、構造域和礦床數(shù)據(jù)庫,基于IGCP509項目的基礎,建立全球地層單元信息和各構造域的變質變形數(shù)據(jù)庫,并與DataView地質年代學數(shù)據(jù)庫相連。該數(shù)據(jù)庫目前為IGCP648項目提供數(shù)據(jù)庫支持。
DateView是一個基于web的數(shù)據(jù)庫,使用標準的開源關系數(shù)據(jù)庫管理系統(tǒng)(Firebird)開發(fā),接口使用Delphi編程語言和Intraweb組件開發(fā)。表結構旨在確保參照完整性,即確保印刷錯誤最小化。圖2以半概念的方式說明了數(shù)據(jù)庫的結構。DataView便于用戶依據(jù)不同的分類比較地質年代學和同位素信息,例如:構造省和地體,不同的地球化學分類,大地構造屬性如前構造、同構造、后構造,識別出的邊界等。此外用戶還可以將上傳的數(shù)據(jù)僅對特定的用戶組可見,這樣未發(fā)表的數(shù)據(jù)就可以和公開的數(shù)據(jù)一起安全地存儲。該數(shù)據(jù)庫網站具有非常好的查詢功能,用戶可以按照國家、地質單元、巖性、地質解釋(如結晶年齡、變質年齡、冷卻年齡、碎屑組成等),年齡區(qū)間、同位素體系、分析物質、參考文獻和其他用戶獲取的分類查詢數(shù)據(jù)庫。查詢結果可以下載和在線分析生成圖表,例如可以按不同解釋分類和數(shù)據(jù)分組繪制誤差條形圖、概率密度圖、地圖分布、鋯石諧和圖,同位素比值—年齡圖等。同時,網站提供了一些用DataView數(shù)據(jù)庫下載的數(shù)據(jù)根據(jù)其位置和屬性制作的動畫,在各個大洲地圖上隨著時間推移顯示出巖漿、變質和冷卻事件的發(fā)生位置。這些動畫旨在展示數(shù)據(jù)庫中的數(shù)據(jù)以便檢查數(shù)據(jù),同時也有助于可視化不同類型的活動隨時間發(fā)生的位置。
圖2 DataView數(shù)據(jù)庫結構設計概念圖(sil.usask.ca/DV_overview.htm)Fig.2 Schematic design of DataView database(sil.usask.ca/DV_overview.htm)
除了學術機構、研究組和個人建立的以收集公開發(fā)表數(shù)據(jù)為主的專業(yè)數(shù)據(jù)庫外,各國地質調查機構在開展地質調查工作的過程中也積攢了大量的巖漿巖相關數(shù)據(jù),并且致力于為公眾提供公開共享服務,紛紛在各自的綜合性數(shù)據(jù)服務中建立和發(fā)布了巖漿巖相關的數(shù)據(jù)庫。以美國地質調查局USGS為例,在包含和繼承了其前身:提取于PLUTO數(shù)據(jù)庫的美國巖漿巖地球化學數(shù)據(jù)庫(Geochemistry of igneous rocks in the US extracted from the PLUTO database)的基礎上,提供了全國巖石地球化學數(shù)據(jù)庫(National Geochemical Database:Rock),目前共有414304條樣品記錄,其中巖漿巖地球化學數(shù)據(jù)約占一半,樣品大部分來自美國境內,但也有一少部分遍布全球的樣品數(shù)據(jù),此外還有全國地質年代學數(shù)據(jù)庫(National Geochronological Database),共有18548條美國境內的樣品記錄。數(shù)據(jù)庫支持在線地圖顯示查看所有樣品點和分析數(shù)據(jù),也可以在Google Earth和GIS軟件平臺中顯示這些數(shù)據(jù),數(shù)據(jù)查詢支持簡單的按地理區(qū)域和巖性關鍵詞查詢,也可以下載全部數(shù)據(jù)為ArcGIS Shapefile格式、DBF數(shù)據(jù)庫格式和文本表格格式到本地。USGS巖石地球化學數(shù)據(jù)庫現(xiàn)也可以通過EarthChem Portal查詢和獲取全部數(shù)據(jù)。各國地質調查機構保有大量的巖石地球化學相關數(shù)據(jù),例如USGS數(shù)據(jù)占EarthChem Portal全部可訪問數(shù)據(jù)的三到四成,但通常都只局限在本國及鄰區(qū)范圍內,很多國家的數(shù)據(jù)還分散在各個省級地質調查局,此外,因其作為公益性服務的一部分,數(shù)據(jù)庫的結構功能和服務設置上專業(yè)性和系統(tǒng)性有所欠缺,很多只提供靜態(tài)的數(shù)據(jù)集下載,缺乏互聯(lián)的接口。
中國在20世紀80、90年代就開始開展巖漿巖數(shù)據(jù)庫的建立和國際對接工作(尚如相等,1989;徐偉昌等,1991;陸松年等,1997;尚如相,1999),也出現(xiàn)(過)研究機構和學者建立的一些巖漿巖數(shù)據(jù)庫(王曉蕊,2008;張聰?shù)龋?012;錢莉莉等,2015),如中國地質科學院的中國及全球火成巖數(shù)據(jù)庫和中國同位素地質年代基礎數(shù)據(jù),中科院數(shù)據(jù)云上的一些巖漿巖地球化學和年代學數(shù)據(jù)集,地質云上的相關數(shù)據(jù)庫等。
中國及全球火成巖數(shù)據(jù)庫可以在線按照不同的查詢條件查詢數(shù)據(jù),同時該數(shù)據(jù)庫提供了從電子地圖上直接查詢不同地區(qū)的火山巖數(shù)據(jù)的功能,但該數(shù)據(jù)庫近年來疏于更新和維護,已難以保證提供穩(wěn)定的在線服務。在中科院數(shù)據(jù)云上進行相關搜索可以獲得中科院廣州地球化學研究所建立的地球化學研究數(shù)據(jù)庫、稀土元素地球化學數(shù)據(jù)庫、微量元素地球化學數(shù)據(jù)庫、常量元素地球化學數(shù)據(jù)庫、穩(wěn)定同位素數(shù)據(jù)庫等一系列專門的地球化學數(shù)據(jù)庫,以及中科院青藏高原研究所建立的如青藏高原局部地區(qū)年代學和同位素數(shù)據(jù)庫等,但這些數(shù)據(jù)庫多基于研究項目的需要而建立,較為分散,且為靜態(tài)的數(shù)據(jù)集,缺乏系統(tǒng)的集成、持續(xù)的更新維護和交互接口。
綜上所述,盡管科學家們在巖漿巖數(shù)據(jù)庫建設方面的多年嘗試已取得一些重要進展,PetDB和GEOROC一直保持不斷更新并形成了較為完善的功能,被科學家廣泛使用,各國地質調查機構的數(shù)據(jù)庫也為開展局部研究提供了更為豐富的數(shù)據(jù),此外還有了如EarthChem Portal這樣覆蓋多個優(yōu)秀數(shù)據(jù)庫的查詢工具,但相比海量的且不斷產生的分散在研究機構和個人手中的數(shù)據(jù)孤島仍只是冰山一角,距離理想中能服務大數(shù)據(jù)和人工智能時代巖漿巖研究的數(shù)據(jù)平臺仍有很多不足,具體表現(xiàn)為:(1)多是研究組、大學或研究機構建立,缺乏學術組織推薦;(2)更新慢,多個數(shù)據(jù)庫已不再更新,或近期少有更新;(3)專業(yè)性強,系統(tǒng)性不夠;(4)共享和開放不夠;(5)集成和挖掘不夠,缺少互聯(lián)、整合的研究平臺。因此,在“深時數(shù)字地球”大科學計劃的推動下,將在已有工作基礎上努力合理解決這些問題,推動專業(yè)的巖漿巖數(shù)據(jù)庫進一步發(fā)展,建立開放、共享、統(tǒng)一的大數(shù)據(jù)平臺,整合各學科基礎數(shù)據(jù)開展全球協(xié)作,為運用大數(shù)據(jù)分析和人工智能解決關鍵科學問題,提供堅實的基礎。
傳統(tǒng)的巖漿巖相關研究當然也離不開數(shù)據(jù)的支持,但究其研究方法仍依賴以演繹法和歸納法這些以因果關系為基礎靠人腦主導的推理來實施的傳統(tǒng)方法,是理論驅動模式。而數(shù)據(jù)驅動模式采用的大數(shù)據(jù)方法,是新提出來的第三種科學研究的方法,它依靠數(shù)據(jù),研究相關關系,在很大程度上改變了人們對世界的認知和理解,許多傳統(tǒng)的認識、方法、觀點被挑戰(zhàn)和顛覆,同時更多新的問題被展示和提出。在巖漿巖領域,數(shù)據(jù)驅動的研究探索既有揭示深部物質結構與地殼生長,超大陸的聚散、循環(huán)及動力學機制,巖漿演化與深部動力學對板塊構造的制約等宏大的綜合性地球科學問題,也有巖漿巖的自然分布、巖石命名分類和大地構造環(huán)境識別這樣的學科基礎問題研究,下面選擇一些研究實例作以介紹。
巨量巖漿發(fā)育有著深刻的地球動力學背景。因此,對巨量巖漿發(fā)育的重大事件,其時空演化和巖漿成因相關數(shù)據(jù)的系統(tǒng)總結研究,可以揭示全球尺度、造山帶尺度和區(qū)域尺度的構造動力學特征和過程。例如,國際火山學與地球內部化學協(xié)會(International Association of Volcanology and Chemistry of the Earth’s Interior,簡稱IAVCEI)成立了大火成巖省委員會,提供不斷更新的全球各個時期大火成巖省的清單信息和地理位置圖(Ernst and Youbi,2017)下載(www.largeigneousprovinces.org/downloads)。大火成巖省數(shù)據(jù)的積累及其系統(tǒng)研究,揭示了地幔柱的發(fā)育時間和大地構造背景,為了解板塊重大裂解、伸展事件提供了基礎(Li and Zhong,2009)。全球巖漿巖特別是造山帶花崗巖的年代學數(shù)據(jù)統(tǒng)計揭示,這些重大巖漿事件與超大陸匯聚相一致(如Condie et al.,2017)。近年來,依據(jù)巖漿巖及其他有關學科大數(shù)據(jù)分析,提出了超大陸循環(huán)的新認識,即全球超大陸與超級地幔柱每隔~600±100 Ma循環(huán)一次(Evans et al.,2016)。這方面的研究正成為新的熱點,IGCP648正在開展超大陸旋回和全球地球動力學方面的研究。Li等(2019)最新的研究發(fā)現(xiàn),在全球地幔柱活動和全球海平面變化與超大陸旋回有相似的周期性的同時,全球鋯石Hf同位素特征和海水Sr同位素比值的變化呈現(xiàn)出另一類循環(huán)趨勢,其周期大約是典型超大陸周期長度的兩倍,這種1000~1500 Ma的周期趨勢也出現(xiàn)在全球尺度的鉛鋅礦床、造山帶和被動邊緣年齡分布的數(shù)據(jù)中,壓倒和調節(jié)了較弱的600~700 Ma的周期(圖3)。同時,基于對過去2000 Ma全球古地理重建的最新進展,提出“外向”和“內向”兩種超大陸聚合方式:外向型如Pangea的聚合,前一個超大陸Rodinia由內而外形成新的超大陸Pangea,在此過程中圍繞Rodinia的超級大洋被俯沖消減,形成沿著板塊構造邊緣的火山和地震“火環(huán)”(ring of fire),大陸進一步分離直到它們再次在地球“另一側”相互碰撞,原超級大洋所處的地殼被吞噬并形成了一個新的超級大洋和超大陸;內向型如Rodinia的聚合,前一個環(huán)Nuna超級大洋在新超大陸周期中幸存,新超大陸Rodinia是通過上一個超大陸Nuna裂解期間形成的內部海洋的俯沖消減而聚合的,裂解形成的新洋殼又被大陸地殼收回形成超大陸,被視為不完全的分裂。Li等(2019)認為,超大陸的聚散似乎是通過外向和內向兩個過程交替進行的。更有趣的是,這兩個交替的過程不僅決定了超級大洋是否存活,而且還決定了超級大洋周邊的俯沖帶“火環(huán)”能否存活。如果這個“火環(huán)”與超級大洋一起存活,那么地幔結構保持與上一次超大陸相似的模式,如果沒有保存,那么地幔結構就會完全重組。研究人員推測,超大陸聚合的這種交替進行模式(以及超級大洋和“火環(huán)”的存活或再生),導致地球周期的存在,其長度大約是~600 Ma超大陸周期的兩倍,同時也影響了一些地球內部資源的形成。
圖3 地球超級循環(huán)的記錄Fig.3 Records of Earth’s supercycles
利用巖漿巖礦物學和地球化學大數(shù)據(jù)分析,還可以進一步揭示超大陸聚合特征。例如,Liu等(2017)分析了來自rruff.info/ima的108857條礦物學數(shù)據(jù),和通過EarthChem Portal獲取的PetDB、NAVDAT、GEOROC、USGS數(shù)據(jù)庫中已知年齡巖漿巖樣品的代表性元素如Zr、Nb、Y、Co、Ni的全巖含量數(shù)據(jù)(包括129161條Zr,105045條Nb,121373條 Y,77835條Co和 82611條Ni)。通過統(tǒng)計學處理呈現(xiàn)和研究發(fā)現(xiàn)與Rodinia聚合(~1.3~0.9 Ga)相關的礦物學和地球化學與其他超大陸有著顯著的不同(圖4):Rodinia超大陸聚合的過程中形成了較多的含Nb、Y礦物和鋯石,相應地巖漿巖富集Zr、Nb和Y。相比之下,含有許多其他元素(例如Ni、Co、Au、Se和鉑族元素)的礦物含量明顯較少,而巖漿巖中的Ni和Co并沒有虧損。前者指示了中元古代顯著的非弧巖漿作用,后者則與火山弧和造山帶的侵蝕增強有關?;詭r和酸性巖的地球化學構造判別圖解均顯示,Rodinia超大陸聚合中巖漿巖板內地球化學特征占主導地位,而在Nuna和Gondwana中相對表現(xiàn)出更強的弧碰撞地球化學特征。因此認為Rodinia是加厚地殼向外側雙向俯沖匯聚拼貼。
圖4 Nuna(藍色x),Rodinia(紅色圓)和Gondwana(灰色-)聚合期間基性(a)和長英質(b)巖石的構造判別圖解(每個超大陸的平均值表示為星形,Liu et al.,2017)Fig.4 Tectonic discrimination diagrams for mafic(a)and felsic(b)rocks formed during assemblies of Nuna(blue,x),Rodinia(red filled circle),and Gondwana(gray,-)based on concentrations of immobile trace elements(Average values for each supercontinent are plotted as filled stars,Liu et al.,2017)
基于鋯石年代學大數(shù)據(jù)可以為重建古地理和地球動力學機制提供依據(jù)。例如,Dean和Bruce(2018)將Laurentia古大陸西緣和北緣發(fā)表的碎屑鋯石數(shù)據(jù),結合GIS地圖的沉積環(huán)境信息、古地理建模和巖漿、變質年代學,以更好地了解該區(qū)的地殼演化。利用從36份出版物中匯編的超過33000個碎屑鋯石U-Th-Pb分析和3000個Lu-Hf分析,從DataView數(shù)據(jù)庫中獲取的69000多個巖漿、變質和冷卻年齡,以及北美各種全巖樣品的初始Nd同位素組成。結合7個地質調查機構的GIS地圖中多邊形信息的沉積環(huán)境,利用古板塊重建模型和Gplates或Paleogis軟件進行數(shù)據(jù)挖掘和古地理呈現(xiàn)。該項數(shù)據(jù)可視化研究展示了使用結構化數(shù)據(jù)系統(tǒng)處理和匯編大量的地球科學數(shù)據(jù)的諸多優(yōu)點,為未來利用多變量和機器學習技術來實現(xiàn)更多的定量評估打下基礎。
在漫長的地質歷史時期中,地球的板塊俯沖樣式隨著地幔溫度的降低發(fā)生過重要的轉變。在地球的早期,其構造樣式以滯留蓋型(Stagnant-lid)垂向構造體制為主,此時的板塊俯沖作用多呈短暫的、間歇性的俯沖(Episodic subduction)樣式。后來,隨著地幔溫度的逐漸降低,板塊俯沖的樣式才轉變成了現(xiàn)在所看到的持續(xù)性的俯沖(Continuous subduction),表現(xiàn)為大洋板塊沿匯聚型板塊邊界持續(xù)性地循環(huán)至地幔中。Liu等(2019)采用統(tǒng)計學手段處理了通過EarthChem Portal獲取的GEOROC、NAVDAT、USGS幾個數(shù)據(jù)庫的全球約55000件基性巖漿巖樣品的地球化學數(shù)據(jù),以全新的方法和視角對這一問題展開了深入研究(圖5)。因為板塊俯沖會將冷的大洋板塊俯沖循環(huán)至熱的地幔中,那么如果板塊俯沖樣式在地質歷史時期的某一時刻從間歇性俯沖轉變?yōu)槌掷m(xù)性俯沖,其中一個重要結果就是會加速地幔的降溫。Liu等(2019)的研究發(fā)現(xiàn),21億年前地球上開始出現(xiàn)大量堿性玄武巖,而堿性玄武巖的大量出現(xiàn)恰恰是地幔溫度快速降低的結果。因此提出,持續(xù)性的板塊俯沖體制開始于21億年前。
圖5 Diff(HFSE)隨時間的變化指示堿性玄武巖在地質歷史中的演化(Liu et al.,2019)Fig.5 EvolutionofalkalibasalticmagmatismthroughoutEarth’s history indicated by Diff(HFSE)(Liu et al.,2019)
科學研究大數(shù)據(jù)在追求數(shù)據(jù)絕對數(shù)量的同時,有時候更強調數(shù)據(jù)的重要性。巖漿巖同位素數(shù)據(jù)盡管遠遠少于一般的常量元素數(shù)據(jù),但是,同位素數(shù)據(jù)在揭示深部物質來源方面無可取代的意義顯示了其數(shù)據(jù)庫的珍貴性與重要性。隨著同位素數(shù)據(jù)的積累,可以開展區(qū)域同位素填圖,揭示區(qū)域性的深部物質組成特征及時空變化,從而為解決地殼生長、大地構造單元劃分、深部動力學過程及區(qū)域成礦制約等重大科學問題提供新的思路和手段。例如,在中亞造山帶通過花崗巖Nd同位素填圖,揭示了深部物質組成特征,構建三維物質組成架構,并探索四維巖石圈架構的演化,從而解決地殼生長重大科學問題(王濤和侯增謙,2018)。在青藏高原碰撞帶通過Hf同位素填圖,揭示了巖石圈物質組成的三維結構和時空演變,為提升區(qū)域成礦規(guī)律認識提供深部物質制約證據(jù),有助于成礦潛力的定量—半定量評級及區(qū)域成礦預測(侯增謙和王濤,2018)。
同位素填圖可以用于研究不同類型(增生、碰撞、復合等)造山帶深部物質組成特征及其異同(Mole et al.,2013;Hou et al.,2015;Yang et al.,2017;Deng et al.,2018)。同位素填圖初步揭示,增生造山帶如中亞造山帶深部發(fā)育很多年輕地殼。例如,阿爾泰Nd同位素填圖顯示近一半是新生(<1.0 Ga)地殼,大興安嶺及鄰區(qū)花崗巖類Nd同位素填圖顯示即新生地殼在60%以上。而對于復合造山帶,如秦嶺和東昆侖復合造山帶Nd-Hf同位素填圖確定的年輕地殼(<1.0 Ga)均<10%~20%,而大別碰撞造山帶花崗巖Nd同位素顯示造山帶主要為古老物質。所以,同位素填圖可以定量—半定量給出不同類型造山帶深部物質組成特征(如年輕地殼與古老地殼比例)的描述。在此基礎上,以中亞造山帶南部巨量顯生宙花崗巖同位素填圖為例,通過花崗巖體的同位素信息提取該區(qū)深部地殼的組成信息,建立同位素??;據(jù)此,圈定深部新、老地殼物質分布范圍,依據(jù)兩者的時空變化,探討地殼深部新老物質組成結構;依據(jù)它們的面積比例估算年輕地殼相對大小及陸殼生長量,從而得出中亞造山帶南部年輕地殼(<1.0 Ga)分布面積>50%,大大高于其它顯生宙造山帶,為估算地殼生長量提供了一個可行思路和有效手段(王濤和侯增謙,2018)。
Mole等(2013)對澳大利亞Yilgarn克拉通的同位素填圖顯示(圖6),其東部Goldfield克拉通由古老(TDM2值為3.0~2.7 Ga,Nd值為-0.2~+3.6)和年輕(模式年齡2.9~2.8 Ga)的塊體混合構成,揭示了新生幔源組分向古老地殼的添加和混入在空間上是不均勻的,但添加量最大地帶處于超級地體偏西側,呈近NS向展布,與高MgO科馬提巖帶空間位置相吻合。Yilgarn克拉通西部由更老的地殼構成,其 TDM2值為 3.3~3.0 Ga,Nd值為-4.0~1.0。具有不同同位素組成的兩個超級地體之間的邊界與Ida超殼斷裂空間位置相吻合,代表了不同的下地殼邊界。表明Yilgarn克拉通由兩個具有不同地殼組成和發(fā)育歷史的“次克拉通”構成,其拼合邊界位于Ida超殼斷裂附近。此外,同位素填圖還示蹤出在Younami地體東部地區(qū)(Machison Domain)一個可能的NE-SW向裂谷,沿其發(fā)生新生地幔組分注入。這種不均勻的克拉通架構控制了礦產的分布。
2.4.1 巖漿巖的自然分布和巖石分類命名
圖6 澳大利亞Yilgarn克拉通花崗巖Sm-Nd同位素填圖(揭示地殼深部物質組成、構造邊界及其對成礦制約;Mole et al.,2013)Fig.6 Sm-Nd isotopic mapping of the granitoids from the Yilgarn craton in Australia(showing compositions in deep crast,tectonic aboundary and its constraints on the metallogenic belt;Mole et al.,2013)
巖漿巖分類是巖石學最基本的問題,是巖石學研究的出發(fā)點,巖石學的基礎。目前在學術界廣泛使用的TAS分類命名方案是IUGS在40年前確定的,已成為學術界的共識,為火山巖分類命名的重要方法。對于火山巖,由于礦物顆粒細小,很難識別,許多是玻璃質的,鏡下很難確定其成分,需要借助巖石化學分析來加以判斷,于是相應的推出了火山巖的TAS分類方案,隨后在火山巖分類的基礎上又提出了侵入巖的TAS分類。上述分類已經得到各國科學家的信賴,成為學術界一致的認識(Cox et al.,1979;Carmichael et al.,1982;都城秋穗和久城育夫,1984;Wilson,1989;Rollison,1993;鄧晉福等,2015)。
最近,張旗等(2019)、葛粲等(2019)和焦守濤等(2019)正在利用數(shù)據(jù)庫的全球數(shù)據(jù)和大數(shù)據(jù)方法探討巖漿巖的自然組合和自然分布問題(圖7a),對TAS分類進行了初步研究,文中討論了TAS分類的初衷、分類的原則及存在的問題,推出了新的TAS分類方案(圖7b)。早先的TAS圖有15個巖區(qū),新方案將其歸并為10個巖區(qū),即正常系列的4個巖區(qū):玄武巖、安山巖、英安巖和流紋巖,建議去掉安山玄武巖和苦橄質玄武巖兩個巖區(qū);粗玄巖系列3個巖區(qū):粗玄巖、粗安巖、粗面巖;堿性巖系列3個巖區(qū):碧玄巖、響巖、堿流巖。不同系列之間的界線依數(shù)據(jù)在TAS圖上的自然分布予以劃分,正常系列與粗玄巖系列的界線在中酸性巖部分大體上與早先的TAS圖的界線吻合,僅玄武巖部分不同于早先的方案。粗玄巖與堿性巖系列的界線則相反,在基性巖部分二者大體與早先的TAS圖的界線相當,不同在酸性巖部分,按照數(shù)據(jù)的分布,很大一塊T區(qū)劃歸了堿性巖系列。
圖7 全球火山巖三個系列數(shù)據(jù)的分布和新的火山巖TAS分類圖解(張旗等,2019)Fig.7 Distribution of three series of global volcanic rocks and new volcanic rock TAS classification diagram
2.4.2 巖漿巖構造環(huán)境判別
巖漿巖的基本理論主要是20世紀20~60年代在全球基性巖研究的成果上建立起來的(Bowen,1928)。在20世紀60~80年代,由于海洋地質學取得的進展及深海鉆探項目的實施,特別是板塊構造理論的建立和不斷完善,使巖漿巖巖石學,尤其是玄武巖理論得到了飛速的發(fā)展?;詭r是巖漿巖巖石學中研究得最詳細的巖石類型,積累的數(shù)據(jù)最多,質量最好,為玄武巖構造環(huán)境的判別方法和標準奠定了理論基礎,繼而又推動了巖石大地構造及地球動力學研究的進展。以Pearce為首的一批學者(Pearce and Cann,1973;Glassley,1974; Pearce,1975,1976; Pearce et al.,1977;Pearce and Norry,1979; Wood,1980; Shervais,1982;Mullen,1983;Pearce et al.,1984;Harris et al.,1986; Meschede,1986; Pearce and Peate,1995; Workmana and Hart,2005; Galoyan et al.,2007)致力于玄武巖構造判別圖的構建,為板塊構造和大陸造山帶研究開辟了新的途徑,極大地豐富了玄武巖的研究內容,并將玄武巖構造環(huán)境研究推向高峰。
但是,到了21世紀初,經過長期的理論與實踐的檢驗,早先的判別圖由于數(shù)據(jù)質量及數(shù)量、研究區(qū)域、研究思路以及研究手段和分析技術的限制,明顯不適應數(shù)據(jù)大量積累帶來的變化,存在一些局限和缺陷。許多學者開始嘗試建立新的效果更好的判別圖(Vermeesch,2006;Li et al.,2015;王金榮等,2016,2017;楊婧等,2016a,b;第鵬飛等,2017,2018;陳萬峰等,2017;劉欣雨等,2017;Jiao et al.,2018)。隨著地質大數(shù)據(jù)的發(fā)展,利用GEOROC和PetDB數(shù)據(jù)庫,采用全數(shù)據(jù)模式,開展全球全體MORB、IAB、OIB數(shù)據(jù)挖掘的嘗試性研究,使得探討元素之間的相關關系成為可能。張旗和周永章(2017)和Zhang等(2019)得出的玄武巖判別圖明顯優(yōu)于早先的判別圖(圖8),且適用性更加廣泛,不排斥蝕變和混染、混合的樣品。劉欣雨等(2017)構造了安山巖的構造環(huán)境判別圖。袁方林等(2019)研究了全球三大構造背景的苦橄巖,提出了苦橄巖構造環(huán)境判別圖,開創(chuàng)了判別圖研究新的一頁,之前學術界沒有一個公認的苦橄巖構造環(huán)境判別圖(Wilson,1989;Pearce et al.,2003)。焦守濤等(2018)、章寶月等(2019)采用機器學習方法對全球輝長巖進行研究,發(fā)現(xiàn)輝長巖也可以識別構造環(huán)境,大大擴展了判別圖研究的領域。
EarthChem、GEOROC等數(shù)據(jù)庫已經清晰地勾勒出了巖石地球化學的“大數(shù)據(jù)”趨勢,未來,在“深時數(shù)字地球”國際大科學計劃的引領和推動下,它們將會進一步融合,形成從陸地到海洋、從地表到地下各巖類全覆蓋的全球巖石地球化學“大數(shù)據(jù)”平臺,離“數(shù)字地球”、“玻璃地球”的目標將更進一步。不同學科和行業(yè)的數(shù)據(jù)積累也都朝著“大數(shù)據(jù)”方向發(fā)展,并且在時間和空間體系內相互關聯(lián),至此地球系統(tǒng)科學的框架將逐漸明朗(余星,2014)。在此基礎上,以大數(shù)據(jù)計算機分析和人工智能為手段,總結發(fā)現(xiàn)新的規(guī)律,進行海量數(shù)據(jù)的深度挖掘和二次開發(fā),結合國內外研究前沿和研究進展,揭示新的規(guī)律和現(xiàn)象,特別是探索未知的地質過程規(guī)律和原理,以期解決地球系統(tǒng)科學的重大問題。結合巖漿巖研究的熱點難點問題和上述巖漿巖數(shù)據(jù)驅動的代表性研究探索,未來“深時數(shù)字地球”大科學計劃巖漿巖領域的關鍵科學問題擬聚焦于四維地球(深部)圈層物質構成、交換與動力學,重點攻關地球(深部)物質演變規(guī)律。具體的研究方向可參考以下幾個方面。
大陸地殼的生長與否可以通過研究花崗巖的物質來源方式探討是否具有新生地幔物質輸入地殼、輸入多少、過程等進行判斷。在區(qū)域乃至全球尺度上,應用花崗巖同位素大數(shù)據(jù),反演地幔物質輸入地殼的多少以及改造地殼的程度,進而綜合分析研究大陸地殼的形成和演化過程。通過花崗巖巖性和地球化學大數(shù)據(jù)的綜合研究,可以推算出幔源巖漿的比例,進而對大陸地殼生長情況提供制約。進一步通過花崗巖的形成時間和成因機制的研究,研究大陸地殼的增生和穩(wěn)定過程。通過大數(shù)據(jù)分析,探索地球四十多億年以來,地殼生長演化規(guī)律,地殼物質的演變規(guī)律。
圖8 新玄武巖構造環(huán)境判別圖(Zhang et al.,2019)Fig.8 Discrimination diagrams for tectonic settings of basalts(Zhang et al.,2019)
通過巖漿巖探針與同位素物源示蹤進行深部物質探測,是深部探測的重要途徑。來自深部、穿越圈層的巖漿巖攜帶有從地幔到地殼不同圈層深部物質信息,深入、系統(tǒng)研究不同圈層和深度層次起源的巖漿巖及其巖石在區(qū)域上的展布,可以揭示地幔-地殼源區(qū)物質的性質、相互作用及其演化,重塑殼幔三維甚至四維物質結構。對于整個地球系統(tǒng)尺度、造山帶尺度及區(qū)域尺度的深部物質結構與演變問題,則需要分析海量深部信息數(shù)據(jù)的時空變化規(guī)律。在大數(shù)據(jù)和人工智能的驅動下,研究全巖元素Sr、Nd、Pb及鋯石Hf、O等各種同位素,以及Mg、Fe、Ti、Zn等新興同位素示蹤結果的關聯(lián)性及其影響因素,輔以大數(shù)據(jù)時空化即填圖的手段,探索深部物質性質、時空分布、三維架構、巖石圈熱-化學組分及其演變過程。
巖石圈尺度的深部地質過程控制著大型成礦系統(tǒng)的形成發(fā)育和空間分布。應用巖漿巖數(shù)據(jù)庫進行成礦相關的大數(shù)據(jù)研究,在區(qū)域尺度上,揭示造山帶大陸生長架構與成礦系統(tǒng)發(fā)育機制;在礦區(qū)尺度上,探索不同成礦系統(tǒng)與巖石學指示標志的相關性,例如巖漿巖Eu/Eu*、(Ce/Nd)/Y等參數(shù)變化?;诖髷?shù)據(jù)探討哪些礦床受哪些條件的控制,各條件對這些礦床的控制程度如何?哪些區(qū)域與哪些已知礦床相似,相似程度如何?從大數(shù)據(jù)的角度重新認識全球大陸格架及礦產分布規(guī)律,由此開創(chuàng)出一條礦床學研究的新路徑,應用大數(shù)據(jù)和人工智能方法定量、精確地研究礦床與控礦因素的關系,大幅提高成礦預測的準確程度(王懷濤等,2018;羅建民和張旗,2019)。
通過巖石大數(shù)據(jù)分析,如巨型巖漿巖帶的年代學、物質組成特征等方面的大數(shù)據(jù)綜合研究,并與大地構造研究更緊密結合,可以為探索大陸地殼深部結構、生長演化、匯聚與裂解、地殼增厚減薄等地球動力學方面提供新的巖石學證據(jù)。例如,應用巖漿巖大數(shù)據(jù)隨時間的切片,通過巖性、地球化學、同位素特征隨時間的變化,反映大陸聚合過程,從而恢復不同時期的古地理面貌。另外,通過巖漿巖數(shù)據(jù)集成分析,揭示巨量巖漿時空演化和穿越圈層的物質交換作用,進一步分析超大陸聚散規(guī)律,特別是超大陸循環(huán)的規(guī)律,深入探索地球深部動力學過程。
早在20世紀60、70年代,最初的巖漿巖數(shù)據(jù)庫建立很大程度上是由于巖石分類命名的需要,并且在當時巖漿巖特別是火山巖的分類命名中發(fā)揮了重要作用(李兆鼎,1984;尚如相,1999)。隨后,巖漿巖判別圖是板塊構造興起后一個重要的科學發(fā)現(xiàn),依據(jù)大洋中脊、島弧、洋島三類構造背景明顯不同的玄武巖的源區(qū)組成,從巖漿巖理論的深度出發(fā),結合典型地區(qū)的研究實例,提出了許多玄武巖構造環(huán)境判別圖(Pearce and Cann,1973; Glassley,1974; Pearce,1975,1976,1982,1983,2003;Pearce et al.,1977;Pearce and Norry,1979)。然而,隨著數(shù)據(jù)量的累積和研究的深入,傳統(tǒng)的巖石分類命名方案和判別圖理論方法由于數(shù)據(jù)質量及數(shù)量、研究區(qū)域、研究思路以及研究手段和分析技術的限制,存在一些局限和缺陷。近年來,大數(shù)據(jù)的到來輔以人工智能方法,可方便挖掘多種元素,元素之間的關系(如比值等)乃至礦物的成分等大量的變量與成因環(huán)境的相關關系,許多新的分類方案和構造環(huán)境判別圖被提出(Vermeesch,2006;Li et al.,2015;王金榮等,2016,2017;楊婧等,2016a,b;第鵬飛等,2017,2018;陳萬峰等,2017;劉欣雨等,2017;張旗和周永章,2017;Jiao et al.,2018)。研究發(fā)現(xiàn)不同構造環(huán)境的樣品,包括初始巖漿以及經過演化的巖漿及其堆晶巖、礦物,均不同程度保留了原構造環(huán)境的基因信息(焦守濤等,2018;韓帥等,2018;杜雪亮等,2018;李玉瓊等,2018),查明上述環(huán)境不同的基因信息,即可判別不同的構造環(huán)境。通過地質大數(shù)據(jù)的研究是有意義的,但是,對巖漿巖分類和判別圖的理論、方法,仍需進行深入的研究。未來,在“深時數(shù)字地球”大科學計劃的推動下,更多的數(shù)據(jù)積累和更深入的分析挖掘將會展示出令人期待的結果。同時,對這些結果揭示出的新問題開展深入研究,也將推進巖漿巖理論研究的進步,促進巖石大地構造學、巖石地球化學及板塊構造理論的發(fā)展。
此外,隨著研究的不斷開展,巖漿巖大數(shù)據(jù)驅動的人工智能研究更讓人期待的是,一定還會揭示出許多之前從沒有見過提到過的新問題,其中有些是早先的研究沒有涉及的、值得進一步探索的科學問題。
通過調研發(fā)現(xiàn)目前巖漿巖方面已存在PetDB、GEOROC、DataView、美國地質調查局巖石地球化學數(shù)據(jù)庫等一批優(yōu)秀的巖漿巖相關數(shù)據(jù)庫;同時,像EarthChem這樣理念架構完整先進的綜合數(shù)據(jù)管理平臺在此基礎上發(fā)展起來,開發(fā)出了EarthChem Portal這樣跨多個主流數(shù)據(jù)庫的在線查詢和簡單可視化分析工具,正在推動巖漿巖相關的科學研究。
依托這些巖漿巖數(shù)據(jù)庫,許多學者開展了數(shù)據(jù)驅動的針對關鍵科學問題的研究探索,如:大數(shù)據(jù)揭示超大陸聚散、循環(huán)和動力學機制,巖漿巖大數(shù)據(jù)揭示板塊俯沖樣式轉變,同位素數(shù)據(jù)揭示深部物質結構與地殼生長,大數(shù)據(jù)和人工智能探索巖漿巖的自然分布、巖石命名分類和大地構造環(huán)境識別等。
隨著大數(shù)據(jù)和人工智能時代的飛速發(fā)展,巖漿巖相關數(shù)據(jù)庫面臨新的挑戰(zhàn),亟須在現(xiàn)有基礎上進一步發(fā)展、融合,建立開放、共享、統(tǒng)一的大數(shù)據(jù)平臺,整合各學科基礎數(shù)據(jù)開展全球協(xié)作,這也是“深時數(shù)字地球”計劃提出的背景和目標。未來,在海量數(shù)據(jù)和全球協(xié)作平臺的支持下,以大數(shù)據(jù)計算機分析和人工智能為手段,進行深度挖掘和二次開發(fā),結合國內外研究前沿和進展,揭示新的規(guī)律和現(xiàn)象,特別是探索未知的地質過程規(guī)律和原理,以期解決地球系統(tǒng)科學的重大問題。在巖漿巖領域,我們建議聚焦于四維地球(深部)圈層物質構成、交換與動力學,重點攻關地球(深部)物質演變規(guī)律。研究方向包括地殼的起源與生長演化規(guī)律,地球深部物質組成三維架構與演變,巖漿演化、超大陸聚散及深部動力學,巖漿巖分類與構造環(huán)境等。
致謝:感謝DDE專輯特邀主編樊雋軒教授和史宇坤副教授對本文的支持和建議。感謝兩位匿名審稿人的仔細修改和建設性意見。