劉春國 李正媛 呂品姬 葉青張素琴 韋進 唐磊
1)中國地震臺網(wǎng)中心,北京市西城區(qū)三里河南橫街5號 100045
2)中國地震局地震研究所,武漢 43007
3)中國地震局地球物理研究所,北京 100081
4)中國地震局地殼應力研究所,北京 100085
“十五”數(shù)字地震觀測網(wǎng)絡項目完成后,地震前兆臺網(wǎng)已發(fā)展成為以數(shù)字化觀測為主、人工及模擬觀測為輔的大臺網(wǎng)。數(shù)字化觀測手段包括水位、水溫、氣氡、氣汞、氦氣、地傾斜、地應變、重力、地磁、地電阻率、地電場等十幾種,采樣間隔為秒、分鐘或小時。目前,基于地震行業(yè)網(wǎng)絡的前兆臺網(wǎng)技術系統(tǒng)已建成,通過該系統(tǒng),數(shù)字化觀測數(shù)據(jù)每天準實時從臺站、區(qū)域中心自動匯集到國家前兆臺網(wǎng)中心前兆數(shù)據(jù)庫,數(shù)據(jù)量達1.1GB/天。
前兆觀測技術系統(tǒng)的自動化、網(wǎng)絡化要求臺網(wǎng)管理工作自動化、高效化,還要求各區(qū)域前兆臺網(wǎng)中心、各學科臺網(wǎng)中心和國家臺網(wǎng)中心的臺網(wǎng)管理人員快速掌握臺網(wǎng)數(shù)據(jù)的質量狀況,以便及時捕捉臺網(wǎng)運行問題并作出快速反應,快速根據(jù)質量的優(yōu)劣對觀測數(shù)據(jù)進行分級服務。
目前,了解數(shù)據(jù)質量情況的唯一渠道是各學科每月、每年開展的觀測資料質量評比工作。盡管各學科的每個測項各自都有一套完整的評價指標,但直接采用該評價體系存在3個方面的問題:
(1)學科評比標準中的評比對象為具體的某個臺站的某個測項,缺少包括多學科、多測項的臺網(wǎng)綜合質量評價方法。
(2)評比時間較長,無法實現(xiàn)快速評價,即現(xiàn)有評價指標包括定量、半定量和定性等3種指標,其中,半定量、定性指標占比較大,完成1個中等大小的臺網(wǎng)(如有70套左右觀測儀器的湖北臺網(wǎng))的月評比至少需要3天,年評比時間則更長。
(3)學科評比的結果是對數(shù)據(jù)質量(包括觀測數(shù)據(jù)的連續(xù)性和有效性、噪聲水平、觀測精度、動態(tài)波形等)、運行維護、數(shù)據(jù)預處理與分析、產出應用等4個方面的綜合反映,不同學科的數(shù)據(jù)質量分值占測項評比總分的比例差異較大,如年評比中水位數(shù)據(jù)質量分值所占比例為75%,而地電阻率數(shù)據(jù)質量分值則占60%。
為了能對整個前兆臺網(wǎng)的數(shù)據(jù)質量進行快速而科學的評價,需要研究1套新的評價指標和臺網(wǎng)數(shù)據(jù)質量評價方法。該方法的評價對象限定為觀測數(shù)據(jù),評價指標從各學科已有的、成熟的數(shù)據(jù)質量指標(表1)中選取,對于定量化程度較低的運行維護、數(shù)據(jù)預處理與分析、產出應用等方面的指標,其優(yōu)劣最終都會不同程度地體現(xiàn)在數(shù)據(jù)質量上,故不再作為指標引入。在對前兆臺網(wǎng)數(shù)據(jù)質量進行評價時須均衡考慮各學科、各測項數(shù)據(jù)質量分值所占的比例。
表1 現(xiàn)有學科評比辦法中數(shù)字化測項數(shù)據(jù)質量指標
對于服務于地震預測的前兆臺網(wǎng)而言,數(shù)據(jù)質量優(yōu)秀的基本標準是觀測數(shù)據(jù)能真實反映觀測量,動態(tài)變化背景清晰,具有記錄到地震、構造活動或其他地球物理事件的能力。因此要求數(shù)據(jù)質量指標應能滿足觀測數(shù)據(jù)的連續(xù)性或完整性、動態(tài)穩(wěn)定與噪聲水平、觀測精度等方面的評價需求,此外,為了實現(xiàn)快速評價,最好能夠根據(jù)前兆數(shù)據(jù)庫已存儲信息快速自動計算。
收集地下流體、形變、電磁學科的觀測資料評比辦法①中國地震局監(jiān)測預報司,2015,地殼形變學科、電磁學科、地下流體學科觀測資料質量評比辦法,從中提取數(shù)字化觀測項目(水位、水溫、氣氡、氣汞、氦氣、擺式傾斜(包括水平擺、垂直擺和鉆孔傾斜等)、水管傾斜、洞體應變、體應變、分量應變、重力、地磁、地電阻率、地電場等共計14種觀測手段)的所有數(shù)據(jù)質量指標(表 1)。
通過對表1質量指標的評價內容及其計算方法進行分析,對以下情形進行了處理:
(1)對部分指標進行了取舍
水位動態(tài)變化特征指標中標準差與水位M2波觀測精度之間存在矛盾,水位M2觀測精度反映了水位潮汐與體應變理論固體潮的相對誤差,基本能評價水位動態(tài)變化的噪聲水平,故不再采用標準差這一動態(tài)變化特征指標。地電阻率、地電場的連續(xù)率與完整率指標均是對數(shù)據(jù)連續(xù)性的評價,完整率是有效數(shù)據(jù)占應產出數(shù)據(jù)的比例,反映有效數(shù)據(jù)的連續(xù)性;而連續(xù)率則是儀器產出數(shù)據(jù)占應產出數(shù)據(jù)的比例,反映觀測系統(tǒng)產出數(shù)據(jù)的能力,從數(shù)據(jù)應用的角度及現(xiàn)有觀測技術水平來看,完整率更實用,故舍棄連續(xù)率指標。
(2)對實質相同而命名不同的指標進行了名稱統(tǒng)一
潮汐因子相對中誤差:在水位評比辦法中稱為觀測精度,規(guī)范名稱為潮汐因子相對中誤差。
潮汐因子中誤差:在重力評價辦法中稱為調和分析精度,在形變評比辦法中稱為潮汐因子均方誤差,統(tǒng)一規(guī)范名稱為潮汐因子中誤差。
(3)對一些指標籠統(tǒng)的名稱規(guī)范為與評價方法相關的名稱
水溫的動態(tài)變化特征指標規(guī)范命名為標準差,而氣氡、氣汞的動態(tài)變化特征指標規(guī)范命名為相對標準差;水溫、氣氡、氣汞等的內在質量指標均重新命名為超差數(shù)。
傾斜的相對噪聲水平即變形監(jiān)測數(shù)據(jù)常用的質量檢驗方法——均方連差(岳建平等,2010)規(guī)范為均方連差;地電阻率觀測精度規(guī)范為月相對標準差。
經(jīng)過篩選與規(guī)范,共有14個數(shù)據(jù)質量指標成為前兆臺網(wǎng)數(shù)字化測項的數(shù)據(jù)質量評價指標,指標分值仍采用學科評比辦法中的相應指標分值(表2)。
表2 用于臺網(wǎng)數(shù)字化觀測數(shù)據(jù)質量評價的指標及其分值
根據(jù)評價內容、方法的不同,這14個指標又可分為數(shù)據(jù)完整性、噪聲水平、固體潮汐參數(shù)、一致性檢驗指標等4類。
數(shù)據(jù)完整性指標是數(shù)據(jù)質量評價最為基礎的一項指標。完整率為儀器產出的有用數(shù)據(jù)總數(shù)與儀器應產出的數(shù)據(jù)總數(shù)之比,反映儀器運行狀態(tài)及產出數(shù)據(jù)的可用情況。有用數(shù)據(jù)可被認為是原始觀測數(shù)據(jù)按照各學科預處理標準預處理后的非空預處理數(shù)據(jù)。
噪聲水平指標與觀測環(huán)境、觀測系統(tǒng)噪聲水平等直接關聯(lián),主要反映數(shù)據(jù)動態(tài)變化的穩(wěn)定性水平。這類指標的計算主要基于統(tǒng)計學的均值、標準差等方法,包括了地下流體學科常用的標準差、相對標準差、超差數(shù),地電采用的月相對標準差,形變采用的均方連差和地磁的背景噪聲等指標。
1.2.1 地下流體的標準差、相對標準差和超差數(shù)
標準差、相對標準差、超差數(shù)等被地下流體學科用來評價觀測數(shù)據(jù)的噪聲水平和內在質量水平。相對標準差與標準差均是通過數(shù)據(jù)的離散度來評價噪聲水平的,其值越小,動態(tài)變化越穩(wěn)定,兩者不同的是相對標準差消除了觀測值大小對標準差的影響,適用于動態(tài)變化起伏較大的化學量如氣氡、氣汞觀測數(shù)據(jù)的噪聲水平評價(中國地震局監(jiān)測預報司,2002b)。
假定觀測數(shù)據(jù)序列為{xi,i=1,2,3…n},序列的均值為 u。首先對觀測數(shù)據(jù)序列進行消除趨勢處理,考慮到地下流體測項動態(tài)變化的復雜性,一般采用移動平均法消除趨勢(周克昌等,2011)。消除趨勢后的數(shù)據(jù)序列為{yi,i=1,2,3…n},其均值為 v,則標準差 σ、相對標準差δ的計算方法為
超差數(shù)為超過k倍標準差的超差次數(shù),一般k為3。超差數(shù)越大,數(shù)據(jù)突變(突跳、臺階)越多,噪聲水平越差。滿足超差的條件為yi-v>kσ或 yi-v<-kσ (2)
1.2.2 地電阻率的相對標準差
相對標準差用來評價地電阻率觀測的噪聲水平。每天每個測道的小時相對標準差的日平均值為日相對標準差,每月所有測道日相對標準差的平均值為月相對標準差kσn,計算公式為
其中,N為臺站的測道數(shù);D為當月的天數(shù);H為1天中小時觀測數(shù)據(jù)的個數(shù);(σn)kji為當月第j測道第i天第k小時地電阻率測值的均方差;(ρs)kji為當月第j測道第i天第k小時地電阻率測值。
1.2.3 傾斜應變的均方連差
利用日均值消除潮汐變化后的均方連差法來評價傾斜、洞體應變等測項的觀測數(shù)據(jù)非潮汐部分的噪聲水平(中國地震局監(jiān)測預報司,2002a)。與流體的標準差類似,均方連差越小,表示測項觀測數(shù)據(jù)的非潮汐部分噪聲水平越低。假定觀測數(shù)據(jù)日均值序列{yi}的均方連差為q2,計算公式為
其中,N為計算天數(shù)(≥90(即3個月))。
1.2.4 地磁的背景噪聲
背景噪聲主要用來評價地磁相對觀測各要素(F、Z、H、D)的噪聲水平。若背景噪聲值處于較低水平,則說明觀測質量較好(中國地震局監(jiān)測預報司,2002c;閆計明等,2013)。以月尺度的背景噪聲計算為例,具體算法如下①:
從地磁臺網(wǎng)的東、南、西、北、中各選擇1個臺站,計算這5個臺站 H分量當月3hr時段的一階差分的標準差,從中選擇相對于這5個臺站標準差均最小的5組3hr時段,認為它們是該月該臺網(wǎng)噪聲最小的時段,將其作為該月背景噪聲計算時段。
某臺站要素k第j組3hr時段內,統(tǒng)計該要素的一階差分絕對值頻次從大到小的序列為{Cikj},對應的一階差分絕對值序列為{Yikj},要素k在第j組3hr時段的噪聲Skj計算公式為
其中,i=1,2,…,m,m為 Cikj依次累計超過 80%的最小累計數(shù);k為 F、Z、H、D要素;j={1,2,3,4,5}。
根據(jù)式(5)計算得到要素k的5個噪聲值,剔除最大值,求平均,即為要素k的月噪聲值。
固體潮汐參數(shù)指標主要用來評價能夠觀測到固體潮汐變化的重力、地傾斜、地應變、地下水位等測項的內在觀測質量,其包括Nakai檢驗百分比、M2潮汐因子、M2潮汐因子中誤差和M2波潮汐因子相對中誤差等4個指標。之所以選擇固體潮汐中的半日波——M2波參與評價,主要是考慮到中國地震監(jiān)測臺網(wǎng)絕大多數(shù)都分布在中緯度地區(qū),而中緯度地區(qū)的M2波振幅最大,具有最大的信噪比(陳華靜,2002)。
(1)Nakai檢驗百分比。該指標主要用于重力學科評價觀測序列固體潮記錄的總體情況,其值為觀測時間序列中與理論固體潮相關性較高、噪聲水平較小的觀測數(shù)據(jù)段所占的比例。對觀測數(shù)據(jù)序列按2天分組,對每組數(shù)據(jù)進行 Nakai檢驗(中國地震局監(jiān)測預報司,2002a),統(tǒng)計中誤差小于2微伽的組數(shù)占總組數(shù)的比例。
(2)M2潮汐因子。該指標主要是地下流體中的水位測項用來評價其固體潮響應幅度的大小,其值為觀測的固體潮M2波振幅與理論固體潮M2波振幅的比值。該值越大,且M2潮汐因子中誤差越小,則內在質量越好。該指標采用Venedikov調和分析方法計算得到(周克昌等,2011)。
(3)M2潮汐因子中誤差。該指標主要用于重力、地傾斜以評價固體潮觀測精度,其值為Venedikov調和分析中每2天1組計算出的觀測固體潮M2振幅與M2理論值振幅之比值序列的標準差。該值越小,觀測精度越好。
(4)M2潮汐因子相對中誤差。該指標主要用于水位、洞體應變和鉆孔應變等,以評價固體潮觀測精度,其值為M2潮汐因子與M2潮汐因子中誤差的比值。該指標與M2潮汐因子中誤差的不同在于,后者消除了潮汐因子值的大小對觀測精度指標的影響。
(5)M2潮汐因子均方差。該指標用于地傾斜,以評價固體潮M2潮汐因子序列的離散程度,也可稱為M2潮汐因子序列的標準差。
1.4.1 四分量應變自檢內精度
根據(jù)四分量應變的校正系數(shù)來檢驗觀測數(shù)據(jù)的可靠性。設si為觀測數(shù)據(jù),Si為實地標定后的結果,{Si=kisi,i=1,2,3,4},ki為各分量的相對校正系數(shù)。當探頭與圍巖的耦合處于理想狀態(tài)時,ki=1。根據(jù)任意2個互相正交方向的測值之和均相等的自檢條件,則有
給定 k1=1,將大量觀測數(shù)據(jù)代入式(6),可計算得到 k2、k3、k3;依次給定 ki為 1,計算其他分量的標定系數(shù),可得到4組 ki(i=1,2,3,4)。對4組 ki取平均值作為最終的標定系數(shù)。ki越接近1,且各相對校正系數(shù)偏差越小,則越反映出探頭與圍巖耦合較好,儀器格值一致可靠(中國地震局監(jiān)測預報司,2002a;邱澤華等,2005;唐磊等,2010;劉琦等,2011)。
1.4.2 地電場相關系數(shù)
采用地電場側向的長、短極距相關系數(shù)檢驗觀測數(shù)據(jù)的可靠性(中國地震局監(jiān)測預報司,2002c)。若地電場相關系數(shù)>0.95,則認為觀測質量較好。地電場月相關系數(shù)R月計算方法如下:
首先,利用該側向的長、短極距每小時測得的分鐘值數(shù)據(jù)計算長極距、短極距測值間的相關系數(shù)R時
式中,E長i為某長極距測道第i個地電場的分鐘觀測數(shù)據(jù);為該測道觀測數(shù)據(jù)的平均值;E短i為短極距測道的第i個地電場的分鐘觀測數(shù)據(jù);為該測道觀測數(shù)據(jù)的平均值;n為計算的每小時分鐘值觀測數(shù)據(jù)的個數(shù)。
然后,計算每天R時的均值、標準差,根據(jù)3倍標準差準則,剔除超出3倍均差的值后再計算平均值作為日相關系數(shù)R日。各測向日相關系數(shù)的平均值即為地電場月相關系數(shù)R月
式中,n為當月天數(shù);R日ij為第i個測向第j天的相關系數(shù);m為側向數(shù)。
1.4.3 地電場差值
用差值判斷地電場同一測向觀測數(shù)據(jù)的變化幅度是否一致,是否存在漂移現(xiàn)象。差值的計算方法為:首先,計算同一方向不同極距或平行方向一段時間內2個測道數(shù)據(jù)的差值
多測向的平均值即為該觀測場地電場的差值。若差值小于1mV/km,則觀測質量較好。
其中,Xi,Yi分別為2個測道的觀測值;X0,Y0分別為2個測道的午夜平均值;n為時間段內數(shù)據(jù)個數(shù)。
采用上述數(shù)據(jù)質量指標,參照學科相應指標的評分標準(表2),即可計算某臺站某測項的數(shù)據(jù)質量得分。臺網(wǎng)質量評價的基本思路為:首先將臺網(wǎng)中數(shù)據(jù)質量滿分各不相同的所有臺站所有測項的得分進行規(guī)范化處理,然后采用多測項、多學科加權平均方法來評價某個區(qū)域臺網(wǎng)、某個學科臺網(wǎng)或全國臺網(wǎng)整體的數(shù)據(jù)質量。以區(qū)域前兆臺網(wǎng)質量評價為例,具體方法如下:
(1)計算參與評價的所有臺站所有測項的數(shù)據(jù)質量指標及其得分。設臺站i測項j的數(shù)據(jù)質量指標為 α1、α2、α3…αm,根據(jù)學科評比辦法的評分標準計算指標得分 β1、β2、β3…βm,指標得分之和即為該臺站該測項的數(shù)據(jù)質量得分Sji。
(2)采用最大-最小值規(guī)范化方法對所有臺站的數(shù)據(jù)質量得分進行處理(李愛國等,2012)。假若所有測項的數(shù)據(jù)質量分的規(guī)范值為γmin、γmax,某測項j的質量得分最小值、最大值為 Sjmin、Sjmax,則某臺站i某測項j的數(shù)據(jù)質量分Sji的規(guī)范化值 Gji可表示為
(3)計算臺網(wǎng)中每個測項數(shù)據(jù)質量規(guī)范化結果的平均值,將其作為臺網(wǎng)該測項的數(shù)據(jù)質量得分。假設臺網(wǎng)中第j測項共計有n個臺站,則第j測項的質量得分Tj可表示為
(4)按照地下流體(包括水位、水溫、氣氡、氣汞和氦氣等)、形變(包括擺式傾斜、水管傾斜、洞體應變、體應變、分量應變和重力等)、電磁(包括地磁、地電阻率和地電場等)等3個學科,分別計算臺網(wǎng)的學科得分 δi(i=1,2,3)。假設臺網(wǎng)中共計有 m類流體測項(C1,C2,C3,…Cm),每類測項對應的臺站數(shù)量分別為 D1、D2、D3、…Dm,則流體學科的得分 δ1為
(5)根據(jù)學科的得分,計算臺網(wǎng)數(shù)據(jù)質量得分ξ。假定臺網(wǎng)的流體、形變、電磁等臺站的數(shù)量分別為 B1、B2、B3,臺網(wǎng)的流體、形變、電磁等學科的質量得分分別為 δ1、δ2、δ3,則
采用上述方法,對2013年我國30個區(qū)域臺網(wǎng)(共計1428套數(shù)字化儀器)進行了評價。
首先,對30個臺網(wǎng)2013年全年的數(shù)字化觀測數(shù)據(jù)的預處理數(shù)據(jù)進行審核,對審核時發(fā)現(xiàn)的預處理數(shù)據(jù)中的錯誤數(shù)據(jù)、故障數(shù)據(jù)等問題數(shù)據(jù)再次進行剔除、改正等預處理,以保證參與評價的數(shù)據(jù)均為可用的觀測數(shù)據(jù)。
利用前兆數(shù)據(jù)質量評價軟件,計算參加評價的所有測項的數(shù)據(jù)質量指標及其得分。對計算結果采用動態(tài)曲線法進行復核。復核結果顯示,對于有著明顯的檢驗參照物的測項,采用與參照物相關的質量指標(如傾斜、形變、重力、水位的固體潮參數(shù)等)來進行質量評價,評價結果基本準確,而對于氣氡、氣汞和地電場等其它測項,評價結果的正確率為90%~95%。以氣氡為例,共計84個觀測站的氣氡測項參與評價,其中8個質量評價為優(yōu)的觀測站,實際上由于觀測裝置設計的缺陷或受干擾因素的影響,質量應為中或差,除此之外,評價結果均準確,正確率為90.5%。
經(jīng)過復核改正后,數(shù)字化測項中重力測項優(yōu)秀率最高,為100%,其次為地磁、水管傾斜、洞體應變和水溫等測項,優(yōu)秀率較低的測項為地電場和氣汞(圖1)。全國前兆臺網(wǎng)質量優(yōu)秀率為80.7%,與各學科質量監(jiān)控結果基本一致。其中,地電場測項因環(huán)境干擾較普遍,故優(yōu)秀率較低;氣汞測項則由于儀器老化、故障率較高而觀測質量較差。
圖1 2013年各數(shù)字化測項數(shù)據(jù)質量優(yōu)秀率
在分值規(guī)范化時,測項質量得分的最大值、最小值取自該測項全國所有臺站而不是某個區(qū)域臺網(wǎng)的臺站。考慮到各測項質量評價結果的最大值一般為滿分,而最小值之間卻存在明顯差異。為了縮小差異,通常將所有測項的質量得分規(guī)范至(50,100),根據(jù)各學科儀器占臺網(wǎng)的比例進行加權平均,計算得到各區(qū)域臺網(wǎng)數(shù)據(jù)質量得分,結果如圖2曲線a所示。這種對質量得分的處理方法與簡單地按照100分折算的方法(圖2曲線b)相比,各臺網(wǎng)的評價結果相差不大。評價結果顯示,30個區(qū)域臺網(wǎng)數(shù)據(jù)質量得分均大于85分,其中,83%的區(qū)域臺網(wǎng)質量得分不小于90分。
此外,在實際評比中,為了各學科的均衡發(fā)展,在計算得到各區(qū)域臺網(wǎng)各學科的得分后,綜合臺網(wǎng)質量得分時采用了“三分天下”的計算方法,即地下流體、形變、地磁等3大學科的得分權重均為1/3。經(jīng)過這些處理后,評價的得分值只能作為參考,而排名則更具實際意義,它反映了該區(qū)域臺網(wǎng)整體的觀測數(shù)據(jù)質量水平在全國所處的位置。
圖2 2013年各區(qū)域地震前兆臺網(wǎng)數(shù)據(jù)質量評價結果
本文在現(xiàn)有學科評比辦法的基礎上,研究獲得了一套相對較完整的前兆臺網(wǎng)數(shù)字化測項數(shù)據(jù)質量評價方法。利用該方法對2013年我國區(qū)域前兆臺網(wǎng)數(shù)字化數(shù)據(jù)質量進行了快速評價。評價結果顯示,測項的質量評價正確率大于90%。數(shù)據(jù)質量指標得分經(jīng)復核后,對臺網(wǎng)的評價結果基本能反映臺網(wǎng)的數(shù)據(jù)質量實際狀況。該方法已應用在全國區(qū)域前兆臺網(wǎng)質量評比工作中,為實現(xiàn)我國前兆臺網(wǎng)數(shù)據(jù)質量的快速評估、質量分級分類打下了基礎。
前兆臺網(wǎng)數(shù)字化測項觀測質量評價方法是近年來隨著數(shù)字化觀測技術的發(fā)展而提出的新研究課題。目前的研究還處于起步階段,尚存在一些問題,如某些測項評價指標不全、測項之間同類指標評分差異較大;普遍缺少環(huán)境干擾、背景動態(tài)等評價指標,在完成了自動計算后,還需要結合動態(tài)波形來復核結果以保證結果的正確性等。今后還需要通過重新評估現(xiàn)有的學科數(shù)據(jù)質量指標,統(tǒng)一各測項各類指標的評分標準,增加反映環(huán)境干擾程度、背景動態(tài)等的量化指標,才有可能建立一套完備的、相對科學的臺網(wǎng)質量評價方法。
致謝:感謝劉耀煒研究員、杜學彬研究員、陳志遙研究員、楊冬梅研究員等在數(shù)據(jù)質量評價方法研究過程中提供的幫助,感謝評審專家在完善論文方面提出的意見和建議。