喻思羽
(長江大學地球科學學院 湖北 武漢 430100)
地質統(tǒng)計學提出于20 世紀50~60 年代,起初用于南非金礦儲層預測。地質統(tǒng)計方法論是一種建立在空間自相關性分析基礎上的空間插值方法體系。使用地質統(tǒng)計學方法可以得到最優(yōu)無偏估計量的插值模型,與傳統(tǒng)的各類樣條函數(shù)插值法和反距離加權插值法相比,地質統(tǒng)計模型不僅能有效表達空間變量的分布特點,而且可以量化評估結果誤差及不確定性,因此地質統(tǒng)計方法廣泛應用于地質、石油、固體礦產(chǎn)等地下資源勘查領域,而且在環(huán)境保護、衛(wèi)星遙感、地下水資源、農(nóng)業(yè)、現(xiàn)代商業(yè)等其他領域也取得了豐碩成果。
為了讓學生更容易理解變差函數(shù)概念,本文深入淺出地從傳統(tǒng)統(tǒng)計學過渡到變差函數(shù),著重講解其物理意義及其特點,以多個實例演示不同空間結構模型的變差函數(shù)形態(tài),讓學生掌握變差函數(shù)的本質。本文首先從傳統(tǒng)變量與區(qū)域化變量的異同點入手,由傳統(tǒng)的雙變量相關性引入到空間單變量的自相關性,然后再由空間自相關性過渡到變差函數(shù)的概念及其物理意義,最后講解理論變差函數(shù)模型的參數(shù)意義和不同空間結構的變差函數(shù)曲線特征,為學生使用變差函數(shù)分析地質特征打下基礎。
地質統(tǒng)計學的研究對象稱為區(qū)域化變量,這種變量與傳統(tǒng)統(tǒng)計變量的不同之處在于,區(qū)域化變量是一種分布在空間區(qū)域中的變量,并且具有一定結構性和隨機性。區(qū)域化變量在現(xiàn)實中經(jīng)常遇見,例如氣溫、降雨量、儲層地質體的物性參數(shù)等??臻g數(shù)據(jù)采樣具有局限性——某個位置只能采樣一次,無法通過對某個位置進行大量采樣獲取該點的統(tǒng)計量(均值、方差等)。地質統(tǒng)計學重點集中于區(qū)域化變量的空間自相關性。以例子簡單闡述傳統(tǒng)變量的相關性以及與區(qū)域化變量的自相關性的區(qū)別。假如有一個小賣部,我們記錄N 天的雪糕銷量與當天氣溫的數(shù)值,得到了如圖1(p59)的一組數(shù)據(jù),并建立銷量與氣溫兩個變量的映射關系,對數(shù)據(jù)進行可視化(圖2,p59),其中圖2[a]是對銷量與氣溫的歸一化曲線圖,每天統(tǒng)計的兩個變量大致具有規(guī)律:當一個變量增加時,另外一個變量也增加,反之亦然,反映了兩個變量具有一定的相關性。為了定量計算兩個變量的相關性,建立如圖2[b]的變量映射散點圖,該圖中每個點的X 軸代表氣溫變量(歸一化數(shù)據(jù)),Y 軸代表銷量變量(歸一化數(shù)據(jù)),將每個點投影到45 度對角線上,可以統(tǒng)計得到當前日期的兩個變量相關性值,很明顯當點偏離對角線距離越遠,說明該點將拉低兩個變量的相關性,反之將提高相關性。
圖1 某小賣部的雪糕銷量(元)與當天的氣溫(攝氏度)
圖2 氣溫(度)與雪糕銷量(元)的相關程度
協(xié)方差是衡量兩個變量的相關性常用指標,協(xié)方差計算公式如下:
基于協(xié)方差對“氣溫與銷量”的關系分析可知兩個變量在變化過程中是同方向變化,還是反方向變化,以及同向或反向變化的程度。例如氣溫與銷量的關系,氣溫升高,銷量也隨之增加,說明這兩個變量是同向變化的,則協(xié)方差為正,否則兩個變量的協(xié)方差為負。
以上是傳統(tǒng)變量的相關性分析方法,在地質統(tǒng)計學中,通常研究的對象稱之為區(qū)域化變量,屬于隨機場的范疇。為了便于描述,下面以一維隨機過程為例講解如何計算區(qū)域化變量的相關性,進而引出變差函數(shù)的概念。如圖3 所示是一個一維隨機過程,隨機變量Z隨著時間t 隨機波動。為了計算時間間隔為△t 的兩個時間點的變量Z(t)與Z(t+△t)之間的相關性,需要從隨機過程f 中提取若干個間隔△t 的點對。如圖3 所示,t1 和t1+△t 屬于一個點對,t2和t2+△t 屬于一個點對。注意這里計算內容稱為單個變量的自相關性,即變量Z隨著時間t 變化的自相關性,而不是兩個變量的相關性,此時如果把橫軸的時間改為空間位置或者距離,計算結果就變換為空間自相關性了。如圖4所示,得到間距△t 的點對映射。此時將變量Z(t)與Z(t+△t)作為兩個不同的變量,基于傳統(tǒng)變量的協(xié)方差計算公式即統(tǒng)計間距△t 的點對相關性值,即變量t 的自相關性。
圖3 隨機過程中間距為△x
圖4 某小賣部的雪糕銷量與當天的氣溫
傳統(tǒng)地質統(tǒng)計學是以空間兩點相關性,以變差函數(shù)為工具完成空間相關性分析,進而進行未采樣區(qū)域的預測。1965 年法國統(tǒng)計學家Matheron 提出基于距估計的變差函數(shù),定義為在相距h(稱為滯后距,屬于矢量)的區(qū)域化變量Z(x)與Z(x+h)增量的方差之半,計算公式定義為
其中x 是采樣點的位置,變差函數(shù)反映了區(qū)域化變量的空間結構性,用于評價區(qū)域化變量在某個方向某個距離的變化程度。實驗變差函數(shù)是指應用觀測值計算的變差函數(shù),計算公式如下
其中是空間兩點的位置矢量,N()為點對的總數(shù),和代表兩個點,是區(qū)域化變量。
為了在教學中使學生易于理解變差函數(shù),以下面實例深入淺出地解釋變差函數(shù)的物理意義。如圖5 所示,在研究區(qū)域內有多個采樣數(shù)據(jù)點(實心點表示采樣點,空白位置表示未采樣點)。點與點之間為規(guī)則網(wǎng)格分布,兩個點之間的水平或垂直間距為100 米。
圖5 某區(qū)域內的區(qū)域化變量分布
現(xiàn)計算滯后距等于1(東西方向、間距100 米)的空間兩點相關性。如圖6[a]所示,首先從圖5 中提取滯后距為1 的點對,將所有的點對按照起點值作為橫軸、終止點值作為縱軸投在圖6[b]的散點圖上。根據(jù)公式2 計算圖6[b]中全部點到45 度對角線的距離,統(tǒng)計得到滯后距等于h1的變量Z 增量的方差,即算出該滯后距的變差函數(shù)值。地質統(tǒng)計學理論強調距離相近的觀測值比距離較遠的觀測值更加相似,即方差較?。∕atheron,1963),反之隨著距離增加,區(qū)域化變量的空間自相關性逐漸減小。通過計算不同滯后距的變差函數(shù)值,建立變差函數(shù)值與滯后距h 的函數(shù)關系(圖7),就能算出評價空間相關性的一組特征定量化參數(shù),常用參數(shù)包括變差函數(shù)的塊金值、變程和基臺值。由圖7 可以發(fā)現(xiàn),隨著滯后距的增加,區(qū)域化變量Z 的增量方差首先快速增加,然后逐漸收斂,表明變差函數(shù)值不會無限增加。
圖6 間距h=100 的點對樣本映射關系
圖7 實驗變差函數(shù)
變差函數(shù)曲線能準確表征出區(qū)域化變量的結構性變化規(guī)律,例如地質結構漸變、突變、周期性以及變化幅度都能敏感地投射到變差函數(shù)的曲線波動特征上。以兩組實例展示模型結構的實驗變差函數(shù)特征。圖8(p61)中有3個模型,模型中有兩種相類型,用編碼0 和1 代表,圖8[a1]中以背景相編碼為0,目標相編碼為1 的垂直高度為10 個網(wǎng)格單元,圖8[b1]中以背景相編碼為0,目標相編碼為1的垂直高度為30 個網(wǎng)格單元,圖8[c1]中以背景相編碼為1,目標相編碼為0 的垂直高度為30 個網(wǎng)格單元。圖8[a2]、圖8[b2]和圖8[c2]分別是圖8[a1]、圖8[b1]和圖8[c1]的垂直方向的實驗變差函數(shù),滯后距取值范圍為0~80,同時進行理論變差函數(shù)擬合。觀察模型與對應變差函數(shù)曲線特征可以發(fā)現(xiàn),圖8[a1]的實驗變差函數(shù)在滯后距約為10 網(wǎng)格單元的位置達到第一個轉折點,這與目標相的垂向高度吻合。分析原因為:由實驗變差函數(shù)公式(公式3)可知,該模型的變差函數(shù)值大小取決于垂直方向上相距h 的點對差是否等于1,如果點對的差等于1,則能增加變差函數(shù)公式的分子項,如果點對的差為0,不會增加變差函數(shù)分子項。隨著h 的增加,如果分子項沒有增加,則將降低變差函數(shù)最終結果。因此實驗變差函數(shù)曲線的幾個拐點對應著實驗變差函數(shù)分子項出現(xiàn)變化的位置。因此圖8[a2]中h 達到40 時縱軸值開始下滑,反映了h 大約40 之后,點對的差值等于1 的比例開始快速減少。在圖8[b2]中,曲線的第一個轉折點對應的h 值為30,與圖8[b1]的編碼為1 的相高度一致。值得注意的是,變差函數(shù)的大小只與某個滯后距的點對數(shù)量(實驗變差函數(shù)的分母項)和點對差的絕對值(實驗變差函數(shù)的分子項)有關。因此如果點對數(shù)量相同,點對差絕對值之和越大,則變差函數(shù)越大,互換背景相和目標相的編碼對變差函數(shù)值沒有本質影響,例如圖8[b1]和圖8[c1]中的兩個模型,它們的相編碼進行互換,對應的實驗變差函數(shù)曲線特征(圖8[b2]與圖8[c2])完全一樣。
圖8 三個模型與實驗變差函數(shù),其中a2 是a1 的垂直方向變差函數(shù),b2 是b1 的垂直方向變差函數(shù),c2 是c1 的垂直方面變差函數(shù)
本文針對石油地礦類高校中地質統(tǒng)計學的關鍵概念——變差函數(shù)講授過程較為枯燥和公式化的問題,將變差函數(shù)的基本思想和物理意義作為重點,通過多個實例逐步將變差函數(shù)內涵展現(xiàn)給學生。此外還闡述了變差函數(shù)在地質研究中的作用特點。本文重點輔助地質統(tǒng)計學的入門學習,對變差函數(shù)的各種高級復雜特點不做探討。