張遠飛,袁繼明,朱谷昌,吳德文,李 紅,3
(1.有色金屬礦產地質調查中心,北京 100012;2.桂林礦產地質研究院,桂林 541004;3.中南大學,長沙 408309)
基于遙感數據隨機模型的空間結構分析與蝕變信息提取
張遠飛1,2,袁繼明1,朱谷昌1,吳德文1,李 紅1,3
(1.有色金屬礦產地質調查中心,北京 100012;2.桂林礦產地質研究院,桂林 541004;3.中南大學,長沙 408309)
遙感圖像信號屬于隨機信號,其波段數據直方圖與二維散點圖分別是隨機模型一維、二維概率密度函數的基本估計。從遙感數據的隨機模型出發(fā),討論了一維概率密度的基本類型與形態(tài)、二維高斯分布的橢圓幾何參數特征等。在此基礎上,系統(tǒng)分析了由不同類型直方圖生成的二維散點圖的空間幾何結構特征,以及異常信息空間定位等問題。最后,通過應用實例闡述了遙感數據空間結構分析在蝕變信息提取中的重要性與實用性。
遙感數據;隨機模型;空間結構分析;蝕變信息提取
筆者曾在文獻[1]中較為詳細地討論過遙感蝕變信息檢測中光譜數據點陣空間的幾何結構問題,在文獻[2]中闡述了基于光譜數據點陣空間遙感圖像的背景、干擾與蝕變異常等3個研究對象的定義、相互關系以及它們的復雜度分析等問題,同時給出了干擾因素類型劃分、背景與異常信號子空間估計等的基本準則;另外,還總結了遙感數據在大多數情況下,其二維散點圖的幾何結構具有單橢圓(線性分布形式)與雙橢圓(非線性分布形式)兩種基本類型;并在實際工作中使這些研究結果得到了有效的應用[3,4]。但是,在上述文獻中僅僅給出了遙感數據幾何結構的描述與基本分類,并未涉及兩個波段聯合概率密度的高斯分布為什么是橢圓形態(tài)的數學求證,以及兩個不同波段組合的二維散點圖會出現哪些空間幾何形態(tài)等問題。
遙感圖像信號屬于隨機信號,其反映的物理現象隨空間坐標而變化,屬于典型的隨機過程,可采用概率密度函數作為描述它的隨機模型,而遙感波段數據的直方圖與二維散點圖分別是隨機模型一維、二維概率密度函數的基本估計;另一方面,遙感的多(高)光譜數據是一種多元數據集合,每一個像元代表的是一個波譜矢量。所以,遙感圖像多元數據集合在高維空間中形成一個點陣,這個點陣空間具有一定的幾何結構[5]。本文將重點討論二維點陣空間(即二維散點圖)的幾何結構特征。
從遙感數據的隨機模型出發(fā),討論一維概率密度的基本類型與形態(tài)、二維高斯分布的橢圓幾何參數特征。研究表明,遙感波段數據的概率密度分布同其點陣空間中的幾何結構有密切關系?;谶@個基本前提,系統(tǒng)分析了不同類型二維散點圖的空間幾何結構特征,以及異常信息空間定位問題;并通過應用實例闡述了遙感數據空間結構分析在蝕變信息提取中的重要性與實用性。
眾所周知,一般情況下都假設單波段遙感圖像數據的概率密度為高斯分布,又稱正態(tài)分布,特別是早期的遙感圖像處理方面的研究更是如此假定。正態(tài)隨機變量X的概率密度函數的形式為
式中,μ為隨機變量X的均值;σ2為隨機變量X的方差。
在實際工作中發(fā)現,大量觀察到的遙感圖像直方圖,其形態(tài)與參數大多數都很難符合高斯分布的要求。
近年來,隨著高階統(tǒng)計量的研究,發(fā)現采用偏度(三階中心矩)與峰度(四階統(tǒng)計量)能夠分別度量概率密度的均值對稱度(分左偏分布與右偏分布)與非高斯性。
根據峰度可以把概率密度分布進行分類[6,7]。一般地,具有負峰度的分布屬于亞高斯分布;若峰度為正,則稱為超高斯分布。亞高斯概率密度傾向于比高斯密度分布更平坦或者多峰。典型的超高斯概率密度比高斯概率密度函數具有更尖銳的峰和更長的拖尾。遙感圖像數據不同概率密度分布的實例可參考文獻[1]。
2.1 二維散點圖與二維概率密度分布
二維散點圖又稱二維直方圖,它表示了2幅圖像像元值的組合分布情況[8]。事實上,二維散點圖反映的是2個變量的聯合概率密度分布的幾何形態(tài)。圖1是青海省黃南州吉地地區(qū)TM圖像的TM5與TM7兩個波段的直方圖及其二維散點圖,由于這2個波段基本接近高斯分布,它們的二維散點圖近似于橢圓形態(tài)。
圖1 青海省黃南州吉地地區(qū)TM圖像數據直方圖與二維散點圖Fig.1 The histograms and two - dimensional scatter plots of TM image in Jidi area of Huangnan in Qinghai
實際上,經常見到的2個不同波段遙感數據的二維散點圖會類似于圖1(c)的近似橢圓形態(tài),這種形態(tài)的二維散點圖表明這2個波段的聯合概率密度函數基本服從二元高斯分布。若設變量X1,X2遵從二元高斯分布(又稱二元正態(tài)分布),則其概率密度分布[9]為
式中,μi與σi分別為變量Xi的均值與均方差(i=1,2);r是X1與X2的相關系數。
2.2 二維高斯分布橢圓形態(tài)的數學推導
對于二維概率密度函數,式(2)的二維高斯分布是否存在一個理論橢圓方程?下面采用數學方法加以推導求證。
令A為變量X1、X2的協方差矩陣,其形式為
則推導出式(2)最后的橢圓方程為
圖1(c)給出了二維分布的橢圓形態(tài)及坐標軸由 X1、X2旋轉至 X'1、X'2的示意圖。
2.3 二維高斯分布橢圓幾何參數特征
下面討論式(7)橢圓方程的幾何參數特性,即該橢圓長軸與短軸同X1、X2兩個隨機變量的方差與相關系數的關系。
若令 σ1=aσ2,為不失一般性,這里假設 σ1≥σ2,則有 a≥1,式(7)可變?yōu)?/p>
由于遙感圖像數據的方差大多比較大(一般σ ≥10),所以項可看作近似于0,式(8)可簡化為
由式(9)~(11)可得到如下結論:
(1)在兩個隨機變量均方差較大的情況下,其二維高斯分布所構成的橢圓體的長半軸、短半軸分別同兩個隨機變量的標準方差成正比(呈線性關系),并與兩個變量的相關系數r成反比(呈非線性關系);
(2)當σ1=σ2=1時,橢圓的長半軸同兩個變量的相關系數r成正比,短半軸則與相關系數r成反比;
由上述分析可知,遙感圖像數據的均值、方差、偏度及峰度決定了直方圖(一維概率密度分布)的分布形態(tài)與統(tǒng)計特征,而波段數據直方圖的上述統(tǒng)計特性與波段之間的相關系數又確定了二維散點圖(二維概率密度分布)的空間結構與統(tǒng)計特征。通過分析由不同分布類型的直方圖組合生成的二維散點圖的形態(tài)結構特征,能夠確定異常信息在散點圖上的大致位置。這里的異常信息主要指干擾地物與蝕變信息[2]。
根據前面的分析,遙感圖像直方圖的基本分布包括:高斯分布、亞高斯分布(多峰分布)、左偏超高斯分布和右偏超高斯分布,4種不同直方圖分布的組合共有10種。下面對這10種直方圖組合進行分析。
(1)高斯分布-高斯分布。在一幅圖像中,存在2個都是高斯分布的波段很少,一般只有低空間分辨率的圖像(如MODIS數據)才有可能常出現這種情況,其原因是由于像元混合光譜造成的。中高空間分辨率的圖像出現這種情況比較少。① 若2個波段高度相關,這樣的波段一般只含有背景信息,即2個波段圖像越接近高斯分布,在其生成的二維散點圖上越無法觀測到明顯的異常聚類結構,而且越接近高斯分布的數據,其二維散點圖越細長(例如圖1(c)是由稍有偏度的近高斯分布的圖像生成的二維散點圖);② 當2個波段出現負相關時,其圖像也主要包含背景信息,但其背景“橢圓”主軸呈現負斜率。
(2)亞高斯分布-亞高斯分布。服從亞高斯分布(多峰分布)的波段圖像(圖2(a)、(b)),其信息量是最豐富的,由這種分布的2個波段生成的二維散點圖也是最具結構信息的。① 較低相關(指r<9.80)的2個波段生成的二維散點圖主要反映背景與大干擾的信息;② 高相關(指r≥9.80)的2個波段生成的二維散點圖則能凸顯異常信息(指蝕變信息與小干擾異常)。
不管反映何種類型的信息,其異常“聚類”通常會在二維散點圖橢圓長軸方向的一側或兩側的邊界上(圖2(c))。
圖2 柴達木北緣烏恰地區(qū)Aster圖像B4、B9波段數據直方圖與二維散點圖Fig.2 The histogram s and two - dimensional scatter plots of the band B4 and B9 of Aster image in Wuqia area in the north of Qaidam
(3)左偏超高斯分布-左偏超高斯分布。這種類型分布的圖像異常信息主要在高值區(qū)。① 當2個波段均為左偏分布且形態(tài)與寬窄相近時,即高相關(r≥0.95)的二維散點圖,大多情況下其異?!熬垲悺睍霈F在二維散點圖橢圓長軸方向的右端點上;②若2個波段均為左偏分布,但主峰包含有多峰時,具有較低相關(r<0.95)的二維散點圖,其異?!熬垲悺睍a生分裂,且它們分布在長軸方向端點的兩側;③若2個波段均為左偏分布,但寬窄相差懸殊時,屬于低相關(r<0.90)的二維散點圖,其異?!熬垲悺睍a生“大頭”現象;④ 若2個波段均為左偏分布并伴右側小峰,而且形態(tài)與寬窄不相同的話,屬于較低相關(r<0.95)的二維散點圖,其異?!熬垲悺睍黠@分布在長軸方向橢圓的兩側;⑤若2個波段左偏且寬度相差較大時,其異?!熬垲悺睍蚱却蟮牟ǘ畏较蚱D。
(4)右偏超高斯分布-右偏超高斯分布。該類型分布同左偏超高斯分布-左偏超高斯分布的情況剛好相反,圖像異常信息主要在低值區(qū)。①高相關(r≥0.95)的二維散點圖,其異常信息主要集中在橢圓主軸方向的左端點上;② 低相關(r<0.95)的二維散點圖,其異常信息不僅分布在橢圓方向的左端點上,而且還會出現在橢圓朝向左偏較大波段一側的邊界上;③當右偏形態(tài)還伴有右側小峰時,大多情況下其異?!熬垲悺睍霈F在二維散點圖橢圓長軸方向的兩側的邊界上。
(5)高斯分布-亞高斯分布。暫時未見這種類型的例子。
(6)高斯分布-左偏超高斯分布。這種組合2個波段的相關性一般都較低,二維散點圖的形態(tài)主要取決于左偏超高斯分布之直方圖的左偏程度。它的背景中心位于低值端,異常信息分布在高值端且異常點群形態(tài)偏向于左偏的波段。這種情況的異常信息主要是由大干擾地物引起的。
(7)高斯分布-右偏超高斯分布。暫時未見這種類型的例子。
(8)亞高斯分布-左偏超高斯分布。這種組合類型必然是低相關的2個波段,其散點圖的異常“聚類”是由大干擾信息造成的,異常“聚類”會偏向于左偏的波段。
(9)亞高斯分布-右偏超高斯分布。同亞高斯分布-左偏超高斯分布的情況一樣,這種組合屬于2個低相關的波段,其散點圖的異?!熬垲悺敝饕怯纱蟾蓴_信息造成的,異常“聚類”會偏向于左偏程度大的波段一側。
(10)左偏超高斯分布-右偏超高斯分布。這樣的組合其2個波段通常不會有很高的相關性,而且它們的偏度越大,其相關程度越低。這種情況的二維散點圖主要包含的是背景或大干擾異常信息。①低相關波段組合的二維散點圖,異?!熬垲悺逼蛴谧笃ǘ危膊肯蛴移ǘ蔚牡椭刀搜由?②較高相關(r≥0.90)波段組合的二維散點圖,異?!熬垲悺币财蛴谧笃ǘ?,但右偏波段的低值端的拖尾現象不明顯。
以青海省巴音山地區(qū)的TM圖像為例,闡述遙感數據二維散點圖的空間結構分析過程及其在蝕變信息提取中的應用。
圖3給出了該地區(qū)TM圖像的TM3和TM4兩個波段的直方圖及它們的二維散點圖。TM3波段屬于亞高斯分布(圖3(a)),而TM4波段基本上可看作右偏超高斯分布(圖3(b)),這2個波段屬于“亞高斯分布-右偏超高斯分布”類型(第9種類型)。因此:①它們的相關性不會太高,這里TM3與TM4的相關系數r只有0.74,在遙感波段數據中是比較低的;②散點圖的異常“聚類”主要是由大干擾信息造成的,此例的大干擾為植被信息;③異常“聚類”會偏向于左偏程度大的波段一側。比較2個波段,TM4波段的左偏程度明顯大于TM3波段。所以,這里的植被“聚類”,無論是暗區(qū)植被或是混合區(qū)植被點群,其長軸均偏向于TM4坐標軸一側(圖3(c))。
圖3 巴音山地區(qū)TM3和TM4的直方圖與二維散點圖Fig.3 The histograms and two - dimensional scatter plots of TM 3 and TM 4 in Bayin mountain area
本例中2個波段的直方圖形態(tài)差異很大,且均不是高斯分布,所以它們生成的二維散點圖不是橢圓形態(tài);但散點圖中存在子類橢圓套疊結構特征,各主要地物子類的小橢圓清晰可見(在圖3(c)中可見到的子類地物有荒漠區(qū)、巖石區(qū)、暗區(qū)植被、混合區(qū)植被等)。值得注意的是,根據2個波段直方圖的異常信息區(qū)位置以及蝕變信息的物理意義與地質意義,在圖3(c)的二維散點圖上確定出蝕變信息區(qū)子橢圓(見圖3(c)中的紅色小橢圓);而且,蝕變信息區(qū)子橢圓同其他子類地物小橢圓的邊界清晰,說明經二維散點圖空間結構分析后,該地區(qū)蝕變信息的提取將變得比較容易。
圖4為采用該地區(qū)TM3和TM4波段數據、用筆者自己研發(fā)的二維彩色相關編碼技術提取得到的遙感蝕變異常信息圖像。
圖4 巴音山地區(qū)遙感蝕變異常信息圖像Fig.4 Remote sensing alteration information image in Bayin mountain area
圖4表明,該地區(qū)的幾個已知礦床都在蝕變異常區(qū)中;而且,除了高海拔的幾個蝕變異常區(qū)暫未查證外,其他異常區(qū)經野外查證均見到礦化蝕變現象,正在做進一步的地質勘查工作。
(1)遙感圖像信號屬于隨機信號,一維與二維概率密度函數分別是單波段和兩波段的隨機模型。而單波段數據直方圖與兩波段二維散點圖又分別是一維和二維概率密度函數的基本估計。
(2)本文討論了遙感數據直方圖的概率密度分類、二維散點圖的基本形態(tài)與特征,同時從數學上推導出二元高斯分布的橢圓理論方程,并由此分析了二維橢圓的參數同2個波段數據的方差與相關系數等統(tǒng)計參數的重要關系。
(3)在上述工作的基礎上,根據直方圖的概率密度類型,系統(tǒng)總結了不同類型直方圖組合生成的二維散點圖的基本特征、空間結構形態(tài)與異?!熬垲悺毙畔⒌目臻g定位等。
(4)通過實例說明了遙感數據空間結構分析的重要性與實用性。
[1]張遠飛,楊自安,朱谷昌,等.遙感圖像蝕變信息檢測中的光譜數據空間結構分析[J].遙感信息,2009(1):3-9.
[2]張遠飛,吳德文,朱谷昌,等.遙感蝕變信息檢測中背景與干擾問題研究[J].國土資源遙感,2008(2):22-26.
[3]李 紅,朱谷昌,張遠飛,等.礦化蝕變區(qū)典型地物光譜特征分析——以內蒙古突泉縣—扎魯特旗成礦帶為例[J].國土資源遙感,2010(1):89-95.
[4]張遠飛,吳德文,張艮中,等.高光譜數據的波段序結構分析與應用研究[J].國土資源遙感,2010(1):30-38.
[5]李智勇,郁文賢,匡綱要,等.基于高維幾何特征的高光譜異常檢測算法研究[J].遙感技術與應用,2003,18(6):379 -383.
[6]Hyvrinen A,Karhunen J,Oja E,等,著.周宗潭,董國華,徐 昕,等,譯.獨立成分分析[M].北京:電子工業(yè)出版社,2007.
[7]馬建倉,牛奕龍,陳海洋,等.盲信號處理[M].北京:國防工業(yè)出版社,2006.
[8]Kenneth R C.著.朱志剛,林學訚,石定機,等,譯.數字圖像處理[M].北京:電子工業(yè)出版社,2002.
[9]何曉群.現代統(tǒng)計分析方法與應用[M].北京:中國人民大學出版社,2007.
(責任編輯:劉心季)
A Study of Spatial Structure Analysis and Alteration Information Extraction Based on Random Models of Remote Sensing Data
ZHANG Yuan - fei1,2,YUAN Ji- ming1,ZHU Gu - chang1,WU De - wen1,LIHong1,3
(1.China Non -ferrous Metals Resource Geological Survey,Beijing 100012,China;2.Guilin Research Institute of Geology for Mineral Resources,Guilin 541004,China;3.Centre South University,Changsha 408309,China)
Remote sensing image signals are random signals whose band data histograms and two-dimensional scatter plots are respectively the basic estimates of one-dimensional probability density function and two dimensional probability density function of the random model.In this paper,the basic types and patterns of one -dimensional probability density and the geometric parameter characteristics of Gaussian distribution ellipses are discussed based on the random models of remote sensing data.Then,problems such as the spatial geometric structure characteristics of the two-dimensional scatter plots generated by different histograms and the positioning in abnormal information space are analyzed.At last,the importance and practicability of the spatial structure analysis of remote Sensing data in alteration information extraction are demonstrated by a case study.
Remote sensing data;Random models;Spatial structure analysis;Alteration information extraction
張遠飛(1958-),教授級高級工程師,主要從事遙感技術方法及地質應用研究。
TP 75
A
1001-070X(2010)04-0034-06
2010-01-21;
2010-03-18
國家高科技研究發(fā)展計劃(863)資助項目(編號:2006AA06Z112)和國家科技支撐項目(編號:2006BABA06)共同資助。