趙一凡,王立國,2
(1.大連民族大學 信息與通信工程學院,遼寧 大連 116605;2.哈爾濱工程大學 信息與通信工程學院,黑龍江 哈爾濱 150001)
高光譜技術是一種基于傳統遙感技術的新型非接觸式目標探測技術,如今的高光譜成像設備的光譜采樣范圍可以從可見光區(qū)域一直延伸至近紅外和中紅外區(qū)域,可將連續(xù)的光譜分離為若干獨立的窄波段。由于其良好的光譜特性,高光譜遙感技術已被廣泛應用于軍事、農業(yè)領域、生態(tài)環(huán)境和地質勘探等領域[1]。
隨著高光譜探測儀成像技術的發(fā)展,光譜圖像的分辨率越來越高,但是由于現實環(huán)境的復雜性和物理條件的限制,每一個最小成像單位即像元中不可避免會出現包含兩類及以上地物類別信息的情況,這樣的像元一般稱為混合像元[2]。為分析混合像元,高光譜圖像解混技術應運而生,其致力于分析高光譜圖像中存在的混合像元各類別所占比例的問題。目前研究較為廣泛的解混算法有最小二乘法解混算法、非負矩陣分解算法(NMF)、原型分析法等[3-4]。由于最小二乘法物理意義明確,在已知光譜端元的情況下解混效率和精度均較高,故得到廣泛使用[5]。
在一般的解混過程中,一個端元用于代表一個類別的地物,即單端元解混,但由于真實的物理環(huán)境中高光譜數據的采集和接收會產生一些無法避免的干擾,以及成像地物本身存在類內光譜變化等特點,這種方式的不準確性導致解混誤差過大[6]。多端元解混技術在一定程度上克服了單端元解混的不足之處。Roberts等提出的多端元光譜混合分析(MESMA)算法,通過尋找大量的多端元組合模型為每一個像元找出使其解混結果最佳的多端元解混模型[7]。MESMA-SAD算法通過結合光譜角距離(SAD)與平均絕對誤差(MAE)的值來減少端元組合的數量以提升算法效率[8]?;诙嗽墓庾V解混算法將距離很小的多個端元看作一個可以代表該類別的端元整體,來解決光譜類內差異問題[9]。
綜上所述,多端元解混技術的發(fā)展雖然能在一定程度上提高解混的精度,但它帶來的問題即不確定性卻鮮有研究。從本質上講,傳統的精度評價是立足于整體的統計評價,而不確定性評價是立足個體,即關心個體像元的分析可靠性,二者既有聯系又有區(qū)別,偏廢任何一方都是不可取的。二者相結合可以實現個體評價與整體評價的辯證統一,形成完整、全面的評價體系,對獲得“科學”的科學評價意義很大。為此,本文立足經典的線性光譜混合分析模型,研究不確定性的本質內涵,計算方法,及其降減方法,以獲得多端元光譜解混方法的完整評價和性能提升。
從本質上說,不確定性是由類內光譜變化造成的[10],具體特性與解混模型具有密切關系。在解混中產生的不確定性一般可分為兩種,即混合像元位置不確定性和混合豐度的不確定性。下面將在二類解混的場景中分析這兩種不確定性的實際含義。
圖1 線性排列的三組端元解混示意圖
圖2 隨機排列的三組端元解混示意圖
由上述兩種情況進行推廣,如圖3。假設每一類可以作為端元的像元構成一個端元束,圓O1為第一類的端元束,O2為第二類的端元束。對于固定的混合比例α = (α1,α2)T,(α1,α2>0且α1,α2>0),可以找到一個與之對應的混合像元束,中最左側的點是由端元組合成的,點是由合成的?;旌舷裨鴿M足約束方程:
圖3 混合像元位置的不確定
(1)
在這種情況下,混合像元的位置變化只受到類內端元變化的影響。
當已知一像元為混合像元,考慮其光譜可變性,如圖4。不同的端元組、和將會得到不同的豐度比例,對于第一類的豐度可表示為
圖4 解混豐度的不確定示意圖
(2)
將上述的特殊解混模型進行推廣,可以得到如圖5所示的情形。根據幾何解混方法,若不考慮類內光譜可變性的影響,此時解混端元為兩個端元束的圓心(O1,O2),解混豐度不確定性為0,即λmax=λmin。在考慮光譜可變性的影響后,對應于第一類的最大分量豐度λmax和最小分量豐度λmin的計算公式為
圖5 解混豐度的不確定性
(3)
在實際應用中,這兩種不確定一般更關心第二類即豐度的不確定,下面將立足流行的線性光譜混合分析(LAMA),給出豐度不確定性的定義及降減方法。
假設待解混的混合像元矩陣X中的任意像元x均由A,B兩類地物構成,單端元解混模式下,存在端元矩陣E,P為每類包含的端元個數,混合像元x可被表示為
x=Eα+n。
(4)
式中:α是由A類混合豐度值αA和B類混合豐度值αB構成的豐度矩陣;n為解混誤差;使用最小二乘誤差問題的建模方法,其模型表達式為
(r-Eα)T(r-Eα) 。
(5)
求解出的豐度值αA,αB均滿足全約束最小二乘約束條件。
在多端元解混問題中,由于每類地物存在多個端元,兩類地物的端元矩陣分別可表示為EA={eA1,eA2,…,eAP}、EB={eB1,eB2,…,eBP},解混使用的端元矩陣Eij=(eAi,eBj)T,i,j∈1,2,…,p為由EA中任意一個端元和EB中任意一個端元構成的端元矩陣。此時多端元解混最小二乘解混問題中混合像元的混合豐度矩陣,如式(6)。
(6)
本文基于有監(jiān)督的高光譜解混研究場景對高光譜解混不確定性進行研究,重點探究上文提到的兩種不確定性問題之中的混合像元位置固定時的豐度不確定性問題。單個混合像元的解混不確定性α可定義為
(7)
其中:
(8)
傳統線性最小二乘高光譜解混方法(LS-LSMA)平均的考慮了端元組中每一個端元對混合像元的影響,對于真實高光譜數據,每一類地物端元組中的各個端元相互獨立且包含不同的空間特征信息[11]。
同一類內每個端元對于混合像元解混應有不同的權重值,為了區(qū)分不同波段對混合像元構成的不同作用,為基于LSMM的LS-LSMA解混模型,提出基于端元加權的多端元解混方法(EW-LSMA),該方法引入一個加權矩陣A:
(r-Eα)TA(r-Eα) 。
(9)
找到合適的加權矩陣,表示各個特征波段的情況是本算法應用的關鍵,高光譜的分類技術中的常用方法Fisher判別法,通過類內散度矩陣來體現不同的特征對于分類效果的不同貢獻,分類中使用的類內散度矩陣SW可以定義為
(10)
(11)
使用ξSW表示過加權矩陣SW線性變換處理后的矩陣:
(12)
使用類內散度矩陣對最小二乘法解混方法加權后的模型表達式為
(13)
樣本加權的解混方法可以區(qū)分不同樣本對于解混分析中不同的意義,通過訓練樣本對數據集進行學習,得出以對解混結果影響程度的大小進行度量的加權矩陣,對于產生解混異常程度較大的樣本賦予更小的權重可以降低其對解混結果的不利影響,同時對產生更小異常的樣本分配更大的權重增強對解混結果的正面影響。
以二分類的解混場景為例,任意混合像元x(x∈X)的豐度矩陣表達式為
(14)
式中,SA和SB為解混端元矩陣的加權矩陣,加權矩陣的加權形式通過端元樣本的類內散度矩陣求出,表達式為
(15)
端元矩陣Eij求得的每一組解混結果表示為
(16)
本文實驗采用真實高光譜數據與模擬數據相結合的方式,實驗使用的高光譜數據集是Indian Pines和Salinas兩組經典高光譜數據集。Indian Pines數據集波段數為200,圖像中一共包含16類地物信息;Salinas數據集包含224個波段,共計16類地物信息。Indian Pines和Salinas數據集的圖像展示如圖6~7。其中6a、7a為相應高光譜圖像的單波段顯示,6b、7b為樣本類別標簽的分類灰度顯示。表展示了后續(xù)實驗中使用兩組數據的部分類別地物的名稱與數量信息,見表1與表2。本文選擇樣本數目較多的類別光譜進行實驗分析,排除樣本選取的偶然性對實驗結果準確性造成的影響。
表1 Indian Pines 部分地物類別名稱及數量統計表
表2 Salinas部分地物類別名稱及數量統計表
a)單波段顯示 b)類別信息圖6 Indian Pines數據集
a)單波段顯示 b)類別信息圖7 Salinas數據集
隨機在實驗類別的地物光譜庫中選取不重復的純像元按隨機混合比例構成合成混合像元,按照此方法共合成1 000個混合像元進行多端元解混不確定性驗證。設ki為第i個像元距離類內標準端元的歐氏距離,像元矩陣Kn為第n類地物中全部像元,按照ki正序排序。端元選取范圍N為選取Kn中前N個像元作為待選取端元。
在Indian Pines數據集中6類地物構成的合成像元矩陣在不同的端元選擇范圍N下豐度變化的平均值,見表3。解混結果不確定性隨端元選取范圍的增大逐步增加,實驗證明解混中的不確定性存在且解混的不確定性大小與端元選取的結果密切相關。
表3 不同N值下解混不確定性變化
使用傳統的LS-LSMA與本課題提出的EW-LSMA分別對兩組數據集進行二類多端元解混實驗,實驗使用蒙特卡洛隨機方法隨機選取兩類地物構成100個混合像元,每個數據集共進行5組實驗,統計解混結果的誤差與不確定性,見表3~7。
實驗結果表明:兩種解混方法均會產生解混誤差,兩組數據集的實驗數據見表4~5。本文提出的EW-LSMA多端元解混方法在一定程度上可以降低解混誤差,在兩組數據集的測試中均略微改善了誤差計算表現。表6~7對比展示了兩種解混方法解混不確性的差異,數據表明使用基于端元加權的解混方法在二分類的多端元解混問題中可以有效降低解混的不確定性,在不增加算法的解混誤差的情況下可以有效提高算法的結果穩(wěn)定性。
表4 Indian Pines數據集解混誤差對比
表5 Salinas數據集解混誤差對比
表6 Indian Pines數據集解混不確定性對比
表7 Salinas數據集解混不確定性對比
本文主要探究了在高光譜數據的多端元解混過程中產生的不確定性問題,并通過實驗進一步證明了不確定性的存在。結果表明解混不確定性的大小與多端元解混選取的端元組距離該類地物端元的歐氏空間離散程度有關。本文提出的基于端元加權的最小二乘多端元解混算法,通過衡量每個端元與混合像元的空間相關性大小,賦予多端元不同的權值。實驗結果表明,加權多端元解混算法與傳統算法相比能有效降低解混不確定性,進一步提升了解混算法的性能。
目前的實驗僅在二分類的多端元解混領域對解混的不確定性進行探究與分析,并且由于解混不確定性的存在使得當前對于多端元解混算法的算法評價方法不夠完善。在后續(xù)研究中,將繼續(xù)研究多分類解混中的不確定性問題,繼續(xù)驗證新算法在新場景中的指標優(yōu)化能力,關注利用混合像元與端元的空間關系信息。在降低不確定性的同時保證解混的精度,從而最大程度利用多端元解混方法相較單端元解混的優(yōu)越性,同時研究完善現有的算法評價體系,將解混不確定性作為評價算法效率的一個重要指標,增加解混算法評價方法的應用價值與實際意義。
最后強調的是,多端元解混技術較之前序單端元解混技術存在不確定性問題,但這并不否認后者的優(yōu)勢。不確定性問題從發(fā)現到理解再到有效利用,進一步鞏固和提升了多端元解混技術的性能?!安淮_定性”是內涵信息的,是揭示問題的,是有警示功能的,是可加利用的?!凹媛爠t明”,生產生活亦或科學研究,莫不如此。