朱玲,李明,秦凱,潘澄雨
(核工業(yè)北京地質(zhì)研究院 遙感信息與圖像分析技術(shù)國家級(jí)重點(diǎn)實(shí)驗(yàn)室,北京 100029)
由于受影像場景的復(fù)雜性和傳感器空間分辨率的限制,遙感影像中地物對(duì)應(yīng)的純凈像元一般較少[1]。高光譜影像具有光譜分辨率高、空間分辨率相對(duì)較低的特點(diǎn),混合像元更是普遍存在[2]。為提高光譜遙感應(yīng)用精度,光譜解混成為研究重點(diǎn)。光譜解混過程包括純凈端元提取和豐度求解,不僅局限于星載、機(jī)載的高光譜影像的解混,也包括微觀角度的如光譜儀量測的混合光譜解混。
巖石一般是由多種礦物構(gòu)成的礦物集合體[3],礦物顆粒之間在400~2 500 nm的可見光-近紅外波段容易發(fā)生多重散射[4],其光譜特征是若干組分礦物光譜的綜合反映[5]。礦物的光譜特征與其內(nèi)在理化特性緊密相關(guān),化學(xué)成分和晶體結(jié)構(gòu)特征是礦物端元識(shí)別的重要依據(jù),在400~1 300 nm波長范圍內(nèi)主要表現(xiàn)為Fe、Cu等過渡性金屬元素的電子躍遷;在1 300~2 500 nm波長內(nèi)主要表現(xiàn)為礦物水分子、羥基、碳酸根、硫酸根等陰離子基團(tuán)振動(dòng)過程[6-7]。20世紀(jì)七八十年代學(xué)者們開始熱衷于巖石樣本光譜特征量測,90年代逐漸開展基于完全波形匹配的巖礦識(shí)別,目前巖礦光譜解混已經(jīng)成為新的研究熱點(diǎn)[8],它是連接遙感技術(shù)與地質(zhì)的關(guān)鍵,對(duì)礦物勘查、礦物含量定量反演和礦物豐度制圖等都具有重要的指導(dǎo)意義[9]。
光譜混合模型主要有線性和非線性2類[10]?;诨旌夏P偷墓庾V解混算法較多,主要分為基于幾何、統(tǒng)計(jì)和稀疏回歸等解混方法,在近20年得到廣泛應(yīng)用。由于巖石的緊致混合特征,基于線性模型解混的精度往往較低[11],Hapke輻射傳輸模型是非線性解混最常用的模型之一[12],可以把混合礦物的波譜反射率轉(zhuǎn)換為單次散射反照率(single scattering albedo,SSA),將非線性特征轉(zhuǎn)變?yōu)榫€性特征進(jìn)行研究。除了基于模型的解混方法外,神經(jīng)網(wǎng)絡(luò)法、核函數(shù)法和流形學(xué)習(xí)等基于數(shù)據(jù)驅(qū)動(dòng)的解混方法可以較好地映射礦物光譜的非線性特征,也逐漸獲得關(guān)注和應(yīng)用[13]。
解混實(shí)驗(yàn)對(duì)光譜解混精度和效率要求越來越高,光譜解混算法已逐漸向智能化方向轉(zhuǎn)變。高光譜解混的多種方法已經(jīng)在實(shí)驗(yàn)室模擬光譜數(shù)據(jù)中得到較好驗(yàn)證[14],在礦區(qū)的礦物識(shí)別和野外地質(zhì)填圖等方面也得到較好的應(yīng)用[15-16],除此之外還成功應(yīng)用于古畫顏料解混[17-18]、月表礦物識(shí)別監(jiān)測[19-20]、月球礦物制圖評(píng)估[21]等眾多方面。本文在學(xué)者們研究的基礎(chǔ)上總結(jié)了2種主要的光譜混合模型,系統(tǒng)地介紹了目前存在的多種光譜解混算法和已開展的光譜解混實(shí)驗(yàn),最后對(duì)目前礦物光譜解混存在的問題和未來發(fā)展趨勢進(jìn)行總結(jié)。
光譜混合模型是光譜解混算法的理論基礎(chǔ)。光譜混合方式從本質(zhì)上可分為線性和非線性混合2種,其主要區(qū)別在于光子是否在地物間發(fā)生多次散射[2]。
線性混合模型(linear mixing model,LMM)即把每一個(gè)混合波譜反射率看作為每一個(gè)端元光譜反射率和對(duì)應(yīng)組分含量的線性組合。LMM用式(1)表示。
(1)
式中:X表示混合光譜反射率;am表示第m個(gè)端元的光譜反射率;em為第m個(gè)端元的豐度;A=(a1a2…aM)T為端元光譜矩陣;E=(e1e2…eM)T為端元豐度矩陣;M為端元數(shù);ε為誤差項(xiàng)。
由于光子在地物間發(fā)生多次散射現(xiàn)象,從微觀角度看粒子的混合是非線性的。非線性混合模型的表達(dá)式為式(2)。
X=f(A,E)+ε
(2)
式中:f(·)表示端元矩陣A和豐度矩陣E之間的非線性關(guān)系。由于模型的不確定性,需要給出確定且合適的非線性模型才能進(jìn)行光譜混合[2]。Hapke模型[22-23]可以詳細(xì)描述礦物混合效應(yīng),把礦物反射率轉(zhuǎn)化為SSA,把非線性混合光譜轉(zhuǎn)變到線性空間。反射率與SSA的函數(shù)表示見式(3)[12]。
(3)
式中:γ(·)為反射率;μ0=cosi;μ=cose;i為入射角;e為出射角;g為相位角;ω為礦物單次散射反照率;B(g)表示后向散射系數(shù);P(g)為相位函數(shù);H(ω,μ)為各向同性散射函數(shù)。由于模型對(duì)參數(shù)要求較高且求解過程較為復(fù)雜,為便于計(jì)算,對(duì)式(3)進(jìn)行簡化[24],使B(g)=0,P(g)=1,簡化后的模型表示為式(4)。
(4)
H函數(shù)可近似表示為式(5)。
(5)
ω的表達(dá)見式(6)。
(6)
式中:em的含義見式(1);ωm為各組分礦物的SSA;ω表示混合礦物的SSA。簡化后的礦物反射率表達(dá)式轉(zhuǎn)換為式(7),可以根據(jù)已知的礦物反射率求解礦物SSA。
(7)
Hapke模型進(jìn)行改進(jìn)后的多混合像元模型(multi-mixture pixel,MMP)是把線性和非線性模型相結(jié)合構(gòu)成的非線性混合模型[25],其物理意義是把非線性混合的端元添加到線性混合模型中。Heylen等[3]在MMP模型基礎(chǔ)上把LMM模型和Hapke模型相結(jié)合,提出了另外一種緊致混合物的線性混合模型(linear mixture of intimate mixtures,LIM)。LMM模型假設(shè)礦物端元在空間上呈棋盤式分布,實(shí)際情況中每個(gè)棋盤模塊由多個(gè)端元構(gòu)成,LIM則描述了非線性混合特征。通過不同參數(shù)的設(shè)置,LIM模型可以轉(zhuǎn)變?yōu)镸MP或Hapke模型。除了Hapke模型之外,余先川等[2,15]還提出了一種二次散射模型用于描述礦物的混合效應(yīng)。
目前礦物混合光譜解混算法有很多,基本可以分為模型驅(qū)動(dòng)和數(shù)據(jù)驅(qū)動(dòng)2大類。模型驅(qū)動(dòng)法是基于混合模型理論的,可以分為基于幾何、統(tǒng)計(jì)和稀疏回歸的解混方法。數(shù)據(jù)驅(qū)動(dòng)主要包括神經(jīng)網(wǎng)絡(luò)法、核函數(shù)法和流形學(xué)習(xí)法等方法。
1)基于幾何方法。在端元提取方面,基于純像元的端元識(shí)別算法常用的有純端元索引法(pixel purity index,PPI)、頂點(diǎn)成分分析法(vertex component analysis,VCA)和內(nèi)部體積最大法等。PPI方法將高光譜數(shù)據(jù)在隨機(jī)向量方向分別進(jìn)行投影,把落在兩端數(shù)據(jù)進(jìn)行標(biāo)記,標(biāo)記次數(shù)大于某閾值數(shù)據(jù)作為潛在端元集[26]。內(nèi)部體積最大法通過選擇最大單形體體積來確定端元,對(duì)數(shù)據(jù)降維后,再利用高光譜數(shù)據(jù)凸面單形體的特征尋找具有最大體積的單形體并將其頂點(diǎn)作為端元[27]。VCA 將像元在所有維度進(jìn)行投影,把投影值最大的像元作為第一個(gè)端元,再把高光譜數(shù)據(jù)投影到與已確定端元構(gòu)成的子空間正交方向上,通過迭代法選取其他端元[28]。PPI算法需要獲取一定的先驗(yàn)知識(shí),通過人工經(jīng)驗(yàn)提取端元,人為因素影響較大,而且隨機(jī)向量選取的不確定性對(duì)端元提取影響較大;內(nèi)部體積最大法利用窮舉方法找出端元,計(jì)算量較大;VCA和內(nèi)部體積最大法在端元識(shí)別時(shí)都需要提前明確端元數(shù)目。上述方法均基于純像元假設(shè),要求高光譜數(shù)據(jù)中存在純像元,在對(duì)實(shí)際高光譜數(shù)據(jù)解混情況下難以滿足要求。
最小體積單形體法(minimum volume simplex analysis,MVSA)[29]和變元切分增量拉格朗日單形體識(shí)別法(simplex identification via variable splitting and augmented Lagrangian,SISAL)[30]是基于最小體積變換的端元識(shí)別法。2種方法的原理都是通過尋找一個(gè)混合矩陣,該矩陣的列所形成的單形體體積是將高光譜數(shù)據(jù)完全包圍的最小體積的單形體;不同之處在于MVSA方法對(duì)初始端元矩陣的選擇非常重要,SISAL法則是采用一系列增廣拉格朗日方法解決最優(yōu)化問題?;谧钚◇w積的方法不再要求純像元假設(shè),但容易受噪聲的影響,估計(jì)端元值與實(shí)際端元誤差往往較大。
在端元矩陣已知后求解各端元的豐度系數(shù),端元豐度估計(jì)依賴于端元光譜的提取。最常用的豐度估計(jì)方法有最小二乘法。最小二乘法是基于線性混合模型估計(jì)豐度的方法,通過添加不同的約束條件又分為無約束的最小二乘算法(unconstrained least squares,UCLS)、“和為一”約束最小二乘(sum-to-one constrained least squares,SCLS)、“非負(fù)”約束最小二乘法(nonnegativity constrained least squares,NCLS)和全約束最小二乘法(fully constrained least squares,F(xiàn)CLS)[31]。
2)基于統(tǒng)計(jì)方法。受地物復(fù)雜度和高光譜數(shù)據(jù)空間分辨率影響,像元光譜蘊(yùn)含多種地物信息。當(dāng)高光譜數(shù)據(jù)為高度混合時(shí),基于幾何的解混方法效果較差,基于統(tǒng)計(jì)的方法可以適用于處理高度混合的像元,同時(shí)獲得端元矩陣和豐度矩陣。主要的統(tǒng)計(jì)方法有獨(dú)立成分分析法(independent component analysis,ICA)和非負(fù)矩陣分解法(nonnegative matrix factorization,NMF)。ICA算法最早由Jutten等提出[32-33],通過估計(jì)分離矩陣使輸出信號(hào)接近于輸入信號(hào),但該方法基于LMM約束端元和豐度的相互獨(dú)立性,容易得到不正確的端元,在高光譜解混應(yīng)用方面容易受到約束。Lee等[34]正式提出NMF概念。NMF是一種盲源分離算法,把一個(gè)非負(fù)數(shù)據(jù)矩陣分解為2個(gè)非負(fù)矩陣的乘積。該方法不需要純像元的假設(shè),但求解中存在局部最小值問題,一般需要加入端元和豐度約束。把非負(fù)矩陣分解和最小體積約束相結(jié)合(minimum volume constrained-NMF,MVC-NMF)進(jìn)行光譜解混的方法可以不依賴于純像元假設(shè),且保證得到的端元矩陣和豐度矩陣是非負(fù)的[35]。
ICA與NMF算法在端元和豐度信息完全未知的情況下提取混合像元中的隱含信息,屬于非監(jiān)督的解混算法,2種方法都需要先給出一個(gè)目標(biāo)函數(shù),再通過優(yōu)化算法進(jìn)行求解?;诮y(tǒng)計(jì)學(xué)方法可以從混合光譜中直接分離得到的端元矩陣和豐度矩陣,但相比于幾何解混法計(jì)算復(fù)雜度相對(duì)較高,降低了高光譜解混效率。
3)稀疏解混法?;诠庾V庫的稀疏解混也是將端元提取和豐度估計(jì)聯(lián)合起來進(jìn)行求解的。用已知的光譜庫作為端元矩陣,光譜庫中光譜數(shù)量遠(yuǎn)遠(yuǎn)大于實(shí)際端元數(shù)量,混合光譜與端元集向量之間具有稀疏關(guān)系,這樣就把解混問題轉(zhuǎn)化為組合優(yōu)化問題,實(shí)際是一種稀疏回歸的問題[36]。Iordache等[37]首次提出基于光譜庫的半監(jiān)督的稀疏解混法,把光譜庫引入到線性模型中代替端元集,利用高光譜數(shù)據(jù)與l1范數(shù)結(jié)合提出一種基于l1范數(shù)稀疏性約束的快速稀疏解混算法(sparse unmixing via variable splitting augmented Lagrangian,SUnSAL),提高了解混的效率;但由于真實(shí)的光譜數(shù)據(jù)與光譜庫中的數(shù)據(jù)存在一定的差異,解混精度并不理想。后期逐漸對(duì)稀疏解混算法進(jìn)行改進(jìn),將協(xié)同稀疏約束與稀疏解混算法相結(jié)合提出協(xié)作稀疏解混算法(collaborative SUnSAL,CLSUnSAL),對(duì)混合高光譜數(shù)據(jù)添加全局行稀疏性[38];利用豐度數(shù)據(jù)的空間連續(xù)性把總變分約束(total variation,TV)與SUnSAL相結(jié)合的算法(SUnSAL-TV)考慮數(shù)據(jù)的空間信息,具有較好的魯棒性[39-40]。這些改進(jìn)后的解混算法比l1稀疏性方法具有更高的解混能力。
此外,學(xué)者們還把稀疏約束和NMF相結(jié)合,求解效率和精度都有較大的提高,優(yōu)于傳統(tǒng)的NMF解混方法[41-42]。Lin等[43]提出了一種基于礦物單次散射反照率光譜庫稀疏解混算法,利用簡化的Hapke模型把混合礦物反射率轉(zhuǎn)變?yōu)閱未紊⑸浞凑章?,?gòu)建單次散射反照率光譜庫,再與稀疏解混算法相結(jié)合求解端元豐度。稀疏解混算法不受端元提取準(zhǔn)確性的影響,也不依賴于純像元的假設(shè),但是對(duì)光譜庫的依賴性較大,光譜庫中光譜數(shù)量較大,光譜間往往存在較高的相關(guān)性,在一定程度上增加了解混的難度。
1)神經(jīng)網(wǎng)絡(luò)解混。20世紀(jì)90年代神經(jīng)網(wǎng)絡(luò)開始應(yīng)用于遙感領(lǐng)域[44],它以神經(jīng)元數(shù)學(xué)模型為基礎(chǔ)可以學(xué)習(xí)復(fù)雜的非線性特征,具有較強(qiáng)的非線性映射能力[45];相比于傳統(tǒng)的手動(dòng)計(jì)算法具有更高的效率,已成功地應(yīng)用于高光譜混合像元分解。傳統(tǒng)神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)較為簡單,包括輸入層、隱藏層和輸出層。隱藏層用于提取特征信息,在不需要先驗(yàn)知識(shí)的前提下可以學(xué)習(xí)數(shù)據(jù)中的復(fù)雜關(guān)系。利用傳統(tǒng)神經(jīng)網(wǎng)絡(luò)解混時(shí)容易出現(xiàn)過擬合問題,由于隱層學(xué)習(xí)不充分,往往導(dǎo)致特征提取能力不足。此外,特征提取和豐度估計(jì)一般也需要分別進(jìn)行訓(xùn)練。
深度學(xué)習(xí)是一種強(qiáng)大的神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)技術(shù),可以對(duì)多層神經(jīng)網(wǎng)絡(luò)進(jìn)行訓(xùn)練,其特點(diǎn)是一次無監(jiān)督學(xué)習(xí)只訓(xùn)練一層,把訓(xùn)練結(jié)果作為下一層的輸入,而且采用“自上而下”的方法對(duì)所有層進(jìn)行微調(diào),克服了傳統(tǒng)神經(jīng)網(wǎng)絡(luò)的不足。Su等[46]基于深度神經(jīng)網(wǎng)絡(luò)的理論,提出了一種堆棧非負(fù)稀疏自編碼解混方法(stacked nonnegative sparse autoencoders,SNSA),用于處理異常值和降低信噪比;通過一系列自動(dòng)編碼器處理異常值,最后一組編碼器通過稀疏編碼策略用于矩陣分解。Palsson等[47]基于改進(jìn)的自編碼神經(jīng)網(wǎng)絡(luò)方法,同時(shí)進(jìn)行端元識(shí)別和豐度計(jì)算,測定了不同的激活函數(shù)和目標(biāo)函數(shù)在解混方面的性能,并證明該方法對(duì)高光譜解混具有較強(qiáng)的魯棒性。Savas等[48]提出了一種端對(duì)端的解混算法,并驗(yàn)證改進(jìn)后的神經(jīng)網(wǎng)絡(luò)模型適用于高光譜解混。
基于深度學(xué)習(xí)的解混方法不需要預(yù)先分析解混的實(shí)際情形與學(xué)習(xí)數(shù)據(jù)間復(fù)雜的非線性關(guān)系,求解方便,還具有較強(qiáng)的抗噪性和容錯(cuò)性。進(jìn)行高光譜數(shù)據(jù)解混通常也面臨何時(shí)停止訓(xùn)練和隱層層數(shù)設(shè)置等問題。目前應(yīng)用神經(jīng)網(wǎng)絡(luò)對(duì)高光譜進(jìn)行解混的研究還處于探索階段,高光譜解混的案例與傳統(tǒng)方法相比應(yīng)用較少,在混合礦物光譜解混方面的應(yīng)用更少。
2)核函數(shù)法。核函數(shù)解混法是利用核函數(shù),把訓(xùn)練樣本從低維空間的非線性解混問題轉(zhuǎn)化到高維空間的線性解混問題[49]。采用核函數(shù)法可以將高維空間的內(nèi)積運(yùn)算轉(zhuǎn)換到低維空間的核函數(shù)運(yùn)算,可以有效地避免較高的特征空間維度。應(yīng)用該方法需先對(duì)數(shù)據(jù)進(jìn)行預(yù)處理,利用核函數(shù)構(gòu)造核矩陣,再基于相關(guān)算法處理核矩陣得到模式函數(shù),然后再進(jìn)行解混。常用的核函數(shù)非線性解混方法有核正交子空間投影算法(kernel orthogonal subspace projection,KOSP)[50]和核化的全約束最小二乘(kernel-FCLS,KFCLS)[51]。二者都是通過定義全局準(zhǔn)則選擇特征向量表征數(shù)據(jù)結(jié)構(gòu),然后將混合像素投影到特征向量上并利用FCLS進(jìn)行計(jì)算。多核支持向量機(jī)(multiple kernel support vector machine,MKSVM)[52],在SVM的基礎(chǔ)上以線性加權(quán)組合核函數(shù)代替單核數(shù),采用簡單多核學(xué)習(xí)方法迭代解算權(quán)系數(shù)實(shí)現(xiàn)分類,然后通過S型函數(shù)將分類器輸出值轉(zhuǎn)化為后驗(yàn)概率,利用后驗(yàn)慨率實(shí)現(xiàn)高光譜影像的非線性解混。
當(dāng)高光譜數(shù)據(jù)像元包含多種地物信息時(shí),基于核函數(shù)解混方法優(yōu)于傳統(tǒng)的解混方法。但目前基于核函數(shù)的混合像元分解主要集中于對(duì)方法的改進(jìn)優(yōu)化方面,在礦物高光譜解混方面應(yīng)用核函數(shù)與線性模型相結(jié)合處理非線性的光譜混合研究還相對(duì)較少。
3)流形學(xué)習(xí)方法。流形學(xué)習(xí)是一種非監(jiān)督的機(jī)器學(xué)習(xí)算法,可以處理復(fù)雜的高維度數(shù)據(jù)。流形學(xué)習(xí)的主要思想是假設(shè)高維空間給定的樣本集處于同一流形,這樣就把高光譜圖像所在的高維空間映射到低維流形局部鄰域中[53]。由于高光譜影像的高維度特征,在保留數(shù)據(jù)集大部分信息的前提下對(duì)輸入的訓(xùn)練數(shù)據(jù)進(jìn)行降維處理是實(shí)驗(yàn)的關(guān)鍵,該方法可以有效地對(duì)高維數(shù)據(jù)進(jìn)行降維處理,獲取數(shù)據(jù)內(nèi)部的幾何結(jié)構(gòu)和規(guī)律。流形學(xué)習(xí)典型代表方法是局部線性嵌入(local linear embedding,LIE)。Roweis等[54]基于局部線性嵌入的思想首次提出了一種約束最小乘方的局部線性加權(quán)回歸的建模方法,采用約束最小平方法計(jì)算權(quán)重系數(shù),通過混合光譜和其端元空間分布進(jìn)行回歸分析。
流形學(xué)習(xí)方法計(jì)算復(fù)雜度較高,難以應(yīng)用于較大的高光譜圖像,由于流形學(xué)習(xí)解混方法是挖掘高維數(shù)據(jù)內(nèi)在關(guān)系規(guī)律,僅適用于學(xué)習(xí)內(nèi)部較為平坦的低維流形,計(jì)算較復(fù)雜且速度較慢。雖然流形學(xué)習(xí)法在非線性解混方面具有較大潛力,但目前在解混方面相關(guān)的算法和應(yīng)用較少。
礦物高光譜解混的算法較多,基于模型驅(qū)動(dòng)的方法理論相對(duì)成熟,目前應(yīng)用較多,隨著人工智能的發(fā)展,基于數(shù)據(jù)驅(qū)動(dòng)解混方法逐步得到關(guān)注。多種解混方法在實(shí)驗(yàn)室模擬光譜數(shù)據(jù)和野外礦區(qū)等高光譜影像的巖礦識(shí)別、礦區(qū)填圖方面得到了驗(yàn)證和應(yīng)用。不過目前眾多實(shí)驗(yàn)主要圍繞Cuprite地區(qū)的AVIRIS高光譜數(shù)據(jù)開展,高光譜影像解混缺乏真實(shí)驗(yàn)證數(shù)據(jù)集。無論是模型驅(qū)動(dòng)法還是數(shù)據(jù)驅(qū)動(dòng)解混法都需要加強(qiáng)在高光譜影像數(shù)據(jù)解混方面的應(yīng)用。
實(shí)驗(yàn)室實(shí)測光譜數(shù)據(jù)解混是重要的解混對(duì)象,也是進(jìn)行高光譜解混的基礎(chǔ)依據(jù)。王亞軍等[55]采集新疆包古圖地區(qū)90個(gè)樣本進(jìn)行粉碎制樣,應(yīng)用ASD光譜儀在實(shí)驗(yàn)室進(jìn)行光譜測量,基于光譜匹配方法進(jìn)行端元識(shí)別,應(yīng)用簡化的Hapke模型把巖石樣品的反射率轉(zhuǎn)換為SSA,并通過分段濾波以及建立區(qū)域光譜庫的方法提高礦物識(shí)別精度。該方法對(duì)長石類礦物含量提取精度達(dá)到80.5%,對(duì)黏土礦物提取精度達(dá)到92.36%。趙恒謙等[17]在實(shí)驗(yàn)室選取朱砂、石黃顏料粉末按不同體積比例進(jìn)行混合量測光譜,用FCLS對(duì)混合光譜進(jìn)行全波段解混,利用比值導(dǎo)數(shù)法對(duì)單波段進(jìn)行解混計(jì)算各自豐度值,全波段解混的均方根誤差較大為28%,單波段解混中有20個(gè)波段為強(qiáng)線性波段,誤差均在10%以內(nèi),解混效果較好。李大朋等[18]基于相同方法對(duì)石青和石綠2種礦物顏料進(jìn)行解混,得到相似的結(jié)論,全波段解混反演的石青和石綠豐度值的均方根誤差較高,為19%,單波段解混誤差精度分別有所提高。由于礦物組分的多樣性和復(fù)雜性,采用實(shí)測方法進(jìn)行礦物識(shí)別難度較大,受到數(shù)據(jù)樣本量的限制,難以驗(yàn)證基于數(shù)據(jù)驅(qū)動(dòng)的多種解混方法的解混效果。
在驗(yàn)證高光譜解混方法時(shí),普遍采用光譜模擬數(shù)據(jù)。對(duì)不同類型的混合礦物波譜模擬有利于解決實(shí)際問題,如對(duì)典型蝕變礦物混合波譜的模擬,既建立蝕變帶礦物波譜模擬理論基礎(chǔ),同時(shí)又為礦床蝕變信息提取的研究提供理論依據(jù);對(duì)月壤表面混合礦物光譜的模擬有利于反演月表典型的礦物含量,對(duì)月球資源利用具有重要的指導(dǎo)意義[20]。余先川等[2,15]利用美國地質(zhì)調(diào)查局礦物光譜庫中天然堿、瀉利鹽和黝簾石3種地物光譜數(shù)據(jù),根據(jù)光譜線性混合模型和二次散射模型分別生成2組模擬數(shù)據(jù);利用VCA提取端元,分別用FCLS和非線性變換后的FCLS進(jìn)行解混得到豐度系數(shù),2組數(shù)據(jù)的端元識(shí)別光譜與真實(shí)光譜相關(guān)系數(shù)均在0.99以上,但當(dāng)?shù)匚锓植紡?fù)雜情況加重時(shí),基于線性模型的解混效果變差,基于二次散射的非線性解混效果提升,而且非線性模型具有更好的抗噪性。
基于Hapke模型與線性模型相結(jié)合進(jìn)行解混的實(shí)驗(yàn)較多。把單斜輝石、斜方輝石、斜長石、橄欖石和鈦鐵礦5種礦物端元非線性混合的反射光譜轉(zhuǎn)換為SSA,隨機(jī)生成混合像元,采用FCLS方法進(jìn)行解混并與真實(shí)值進(jìn)行比較分析,得出單斜輝石、斜方輝石和斜長石3種端元礦物反演含量與真實(shí)含量相關(guān)系數(shù)分別為0.85、0.78和0.66,橄欖石和鈦鐵礦的反演結(jié)果相關(guān)系數(shù)相對(duì)較差為0.54和0.23[20]。把Hapke模型與多種線性解混算法相結(jié)合對(duì)模擬的火星表面的巖礦樣本和在可見光-近紅波段內(nèi)衛(wèi)星采集的樣本進(jìn)行解混時(shí)[56],對(duì)于模擬的已知的二元、三元混合光譜解混精度在5%~10%誤差以內(nèi),但對(duì)于未知端元的多端元光譜解混誤差達(dá)到了25%。林紅磊等[4]從美國布朗大學(xué)Relab光譜庫中選取混合礦物光譜轉(zhuǎn)變?yōu)镾SA光譜庫,以半監(jiān)督方式基于SSA稀疏解混模型得到礦物的豐度,與真實(shí)含量相比反演結(jié)果的平均絕對(duì)誤差為3.12%,線性擬合相關(guān)系數(shù)的均值為0.997 7,非線性稀疏解混具有較高的精度。對(duì)石英和明礬石按照已知的比例進(jìn)行混合,利用LIM、MMP、LMM和Hapke模型分別進(jìn)行解混,Hapke模型獲取的豐度系數(shù)與真實(shí)比例最為接近,LIM、MMP具有相似結(jié)果,LMM模型獲取的結(jié)果與真實(shí)比例差異最大[3]。
目前高光譜解混在礦物識(shí)別和礦區(qū)填圖等方面也取得了較好的應(yīng)用。對(duì)不同礦區(qū)或月球表面的巖礦樣本組分及含量的分析有助于研究巖石成因、地質(zhì)構(gòu)造、巖漿演化、歷史演變等重要課題[57]。
美國內(nèi)華達(dá)州Cuprite地區(qū)的AVIRIS高光譜數(shù)據(jù)是學(xué)者研究的熱點(diǎn),對(duì)該地區(qū)礦物填圖研究已經(jīng)取得較大進(jìn)展。余先川等[15]利用VCA方法提取6種礦物端元,并證明基于二次散射的非線性模型的填圖結(jié)果顯著優(yōu)于LMM模型解混的填圖結(jié)果,而且每個(gè)像元所填礦物種類為3時(shí)填圖結(jié)果更優(yōu)。在對(duì)AVIRIS高光譜數(shù)據(jù)進(jìn)行解混時(shí),Heylen等[3]采用重建誤差驗(yàn)證解混結(jié)果,結(jié)果表明LIM和MMP模型獲取相對(duì)重建誤差比LMM模型獲取的重建誤差好,但Hapke模型對(duì)像元的重建誤差要高于LMM模型,證明Hapke模型對(duì)于AVIRIS數(shù)據(jù)高光譜解混并不是最理想的解混模型。
林娜等[49]采用核函數(shù)方法對(duì)AVIRIS高光譜數(shù)據(jù)解混時(shí),證明基于該方法的解混結(jié)果明顯優(yōu)于傳統(tǒng)的NCLS和FCLS等解混方法;以明礬石和高嶺石為例,核化的正交子空間投影、核化的非約束的最小二乘和核化的全約束最小二乘獲取的均方根均值誤差分別為0.61%、0.315和0.17%,在未核化情況下誤差分別為2.7%、0.92和0.3%,誤差明顯增大。Heylen等[58]應(yīng)用等距映射算法,把AVIRIS高光譜數(shù)據(jù)流映射到低維非線性空間,使用改進(jìn)的內(nèi)部體積最大法提取端元,并利用單形體體積的比值來計(jì)算端元豐度;該方法與利用傳統(tǒng)的內(nèi)部體積最大法提取端元、FCLS計(jì)算的豐度結(jié)果進(jìn)行比較,在端元數(shù)量設(shè)置為14時(shí),利用傳統(tǒng)的內(nèi)部體積最大法提取的高嶺石、蒙脫石和明礬石與USGS光譜庫的光譜比較,光譜角誤差分別為0.056、0.048和0.043,利用改進(jìn)的方法在端元數(shù)量為16時(shí)計(jì)算的光譜角分別為0.070、0.049和0.056,2種方法端元提取效果相似,但改進(jìn)后的方法在高光譜降維處理方面計(jì)算效率顯著提升。
利用端對(duì)端的改進(jìn)后的自編碼網(wǎng)絡(luò)對(duì)AVIRIS的12種礦物解混的平均光譜角誤差為0.095[48];利用SNSA方法對(duì)AVIRIS數(shù)據(jù)集進(jìn)行解混時(shí),SNSA、內(nèi)部體積最大法、VCA和MVC-NMF的光譜角誤差分別為0.088 9、0.105 1、0.098 9和0.090 1[46],實(shí)驗(yàn)證明神經(jīng)網(wǎng)絡(luò)具有比傳統(tǒng)解混方法更高的解混精度。除此之外,張霞等[59]使用協(xié)同稀疏解混對(duì)火星Eberswalde撞擊坑三角洲進(jìn)行礦物豐度反演,得到斜長石豐度為51%、高鈣輝石豐度為29%、低鈣輝石豐度為6%和鋰蒙脫石豐度為10%,獲得了較好的解混結(jié)果。
通過對(duì)混合模型、解混算法和目前已開展的解混實(shí)驗(yàn)分析,概括總結(jié)如下。
1)線性模型物理意義簡單,易于理解和計(jì)算,應(yīng)用最為廣泛;對(duì)于礦物粒子而言,Hapke 模型可以詳細(xì)描述混合特征。基于混合模型的解混方法比較成熟,如VCA等端元識(shí)別算法和FCLS豐度求解算法依然是當(dāng)前較為常用的解混方法,這種線性解混方法對(duì)礦物光譜解混精度往往較低,不能滿足研究需求。近年來,把Hapke模型與線性解混相結(jié)合進(jìn)行光譜解混的研究和應(yīng)用逐漸增多,可以明顯提高光譜解混精度,但是對(duì)參數(shù)要求較高,模型計(jì)算往往較為復(fù)雜。傳統(tǒng)解混算法一般是基于模型驅(qū)動(dòng)的非監(jiān)督算法,解混結(jié)果的好壞對(duì)混合像元數(shù)量、噪聲干擾、特征的選取、算法設(shè)計(jì)這幾個(gè)因素的依賴性很大,任意一個(gè)因素都有可能對(duì)最終解混結(jié)果產(chǎn)生較大的影響。把線性與非線性混合模型相結(jié)合以提高解混精度、降低噪聲干擾等是基于模型驅(qū)動(dòng)算法方面需要進(jìn)一步深入研究的方向。
2)基于數(shù)據(jù)驅(qū)動(dòng)的解混方法可以降低計(jì)算復(fù)雜性,提高解混效率,已經(jīng)逐漸應(yīng)用于礦物高光譜解混。雖然流形學(xué)習(xí)和核函數(shù)法具有較強(qiáng)的非線性映射能力,但目前在光譜解混方面仍然處于起步階段,應(yīng)用于礦物解混的研究較少。神經(jīng)網(wǎng)絡(luò)可以學(xué)習(xí)復(fù)雜的非線性關(guān)系,具有較強(qiáng)的抗噪性和容錯(cuò)性,近年來基于神經(jīng)網(wǎng)絡(luò)解混的研究逐漸增多,由于深度神經(jīng)網(wǎng)絡(luò)訓(xùn)練的可監(jiān)督性、較強(qiáng)的泛化性能、優(yōu)于傳統(tǒng)算法的抗噪能力和提取復(fù)雜特征等優(yōu)點(diǎn),已經(jīng)成為學(xué)者關(guān)注的焦點(diǎn),在非線性光譜解混方面取得一定的成果,但是目前處于探索階段。未來提高流形學(xué)習(xí)的抗噪性、深刻探究內(nèi)部的數(shù)學(xué)理論以及對(duì)核函數(shù)算法進(jìn)行改進(jìn)、降低求解復(fù)雜度等是進(jìn)一步深入探究的方向,對(duì)混合礦物高光譜解混將會(huì)產(chǎn)生重要影響。應(yīng)用神經(jīng)網(wǎng)絡(luò)進(jìn)行礦物高光譜解混也存在一些需要解決的問題:端元數(shù)目的不確定性增加了端元識(shí)別的難度;基于數(shù)據(jù)驅(qū)動(dòng)的解混方法需要大量的標(biāo)簽數(shù)據(jù),目前缺乏大量的標(biāo)簽數(shù)據(jù);對(duì)于深度神經(jīng)網(wǎng)絡(luò)的隱層物理意義理解不足,隱藏層層數(shù)的設(shè)定不明確等。因此,建立大量優(yōu)質(zhì)的標(biāo)簽數(shù)據(jù)庫、深入地挖掘神經(jīng)網(wǎng)絡(luò)內(nèi)部的物理含義、在端元數(shù)目未知情況下訓(xùn)練深度神經(jīng)網(wǎng)絡(luò)等是未來應(yīng)用深度學(xué)習(xí)進(jìn)行礦物解混的重要研究方向。