薛曉琴,岳亞偉,夏磊,李麗,賀雄偉
(山西農(nóng)業(yè)大學(xué) 軟件學(xué)院,山西 太谷 030801)
高光譜遙感圖像[1]中普遍存在著混合像元,研究者認(rèn)為混合像元中存在的地物類別、各地物類別所占的比例信息以及各地物類別的具體空間位置具有重要意義[2]?;旌舷裨写嬖诘母鞯匚镱悇e稱為端元,尋找端元是對(duì)混合像元的定性分析;混合像元中端元所占的百分比稱為豐度,求解豐度是對(duì)混合像元的定量分析;混合像元中不同地物類別的空間分布是亞像元定位的結(jié)果,亞像元定位是對(duì)混合像元的定位分析。
亞像元定位的思想最早由Atkinson在1997年提出[3]。亞像元定位自提出之后引發(fā)了國(guó)內(nèi)外學(xué)者的高度關(guān)注以及深入的科學(xué)研究。亞像元定位技術(shù)根據(jù)空間分辨率提高的尺度因子將像元?jiǎng)澐殖啥鄠€(gè)小的亞像元,并為每個(gè)小的亞像元分配唯一的類別標(biāo)簽。現(xiàn)有的亞像元定位模型主要有三大類:1)基于空間引力的亞像元定位,如Mertens提出的亞像元空間引力模型(subpixel/pixel spatial attraction model,SPSAM)[4]、基于空間引力模型和自適應(yīng)端元選取的亞像元定位(attraction based subpixel mapping,ASPM)[5]、基于空間引力和空間輔助信息的亞像元定位(attraction based contextual subpixel mapping,ACSPM)[5];2)基于目標(biāo)優(yōu)化的的亞像元定位,如基于最大后驗(yàn)概率(maximum a posteriori,MAP)的亞像元定位[6]、基于MAP的引入多個(gè)亞像元移位圖像的亞像元定位[7]、基于馬爾可夫隨機(jī)場(chǎng)(markov random field,MRF)的亞像元定位[8]、基于MRF和多個(gè)亞像元移位圖像的亞像元定位[9]、基于模擬退火算法的亞像元定位模型[10]、具有稀疏約束和全變分最小約束的亞像元定位[11];3)基于訓(xùn)練方式的亞像元定位,如基于BPNN(backpropagation neural network)的亞像元定位[12]、基于HNN(Hopfield neural network)的亞像元定位[13]、以全色圖像作為附加信息的基于HNN的亞像元定位[14]、基于SVM的亞像元定位[15]。
基于空間引力的亞像元定位精度的提高依賴于空間相關(guān)性的充分表達(dá),以及空間輔助信息的有效利用?;谀繕?biāo)優(yōu)化的的亞像元定位精度提高的關(guān)鍵在于空間輔助信息的有效表示以及附加約束項(xiàng)的引入。目前,基于空間引力的亞像元定位與基于目標(biāo)優(yōu)化的亞像元定位方法精度的提高皆依賴于高空間分辨率圖像中空間信息的有效表示?;谟?xùn)練方式的亞像元定位,如基于BPNN的亞像元定位,網(wǎng)絡(luò)訓(xùn)練時(shí)間較長(zhǎng),且算法的精度依賴于大量有效的訓(xùn)練樣本。然而,在實(shí)際應(yīng)用中高光譜遙感數(shù)據(jù)的有效訓(xùn)練樣本有限,導(dǎo)致基于訓(xùn)練方式的亞像元定位的精度有限。將小樣本擴(kuò)充為有效的大量樣本是提高基于BPNN的亞像元定位精度的關(guān)鍵。
基于協(xié)同表示的分類(collaborative representation-based classification,CRC)最早由Zhang提出并應(yīng)用于人臉識(shí)別[16]。 CRC引入了l2-范數(shù)最小化約束,使得權(quán)值向量可直接近似估計(jì),極大程度地降低了算法的時(shí)間復(fù)雜度。本文所提算法應(yīng)用了聯(lián)合空間信息的基于協(xié)同表示(joint collaborative representation,JCR)的分類[17]和聯(lián)合空間信息的基于協(xié)同表示的后分割(joint collaborative representation with tikhonov regularization,JCRT)[18]分類器進(jìn)行像元級(jí)分類。不同于JCR,JCRT同時(shí)使用來(lái)自不同類別的訓(xùn)練樣本進(jìn)行協(xié)同表示。因此,JCRT比JCR更適合于監(jiān)督分類,但JCRT比JCR運(yùn)行效率低。
本文針對(duì)小樣本情況下基于BPNN高光譜圖像亞像元定位精度有限的問(wèn)題,提出利用協(xié)同表示與神經(jīng)網(wǎng)絡(luò)的高光譜圖像亞像元定位算法。本文所提算法以一幅低空間分辨率的高光譜圖像(low resolution hyperspectral image,LHSI)和少量的訓(xùn)練樣本作為輸入,首先應(yīng)用基于協(xié)同表示[16]的分類等技術(shù)獲取兩幅初始的亞像元級(jí)類別標(biāo)簽圖,之后依據(jù)兩幅初始的亞像元級(jí)的類別標(biāo)簽圖擴(kuò)充訓(xùn)練集,最后利用擴(kuò)充后的訓(xùn)練集基于BPNN對(duì)高光譜圖像進(jìn)行亞像元定位,從而提高小樣本情況下亞像元定位的精度。
前期研究發(fā)現(xiàn)協(xié)同表示[16]無(wú)需迭代便可近似求解豐度,較大程度地降低了計(jì)算復(fù)雜度,而且可以產(chǎn)生更好的分類性能。BPNN模型較為簡(jiǎn)單,在訓(xùn)練樣本充足的情況下應(yīng)用BPNN可以得到較為精細(xì)的亞像元定位結(jié)果。鑒于協(xié)同表示和BPNN的優(yōu)點(diǎn),提出利用協(xié)同表示和BPNN的高光譜圖像亞像元定位算法(subpixel mapping approach using collaborative representation and backpropagation neural network,CRSPM-BP)。如圖1所示,CRSPM-BP以低空間分辨率的高光譜圖像(LHSI)作為輸入,由高空間分辨率的高光譜圖像(high resolution hyperspectral image,HHSI)的分類,LHSI的亞像元定位,新訓(xùn)練集的生成以及基于BPNN的亞像元定位4個(gè)模塊組成。
圖1 CRSPM-BP總體框圖
CRSPM-BP的第一模塊是HHSI的分類,該分支的輸入是LHSI,輸出是一幅高空間分辨率下的類別標(biāo)簽圖。該模塊包含以下2個(gè)步驟:①對(duì)LHSI空間上采樣以獲得HHSI;②對(duì)空間上采樣所得的HHSI進(jìn)行像元級(jí)的監(jiān)督分類。
若空間分辨率提高的尺度因子為S,則利用立方卷積插值法[19]以S為上采樣尺度因子對(duì)LHSI空間上采樣,可以得到HHSI。之后采用基于JCR的分類器對(duì)空間上采樣所得的HHSI進(jìn)行像元級(jí)分類,可得到一幅高空間分辨率下的類別標(biāo)簽圖。
由于LHSI的訓(xùn)練樣本為純像元,LHSI的訓(xùn)練樣本所對(duì)應(yīng)的亞像元的類別標(biāo)簽與其一致。LHSI訓(xùn)練樣本對(duì)應(yīng)的亞像元即可組成HHSI的訓(xùn)練樣本。HHSI的像素個(gè)數(shù)是LHSI像素個(gè)數(shù)的S2倍,且訓(xùn)練樣本是LHSI訓(xùn)練樣本的S2倍,因此該模塊采用了運(yùn)行效率較高的基于JCR的分類器[17]。
CRSPM-BP的第二模塊為L(zhǎng)HSI的亞像元定位,該分支采用了JASPM[18]算法。LHSI的亞像元定位包括以下3個(gè)步驟:①使用基于JCRT的分類器對(duì)LHSI進(jìn)行像元級(jí)分類;②根據(jù)LHSI的像元級(jí)分類結(jié)果為各混合像元選取端元,并使用全約束最小二乘法(fully constrained least squares,F(xiàn)CLS)[20]求解豐度;③采用SPSAM對(duì)LHSI進(jìn)行亞像元定位。
在LHSI的亞像元定位模塊中,選用基于JCRT的分類器[18]對(duì)LHSI進(jìn)行像元級(jí)分類,獲得一幅低空間分辨率下的類別標(biāo)簽圖。低空間分辨率下的類別標(biāo)簽圖將為后續(xù)的自適應(yīng)端元選取提供依據(jù)。
CRSPM-BP算法將初始訓(xùn)練樣本視為純像元,其他樣本視為混合像元。端元的選取有以下幾條基本原則:①為每個(gè)混合像元選取10個(gè)端元;②多個(gè)端元可以共享同一種地物類別;③從訓(xùn)練集中選取空間上與當(dāng)前混合像元最近的訓(xùn)練樣本作為端元;④所選取的10個(gè)端元中,只有5個(gè)端元的地物類別標(biāo)簽與當(dāng)前混合像元在LHSI像元級(jí)分類結(jié)果中的類別標(biāo)簽一致,其他5個(gè)端元?jiǎng)t來(lái)自不同于像元當(dāng)前標(biāo)簽的其他地物類別。端元選取之后,采用FCLS對(duì)混合像元中各端元所對(duì)應(yīng)的豐度進(jìn)行估計(jì)。由于多個(gè)端元可以共享同一種地物類別,對(duì)當(dāng)前混合像元中所有屬于同一類別的端元對(duì)應(yīng)的豐度信息求和可以得到當(dāng)前混合像元中各地物類別所占的豐度比例。
SPSAM包括3個(gè)步驟:①通過(guò)混合像元中各地物類別的豐度信息和空間分辨率提高的尺度因子計(jì)算混合像元中各地物類別亞像元的個(gè)數(shù);②SPSAM通過(guò)混合像元中各亞像元對(duì)應(yīng)于各地物類別的空間引力值來(lái)量化空間相關(guān)性;③將混合像元中的所有空間引力值從高到低排列,從引力值最高的亞像元開(kāi)始為其分配對(duì)應(yīng)的類別標(biāo)簽,同時(shí)保持亞像元定位結(jié)果與混合像元中各地物類別的亞像元個(gè)數(shù)一致。
2幅高空間分辨率下的類別標(biāo)簽圖已分別由HHSI像元級(jí)分類和LHSI的亞像元定位兩個(gè)模塊獲得。CRSPM-BP的前兩個(gè)模塊所得的高空間分辨率下類別標(biāo)簽圖中類別標(biāo)簽一致的亞像元較多,假設(shè)這些亞像元均定位正確,可以使用這些亞像元所在的像元來(lái)擴(kuò)充訓(xùn)練集。
CRSPM-BP的第三個(gè)模塊為新訓(xùn)練集的生成。新訓(xùn)練集包括了原始的訓(xùn)練集與所有亞像元在CRSPM-BP的前2個(gè)模塊所得的2幅圖像中類別標(biāo)簽均一致的像元。當(dāng)像元所包含的亞像元的標(biāo)簽在JHHS和JASPM中均一致時(shí),該像元的亞像元定位結(jié)果正確的概率較大。將HHSI的分類結(jié)果記作JHHS,LHSI的亞像元定位結(jié)果記作JASPM。假設(shè)上采樣因子S=2,則一個(gè)像元Pi,j被劃分為2×2個(gè)亞像元,像元Pi,j加入新訓(xùn)練集的條件為:
金礦物70.59%為自然金,29.41%為銀金礦。據(jù)區(qū)內(nèi)金礦物電子探針成分分析樣結(jié)果統(tǒng)計(jì),金礦物自然金成色為908.2,銀金礦成色為749.7,平均859.4。自然金中Au/Ag為11.35∶1。成色較高的金礦物,反映成礦溫度為中偏高及較高的成礦深度,微觀觀察礦石可發(fā)現(xiàn),金礦物絕大部分集中在一個(gè)成礦階段內(nèi)[13-15],從均方差64.63和變化系數(shù)9.45來(lái)看,金礦物成色相差較小,反映出金礦物在生成時(shí)間上較接近,成礦階段較單一(表4、表5)。
(1)
由于BPNN較為智能且應(yīng)用較為簡(jiǎn)單,CRSPM-BP的第四個(gè)模塊應(yīng)用BPNN進(jìn)行亞像元定位,對(duì)JHHS和JASPM中標(biāo)簽不一致的亞像元進(jìn)行標(biāo)號(hào)。在只有少量訓(xùn)練樣本的情況下,直接使用BPNN進(jìn)行亞像元定位的精度較低。使用新的訓(xùn)練集有望提高亞像元定位的精度。以新訓(xùn)練集中的像元的豐度信息與其鄰域像元的豐度信息(CRSPM-BP第二模塊中所估計(jì)的豐度)作為輸入,像元中各亞像元的類別標(biāo)簽作為輸出,訓(xùn)練網(wǎng)絡(luò)可以得到合適的權(quán)值和偏置。之后將未確定類別標(biāo)簽的亞像元所在的像元的豐度信息及其鄰域像元的豐度信息輸入訓(xùn)練好的網(wǎng)絡(luò)即可對(duì)該像元進(jìn)行亞像元定位。
基于BPNN的亞像元定位可用MATLAB中的神經(jīng)網(wǎng)絡(luò)工具箱來(lái)完成。該工具箱支持多種可選的訓(xùn)練和學(xué)習(xí)算法。首先,使用訓(xùn)練樣本確定網(wǎng)絡(luò)的較優(yōu)權(quán)值;然后將待亞像元定位的像元的豐度信息及其鄰域像元的豐度信息輸入網(wǎng)絡(luò),即可得到像元中各亞像元屬于各地物類別的概率;最后根據(jù)概率值的高低即可得到該像元中各亞像元的類別標(biāo)簽。
為了驗(yàn)證所提出的CRSPM-BP的有效性,實(shí)驗(yàn)使用了目前廣泛使用的2組由不同成像光譜儀收集的高光譜圖像數(shù)據(jù)集,分別為Indian Pines數(shù)據(jù)和Pavia University數(shù)據(jù)。這2組數(shù)據(jù)代表了不同的地物覆蓋場(chǎng)景,由機(jī)載可見(jiàn)光/紅外成像光譜儀(AVIRIS)獲得的Indian Pines數(shù)據(jù)代表了農(nóng)業(yè)地區(qū),由反射光學(xué)系統(tǒng)成像光譜儀(ROSIS)獲得的Pavia University數(shù)據(jù)代表了城市地區(qū)。
CRSPM-BP的輸入是一幅LHSI,輸出是高空間分辨率下的類別標(biāo)簽圖。為了模擬亞像元定位,對(duì)原始的HHSI以S為下采樣因子進(jìn)行高斯下采樣,以獲得CRSPM-BP的輸入LHSI。實(shí)驗(yàn)中對(duì)202個(gè)波段的包含144像素×144像素的Indian Pines圖像進(jìn)行高斯下采樣并加入噪聲,下采樣后的Indian Pines圖像包含202個(gè)波段,每個(gè)波段包含72像素×72像素。實(shí)驗(yàn)中對(duì)103個(gè)波段的包含609像素×339像素的Pavia University圖像進(jìn)行高斯下采樣并加入噪聲,下采樣后的Pavia University圖像包含103個(gè)波段,每個(gè)波段包含203像素×113像素。
實(shí)驗(yàn)中選擇LHSI的純像元(像元中所有的亞像元屬于同一種地物類別)組成LHSI的訓(xùn)練集。下采樣后的Indian Pines圖像包含2 213個(gè)純像元,從中隨機(jī)選擇15%的純像元構(gòu)建訓(xùn)練集,則訓(xùn)練集包含333個(gè)訓(xùn)練樣本。下采樣后的Pavia University圖像包含206個(gè)純像元,將其全部作為訓(xùn)練樣本,則訓(xùn)練集包含206個(gè)訓(xùn)練樣本。
CRSPM-BP的實(shí)驗(yàn)方法示意圖如圖2所示。LHSI通過(guò)HHSI的像元級(jí)分類和LHSI的亞像元定位2個(gè)分支得到2幅高空間分辨率下的類別標(biāo)簽圖。根據(jù)2幅高空間分辨率的類別標(biāo)簽圖生成新的訓(xùn)練樣本以擴(kuò)充訓(xùn)練樣本集,來(lái)解決小樣本問(wèn)題。CRSPM-BP的核心思想在于利用協(xié)同表示等技術(shù)生成新的訓(xùn)練樣本,而后利用大量樣本基于BPNN進(jìn)行亞像元定位。
圖2 CRSPM-BP實(shí)驗(yàn)方法示意圖
CRSPM-BP的亞像元定位結(jié)果分別與HHSI的像元級(jí)分類結(jié)果(JHHS)、LHSI的亞像元定位結(jié)果(JASPM)進(jìn)行比較,以驗(yàn)證CRSPM-BP第三個(gè)模塊和第四個(gè)模塊的必要性。CRSPM-BP的亞像元定位結(jié)果還與一些具有代表性的同類亞像元定位算法進(jìn)行比較,包括基于空間引力模型和自適應(yīng)端元選取的亞像元定位(ASPM)、基于空間引力模型和輔助空間信息的亞像元定位(ACSPM)算法。
圖3 不同算法對(duì)Indian Pines圖像的亞像元定位結(jié)果
圖4 不同算法對(duì)Pavia University圖像的亞像元定位結(jié)果
為了更加清晰地展示CRSPM-BP的亞像元定位效果,圖5給出了不同算法對(duì)Pavia University圖像的亞像元定位結(jié)果的右下角區(qū)域局部放大圖。ASPM、ACSPM和JHHS所得亞像元定位結(jié)果中的草地類別被誤分為裸地與樹(shù)木類別,如圖5(b)至圖5(d)所示;JASPM所得亞像元定位結(jié)果中的草地類別被誤分為裸地、樹(shù)木、瀝青道路和地磚類別,如圖5(e)所示;CRSPM-BP所得亞像元定位結(jié)果中的草地類別被誤分為樹(shù)木類別,如圖5(f)所示。對(duì)比圖5中不同方法所得亞像元定位結(jié)果的局部放大圖,可以發(fā)現(xiàn)該區(qū)域的CRSPM-BP 結(jié)果類別間混淆較少且沒(méi)有出現(xiàn)“空洞現(xiàn)象”。
圖5 不同算法對(duì)Pavia University圖像的亞像元定位結(jié)果的右下角區(qū)域局部放大圖
實(shí)驗(yàn)中使用總體分類精度(overall accuracy,OA)與Kappa系數(shù)對(duì)亞像元定位結(jié)果進(jìn)行定量評(píng)價(jià)。ASPM、ACSPM、JHHS、JASPM、CRSPM-BP對(duì)于AVIRIS數(shù)據(jù)和ROSIS數(shù)據(jù)的亞像元定位精度見(jiàn)表1。從表1可以看出,CRSPM-BP的亞像元定位精度均優(yōu)于表中所列舉的其他算法。尤其對(duì)于Pavia University圖像,CRSPM-BP算法的OA比ACSPM算法高8.91%。CRSPM-BP和ASPM算法以LHSI作為輸入,而ACSPM算法以LHSI和輔助的高空間分辨率的彩色圖像作為輸入,然而CRSPM-BP仍然生成了比ACSPM精度更高的亞像元定位結(jié)果。
表1 不同算法的亞像元定位精度
CRSPM-BP使用擴(kuò)充后的訓(xùn)練集來(lái)對(duì)BPNN進(jìn)行訓(xùn)練,對(duì)易混淆的像元進(jìn)行亞像元定位,從而提高了亞像元定位的精度。相比Indian Pines圖像,Pavia University圖像細(xì)節(jié)信息較為豐富。CRSPM-BP對(duì)Pavia University圖像的亞像元定位精度的提高更為顯著,CRSPM-BP更適用于細(xì)節(jié)信息豐富的高光譜圖像的亞像元定位。
本文提出了基于協(xié)同表示與BP神經(jīng)網(wǎng)絡(luò)的高光譜圖像亞像元定位算法。CRSPM-BP算法包含了4個(gè)模塊,HHSI的像元級(jí)分類、LHSI的亞像元定位、新訓(xùn)練集的生成和基于BPNN的亞像元定位。HHSI的像元級(jí)分類應(yīng)用了立方卷積插值法和基于JCR的分類技術(shù)。LHSI的亞像元定位包含了基于JCRT的分類、光譜解混和基于空間引力模型的亞像元定位3個(gè)步驟。假設(shè)前2個(gè)模塊產(chǎn)生的類別標(biāo)簽一致的亞像元標(biāo)號(hào)正確,以這些亞像元所在的像元作為新的訓(xùn)練樣本,極大地?cái)U(kuò)充了訓(xùn)練樣本集。較大的訓(xùn)練樣本集使得BPNN可以訓(xùn)練得到合適的權(quán)值和偏置,從而解決了小樣本情況下基于BPNN進(jìn)行亞像元定位精度有限的問(wèn)題。實(shí)驗(yàn)使用了兩組高光譜數(shù)據(jù)集對(duì)CRSPM-BP算法進(jìn)行驗(yàn)證。與同類代表性算法進(jìn)行對(duì)比,CRSPM-BP算法可以產(chǎn)生較好的亞像元定位結(jié)果。對(duì)于Pavia University圖像,CRSPM-BP算法的OA比ACSPM算法高8.91%。然而,對(duì)于Indian Pines圖像,CRSPM-BP的OA僅僅比ACSPM算法高0.26%。CRSPM-BP的精度對(duì)BPNN參數(shù)的依賴性較強(qiáng)。未來(lái)研究將圍繞小樣本情況下基于卷積神經(jīng)網(wǎng)絡(luò)的亞像元定位展開(kāi),有望提高小樣本情況下利用神經(jīng)網(wǎng)絡(luò)進(jìn)行亞像元定位的普適性。