占燕婷,吳柯,徐宏根,劉慧澤
(1.中國(guó)地質(zhì)大學(xué)(武漢) 地球物理與空間信息學(xué)院,武漢 430074;2.中國(guó)地質(zhì)調(diào)查局武漢地質(zhì)調(diào)查中心,武漢 430205)
高光譜遙感是在成像光譜學(xué)的基礎(chǔ)上發(fā)展起來的,具有光譜分辨率高、圖譜合一的獨(dú)特優(yōu)勢(shì),在軍事偵察、大氣探測(cè)、環(huán)境監(jiān)測(cè)、地質(zhì)勘察、海洋、林業(yè)和農(nóng)業(yè)遙感等領(lǐng)域有著廣泛和重要的應(yīng)用[1-2]。與傳統(tǒng)遙感相比,高光譜遙感的每個(gè)成像像元都有幾十上百個(gè)成像波段,每個(gè)波段寬度一般小于10 nm,并且在傳感器的成像光譜區(qū)間內(nèi)是連續(xù)分布的,因此,高光譜遙感影像中的每一個(gè)像元光譜都是一條連續(xù)、平滑、完整的曲線,為基于光譜對(duì)影像地物類型的識(shí)別提供了更多的信息和方法。
光譜匹配技術(shù)是高光譜影像分類的關(guān)鍵技術(shù)之一,它是由已知地物類型的反射波譜,通過波形或特征匹配來達(dá)到識(shí)別地物類型的目的[3]。分類的主要依據(jù)是“同物同譜”理論,即:同種地物具有相似的光譜特征,在影像上呈現(xiàn)出高度的相似性。基于光譜相似性測(cè)度對(duì)影像進(jìn)行分類的原理是對(duì)每一參考類別確定其參考光譜,然后對(duì)每一待定像元進(jìn)行光譜測(cè)試,計(jì)算其與參考光譜的相似性,待定像元類別則屬于相似性最高的一類[4]。常見的光譜相似性測(cè)度有歐氏距離、光譜信息散度、光譜交叉相關(guān)系數(shù)測(cè)度和光譜角度測(cè)度等[5]。其中,光譜角匹配法(spectral angle mapping,SAM)是一種比較波譜整體形狀相似度的分類方法,由于具有明確的物理意義以及較好的分類效果,因此,它在高光譜匹配分類中一直擁有廣泛的應(yīng)用。近年來,眾多研究者以SAM為基礎(chǔ),提出了一系列改進(jìn)的光譜匹配分類算法,取得了良好的效果。比如:何中海等[6]通過在相似波譜曲線差異較大的特征區(qū)間設(shè)置權(quán)重,提出權(quán)重光譜角的方法,增大相似性礦物波譜與參考波譜的差異;Liu等[7]通過在SAM分類方法中加入基于像素間的“光譜向量長(zhǎng)度差異”因子,提高了高光譜遙感影像的分類精度。
此外,突出光譜信息的局部特征(主要是波譜吸收谷特征)生成不同的特征參數(shù),也能夠進(jìn)行地物類型有效的區(qū)分。尤其是對(duì)“同譜異物”的現(xiàn)象而言,光譜特征參數(shù)的引入能夠顯著提高相似地物類型的識(shí)別精度。例如:車永飛等[8]通過對(duì)光譜特征較穩(wěn)定的主、次吸收谷特征參數(shù)賦以不同的權(quán)重系數(shù),提取礦物的蝕變信息;韋晶等[9]綜合利用多種光譜特征參數(shù),進(jìn)行統(tǒng)計(jì)分析,得到Cuprite礦區(qū)的礦物識(shí)別模型,最終實(shí)現(xiàn)了礦物信息的高精度識(shí)別。但是,僅僅基于光譜特征參數(shù)的絕對(duì)大小對(duì)典型地物類型進(jìn)行識(shí)別,具有一定的局限性。由于只考慮了局部光譜特征的相似性,無法對(duì)整體光譜特征進(jìn)行有效的表達(dá),在常規(guī)的光譜匹配分類中,往往會(huì)造成分類精度低下。因此,研究者一般會(huì)在光譜特征參數(shù)的基礎(chǔ)上,結(jié)合其他分類方法,構(gòu)建完整的分類模型。例如:劉煥軍等[10]提取土壤的反射光譜特征參數(shù)后,利用K均值聚類和決策樹分別進(jìn)行聚類分析和分類模型構(gòu)建,實(shí)現(xiàn)的土壤的快速分類;王翔[11]以光譜特征參數(shù)為輸入量構(gòu)建決策樹模型,對(duì)土壤進(jìn)行分類,得到了比其他方法更高的分類精度。
基于以上分析,本文在SAM匹配分類模型的基礎(chǔ)上,提出一種聯(lián)合光譜角與組合特征參數(shù)(spectral angle mapping-combination characteristic parameter,SAM-CCP)的新型高光譜遙感影像分類方法。該方法能夠有效區(qū)分不同地物類型的整體波譜曲線,同時(shí)兼顧對(duì)光譜局部特征信息的約束和識(shí)別,使得相似地物類型的光譜曲線也能夠得到有效的區(qū)分。本文通過兩組實(shí)驗(yàn)證明:SAM-CCP匹配法能夠動(dòng)態(tài)地調(diào)整特征參數(shù),選擇最優(yōu)的組合方式,有效地降低了匹配分類的誤差。
光譜角匹配法是指將兩條光譜曲線各個(gè)波段的反射率值組成二維空間向量,通過計(jì)算其廣義夾角來表征兩條光譜的相似程度:夾角越小,光譜越相似。計(jì)算得到兩條光譜曲線的夾角余弦值為cos,余弦值越接近于1,兩條光譜曲線越相似[12]。光譜角匹配法雖然能從光譜曲線的形狀上比較光譜的相似程度,但是對(duì)于光譜局部特征上的差異性較難區(qū)分[13]。
光譜特征參數(shù)匹配法(spectral characteristic parameter,SCP)是指將從光譜曲線提取出的吸收谷光譜特征參數(shù)組合成二維特征向量,然后計(jì)算像元光譜與參考光譜的特征向量之間的距離來表征兩條光譜的相似程度,距離值越小,則證明光譜特征參數(shù)越接近,吸收谷越相似。計(jì)算其歐氏距離值如式(1)所示。
(1)
式中:xi和yi分別表示參考光譜和像元光譜的第i個(gè)特征參數(shù);n為參數(shù)總個(gè)數(shù);Euclidean為歐式距離值。
根據(jù)光譜的吸收谷特征,本文主要提取了吸收谷的八個(gè)特征參數(shù)進(jìn)行分類,分別如下所示。
(1)吸收波谷位置P是光譜吸收谷反射率最低處對(duì)應(yīng)的波長(zhǎng)。
(2)吸收反射率Ep是吸收波谷位置處的反射率值。
(3)吸收寬度W是吸收谷兩側(cè)肩部的波譜帶寬。
(4)吸收對(duì)稱度S是過波谷位置垂線的左右兩部分的對(duì)稱程度,等于左右肩部距離谷底的波長(zhǎng)寬度與吸收寬度之比。
(5)吸收深度H是吸收反射率Ep與吸收谷兩側(cè)肩部對(duì)應(yīng)的較小反射率值的差值。
(6)吸收面積A是吸收帶曲線與兩側(cè)肩部連線所圍成的面積。
(7)吸收斜率K是原始光譜曲線中,吸收波谷兩肩部連線的斜率。
(8)光譜吸收指數(shù)SAI是非吸收基線和吸收谷底垂線交點(diǎn)的反射率值與吸收谷底反射率值的比值。
1) SAM-CCP。SAM-CCP匹配法是指將光譜角匹配法得到的夾角余弦值cos與組合特征參數(shù)匹配得到的歐式距離值Euclidean相結(jié)合,匹配距離值如式(2)所示。
Distance=(1-cos)·Euclideanμ
(2)
式中:μ為歐式距離開方系數(shù),通過在0~1之間調(diào)節(jié)μ的大小,可以不同步地改變像元光譜與不同參考光譜之間的Euclidean值,使距離大的值更大、距離小的值更小,增大光譜之間的差異性;Distance值為聯(lián)合后的匹配距離,值越小,兩條光譜越相似。光譜角表征的是光譜曲線的整體形狀特征,而光譜特征參數(shù)表征的是光譜曲線的局部吸收谷特征,所以將二者相結(jié)合充分利用了地物的反射率光譜信息,有利于提高地物類型的識(shí)別精度。
2) 最優(yōu)光譜特征參數(shù)組合選取。在實(shí)際應(yīng)用中,選擇更多的光譜特征參數(shù)對(duì)地物進(jìn)行分類未必取得最好的結(jié)果,所以,從眾多的光譜特征參數(shù)中,選擇最佳的組合,從而更準(zhǔn)確地識(shí)別地物類型,是該方法的重點(diǎn)。最優(yōu)光譜特征參數(shù)組合選取步驟如下。
步驟1:利用包絡(luò)線去除的方法對(duì)光譜曲線進(jìn)行歸一化處理,放大吸收谷的特征,然后根據(jù)地物光譜曲線的吸收谷特性,確定吸收谷的個(gè)數(shù),從短波到長(zhǎng)波方向,依次為v1、v2…vn。
步驟2:提取每個(gè)谷的光譜特征參數(shù),共8n個(gè)。比如:v1的光譜特征參數(shù)分別為P1、Ep1、W1、S1、H1、A1、K1、SAI1,其他谷同理。
步驟3:選擇一個(gè)光譜特征參數(shù)進(jìn)行光譜匹配,共8n種分類結(jié)果,對(duì)其進(jìn)行精度評(píng)價(jià),得到最大分類精度的匹配參數(shù)f1。
步驟4:選擇f1與其他8n-1個(gè)參數(shù)組合,對(duì)影像進(jìn)行分類,對(duì)比所有結(jié)果的總體分類精度,得到最大分類精度的參數(shù)組合為[f1,f2]。
步驟5:重復(fù)步驟4,直到最大分類精度不再提高,此時(shí)的參數(shù)組合即為最優(yōu)光譜特征參數(shù)組合。
為驗(yàn)證本文提出的聯(lián)合光譜角與組合特征參數(shù)的光譜匹配算法的有效性,分別選用Indian Pines地區(qū)和Cuprite礦區(qū)的兩組高光譜影像數(shù)據(jù)進(jìn)行實(shí)驗(yàn),并將分類結(jié)果與傳統(tǒng)的最小距離法(minimum distance discriminant method,MD)、光譜信息散度匹配法(spectral information divergence,SID)和光譜角匹配法SAM的分類結(jié)果進(jìn)行比較,精度評(píng)價(jià)選擇總體分類精度(overall accuracy,OA)、Kappa系數(shù)、生產(chǎn)者精度(producer’s accuracy,PA)和使用者精度(user’s accuracy,UA)。
Indian Pines數(shù)據(jù)獲取于1992年,由AVIRIS傳感器收集,覆蓋區(qū)域?yàn)槊绹?guó)加利福利亞的一處農(nóng)業(yè)實(shí)驗(yàn)區(qū),如圖1所示。數(shù)據(jù)由224個(gè)反射率光譜波段組成,波長(zhǎng)范圍為0.4~2.5 μm,大小為145像素×145像素,空間分辨率為20 m。去除覆蓋在吸水區(qū)域的條帶后,波段數(shù)量減少到200個(gè)。研究區(qū)地物類型以農(nóng)作物為主,已知地物像元個(gè)數(shù)為10 249,共16類,分別是苜蓿、玉米Ⅰ、玉米Ⅱ、玉米Ⅲ、草Ⅰ、草Ⅱ、草Ⅲ、干草料堆、燕麥、大豆Ⅰ、大豆Ⅱ、大豆Ⅲ、小麥、森林、建筑和石頭鋼塔。該影像的反射率光譜曲線一般有五個(gè)明顯的吸收谷特征,圖2為經(jīng)包絡(luò)線去除后的大豆Ⅱ的參考光譜曲線,參考光譜是通過對(duì)比參考分類圖,在原始影像中畫感興趣區(qū)域,獲取其平均光譜,影像中其他地物類型的參考光譜總體形狀與圖2相似。從圖中可以看出,光譜在前40個(gè)波段和波段90和120附近,噪聲明顯,據(jù)此采用窗口大小為5的均值濾波對(duì)其進(jìn)行平滑處理,減小光譜特征參數(shù)提取的誤差。經(jīng)包絡(luò)線去除后的光譜,可提取出五個(gè)吸收谷特征,從左往右依次為v1、v2、v3、v4、v5,吸收波谷位置P分別為band 32、58、78、104、145。
圖1 Indian Pines原始影像
圖2 經(jīng)包絡(luò)線去除的大豆Ⅱ參考光譜
實(shí)驗(yàn)首先調(diào)節(jié)μ值大小,調(diào)節(jié)范圍為0~1,間隔為0.1,對(duì)比各個(gè)結(jié)果分類精度,再縮小范圍到0.2~0.3,以0.01為間隔調(diào)節(jié)μ值大小,最終表明,當(dāng)μ為0.25時(shí),分類精度最高。然后對(duì)該數(shù)據(jù)提取出五個(gè)吸收谷的光譜特征參數(shù),共40個(gè);利用單個(gè)光譜特征參數(shù)對(duì)影像進(jìn)行分類,分類精度最高的參數(shù)即為最優(yōu)光譜特征參數(shù)組合中的第一個(gè)量,即A5;最后將A5與其他特征參數(shù)進(jìn)行組合,依次獲取最優(yōu)組合中的其他參數(shù),當(dāng)分類精度不再提高時(shí),該組合即為最優(yōu)光譜特征參數(shù)組合。圖3為選擇不同個(gè)數(shù)的光譜特征參數(shù)進(jìn)行組合時(shí),對(duì)應(yīng)的最高總體分類精度。由圖可知,前期總體分類精度隨著組合中參數(shù)個(gè)數(shù)的增加而增加,直到參數(shù)個(gè)數(shù)為6時(shí)達(dá)到峰值,隨后總體分類精度不再增加,到第10個(gè)參數(shù)有降低的趨勢(shì)。所以,由六個(gè)光譜特征參數(shù)組成的組合[A5,SAI2,Ep2,H3,S4,H4]即為該影像分類的最優(yōu)光譜特征參數(shù)組合,此時(shí),總體分類精度為77.66%。
圖3 Indian Pines數(shù)據(jù)參數(shù)個(gè)數(shù)對(duì)分類精度的影響
基于四種方法的Indian Pines數(shù)據(jù)集分類結(jié)果如圖4所示。從圖中可以看出,所有算法對(duì)于苜蓿、干草料堆、小麥和石頭鋼塔等地物類型,表現(xiàn)出較好的分類結(jié)果,其原因可能與占地面積少且光譜曲線特征明顯有關(guān);而對(duì)于草Ⅰ、大豆Ⅲ和建筑,由于許多相似地物類型的存在,不同的地物類型具有極其相似的光譜形狀和吸收谷特征,又加上影像中存在著大量的混合像元,對(duì)分類結(jié)果造成了較大的影響,精度仍然低下。SAM-CCP分類法對(duì)于區(qū)域中占地面積較大且位于中部位置的大豆Ⅰ和大豆Ⅱ,分類結(jié)果較其他三種方法更好,區(qū)域中錯(cuò)分的像素點(diǎn)更少。Indian Pines數(shù)據(jù)集的分類精度定量結(jié)果如表1所示。SAM-CCP分類法的總體分類精度最高,為77.66%,分別比MD、SID和SAM提高了7.07%、1.36%和2.65%。
圖4 Indian Pines數(shù)據(jù)集分類結(jié)果
表1 Indian Pines數(shù)據(jù)集分類精度 %
Cuprite礦區(qū)位于美國(guó)西南部的內(nèi)華達(dá)州,該地區(qū)基巖裸露程度高,礦物類型豐富,是遙感地質(zhì)研究的典型實(shí)驗(yàn)區(qū)。Cuprite礦區(qū)的AVIRIS高光譜數(shù)據(jù),獲取時(shí)間為2006年9月20日,光譜范圍為0.4~2.5 μm,光譜分辨率為10 nm,空間分辨率為20 m,數(shù)據(jù)大小為477像素×533像素,共224個(gè)波段,刪除數(shù)據(jù)異常的108波段后,共223個(gè)波段用于實(shí)驗(yàn),如圖5所示。參照Clark等[14]1995年的Cuprite礦區(qū)填圖結(jié)果,選取礦區(qū)中九種典型的礦物類型進(jìn)行分類實(shí)驗(yàn),分別為明礬石、高嶺石、蒙脫石、白云母、方解石、玉髓、多水高嶺土、高嶺石和白云母的混合物,以及明礬石、高嶺石和白云母的混合物。圖6為九種礦物的參考光譜曲線,通過對(duì)比參考分類影像,獲取原始影像中每一類型對(duì)應(yīng)區(qū)域的平均光譜,即為該礦物的參考光譜。從圖中可以看出,九種礦物類型的光譜曲線在整體上較為相似,但局部特征具有一定的差異性。在波段110和160附近曲線噪聲較大,所以選取窗口大小為3的均值濾波對(duì)曲線進(jìn)行平滑后再提取吸收谷的光譜特征參數(shù),將減小因噪聲引起的分類誤差。經(jīng)包絡(luò)線去除后,該影像的光譜曲線可提取出七個(gè)明顯的吸收谷特征,吸收谷位置分別在band 13、35、59、114、147、163、189附近。
圖5 Cuprite原始影像
與Indian實(shí)驗(yàn)相同,首先調(diào)節(jié)μ值大小,找到最佳指數(shù)μ為0.08。然后組合光譜特征參數(shù),對(duì)Cuprite礦區(qū)高光譜數(shù)據(jù)進(jìn)行分類。圖7為該實(shí)驗(yàn)中參數(shù)個(gè)數(shù)對(duì)分類精度的影響,當(dāng)參數(shù)個(gè)數(shù)為4時(shí),總體分類精度達(dá)到最高值87.89%,隨后不再增加,此時(shí)光譜特征參數(shù)組合為[K7,W7,W2,P7],即為最優(yōu)光譜特征參數(shù)組合,由此可見,谷7對(duì)分類精度的提高貢獻(xiàn)率最大。
圖6 Cuprite影像參考光譜曲線
圖8為分類參考圖和MD、SID、SAM以及本文方法分類結(jié)果的對(duì)比,總體來說SAM-CCP分類法的效果更好,各個(gè)類別的劃分與地表真實(shí)類別更接近;其中,白云母的分類效果相比于其他三種方法更好,區(qū)域中錯(cuò)分的像素點(diǎn)更少,誤差最大的是最小距離分類結(jié)果,將左邊區(qū)域的部分白云母錯(cuò)分為方解石;四種方法都將研究區(qū)右邊部分的明礬石、高嶺石和白云母的混合物錯(cuò)分為明礬石,從圖6中可以看出,這兩種地物類型的光譜比較接近,因此造成了誤分。Cuprite礦區(qū)數(shù)據(jù)集的分類精度如表2所示?;赟AM-CCP方法的分類結(jié)果總體分類精度和Kappa系數(shù)最高,分別為87.89%和0.779 1,其總體分類精度分別比MD、SID、SAM分類結(jié)果高9.24%、8.21%和3.59%。
圖7 Cuprite數(shù)據(jù)參數(shù)個(gè)數(shù)對(duì)分類精度的影響
圖8 Cpurite數(shù)據(jù)集分類結(jié)果
表2 Cuprite數(shù)據(jù)集分類精度 %
從兩組數(shù)據(jù)的分類結(jié)果可知,本文提出的SAM-CCP匹配法對(duì)于農(nóng)作物和巖礦類型的識(shí)別都較SAM等傳統(tǒng)的分類方法精度有所提升,尤其是對(duì)于光譜曲線整體相似性大而局部差異性大的地物類型,其識(shí)別精度得到了明顯的改善,證明了該方法的優(yōu)勢(shì)。
由Indian Pines數(shù)據(jù)集分類結(jié)果可知,改善效果最明顯的前三類分別為大豆Ⅲ、大豆Ⅰ以及玉米Ⅰ(表1中標(biāo)粗顯示)。其中,大豆Ⅲ的生產(chǎn)者精度和使用者精度比其他方法中精度最高的SID匹配法分別高出22.26%和13.68%;大豆Ⅰ的生產(chǎn)者精度比其他方法中精度最高的SAM高8.02%,使用者精度比其他方法中精度最高的SID高8.98%;玉米Ⅰ的生產(chǎn)者精度和使用者精度分別較SAM提高了9.24%和10.63%。而對(duì)于Cuprite礦區(qū)分類結(jié)果,白云母因具有獨(dú)特的光譜特征區(qū)別于其他礦物類型,分類精度最高,其生產(chǎn)者精度達(dá)85.37%,使用者精度達(dá)93.98%,分別高出其他方法最高精度11.19%和4.41%。分類精度提高最為明顯的三種類型分別是:高嶺石和白云母的混合物、高嶺石以及玉髓(表2中標(biāo)粗顯示)。高嶺石和白云母的混合物生產(chǎn)者精度比精度最高的SAM高出12.54%,使用者精度比精度最高的SID高出10.58%;高嶺石的生產(chǎn)者精度比MD高8.85%,使用者精度比SAM高7.08%;玉髓的生產(chǎn)者精度雖然只比其他方法中精度最高的SAM高2.01%,但其使用者精度提高了28.97%。
由于Indian Pines數(shù)據(jù)為精細(xì)農(nóng)作物的分類,其每一類別的參考光譜都很相似,而Cuprite數(shù)據(jù)為巖礦類型的識(shí)別,各巖礦參考光譜之間的吸收谷差異較大,特征顯著,所以添加了光譜特征參數(shù)后的光譜角匹配法,對(duì)于巖礦類型的識(shí)別較農(nóng)作物,其精度提高更為明顯。
本文提出了一種聯(lián)合光譜角和組合特征參數(shù)的SAM-CCP匹配法,該方法基于遙感影像的光譜特征對(duì)地物進(jìn)行識(shí)別分類,有效地解決了圖像匹配中突出光譜曲線整體特征,而忽略光譜的局部特征信息的問題。將該方法應(yīng)用于Indian Pines地區(qū)和Cuprite礦區(qū)高光譜影像數(shù)據(jù),并與MD、SID和SAM分類結(jié)果進(jìn)行對(duì)比分析。結(jié)果表明:
1)綜合考慮了光譜曲線的整體和局部特征的SAM-CCP匹配法,能夠改善多數(shù)光譜相似地物的識(shí)別精度,提高高光譜遙感影像分類的總體精度。
2)該方法對(duì)于農(nóng)作物和巖礦地物類型的區(qū)分都具有一定的適用性,相比于農(nóng)作物分類,該方法對(duì)于具有獨(dú)特吸收谷特征的礦物類型的區(qū)分,精度提高更明顯。
在以后的研究工作中,將考慮結(jié)合卷積神經(jīng)網(wǎng)絡(luò)等深度學(xué)習(xí)技術(shù),進(jìn)一步改善分類方法,提高地物識(shí)別精度。