陳軍麗,黃睿
(上海大學(xué) 通信與信息工程學(xué)院,上海 200444)
高光譜影像因能提供精細(xì)的地物光譜曲線和空間特征,在精準(zhǔn)農(nóng)業(yè)、城市規(guī)劃、目標(biāo)檢測(cè)等方面有極大的應(yīng)用能力。
高光譜影像分類(lèi)是高光譜數(shù)據(jù)分析的基礎(chǔ)應(yīng)用,目前已經(jīng)提出多種分類(lèi)方法,如:支持向量機(jī)(support vector machine,SVM)[1]、多項(xiàng)邏輯蒂斯回歸(multinomial logistic regression,MLR)[2]、隨機(jī)森林[3]、神經(jīng)網(wǎng)絡(luò)[4]和主動(dòng)學(xué)習(xí)[5]等。然而,隨著成像儀空間分辨率的提高,“同物異譜”和“同譜異物”現(xiàn)象凸顯,僅利用地物光譜特征的分類(lèi)方法已無(wú)法滿足需求。因此,結(jié)合光譜與空間特征的分類(lèi)方法近年來(lái)成為研究熱點(diǎn)[6-7],出現(xiàn)了基于灰度共生矩陣、馬爾可夫隨機(jī)場(chǎng)、小波變換、形態(tài)學(xué)理論等多種空間特征提取方法。其中,形態(tài)學(xué)屬性剖面(attribute profiles,AP)特征因能有效反映目標(biāo)的尺寸、紋理、光譜等信息,在使用過(guò)程中體現(xiàn)出較好的分類(lèi)性能,被廣泛應(yīng)用于高光譜影像分類(lèi)[8-10]。
依據(jù)屬性濾波的不同,形態(tài)學(xué)屬性剖面可以提取4種屬性特征(即面積、外接矩形對(duì)角線長(zhǎng)度、慣性矩和標(biāo)準(zhǔn)差),但單一的屬性特征難以全面反映地物特性,需要考慮多種屬性特征的融合。當(dāng)前,特征的融合主要發(fā)生在特征級(jí)和決策級(jí)。將不同特征經(jīng)歸一化后直接連接為一個(gè)長(zhǎng)特征,是最直接簡(jiǎn)單的特征級(jí)融合方法[9]。另一種方法是對(duì)產(chǎn)生的長(zhǎng)特征進(jìn)行特征提取,獲得具有更好判別性的低維特征[11-12]。在決策級(jí)融合中,首先根據(jù)單一特征進(jìn)行分類(lèi),接著將不同分類(lèi)結(jié)果按一定準(zhǔn)則進(jìn)行融合。Huang Xin等[13]提出p-fusion方法,利用后驗(yàn)概率估計(jì)對(duì)不同分類(lèi)結(jié)果的可靠性進(jìn)行評(píng)估,但其方法在融合的過(guò)程中未考慮特征的適應(yīng)性。在此基礎(chǔ)上,張春森等[14]改進(jìn)了可靠性評(píng)估方法,并基于訓(xùn)練樣本分類(lèi)精度引入特征權(quán)重,但其可靠性評(píng)估的過(guò)程計(jì)算存在意義不明確的問(wèn)題。
鑒于此,本文提出的基于屬性剖面多特征概率融合的方法定義了新的可靠性度量準(zhǔn)則,并基于樣本分類(lèi)精度估計(jì)每種特征的重要度權(quán)值,兩者結(jié)合建立概率融合模型,獲得最終分類(lèi)結(jié)果。方法通過(guò)決策融合將不同的形態(tài)學(xué)屬性特征有效結(jié)合起來(lái),高光譜影像分類(lèi)實(shí)驗(yàn)表明,與已有決策融合方法相比,所提方法具有更好的性能。
本文所提算法主要由3個(gè)部分構(gòu)成。首先通過(guò)主成分分析(principal component analysis,PCA)獲得高光譜數(shù)據(jù)的降維影像,并在降維影像上提取面積、外接矩形對(duì)角線長(zhǎng)度、慣性矩和標(biāo)準(zhǔn)差等4種特征;然后基于單個(gè)特征實(shí)現(xiàn)分類(lèi),獲得樣本分類(lèi)結(jié)果以及后驗(yàn)概率;最后通過(guò)后驗(yàn)概率計(jì)算每種特征的分類(lèi)結(jié)果可靠性,并基于樣本分類(lèi)精度估計(jì)每種特征的重要度權(quán)值,結(jié)合可靠性和重要度權(quán)值建立概率融合模型,獲得最終分類(lèi)結(jié)果??傮w的流程如圖1所示。下面將主要對(duì)AP特征提取以及概率融合模型進(jìn)行介紹。
圖1 所提算法流程
屬性剖面濾波是形態(tài)學(xué)濾波的擴(kuò)展,它把傳統(tǒng)形態(tài)學(xué)運(yùn)算的結(jié)構(gòu)元素替換為一般性的屬性準(zhǔn)則,能更有效地反映地物的結(jié)構(gòu)特性。屬性剖面濾波操作基于給定參考閾值λ,評(píng)估灰度圖像I中相連成分的屬性值。例如,記圖像的相連成分為Ci,I(Ci)為圖像I中連接部分Ci(連接的像素區(qū)域)的值,如果屬性值A(chǔ)P(I(Ci))大于閾值λ,(即AP(I(Ci))>λ),則這一區(qū)域?qū)⒈槐A簦环粗?,把該區(qū)域值Ci設(shè)置為最近鄰灰度區(qū)域的灰度值,從而將Ci合并到周邊子塊[10]。如果被合并到的區(qū)域灰度值較低,則這一過(guò)程稱(chēng)為圖像的變薄變換,反之稱(chēng)為增厚變換。
設(shè)高光譜影像經(jīng)PCA降維,保留M個(gè)主成分。對(duì)于第m個(gè)主成分影像Im,提取的形態(tài)學(xué)屬性剖面特征為:
AP(Im)=φn(Im),…,φ1(Im),fm,γ1(Im),…,γn(Im)
(1)
式中:φi和γi分別代表屬性增厚和變薄轉(zhuǎn)換操作(i=1,…n)。由此可得到M個(gè)主成分影像的形態(tài)學(xué)屬性剖面特征(即擴(kuò)展形態(tài)學(xué)屬性剖面特征,Extend AP):
EAP=AP(I1),AP(I2),…,AP(IM)
(2)
圖2為對(duì)高光譜影像的第一主成分提取4種屬性特征的示意。參考文獻(xiàn)[10],閾值選取為λa=100、λd=10、λs=20以及λi=0.2。
圖2 AP特征提取舉例
定義基于第f組特征將測(cè)試樣本xi分到第c類(lèi)的可靠性為:
(3)
同時(shí),考慮到不同的屬性特征對(duì)高光譜影像分類(lèi)性能的影響不同,借鑒文獻(xiàn)[13],定義第f組特征對(duì)第c類(lèi)的重要度權(quán)重為:
(4)
基于分類(lèi)可靠性和特征重要度權(quán)重,樣本xi的最終所屬類(lèi)別由以下融合模型確定:
(5)
實(shí)驗(yàn)采用Indian Pine和Pavia University 2個(gè)廣泛使用的高光譜數(shù)據(jù)集。Indian Pine數(shù)據(jù)集是由機(jī)載可見(jiàn)近紅成像光譜儀(airborne visible infra-red imaging spectrometer,AVIRIS)在美國(guó)印第安納州西北農(nóng)業(yè)種植區(qū)獲取的。該圖像包含220個(gè)波段,空間分辨率為20 m,光譜范圍為0.4~2.5 μm,圖像大小為145像素×145像素,共有16種地物類(lèi)別,標(biāo)記樣本個(gè)數(shù)為10 366。為消除噪聲的影響,去除被水體吸收的20個(gè)波段,只留下200個(gè)光譜波段的數(shù)據(jù)用于實(shí)驗(yàn)。數(shù)據(jù)集Pavia University是由反射光學(xué)系統(tǒng)成像光譜儀(reflective optics system imaging spectrometer,ROSIS)在意大利Pavia市的Pavia大學(xué)獲取的。此數(shù)據(jù)集包含115個(gè)波段,光譜范圍為0.43~0.86 μm,空間分辨率為1.3 m,圖像大小610像素×340像素,包含9種地物類(lèi)別,標(biāo)記樣本個(gè)數(shù)為42 776。圖3和圖4分別給出了2個(gè)高光譜數(shù)據(jù)集的偽彩色圖、以及標(biāo)記樣本類(lèi)別和分布狀況。
圖3 Indian Pine高光譜數(shù)據(jù)集
圖4 Pavia University高光譜數(shù)據(jù)集
實(shí)驗(yàn)對(duì)比了所提算法與p-fusion[13]和文獻(xiàn)[14]方法的性能。在融合前均采用形態(tài)學(xué)屬性濾波,提取4種AP特征,其閾值選取與文獻(xiàn)[10]相同,有:
(1)像素標(biāo)準(zhǔn)差準(zhǔn)則(std):
λs=[20304050];
(2)面積準(zhǔn)則(area):
λa=[1005001 0005 000];
(3)慣性矩準(zhǔn)則(inertia):
λi=[0.20.30.40.5];
(4)外接形狀準(zhǔn)則(diagonal):
λd=[102050100]。
為減少計(jì)算量,在提取AP特征前采用PCA對(duì)高光譜影像進(jìn)行降維,要求保留的主成分分量包含的累計(jì)特征值比率達(dá)到99%。因此,對(duì)于Indian Pine和Pavia University數(shù)據(jù)集分別保留4個(gè)和3個(gè)主成分分量。
為驗(yàn)證所提算法(記為aps-fusion)的有效性,我們比較了純光譜分類(lèi)方法(記為spec)、4種基于單個(gè)特征的方法(分別記為std、area、diagonal和inertia)、2種決策級(jí)融合方法p-fusion[13]以及文獻(xiàn)[14]的方法。由于SVM以統(tǒng)計(jì)學(xué)習(xí)理論為基礎(chǔ),在解決小樣本、非線性及高維模式識(shí)別問(wèn)題中表現(xiàn)出了許多特有的優(yōu)勢(shì),是當(dāng)前高光譜影像分類(lèi)中的常用分類(lèi)器。故本實(shí)驗(yàn)所有算法均采用SVM分類(lèi)器。核函數(shù)為高斯函數(shù),相關(guān)參數(shù)采用5倍交叉驗(yàn)證確定。對(duì)于2組數(shù)據(jù)集,從每個(gè)類(lèi)別中隨機(jī)抽取10個(gè)樣本作為訓(xùn)練樣本,余下樣本均作為測(cè)試樣本。精度評(píng)價(jià)指標(biāo)包括總體精度(overall accuracy,OA)、平均精度(average accuracy,AA)和Kappa系數(shù)。
表1和表2分別給出了2個(gè)數(shù)據(jù)集在8種算法下的性能比較結(jié)果。其中,所有的指標(biāo)均為10次運(yùn)行的平均值。對(duì)于Indian Pine數(shù)據(jù)集,特征權(quán)重的參數(shù)τ設(shè)為0.075。從中可以看出,當(dāng)僅依靠純光譜波段分類(lèi)時(shí),精度最低,OA只有18.60%。這說(shuō)明在訓(xùn)練樣本數(shù)量很有限時(shí),純光譜分類(lèi)難以得到滿意結(jié)果。當(dāng)引入AP特征后,分類(lèi)精度得到顯著提升。在4種單一特征中,面積屬性特征獲得最好的分類(lèi)精度,OA達(dá)到79.70%。而3種融合方法集成了4種屬性剖面的特性,均得到更好的分類(lèi)結(jié)果。其中,本文方法獲得最高精度,OA、AA和Kappa系數(shù)分別達(dá)到83.41%、89.05%和0.810。對(duì)于Pavia University數(shù)據(jù)集,特征權(quán)重的參數(shù)τ設(shè)為0.5。從表2中同樣可以看出,純光譜分類(lèi)的精度最低;當(dāng)結(jié)合AP特征后,精度得到提升;當(dāng)采用多特征融合方法時(shí),精度進(jìn)一步提高,其中本文方法獲得最佳的分類(lèi)性能。
圖5進(jìn)一步給出了5種算法對(duì)Pavia University數(shù)據(jù)集的分類(lèi)結(jié)果??梢钥吹?,本文提出的算法aps-fusion取得了最好的分類(lèi)效果,地物的錯(cuò)分情況最少。
表1 Indian Pine數(shù)據(jù)集不同算法的精度比較
表2 Pavia University數(shù)據(jù)集不同算法的精度比較
圖5 Pavia University數(shù)據(jù)集的5種方法分類(lèi)結(jié)果圖
基于形態(tài)學(xué)屬性剖面的特征能反映地物的空間結(jié)構(gòu)特性,取得了較好的分類(lèi)性能。但不同的屬性剖面特征對(duì)地物特性的描述側(cè)重點(diǎn)又有不同。本文提出一種融合多種屬性剖面特征的高光譜影像分類(lèi)方法。方法在分別提取高光譜影像4種AP特征并進(jìn)行分類(lèi)的基礎(chǔ)上,利用樣本的后驗(yàn)概率估計(jì)值和分類(lèi)精度計(jì)算不同特征的分類(lèi)可靠性以及重要度權(quán)值,兩者結(jié)合建立基于概率的決策融合模型,獲得高光譜影像的最終分類(lèi)結(jié)果。2個(gè)公共高光譜影像數(shù)據(jù)集的分類(lèi)實(shí)驗(yàn)表明,多特征融合算法的性能普遍優(yōu)于使用單特征的算法;其中,所提融合算法與其他融合算法相比,分類(lèi)精度得到了進(jìn)一步提升。