謝水根 李文娟
(1. 武漢中地?cái)?shù)碼科技有限公司, 湖北 武漢 430073;2. 杭州??低晹?shù)字技術(shù)股份有限公司 浙江 杭州 310000)
高光譜圖像分類是高光譜領(lǐng)域的研究熱點(diǎn)。高光譜圖像分類技術(shù)是指通過(guò)對(duì)圖像各像元進(jìn)行特征提取及唯一性表達(dá),然后利用一定的算法依據(jù)像元所表達(dá)特征,依次賦予特定類別標(biāo)簽的過(guò)程。高光譜圖像分類已廣泛應(yīng)用于土地利用、環(huán)境調(diào)查、精準(zhǔn)農(nóng)業(yè)等領(lǐng)域。
高光譜圖像分類研究已取得較好的進(jìn)展。引入空間特征進(jìn)行高光譜圖像分類是當(dāng)前高光譜圖像分類中主要的方法手段,根據(jù)實(shí)現(xiàn)手段可以分為超像元、特征融合、深度網(wǎng)絡(luò)、復(fù)合核、基于圖等方式,其中特征融合是當(dāng)前利用空間特征進(jìn)行高光譜圖像分類的主流方式之一,但特征融合方式多為直接堆疊式,但由于不同圖像因其面向?qū)ο蟛煌?因此對(duì)不同特征的適用性不同,故而直接采取堆疊式特征融合過(guò)于機(jī)械。
雖然空間特征的利用方式多樣,但其本質(zhì)皆是利用了像元分布上的空間相關(guān)性,而地物的分布往往具有聚類性和延續(xù)性,因此地物的邊界信息對(duì)于圖像分類來(lái)說(shuō)具有一定的應(yīng)用價(jià)值,而傳統(tǒng)分類方法中往往忽略了地物邊界信息。此外,訓(xùn)練樣本是高光譜圖像監(jiān)督分類中的重要基礎(chǔ),對(duì)于訓(xùn)練樣本的選取與標(biāo)定需要耗費(fèi)大量人力物力,因此,研究基于小訓(xùn)練樣本的高光譜圖像分類方法具有重要意義。
綜上所述,本文提出顧及小樣本及權(quán)重融合的極限學(xué)習(xí)機(jī)高光譜圖像分類方法,首先通過(guò)主成分分析(principal component analysis,PCA)對(duì)高光譜圖像進(jìn)行降維,以降低運(yùn)算復(fù)雜度;其次利用第一主成分作為引導(dǎo)圖對(duì)剩余主成分進(jìn)行引導(dǎo)濾波,以保留邊界信息;再次利用拓展形態(tài)學(xué)屬性剖面提取圖像結(jié)構(gòu)特征并與引導(dǎo)濾波進(jìn)行權(quán)重融合;最后利用極限學(xué)習(xí)機(jī)對(duì)融合結(jié)果進(jìn)行分類,得到最終分類結(jié)果。
I
,引導(dǎo)圖G
,濾波輸出圖像O
,G
與O
在以像元點(diǎn)c
為中心的領(lǐng)域窗口存在局部線性轉(zhuǎn)換,如式(1)所示。(1)
式中,w
表示以像元點(diǎn)c
為中心的窗口;a
和b
為窗口w
的線性系數(shù);G
表示引導(dǎo)圖在窗口w
中的像元點(diǎn)。為求解式(1)中的線性系數(shù)a
、b
,通過(guò)對(duì)輸入圖像I
進(jìn)行約束以決定線性系數(shù)的取值,在保持局部線性關(guān)系的同時(shí),通過(guò)最小化I
和O
之間的最小差距,從而將求解線性系數(shù)問題轉(zhuǎn)化為求最優(yōu)解問題,如式(2)所示。(2)
式中,ε
為正則化參數(shù),其作用為避免a
值過(guò)大,且ε
>0,I
表示輸入圖像的一個(gè)像元點(diǎn)i
。通過(guò)線性回歸模型,可對(duì)式(2)求解,如式(3)所示。(3)
但由于像元點(diǎn)在空間上往往會(huì)被包含在多個(gè)窗口的重疊區(qū)域,每個(gè)窗口的線性系數(shù)不一致,其計(jì)算得出的結(jié)果也必然不同,因此,為解決這個(gè)問題,最簡(jiǎn)單的辦法就是對(duì)所有得到的值求取平均值,如式(4)所示。
(4)
根據(jù)窗口對(duì)稱性,式(4)可以轉(zhuǎn)化為式(5)。
(5)
拓展形態(tài)學(xué)多屬性剖面(extended multi-attribute profiles,EMAPs)是通過(guò)形態(tài)學(xué)屬性剖面(morphological attribute profiles,MAP)進(jìn)行一系列不同屬性指標(biāo)的濾波器進(jìn)行圖像濾波以獲取不同屬性特征信息,再將不同屬性信息進(jìn)行疊加即可得到拓展形態(tài)學(xué)屬性剖面。
具體原理為:假設(shè)有灰度圖像I
,某屬性指標(biāo)f
,連通分量C
,閾值T
,則根據(jù)式(6)判斷進(jìn)行細(xì)化或粗化操作。(6)
當(dāng)滿足式(6)時(shí),則該連通分量并入相近區(qū)域,根據(jù)并入相近區(qū)域灰度值大小劃定細(xì)化和粗化操作。當(dāng)給定多個(gè)閾值時(shí),即可產(chǎn)生一系列結(jié)果,基于此,對(duì)不同的多個(gè)屬性進(jìn)行操作,最后疊加即可生成EMAPs。詳細(xì)原理可見文獻(xiàn)[13]。
極限學(xué)習(xí)機(jī)(extreme learning machine,ELM)是由黃廣斌教授提出的一種快速、高效的單隱層學(xué)習(xí)網(wǎng)絡(luò),已被廣泛應(yīng)用于高光譜圖像分類,詳細(xì)原理可參見文獻(xiàn)[14]。
為應(yīng)對(duì)高光譜圖像分類中邊緣信息丟失、特征融合方式機(jī)械等問題,本文基于權(quán)重特征融合與極限學(xué)習(xí)機(jī)進(jìn)行分類,方法流程圖見圖1所示。
圖1 本文方法流程圖
如圖1所示,首先利用PCA對(duì)高光譜圖像進(jìn)行處理,以達(dá)到降維目的,降低運(yùn)算復(fù)雜度,然后利用GF和EMAPs分別提取保存邊緣信息的GF結(jié)果以及拓展形態(tài)學(xué)屬性剖面特征,值得注意的是,對(duì)GF中所需引導(dǎo)圖以第一主成分代替,隨后通過(guò)分別設(shè)置1∶4、2∶3、1∶1、3∶2、4∶1的權(quán)重比值進(jìn)行特征融合,尋找對(duì)該數(shù)據(jù)最合適的權(quán)值比值,并以此作為最終輸入至ELM進(jìn)行分類的融合特征,得到最終分類結(jié)果。
為驗(yàn)證本文方法的有效性和穩(wěn)定性,采用當(dāng)前國(guó)內(nèi)外公認(rèn)的三組標(biāo)準(zhǔn)數(shù)據(jù)集,印第安納松樹數(shù)據(jù)集(Indian Pines,IP)、帕維亞大學(xué)數(shù)據(jù)集(Pavia University,PU)、薩利納斯場(chǎng)景數(shù)據(jù)集(Salinas,SA),各數(shù)據(jù)集具體信息如表1所示。
表1 實(shí)驗(yàn)數(shù)據(jù)信息表
表1中,AVIRIS是指美國(guó)的機(jī)載可見光近紅外成像光譜儀(airborne visible infrared imaging spectrometer,AVIRIS),ROSIS則為德國(guó)的高光譜傳感器反射光學(xué)系統(tǒng)成像光譜儀(reflective optics system imaging spectrometer,ROSIS)。
為客觀的驗(yàn)證本文方法的效果,對(duì)方法及比較方法中所用的相關(guān)算法進(jìn)行參數(shù)設(shè)定,主要有:
(1)PCA為取對(duì)應(yīng)前99%信息量的主成分。
(2)GF為取第一主成分為引導(dǎo)圖,濾波窗口3×3。
(3)EMAPs為閾值設(shè)置為100、200、500、1 000。
(4)ELM為正則化因子為2、2、…2,隱層節(jié)點(diǎn)數(shù)設(shè)為1 000。
支持向量機(jī)(support vector machine,SVM):正則化因子為2、2、…2,徑向基核參數(shù)為2、2、…2。
此外,本文實(shí)驗(yàn)環(huán)境為Intel(R) Core(TM) i5-10300H,主頻2.5 GHz,內(nèi)存16 GB,操作系統(tǒng)Windows 10,算法實(shí)現(xiàn)環(huán)境為Matlab R2020。
為比較本文方法的優(yōu)劣,利用ELM、SVM、ELM-EMAPs三類方法進(jìn)行對(duì)比實(shí)驗(yàn),以常用的總體精度(overall accuracy,OA)、平均精度(average accuracy,AA)、KAPPA系數(shù)(Kappa系數(shù)用于衡量分類精度,K)三類指標(biāo)作為本文精度評(píng)價(jià)指標(biāo),且實(shí)驗(yàn)中分別隨機(jī)選取每類5、10個(gè)像元作為訓(xùn)練樣本,以驗(yàn)證本文方法在小訓(xùn)練樣本中的適用性,其中ELM-EMAPs指利用ELM對(duì)EMAPs特征進(jìn)行分類。
2.3.1
權(quán)重確定由于不同特征對(duì)不同場(chǎng)景圖像適用性不一,因此需根據(jù)具體圖像數(shù)據(jù)對(duì)GF特征和EMAPs特征進(jìn)行權(quán)重設(shè)定。在本文中,以每類5像元作為訓(xùn)練樣本,對(duì)應(yīng)GF特征和EMAPs特征,按權(quán)重比值,分別設(shè)定為1∶4、2∶3、1∶1、3∶2、4∶1(即GF特征比例為20%、40%、50%、60%、80%),并進(jìn)行特征融合分類,三組實(shí)驗(yàn)數(shù)據(jù)集的分類結(jié)果見圖2。
圖2 引導(dǎo)濾波權(quán)重值與三組實(shí)驗(yàn)數(shù)據(jù)分類精度關(guān)系
從圖2可知,當(dāng)特征權(quán)重不同時(shí),分類的總體精度存在一定差異,且每組實(shí)驗(yàn)數(shù)據(jù)都存在一個(gè)最優(yōu)的權(quán)重取值,圖2中,IP、PU、SA分別在GF權(quán)重為0.8、0.5、0.5時(shí)取得最優(yōu),因此,以此作為后續(xù)每組實(shí)驗(yàn)數(shù)據(jù)分類中GF和EMAPs特征融合權(quán)重值。
2.3.2
分類及精度以每類5、10個(gè)像元作為訓(xùn)練樣本,分別利用SVM、ELM、ELM-EMAPs、本文方法進(jìn)行分類,并計(jì)算分類精度與運(yùn)算時(shí)間,分類結(jié)果如圖3~圖4所示(本文僅展示IP數(shù)據(jù)在2組訓(xùn)練樣本及4種方法下的分類結(jié)果)。
本文方法分類效果是在如圖3、圖4所示每類5及10個(gè)像元的情況下,皆要優(yōu)于3類對(duì)比方法,圖中各分類圖虛線框所標(biāo)注的可知,SVM及ELM方法僅使用光譜特征,存在眾多誤分錯(cuò)分現(xiàn)象,當(dāng)EMAPs被引入后,錯(cuò)分誤分現(xiàn)象有所減少,這是因?yàn)镋MAPs利用了高光譜圖像的空間特征,而本文方法可在ELM-EMAPs的基礎(chǔ)上得到進(jìn)一步的精度提升,相比前面3種對(duì)比方法,本文方法具有最優(yōu)分類精度。具體分類精度及運(yùn)算時(shí)間如表2~表4所示。其中,最優(yōu)分類精度和最短運(yùn)算時(shí)間已加粗表示。
圖3 每類5個(gè)像元IP數(shù)據(jù)分類結(jié)果
圖4 每類10個(gè)像元IP數(shù)據(jù)分類結(jié)果
表2 印第安納松樹數(shù)據(jù)集不同方法分類結(jié)果評(píng)價(jià)表
表3 帕維亞大學(xué)數(shù)據(jù)集不同方法分類結(jié)果評(píng)價(jià)表
表4 薩利納斯場(chǎng)景數(shù)據(jù)集不同方法分類結(jié)果評(píng)價(jià)表
可知,本文方法相比其他三類比較方法,在面向小訓(xùn)練樣本時(shí)具有精度優(yōu)勢(shì),且運(yùn)算時(shí)間較短,具備一定的實(shí)際應(yīng)用意義。
面對(duì)高光譜圖像分類中的邊緣及特征融合問題,提出了一種面向小樣本、結(jié)合權(quán)重融合及極限學(xué)習(xí)機(jī)的高光譜圖像分類方法。本方法通過(guò)引導(dǎo)濾波提取圖像邊緣信息,利用拓展形態(tài)學(xué)多屬性剖面提取結(jié)構(gòu)信息,通過(guò)列出多組權(quán)值進(jìn)行實(shí)驗(yàn)選擇最優(yōu)的權(quán)重,然后通過(guò)極限學(xué)習(xí)機(jī)完成分類。實(shí)驗(yàn)結(jié)果表明,本文方法在精度和時(shí)效性上皆具有一定優(yōu)勢(shì),具備一定應(yīng)用價(jià)值。