劉金滄,王成波,常原飛
(1. 廣東省國(guó)土資源測(cè)繪院,廣東 廣州 510500; 2. 中國(guó)科學(xué)院遙感與數(shù)字地球研究所,北京 100101)
隨著遙感技術(shù)的發(fā)展,高分辨率遙感影像逐漸成為監(jiān)測(cè)森林病蟲(chóng)災(zāi)害的主要數(shù)據(jù)源,通過(guò)對(duì)影像上感病導(dǎo)致變色的樹(shù)木特征描述及分類識(shí)別,可實(shí)現(xiàn)變色松樹(shù)提取,進(jìn)而獲取樹(shù)木染病、枯死等信息。近年來(lái),深度學(xué)習(xí)發(fā)展迅速,在遙感影像分類與識(shí)別中得到應(yīng)用,深度學(xué)習(xí)的主流算法模型有受限波爾茲曼機(jī)、深度信念網(wǎng)絡(luò)、卷積神經(jīng)網(wǎng)絡(luò)及自動(dòng)編碼器4種[1]。但深度神經(jīng)網(wǎng)絡(luò)模型待訓(xùn)練參數(shù)極多,往往需要大量樣本數(shù)據(jù)。對(duì)于尚未積累足夠樣本數(shù)據(jù)的應(yīng)用領(lǐng)域,采用深度學(xué)習(xí)方法存在一定的困難。在遙感影像目標(biāo)識(shí)別、圖像分割或分類工作中,一般分類器通過(guò)與圖像特征結(jié)合從而達(dá)到融合上下文信息的目的,模型本身不考慮空間信息的問(wèn)題。概率圖模型的引入,實(shí)現(xiàn)了在模型中加入上下文信息的概念,考慮了像素空間相關(guān)性。條件隨機(jī)場(chǎng)模型(conditional random field,CRF)[2]為后驗(yàn)概率建模,能夠同時(shí)考慮標(biāo)記和觀測(cè)數(shù)據(jù)的上下文信息,可用于各種具有不同統(tǒng)計(jì)特性的圖像的分類,具有普遍適用性,對(duì)圖像分類效果較好,已經(jīng)成功用于序列數(shù)據(jù)標(biāo)記、自然圖像分割[3]、醫(yī)學(xué)影像處理[4]等。目前,國(guó)內(nèi)外學(xué)者也嘗試將CRF引入遙感圖像處理,展開(kāi)了對(duì)高分辨率、多光譜、高光譜、SAR影像中CRF的使用和改進(jìn)[5-8],旨在遙感圖像處理過(guò)程中更為正確和有效地發(fā)揮空間信息作用。
松材線蟲(chóng)病是全球森林生態(tài)系統(tǒng)中最具危險(xiǎn)性、毀滅性的有害物種[9]。松樹(shù)感病后,針葉快速變成黃紅色。在我國(guó),松樹(shù)占森林資源的1/4[10],為了有效預(yù)防和控制松材線蟲(chóng)病,需對(duì)其進(jìn)行全面而又快速的監(jiān)測(cè)。無(wú)人機(jī)遙感作為一項(xiàng)新興的對(duì)地觀測(cè)技術(shù),可大幅減少森林資源調(diào)查的外業(yè)工作量,大大提高工作效率[11]。無(wú)人機(jī)影像地物清晰、細(xì)節(jié)明顯、信息豐富,為松材線蟲(chóng)病的及時(shí)快速監(jiān)測(cè)提供了有效的途徑,但考慮到影像中裸地陰影明顯、樹(shù)冠變化過(guò)大及樹(shù)木之間邊界復(fù)雜等問(wèn)題,對(duì)病害松樹(shù)提取帶來(lái)了一定困難,需要選擇合適的提取算法。
CRF模型通過(guò)融合多種特征提取變色松樹(shù),主要包括:①對(duì)無(wú)人機(jī)影像進(jìn)行處理,提取描述圖像的多種特征;②將所提取的特征映射到高維或低維空間中組成新的特征向量;③利用CRF模型對(duì)最終特征向量進(jìn)行分類,并獲得相應(yīng)的標(biāo)記,主要工作為特征提取、CRF模型的構(gòu)建與實(shí)現(xiàn)。分類模型過(guò)程如圖1所示。
圖像特征是復(fù)雜圖像的簡(jiǎn)化表達(dá),特征提取和選擇是高分辨率遙感影像識(shí)別和分類的基礎(chǔ)和關(guān)鍵。正常情況下不同地物具有不同的顏色特征,但也經(jīng)常會(huì)出現(xiàn)同物異譜、同譜異物現(xiàn)象[12]。為更加有利于變色松樹(shù)專題信息提取,本文綜合考慮了顏色特征和紋理特征。
1.2.1 顏色特征
顏色特征是圖像檢索、識(shí)別中應(yīng)用最廣泛的視覺(jué)特征,在變色松樹(shù)提取試驗(yàn)中,顏色特征是區(qū)分病害松樹(shù)與健康松樹(shù)的重要特征,本文顏色特征直接采用影像上的R、G、B三通道特征。
1.2.2 紋理特征
高分辨率影像中紋理結(jié)構(gòu)種類豐富,由不同的紋理基元按照不同規(guī)則和組合方式重復(fù)出現(xiàn)而形成,本文使用的紋理特征為Gabor特征、局部二值模式(LBP)特征和方向梯度直方圖(HOG)特征。
(1) Gabor特征。Gabor變換兼具在空域和頻域中的分辨能力,2-D Gabor濾波器通過(guò)調(diào)整濾波器的空間與頻率參數(shù),可以獲得空域和頻域的最優(yōu)聯(lián)合分辨率,以達(dá)到空域和頻域的局部最優(yōu)化,表達(dá)出能夠充分描述圖像的紋理信息[13]。由于小波變換的窗口大小可以隨著窗口中心頻率的變化而自適應(yīng)地調(diào)節(jié),通常采用Gabor小波濾波器提取紋理圖像[14]。Gabor濾波器提取紋理特征主要是濾波器的設(shè)計(jì),包括濾波函數(shù)、數(shù)目、方向和間隔。
(2) LBP特征。LBP通過(guò)統(tǒng)計(jì)局部區(qū)域內(nèi)結(jié)構(gòu)出現(xiàn)的頻次來(lái)表達(dá)圖像特性,主要是對(duì)像素點(diǎn)與其局部區(qū)域內(nèi)像素點(diǎn)的灰度級(jí)大小對(duì)比而產(chǎn)生。LBP特征提取首先將檢測(cè)窗口劃分為16×16的小區(qū)域(cell),對(duì)單個(gè)cell中的每個(gè)像素,將其4鄰域或8鄰域內(nèi)點(diǎn)的灰度與該點(diǎn)(也可以是環(huán)形鄰域)進(jìn)行順時(shí)針或逆時(shí)針的比較,如果中心點(diǎn)像素值比鄰點(diǎn)大,則鄰點(diǎn)的值為1,反之則為0,這樣每個(gè)點(diǎn)都會(huì)獲得一個(gè)8位二進(jìn)制數(shù),轉(zhuǎn)換為十進(jìn)制,得到每個(gè)像素的LBP值;然后通過(guò)對(duì)每個(gè)cell中每個(gè)數(shù)字出現(xiàn)的頻率進(jìn)行統(tǒng)計(jì),得到cell的直方圖后,再對(duì)該直方圖進(jìn)行歸一化處理;最后連接所有cell的統(tǒng)計(jì)直方圖得到整幅圖的LBP紋理特征。
(3) HOG特征。HOG特征[15]通過(guò)計(jì)算和統(tǒng)計(jì)圖像局部區(qū)域的梯度方向直方圖來(lái)表達(dá)特征,具有圖像幾何和光學(xué)的形變不變性。HOG特征提取首先將圖像分成小的連通區(qū)域,即細(xì)胞單元,然后計(jì)算每個(gè)細(xì)胞單元中所有像素的梯度或邊緣的方向直方圖。由于局部光照的變化及前景和背景對(duì)比度的變化,使得梯度強(qiáng)度的變化范圍非常大,采用重疊的局部對(duì)比度歸一化技術(shù)對(duì)梯度強(qiáng)度作歸一化,最后把這些直方圖組合起來(lái)構(gòu)成HOG特征描述器。
1.3.1 CRF原理
CRF模型最早由文獻(xiàn)[2]提出,是一種判別式概率無(wú)向圖學(xué)習(xí)模型,CRF通過(guò)Gibbs分布直接對(duì)后驗(yàn)概率P(X|Y)建模。
定義y={y1,y2,…,yk}為觀察特征集的隨機(jī)變量,x={x1,x2,…,xk)}為標(biāo)簽集合的隨機(jī)變量,對(duì)每個(gè)隨機(jī)變量yi∈y標(biāo)簽集合中的標(biāo)簽相對(duì)應(yīng),P(x|y)表示給定條件y下的隨機(jī)變量x的條件概率。根據(jù)Hammersley-Clifford定理,標(biāo)記場(chǎng)的后驗(yàn)概率服從Gibbs分布為
(1)
式中,Z為歸一化函數(shù);Z(y)=∑yexp{-∑c∈C
ψc(xc,y,θ)};θ為模型參數(shù);基團(tuán)c為一些隨機(jī)變量的集合;C為所有基團(tuán)c的集合;數(shù)據(jù)項(xiàng)ψc(xc,y,θ)為在基團(tuán)c上定義的勢(shì)函數(shù)。相應(yīng)的Gibbs能量函數(shù)為
(2)
以較常見(jiàn)的二階CRF為例,二階CRF能夠考慮像素的空間鄰域信息,只有關(guān)聯(lián)勢(shì)能和交互勢(shì)能,則其能量函數(shù)包含了關(guān)聯(lián)勢(shì)能ψi和交互勢(shì)能ψij
(3)
式中,V為由圖像的像素組成的集合;ε為相鄰的像素對(duì),對(duì)像素而言一般是4鄰域或8鄰域。
1.3.2CRF建模
CRF關(guān)聯(lián)勢(shì)能ψi()通過(guò)一個(gè)局部判別分類器來(lái)表示,通常表達(dá)為基于顏色、位置和紋理等多特征的成本函數(shù),表達(dá)觀測(cè)變量yi與標(biāo)簽xi之間的關(guān)聯(lián)屬性,反映給定yi和參數(shù)w條件下標(biāo)記為xi的概率,表示為
ψi(xi,yj,w)=lnP(xi|yj,w)
(4)
由于SVM在高分辨率遙感數(shù)據(jù)中具有較好的分類效果,因此參考文獻(xiàn)[8]定義關(guān)聯(lián)勢(shì)能,由SVM訓(xùn)練參數(shù)得到的歸一化概率。交互勢(shì)能ψij()通常依據(jù)鄰接觀測(cè)變量,以及其標(biāo)簽變量之間的相關(guān)性關(guān)系來(lái)表示,體現(xiàn)了模型對(duì)上下文信息利用的能力。一般定義為
ψij(xixjyi,yj,λ)=λTgij(yi,yj)δxi≠xj
(5)
式中,λ為交互勢(shì)能中待估計(jì)參數(shù);δ為0-1指示函數(shù),若xi≠xj,δ為1,否則為0;gij(yi,yj)為特征相似性描述函數(shù),其定義是描述相鄰變量相關(guān)性的關(guān)鍵,通常定義通過(guò)距離衡量特征之間的相似性,表達(dá)為
(6)
式中,β幅圖像中鄰接像素對(duì)的顏色對(duì)比度的均值,β=(2〈‖yi-yj‖2〉)-1。
為了減輕交互項(xiàng)過(guò)平滑的問(wèn)題,在關(guān)聯(lián)項(xiàng)和交互項(xiàng)之間加入權(quán)重λ,則后驗(yàn)概率最終可表達(dá)如下
P(x|y,w,v)∝exp
(7)
無(wú)人機(jī)影像變色松樹(shù)提取過(guò)程如圖2所示,主要分為5步:
(1) 數(shù)據(jù)獲?。簾o(wú)人機(jī)航攝獲取監(jiān)測(cè)區(qū)域0.1 m分辨率的影像數(shù)據(jù)。
(2) 數(shù)據(jù)處理:通過(guò)影像匹配、空三加密、正射糾正、影像拼接和圖像增強(qiáng)等處理,制作0.1 m分辨率正射影像圖。
(3) 數(shù)據(jù)準(zhǔn)備:制作標(biāo)記變色樹(shù)木、健康樹(shù)木的樣本數(shù)據(jù),單個(gè)樣本的大小為500×500像素,用于變色松樹(shù)提取的訓(xùn)練和測(cè)試。
(4) 變色松樹(shù)提?。菏紫冗M(jìn)行多種特征提取,增加不同類別地物特征描述的差異;然后利用有效的分類算法將變色樹(shù)木與正常樹(shù)木區(qū)分開(kāi),以完成變色松樹(shù)專題信息提取。
(5) 結(jié)果分析:結(jié)合目視解譯,對(duì)變色木提取結(jié)果進(jìn)行分析,以提供疑似遭受病蟲(chóng)害的松樹(shù),為實(shí)地調(diào)查提供有利線索。
標(biāo)記樣本數(shù)據(jù)如圖3所示。其中,部分暗灰色為松樹(shù)枯萎或失葉后剩下枝杈呈現(xiàn)的效果,一般是樹(shù)木長(zhǎng)期染病枯死所致。另外,由于影像分辨率較高,樹(shù)木之間的空隙、陰影明顯,將其分為其他類。綜上,將影像標(biāo)記為4類:兩種變色木(發(fā)灰木、發(fā)黃木),健康木和其他(陰影、空隙)。
本次試驗(yàn)標(biāo)記樣本數(shù)據(jù)集總數(shù)為860個(gè),隨機(jī)選取總樣本的70%作為模型訓(xùn)練數(shù)據(jù),剩余的樣本則為測(cè)試數(shù)據(jù)。變色松樹(shù)提取試驗(yàn)設(shè)置Gabor紋理的σ=2π,方向數(shù)為4,頻率為5,共20維,HOG特征9維,LBP特征4維。提取的多維特征通過(guò)白化、聚類操作形成用于圖像分類的特征向量。
試驗(yàn)將CRF提取的結(jié)果與幾種常用的分類算法提取結(jié)果進(jìn)行對(duì)比,包括支持向量機(jī)(SVM)、boost算法、隨機(jī)森林(RF),如圖4所示。從圖4可以看出,前3種不考慮相鄰像元相關(guān)性的分類算法得到的分類結(jié)果的椒鹽現(xiàn)象比較嚴(yán)重,分類效果不佳,而CRF的分類結(jié)果更加平滑,視覺(jué)效果更好。從影像可以看出,變色樹(shù)松樹(shù)的數(shù)量較少,前3種方法對(duì)變灰松樹(shù)與陰影、空隙等紋理的區(qū)分效果不佳,在邊界處變灰樹(shù)木與其他的地類產(chǎn)生混淆。相對(duì)于前3種試驗(yàn)結(jié)果,只利用RGB顏色特征的CRF模型整體分類結(jié)果有所改善,說(shuō)明CRF模型對(duì)變色松樹(shù)的分類效果較好,但其同樣存在對(duì)變灰松樹(shù)的提取結(jié)果不太理想的問(wèn)題。在顏色特征的基礎(chǔ)上,加入多種紋理特征后的CRF模型分類結(jié)果對(duì)變灰木區(qū)分能力有所提高。紋理特征的加入增加了類別之間的差異,能夠改善分類器的性能。
對(duì)應(yīng)5種分類結(jié)果的定量精度評(píng)價(jià)見(jiàn)表1,結(jié)合圖4分類結(jié)果,可以看出:定義交互勢(shì)能的CRF模型考慮了鄰域像素之間的空間關(guān)系,分類結(jié)果比不考慮交互勢(shì)能的普通分類器(SVM、boost、RF)分類精度更好,模型精度總體比其他基于像元的分類器高,多特征的CRF模型精度提高超過(guò)5%,基于多特征CRF方法有利于提高變色松樹(shù)的提取效果和精度。與考慮顏色特征的CRF模型分類結(jié)果相比,基于多特征CRF方法在分類精度上提高了約3.55%,這表明文中所述紋理特征能夠有效改善模型的分類精度。無(wú)論是從分類結(jié)果的視覺(jué)效果,還是從分類精度評(píng)價(jià)來(lái)看,基于多特征的CRF模型都能夠獲取較好的變色松樹(shù)識(shí)別結(jié)果。
表1 松樹(shù)林無(wú)人機(jī)RGB影像的分類精度 (%)
利用無(wú)人機(jī)航攝獲取森林高分辨率影像,并選用合適的分類方法對(duì)影像進(jìn)行病害變色松樹(shù)自動(dòng)提取,為快速監(jiān)測(cè)松材線蟲(chóng)病提供了有效途徑。其中關(guān)鍵在于尋找適用高分辨率航空影像分類的算法,基于多特征CRF模型能夠客觀準(zhǔn)確地對(duì)病害松樹(shù)進(jìn)行分類,作為傳統(tǒng)的目視解譯方法的補(bǔ)充,能夠大大減少人工判讀的工作量,有利于提高松樹(shù)病蟲(chóng)害監(jiān)測(cè)的效率與精度。