張金盈,姚光虎,林 琳,郭懷軒
(1. 山東省國土測繪院遙感技術(shù)部,山東 濟南 250013; 2. 神舟航天軟件(濟南)有限公司衛(wèi)星應(yīng)用中心,山東 濟南 250013; 3. 山東省水利科學(xué)研究院水資源與水環(huán)境省重點實驗室, 山東 濟南 250013)
我國遙感技術(shù)的發(fā)展,使得遙感影像空間分辨率越來越高,這極大地便利了城區(qū)土地利用覆蓋制圖的研究,為城鎮(zhèn)發(fā)展規(guī)劃、應(yīng)急響應(yīng)和災(zāi)害評估等領(lǐng)域的應(yīng)用提供了重要的參考數(shù)據(jù)支持。高空間分辨率的遙感影像伴隨著豐富的光譜和紋理信息,同類地物內(nèi)的光譜差異增大,類間的光譜差異減少,同物異譜及同譜異物的現(xiàn)象也變得更加嚴(yán)重,導(dǎo)致目前的分類方法正確率不高[1],因此,基于高分辨率影像的分類具有一定的研究價值。
大量細節(jié)信息和復(fù)雜的光譜特征導(dǎo)致基于光譜統(tǒng)計特征進行分類的方法正確率下降[2]。近年來,一些學(xué)者在分類過程中加入影像的紋理、空間結(jié)構(gòu)等特征[3],然后利用神經(jīng)網(wǎng)絡(luò)和支持向量機等分類高分辨率影像。文獻[4]利用自適應(yīng)級聯(lián)分類器分類高分二號遙感影像。文獻[5]則利用高分二號影像進行大麻地塊提取方法研究。文獻[6]從高分二號遙感影像中自動提取云南松林區(qū)域。文獻[7]從多尺度的分割對象中提取紋理、顏色和形狀特征實現(xiàn)高分辨率影像的分類。文獻[8]將CART決策樹和面向?qū)ο蟮姆诸惙椒ㄏ嘟Y(jié)合分類高分辨率遙感影像,進行土地利用監(jiān)測。文獻[9]則提出融合像素和分割對象特征分類高分辨率遙感影像。這些淺層視覺特征往往存在于低層高維特征空間,帶有很多冗余信息和雜點。而且,這些監(jiān)督方法往往是人工選擇訓(xùn)練樣本,分類器的性能很大程度上取決于樣本的選取質(zhì)量。
針對目前高分辨率影像分類中存在的問題,本文提出一種結(jié)合主動學(xué)習(xí)和詞袋模型的高分二號遙感影像分類方法。圖1為本文方法的流程。文中首先以多尺度分割算法得到多尺度的影像分割對象作為基元;其次,考慮同一影像分割對象中視覺特征的相似性,基于詞袋模型來組織影像對象中的局部特征,以生成具有一定表達能力的視覺單詞,建立影像分割對象的高層次語義表達,以提高影像分割對象視覺特征的表達能力;最后,充分考慮位于分類邊界的不確定性樣本分布,迭代選擇最優(yōu)和最優(yōu)價值的樣本用于訓(xùn)練支持向量機[10],用于分類遙感影像。
現(xiàn)實世界地物目標(biāo)復(fù)雜多變,不同地物類型需要適當(dāng)?shù)木嚯x和比例尺才能有效完整地呈現(xiàn),因此應(yīng)用單一的分割尺度很難實現(xiàn),要充分描述和表達不同的地物類型需要在不同的分割尺度下才能進行。多尺度分割算法通過分割參數(shù)的設(shè)定,不同的參數(shù)設(shè)定決定了分割結(jié)果的尺度和質(zhì)量,進一步會直接影響對象分類的精度。本文采用基于分型網(wǎng)絡(luò)演化算法[11]生成影像分割對象。這種分割算法具有良好的穩(wěn)健性,有效地改善了影像信息萃取的信噪比。文中首先對研究區(qū)域遙感數(shù)據(jù)進行多尺度分割,基于多尺度分割結(jié)果選擇最佳的分割尺度。
在利用機器學(xué)習(xí)分類之前,需要對影像分割對象建立具有良好表達能力且穩(wěn)健的視覺特征表達。由于高分二號遙感影像空間分辨率的提高,導(dǎo)致同物異譜和同譜異物現(xiàn)象變得更加嚴(yán)重,這些存在于底層高維空間的視覺特征通常帶有大量的信息冗余和噪聲問題[12],使得基于這些底層視覺特征進行分類的方法正確率不高。為了實現(xiàn)遙感影像信息解譯中影像分割對象的表達和分類,文中通過詞袋模型來提取影像分割對象中局部視覺特征的統(tǒng)計信息,實現(xiàn)影像分割對象的詞袋表示。圖2為影像分割對象的詞袋表達構(gòu)建示意圖,影像分割對象的詞袋表示構(gòu)建的具體過程如下:
(1) 基于像素提取每個像素的光譜和紋理信息[13],構(gòu)建像素的視覺特征向量并歸一化。
(2) 視覺詞典的構(gòu)建。利用K-means聚類算法計算n個聚類中心,每個聚類中心被看作一個“視覺單詞”,則n個“視覺單詞”組成了視覺詞典。
(3) “視覺單詞”的表示。將影像分割對象內(nèi)所有像素的視覺特征向量用離它最近的“視覺單詞”代替,統(tǒng)計當(dāng)前影像分割對象內(nèi)每個“視覺單詞”出現(xiàn)的頻率,構(gòu)建影像分割對象的詞袋表示。這個基于影像分割對象的詞袋表示將作為SVM分類器的輸入,對其對應(yīng)的影像分割對象進行分類。
影像分割對象的詞袋表達構(gòu)建之后,文中采用SVM模型實現(xiàn)影像分類。由于SVM模型對于分類非線性高維數(shù)據(jù)通常表現(xiàn)出良好的性能。SVM模型[14]是一個二分類器(如圖3所示)。假設(shè)數(shù)據(jù)集D={(x1,y1),(x2,y2),…,(xn,yn)},其中,xi(1≤i≤n)表示影像分割對象的詞袋表示,yi(1≤i≤n)表示對應(yīng)影像對象的標(biāo)簽,分類超平面函數(shù)為f(x)=ωTx+b。對于分類超平面的求解通常被轉(zhuǎn)換為優(yōu)化問題
(1)
式(1)等價于
(2)
通過給每一個約束條件加上一個拉格朗日乘子α,將約束條件融合到目標(biāo)函數(shù)中,即
(3)
令
(4)
然而,傳統(tǒng)的SVM模型是針對二分類問題的。對于遙感影像的分類,往往涉及多種地物類型,因此,需要將遙感影像的分類方法轉(zhuǎn)化為多類問題。目前最簡單的方法是將多類問題直接分解為若干個兩類問題。在SVM分類問題中,可采用一對一法和一對余[15]進行多類分類,其中一對余的擴展方法目前已經(jīng)在廣泛應(yīng)用于遙感影像分類中,因此本文采用此方法。
對于監(jiān)督方法而言,訓(xùn)練樣本的數(shù)量和質(zhì)量對分類器的性能起決定性作用。對于SVM分類器而言,離分類超平面越遠的樣本,其分類置信度越高。主動學(xué)習(xí)可以在SVM模型訓(xùn)練過程中根據(jù)學(xué)習(xí)進程,根據(jù)一定的規(guī)則(如邊緣采樣[16])主動選擇最有利于分類器性能的樣本進行學(xué)習(xí),提高訓(xùn)練模型的泛化能力。因此,本文采用主動學(xué)習(xí)的策略[17]訓(xùn)練最優(yōu)的SVM分類器。主動學(xué)習(xí)從形式上說是一個循環(huán)迭代的過程,具體過程如下:
(1) 將已知樣本集分成3個集合,分別為初始訓(xùn)練樣本集U0、候選樣本集UC和測試樣本集UT。
(2) 進行第i(i≥1)次循環(huán),利用訓(xùn)練樣本集Ui-1訓(xùn)練得到分類超平面fi-1。利用當(dāng)前分類超平面fi-1識別測試樣本集UT,記錄當(dāng)前分類超平面fi-1的正確率。然后利用當(dāng)前超平面fi-1識別候選樣本集UC,選擇新樣本,記作UN。樣本選擇準(zhǔn)則是:①添加錯誤檢測的樣本。②對一個數(shù)據(jù)點進行分類,當(dāng)數(shù)據(jù)點離超平面的距離越大,分類結(jié)果的確信度也越大。因此如果沒有錯誤檢測的樣本則按樣本點到超平面的距離遠近添加樣本。執(zhí)行Ui=Ui-1∪UN,UC=UC-UN。
(3) 重復(fù)步驟(2),直到UC為空或正確率不再變化為止(在所允許的誤差范圍內(nèi))。
為了驗證本文方法的有效性,采用山東省某市的高分二號遙感影像作為驗證數(shù)據(jù)集,同時將試驗結(jié)果與傳統(tǒng)的基于像素的方法得到的分類結(jié)果進行對比分析。場景Ⅰ和場景Ⅱ的大小均為1110×1105像素,空間分辨率為1 m。試驗中主要將場景分類為地面、建筑物、植被和水體4大類,以驗證本文方法的有效性。文中采用精確率(P)、召回率(R)、F1-score和總正確率評價分類結(jié)果的優(yōu)劣。
對于傳統(tǒng)的被動學(xué)習(xí)而言,訓(xùn)練樣本的選擇是人為確定的訓(xùn)練樣本。而本文利用邊緣采樣的主動學(xué)習(xí)方式優(yōu)化SVM模型的訓(xùn)練過程。為了驗證該方法的有效性,文中將最大邊界采樣的策略和隨機采樣策略進行對比分析。試驗中訓(xùn)練樣本庫分別采用兩種采樣方式進行更新。從圖4可以看出,隨著訓(xùn)練樣本庫的不斷更新,采用本文策略的樣本庫更新方式可以得到更優(yōu)的訓(xùn)練模型。
為了處理低維空間不可分的數(shù)據(jù),SVM通常利用核函數(shù)的方法將低維向量升維至高維空間。為了驗證不同核函數(shù)對分類精度的影響,試驗結(jié)果如圖5所示。與其他核函數(shù)相比,使用徑向基核函數(shù)的分類結(jié)果在總正確率上要高出2%以上。
視覺詞典中視覺單詞的個數(shù)決定了詞典的表達能力。為了驗證視覺單詞個數(shù)對分類結(jié)果的影響,文中分別設(shè)置視覺單詞個數(shù)為100、200、300、400和500進行對比試驗。圖6中柱狀圖表示的不同地物類型的分類精度受視覺單詞個數(shù)的影響,而折線圖則反映的是分類總正確率受視覺單詞個數(shù)的影響。試驗結(jié)果表明,視覺單詞個數(shù)對分類精度有較大影響,正確率的波動大于4%。
為了進一步驗證本文方法的優(yōu)勢,將本文方法與傳統(tǒng)的基于像素的方法進行對比分析。表1給出了兩種方法分類場景Ⅰ和場景Ⅱ的精度對比??梢缘贸?,本文方法在分類正確率上要高出基于像素的方法6%以上。圖7中灰色表示建筑物區(qū),白色表示地面區(qū),黑色表示水體區(qū),淺灰色表示植被區(qū)。從圖中可以看出,本文方法可以有效抑制分類結(jié)果中的椒鹽現(xiàn)象。
表1 不同方法分類結(jié)果的對比 (%)
本文提出了一種結(jié)合主動學(xué)習(xí)和詞袋模型的高分二號遙感影像分類方法。首先基于多尺度分割算法獲取最優(yōu)的影像分割對象集合;其次在提取影像的光譜和紋理信息基礎(chǔ)上,利用詞袋模型建立影像分割對象的語義表達,以解決低層視覺特征與語義特征之間的語義鴻溝問題;最后基于邊緣采樣的方法獲取最有價值的訓(xùn)練樣本,以訓(xùn)練最優(yōu)的SVM模型。對高分二號衛(wèi)星的分類結(jié)果驗證了本文方法的有效性。下一步將融合多源數(shù)據(jù),如多光譜的數(shù)據(jù)進行融合處理和分類,以提高分類結(jié)果的正確性。