王勝利,張連蓬,李 行,趙卓文,沈 揚,柴 琪
(江蘇師范大學(xué)地理測繪與城鄉(xiāng)規(guī)劃學(xué)院,江蘇 徐州 221116)
?
面向特定目標(biāo)地物提取的改進(jìn)最佳波段組合方法研究
王勝利,張連蓬,李 行,趙卓文,沈 揚,柴 琪
(江蘇師范大學(xué)地理測繪與城鄉(xiāng)規(guī)劃學(xué)院,江蘇 徐州 221116)
提出了一種利用一類支持向量機(OC-SVM)進(jìn)行特定目標(biāo)地物提取的改進(jìn)最佳波段組合方法(MOIF)。以Landsat8衛(wèi)星影像作為數(shù)據(jù)源,對江蘇省沿海灘涂光伏電站進(jìn)行了提取試驗,并利用人工解譯的結(jié)果進(jìn)行了精度評定。結(jié)果表明,本文提出的波段組合方法能夠有效提取特定的目標(biāo)地物。
濱海灘涂;改進(jìn)最佳波段組合;光伏電站;一類支持向量機;目標(biāo)地物提取
多光譜遙感數(shù)據(jù)波段較多、信息量大,具備數(shù)據(jù)獲取周期短、覆蓋空間范圍廣的特點,已經(jīng)廣泛應(yīng)用于城市地物分類與提取、軍事目標(biāo)識別、煤礦災(zāi)害調(diào)查和生物量的精細(xì)提取等方面[1-4]。多光譜遙感技術(shù)既可以根據(jù)影像上地物的形態(tài)特征識別目標(biāo),還可以根據(jù)地物在不同波段上的光譜差異進(jìn)行識別,給地物提取和分類帶來很大的便利[5]。在進(jìn)行遙感影像分析時,波段選擇是減少數(shù)據(jù)冗余、提高運算效率較為有效的方法,其中最佳指數(shù)法(optimum index factor,OIF)已經(jīng)在多光譜影像的分類和地物提取中取得較好的效果[6-9]。
目標(biāo)提取的常用算法包括支持向量機(support vector machine,SVM)、面向?qū)ο蠹夹g(shù)、基于規(guī)則和機器學(xué)習(xí)等算法。但這些算法均有其局限性,如SVM和機器學(xué)習(xí)需要選取每類地物的樣本作為訓(xùn)練數(shù)據(jù)[10-11]、面向?qū)ο蠹夹g(shù)受到多尺度分割參數(shù)難以確定的限制[12-13]、基于規(guī)則的方法地物提取參數(shù)難以控制[1]等,而一類支持向量機(one-class support vector machine,OC-SVM)只需要選取目標(biāo)地物的樣本作為訓(xùn)練數(shù)據(jù)就能提取出目標(biāo)地物,大大減少了選取樣本的工作量,在研究區(qū)地物混雜、種類較多時較為適用。
OC-SVM結(jié)合OIF提取特定目標(biāo)地物能夠提高效率,但也存在以下不足:①OC-SVM只需選取目標(biāo)地物樣本作為訓(xùn)練數(shù)據(jù),而OIF以整幅影像為研究對象使其較適合多分類,當(dāng)面臨提取目標(biāo)地物的“二分類”問題時并不能保證訓(xùn)練數(shù)據(jù)的信息量最大;②利用OC-SVM作為模型進(jìn)行地物提取時,對樣本質(zhì)量要求高,前人研究結(jié)果表明訓(xùn)練樣本的好壞對最終結(jié)果的影響甚至大于模型自身[14],因此如何篩選出穩(wěn)定性較強的目標(biāo)地物樣本所在波段對于精度的提高至關(guān)重要。針對上述問題,本文提出一種改進(jìn)的最佳波段組合方法(modified optimum index factor,MOIF),利用OC-SVM對江蘇灘涂上的光伏電站進(jìn)行提取,也為后續(xù)其他目標(biāo)地物的提取提供新的思路與方法。
1.1 波段組合原理
由于多光譜影像波段較多,且原始影像波段之間存在不同程度的相關(guān),因此進(jìn)行目標(biāo)地物提取時如何篩選出適當(dāng)?shù)牟ǘ渭敖M合,對于減小數(shù)據(jù)冗余、提高試驗效率較為重要。最終波段一般由原始波段的某3個波段構(gòu)成,波段選擇時應(yīng)遵循以下原則[6-9]:①所選波段包含信息量大且波段間相關(guān)性較??;②目標(biāo)地物要在所選的波段組合內(nèi)與其余地物有較好的可分性。
依據(jù)以上原則,波段選擇的前提是計算不同波段的標(biāo)準(zhǔn)差和相關(guān)性。標(biāo)準(zhǔn)差是反映影像灰度值離散程度的指標(biāo),標(biāo)準(zhǔn)差越大表示影像信息量越豐富,因此波段組合時選擇的波段標(biāo)準(zhǔn)差之和要盡可能大;另外,遙感影像的輻射特性使得波段間存在不同程度的相關(guān),因此3個標(biāo)準(zhǔn)差最大的波段組合起來并不一定能得到最大的信息量,還需滿足波段間相關(guān)性盡可能小。在此基礎(chǔ)上,還需滿足目標(biāo)地物和其余地物在所選波段上有較好的可分性。
1.2 改進(jìn)最佳波段組合指數(shù)的提出
與獨立分量分析(ICA)[15]、主成分分析(PCA)[16]等減少數(shù)據(jù)冗余方法相比,OIF指數(shù)綜合考慮單波段的信息量和波段間的相關(guān)度,是一種比較客觀的衡量標(biāo)準(zhǔn)[8-9]。其公式如下
(1)
式中,Si為第i個波段的標(biāo)準(zhǔn)差;Rij為i和j波段間的相關(guān)系數(shù)。OIF值越大,表明該組合信息量越豐富。遙感影像地物提取和分類的理論依據(jù)為:同種地物在特定條件下具有相似的光譜特征,而不同地物之間光譜特征具有一定的差異,因此若不同地物的特征空間越離散,則越容易將各類地物分開。這也是OIF指數(shù)要求波段的標(biāo)準(zhǔn)差越大越好的原因,即類間距離要大,類內(nèi)距離要小[17]。
OIF指數(shù)在影像分類方面取得了較好的效果[6,9],但是利用OC-SVM提取特定目標(biāo)地物時OIF指數(shù)卻暴露出諸多不足,具體表現(xiàn)如下:①特定目標(biāo)地物提取相當(dāng)于二分類,只需考慮目標(biāo)地物和非目標(biāo)地物間的差異即可,而OIF指數(shù)將非目標(biāo)地物中各類地物間的差異考慮在內(nèi),這勢必造成其準(zhǔn)確度下降;②對于提取同一個目標(biāo)地物而言,如果研究區(qū)的大小發(fā)生變化,則OIF遴選出的最優(yōu)組合可能隨之發(fā)生變化。鑒于目標(biāo)地物提取應(yīng)用廣泛,因此有必要針對該問題進(jìn)行研究。
根據(jù)波段組合原理,本文作如下分析:對于光譜特征而言,類間距離越大則不同地物間的差異越大,影像標(biāo)準(zhǔn)差越大,越有利于分類;類內(nèi)距離越小則表明此類地物的特征穩(wěn)定性越強,標(biāo)準(zhǔn)差越小,越有利于地物提取。因此,針對特定地物提取問題提出一種改進(jìn)的最佳波段組合指數(shù)(MOIF),該指數(shù)從目標(biāo)地物的特征考慮,首先選取一定數(shù)量目標(biāo)地物樣本,計算目標(biāo)地物樣本在不同波段上的標(biāo)準(zhǔn)差和相關(guān)性,通過分析標(biāo)準(zhǔn)差和相關(guān)性,篩選出目標(biāo)地物穩(wěn)定性強且信息量較大的波段組合,具體公式如下
(2)
式中,S為目標(biāo)地物在不同波段上的標(biāo)準(zhǔn)差;Rij為i和j波段間的相關(guān)系數(shù)。MOIF值越小,表明該組合地物的光譜穩(wěn)定性越強,冗余度小,越有利于目標(biāo)地物的提取。
2.1 研究區(qū)概況
研究區(qū)位于江蘇省沿海中部(32°33′N—32°57′N,120°07′E—120°53′E),上接鹽城,下依南通,擁有85 km黃金海岸線,屬于典型的濱海灘涂地區(qū)。國內(nèi)最大的灘涂光伏電站——東臺30兆瓦灘涂電站于2011年12月建成并網(wǎng),該項目位于東臺沿海經(jīng)濟區(qū),占地面積約4.23 km2,研究區(qū)內(nèi)的地物類型主要包括農(nóng)田、混凝土屋頂、石棉瓦屋頂、光伏電池板、水池、道路和光灘。中節(jié)能江蘇射陽20兆瓦灘涂電站于2010年12月并網(wǎng)發(fā)電,占地約1.87 km2,研究區(qū)地物類型與東臺類似。
2.2 數(shù)據(jù)源
試驗數(shù)據(jù)采用2015年10月13號的Landsat8 OLI衛(wèi)星數(shù)字產(chǎn)品,條帶號為119、37,包括11個波段,與ETM+數(shù)據(jù)相比新增兩個波段。其中第1波段為海藍(lán)波段,主要用于海岸帶監(jiān)測;第9波段為卷云波段,主要用于云檢測;第8波段為全色波段,主要用于凸顯地物幾何特征,分辨率為15 m;第10和11波段為熱紅外波段,用于城市熱島效應(yīng)觀測等,空間分辨率為100 m;其余波段的分辨率均為30 m。由于試驗采用的影像云量僅為2.11%,因此無需作去云處理;考慮到提取地物的特征,不需要利用第8、9、10、11波段,即本文采用1~7波段進(jìn)行試驗。
首先,對影像進(jìn)行預(yù)處理,通過波段間相關(guān)信息的統(tǒng)計,結(jié)合最佳指數(shù)法(OIF)得到最佳波段組合A;通過選取適量的光伏電站樣本,結(jié)合MOIF得到最佳波段組合B;然后,利用OC-SVM進(jìn)行光伏電站信息提取;最后對提取結(jié)果進(jìn)行評定精度。技術(shù)流程如圖1所示。
圖1 技術(shù)流程
3.1 一類支持向量機
(3)
(4)
3.2 試驗分析
本文選取兩個研究區(qū)對提出的波段組合方法進(jìn)行驗證,其中東臺研究區(qū)空間大小為1400×900像素,選取電站樣本342個;射陽研究區(qū)空間大小為300×460像素,選取電站樣本312個。以下各表中小括號里的數(shù)值為依據(jù)選取電站樣本的統(tǒng)計信息。
通過ENVI軟件中的波段分析統(tǒng)計工具(Compute Statistic)計算研究區(qū)1~7各波段統(tǒng)計信息和波段間相關(guān)系數(shù);利用Matlab和SPSS Statistics工具分別計算選取電站樣本的標(biāo)準(zhǔn)差和相關(guān)系數(shù),計算結(jié)果見表1和表2。由表3可知,457波段組合的OIF指數(shù)最大,為最佳波段組合;利用MOIF指數(shù)時,光伏電站的樣本標(biāo)準(zhǔn)差越大,表明該波段上樣本的穩(wěn)定性越差,越不利于地物提取,因此對于東臺地物的光伏電站,標(biāo)準(zhǔn)差最大的波段6不參與提取試驗;此外,進(jìn)行相關(guān)性分析時將閾值設(shè)為0.9,即兩個波段相關(guān)系數(shù)大于0.9時不能同時出現(xiàn)在一個組合中。由表2中的相關(guān)系數(shù)可知,波段1、2,波段3、4,波段4、5,波段5、7不能組合,最終篩選出組合135、137、235、237作為備選波段組合。MOIF指數(shù)的計算結(jié)果見表4,可以看到137波段組合的MOIF值最小,表明該波段組合樣本穩(wěn)定性強,所含信息量較多,有利于光伏電站的提取。不同波段組合的電站提取效果和精度如表5和圖2所示,可以看出根據(jù)OIF指數(shù)的提取結(jié)果中噪聲現(xiàn)象嚴(yán)重,將大量的光灘和部分水泥馬路誤識別為光伏電站,而根據(jù)MOIF指數(shù)提取的電站,整體精度達(dá)到77.05%,落在背景區(qū)的誤分像元數(shù)僅為503個,較前者精度有大幅提高。
射陽電站樣本的統(tǒng)計量見表6和表7。由表8可以看出,456波段組合的OIF指數(shù)最大,為最佳組合;利用MOIF指數(shù)時標(biāo)準(zhǔn)差最大的波段5不參與提取試驗。由表7中的相關(guān)系數(shù)可知,波段1、2,波段3、4,波段6、7不能組合,最終篩選出備選波段組合136、137、146、147、246、247。MOIF指數(shù)計算的最佳波段組合為137,見表9。射陽研究區(qū)不同波段組合的電站提取效果和精度如表5和圖3所示,可以看出根據(jù)OIF指數(shù)的提取結(jié)果將部分地物和光灘誤識別為光伏電站,提取精度僅為60.29%時背景區(qū)的錯誤像元數(shù)達(dá)到1006個;而根據(jù)MOIF指數(shù)提取的電站,整體精度達(dá)到70.73%,落在背景區(qū)的誤分像元數(shù)減少389個,且提取出的光伏電站更加緊湊,孤立的斑點噪聲簇明顯減少。
表1 東臺地區(qū)影像波段(電站樣本)光譜信息統(tǒng)計
表2 東臺地區(qū)影像(電站樣本)7波段相關(guān)系數(shù)矩陣
表3 東臺地區(qū)影像備選組合波段的OIF值統(tǒng)計結(jié)果
表4 東臺地區(qū)影像備選組合波段的MOIF值統(tǒng)計結(jié)果
表5 不同方法的提取精度
圖2 東臺研究區(qū)提取結(jié)果對比
波段序號最小值最大值平均值標(biāo)準(zhǔn)差19848(10786)21150(11553)10480.75(11199.99)435.45(155.45)28923(9987)22097(10771)9750.95(10362.52)561.88(177.75)37757(8751)23006(9820)9235.08(9212.91)735.03(204.72)46819(8085)25037(9454)8743.76(8664.907)1055.29(274.89)55784(7914)28602(13094)12021.82(9662.03)3898.83(744.77)64871(9434)27450(11927)9062.03(10742.36)2811.40(534.14)75011(7387)38382(9426)7452.37(8231.641)1918.62(397.04)
表7 射陽地區(qū)影像(電站樣本)7波段相關(guān)系數(shù)矩陣
表8 射陽地區(qū)影像備選組合波段的OIF值統(tǒng)計結(jié)果
表9 射陽地區(qū)影像備選組合波段的MOIF值統(tǒng)計結(jié)果
圖3 射陽研究區(qū)提取結(jié)果對比
通過分析OC-SVM與常用波段選擇指數(shù)OIF相結(jié)合在提取特定目標(biāo)地物時存在的不足,本文提出了一種改進(jìn)的最佳波段組合指數(shù)(MOIF),利用Landsat8多光譜影像作為數(shù)據(jù)源,選擇江蘇省沿海灘涂上東臺和射陽兩個研究區(qū)進(jìn)行了試驗分析,得出以下結(jié)論:
(1) 傳統(tǒng)的最佳指數(shù)法(OIF)較適用于多分類,但與OC-SVM相結(jié)合在提取特定目標(biāo)地物時存在弊端。
(2) 本文提出的MOIF指數(shù)在保證訓(xùn)練數(shù)據(jù)信息量盡可能大的基礎(chǔ)上,將目標(biāo)地物的光譜穩(wěn)定性考慮在內(nèi),適用于特定地物的提取,在提取精度和識別效果方面具備一定優(yōu)勢。
(3) OC-SVM僅需要選擇目標(biāo)地物的部分樣本作為訓(xùn)練數(shù)據(jù),省時省力,且提取地物的精度令人滿意。
當(dāng)然,本文方法還存在些許不足,如未能根據(jù)相似地物的光譜特征深入分析,下一步將嘗試加入紋理特征,以進(jìn)一步提高光伏電站的提取精度。
[1] 閆利,趙展,聶倩,等.利用規(guī)則進(jìn)行高分辨率遙感影像地物提取[J].武漢大學(xué)學(xué)報(信息科學(xué)版), 2012, 37(6):636-639.
[2] 李益.基于光譜/空間聯(lián)合特征的遙感影像地物提取技術(shù)研究[D].鄭州:信息工程大學(xué), 2012.
[3] 盧遙,盧小平,武永斌,等.綜合機載LiDAR與高分影像的煤礦區(qū)典型地物提取方法[J].測繪通報, 2015(12):57-59.
[4] 王樹東,張立福,陳小平,等.基于Landsat TM的熱帶精細(xì)地物信息提取的模型與方法——以海南島為例[J].生態(tài)學(xué)報, 2012, 32(22):7036-7044.
[5] 程維芳,周藝,王世新,等.基于多光譜遙感的撂荒地識別方法研究[J]. 光譜學(xué)與光譜分析, 2011, 31(6):1615-1620.
[6] 郭娜,劉劍秋.TM遙感影像植被信息提取的最佳波段組合選擇——以福建省松溪至建甌高速公路為例[J].福建師范大學(xué)學(xué)報(自然科學(xué)版),2012,28(1):103-107.
[7] CHAVEZ P S, BERLIN G L, SOWERS L B. Statistical Method for Selecting Landsat MSS Ratios 147[J]. Journal of Applied Photographic Engineering, 1984, 8(1):23-30.
[8] 陸燈盛,游先祥,崔賽華.TM圖像的信息量分析及特征信息提取的研究[J].環(huán)境遙感,1991(4):267-274,323.
[9] 馮恩國,秦奮,李淑香.居民地信息提取的最優(yōu)波段組合方案研究——以開封市區(qū)為例[J].水土保持研究, 2007, 14(3):200-202.
[10] TARABALKA Y, BENEDIKTSSON J A, CHANUSSOT J. Spectral-Spatial Classification of Hyperspectral Imagery Based on Partitional Clustering Techniques[J]. IEEE Transactions on Geoscience & Remote Sensing, 2009, 47(8):2973-2987.
[11] 慎利,唐宏,王世東,等.結(jié)合空間像素模板和Adaboost算法的高分辨率遙感影像河流提取[J].測繪學(xué)報, 2013, 42(3):344-350.
[12] 周亦,張亞亞.利用eCognition進(jìn)行高分一號衛(wèi)星數(shù)據(jù)土地利用現(xiàn)狀解譯能力測試[J].測繪通報, 2016(8):77-80.
[13] 殷亞秋,李家國,余濤,等.基于高分辨率遙感影像的面向?qū)ο笏w提取方法研究[J].測繪通報, 2015(1):81-85.
[14] 胡俊.基于多元邏輯回歸和鄰域信息的高光譜遙感影像半監(jiān)督分類[D].徐州:中國礦業(yè)大學(xué), 2015.
[15] 曾生根,王小敏,范瑞彬,等.基于獨立分量分析的遙感圖像分類技術(shù)[J].遙感學(xué)報, 2004, 8(2):150-157.
[16] 翟天林,金貴,鄧祥征,等.植被信息的Landsat8衛(wèi)星影像提取方法[J].測繪科學(xué), 2016,41(10):126-131.
[17] 張薈平.基于光譜特征不確定性的遙感影像分類研究[D].武漢:華中科技大學(xué), 2013.
[18] 林顥,趙杰文,陳全勝,等.近紅外光譜結(jié)合一類支持向量機算法檢測雞蛋的新鮮度[J].光譜學(xué)與光譜分析, 2010, 30(4):929-932.
Research on Modified Optimum Index Factor Method for Specific Object Extraction
WANG Shengli,ZHANG Lianpeng,LI Xing,ZHAO Zhuowen,SHEN Yang,CHAI Qi
(School of Geography, Geomatics and Planning, Jiangsu Normal University, Xuzhou 221116, China)
This paper presents a modified optimum index factor based on one-class support vector machine for extracting specific object. The proposed method was used to extract the photovoltaic power station from the Landsat 8 satellite image in Jiangsu coastal zone. The accuracy evaluation was conducted by referencing the visual interpretation results. The proposed method is useful to extract the specific object from satellite image.
intertidal flats; modified optimum index factor; photovoltaic power station; one-class support vector machine; object extraction
王勝利,張連蓬,李行,等.面向特定目標(biāo)地物提取的改進(jìn)最佳波段組合方法研究[J].測繪通報,2017(7):49-54.
10.13474/j.cnki.11-2246.2017.0222.
2017-01-18
國家自然科學(xué)基金(41401093;41601405)
王勝利(1992—),男,碩士生,研究方向為遙感信息提取與影像分類。E-mail:wsli586@163.com 通信作者: 張連蓬。E-mail:zhanglp2000@126.com
P237
A
0494-0911(2017)07-0049-06