烏云德吉,陳瑞卿,敦惠霞
(1.內(nèi)蒙古自治區(qū)農(nóng)牧業(yè)科學(xué)院農(nóng)牧業(yè)經(jīng)濟與信息研究所,內(nèi)蒙古呼和浩特 010031;2.中國農(nóng)業(yè)科學(xué)院農(nóng)業(yè)資源與農(nóng)業(yè)區(qū)劃研究所/農(nóng)業(yè)農(nóng)村部農(nóng)業(yè)遙感重點實驗室,北京 100081)
近年來,利用遙感圖像,采用面向?qū)ο蠓诸惙椒ㄟM行土地覆蓋制圖引起了廣泛的關(guān)注[1]。土地利用和土地覆蓋類型的遙感制圖是在局地、區(qū)域和全球尺度上監(jiān)測、理解和預(yù)測人類活動和自然相互干預(yù)的重要依據(jù)[2]。城市及周邊土地覆蓋類型包括不透水面、水體、林地、農(nóng)田、低矮灌叢等。用米級或亞米級的高分辨率光學(xué)遙感數(shù)據(jù)快速提取土地覆蓋類型是目前普遍關(guān)注的焦點,具有十分重要的意義。準(zhǔn)確高效提取城市周邊土地和建成區(qū),不僅可以為城市規(guī)劃提供科學(xué)依據(jù),還能夠為減少或避免熱島效應(yīng)和維護景觀格局提供科學(xué)依據(jù)。城市建成區(qū)空間布局在城市規(guī)劃和資源管理中具有重要作用,面向?qū)ο蟮膱D像分析技術(shù)能夠有效地提取城市建筑區(qū)域的圖像[3]。利用遙感影像分類土地利用和土地覆蓋的方法大致可以分為基于像素的分類和面向?qū)ο蟮姆诸?種,分割通常是面向?qū)ο蠓诸惖牡谝徊絒4]。國內(nèi)外許多學(xué)者針對面向?qū)ο蠓诸惙椒ㄗ隽舜罅垦芯?,例如:DURO 等[5]對比了3種機器學(xué)習(xí)分類方法,分別是決策樹DT、隨機森林RF、支持向量機SVM,分類結(jié)果證明,面向?qū)ο蟮姆诸惙椒ㄕw分類精度高于基于像素的分類方法,但是,基于像素的分類中3種方法的精度沒有明顯的差別,面向?qū)ο蠓诸愔胁町愝^大,隨機森林RF和支持向量機SVM的分類結(jié)果明顯優(yōu)于決策樹DT。BELGIU 等[6]指出,面向?qū)ο蟮姆诸惙椒ㄔ诹_馬尼亞、意大利和美國3個試驗區(qū)農(nóng)作物種類識別的精度和時間上要優(yōu)于基于像素的分類方法,并且基于哨兵-2時間序列數(shù)據(jù)的時間加權(quán)動態(tài)時間偏差(TWDTW)方法在羅馬尼亞和意大利的分類精度跟隨機森林RF 相差不多,但是在美國沒有隨機森林RF 理想,并且TWDTW 方法對訓(xùn)練樣本的依賴性沒有隨機森林RF 高,這對訓(xùn)練樣本較少的區(qū)域具有十分重要的價值。此外,面向?qū)ο蟮姆诸惸軌蛴行Ы档驮肼?,噪聲會?dǎo)致過分分割和影響邊緣檢測。董婷等[7]以武漢市主城區(qū)為研究區(qū)域,選取Landsat 7/ETM+和Landsat 8/OLI 影像,利用改進后的歸一化水體指數(shù)NDWI、歸一化植被指數(shù)NDVI和光譜特征分析實現(xiàn)了建筑用地和裸地的分離,該文章的研究證明,層次分類能夠較高精度地提取城市裸地信息。馬吉晶等[8]基于GF-2 提出了耦合空-頻域信息的濁水提取模型,較高精度地提取了城市濁水區(qū)域。張華等[9]基于GF-1 遙感數(shù)據(jù),以民勤綠洲為試驗區(qū),獲取了建筑物、林地與耕地的最優(yōu)分割尺度,使用最鄰近分類法對試驗區(qū)的地物進行了分類,取得了較高的精度。還有部分研究表明,結(jié)合基于像素和面向?qū)ο蟮姆诸惙椒ㄊ亲詈玫倪x擇;其中,eCongnition軟件的應(yīng)用表現(xiàn)最好,該軟件的核心就是先基于像素分割影像,再面向?qū)ο蠼⒁?guī)則集,逐步修正、提取、合并類,是一種靈活的非監(jiān)督分類軟件[10-11]。
隨著我國城市化進程的加速發(fā)展,在對城市發(fā)展和變化的評價與規(guī)劃中遙感起到了至關(guān)重要的作用。當(dāng)前,航空航天遙感、雷達遙感、無人機遙感、高光譜遙感等新技術(shù)的廣泛應(yīng)用,大大方便了小尺度城市土地利用的分類研究。但是,衛(wèi)星影像因其低成本和高獲取能力仍然是主流技術(shù)之一,它在城市變化監(jiān)測研究中起著重要的作用。在分類研究中,面向?qū)ο蠓诸愝^適用于城市地區(qū)提取。因此,本文選取了海南省屯昌縣為研究區(qū),采用面向?qū)ο蠓诸惙椒▽ρ芯繀^(qū)城市及城市周邊土地覆蓋類型做了識別和提取。
屯昌縣位于海南省中部偏北,地理位置為19°08′~19°31′N、109°45′~110°15′E,東與瓊海市和定安縣交接,南與瓊中縣接壤,西北與澄邁縣毗鄰,面積1 231.5 km2,境內(nèi)有6個國有農(nóng)場,且植被類型豐富。此外,屯昌縣為低山丘陵地帶,地勢呈南高北低,山地占全縣面積的5%、丘陵占85%、其他地類占10%,屬熱帶季風(fēng)氣候,四季變化不大,長夏無冬,高溫多雨,干濕季分明。
面向?qū)ο蠓诸愅黄屏藗鹘y(tǒng)的基于像素的分類方法,不再以像素為最小單位,而是將圖像劃分為對象,并綜合利用對象的光譜和空間特征進行分類[6]。近10年,在土地利用分類研究中算法的發(fā)展已經(jīng)從傳統(tǒng)的基于影像到基于像素,再逐步發(fā)展到現(xiàn)如今的基于對象分類;隨著算法的優(yōu)化,算法實施的平臺不斷發(fā)展。目前,比較成熟且應(yīng)用比較廣泛的此類商業(yè)軟件主要有:美國Trimble公司的eCognition軟件、美國Overwatch System公司的Feature Analyst 軟件、美國ERDAS公司ERDAS IMAGINE 遙感圖像處理軟件的Objective模塊、加拿大PCI公司PCI GEOMATICA 軟件的Feature Obje X模塊、美國ITT公司ENVI 遙感圖像處理軟件的Feature Extraction模塊等。其中,eCognition和Feature Analyst 是從高分辨率遙感圖像中提取信息的兩種最先進的商業(yè)軟件[12]。
eCongnition在定義中只使用規(guī)則進行分類,因此,可以為不同的類制定不同的規(guī)則,例如使用閾值、隸屬函數(shù)來設(shè)置某些類別,然后根據(jù)構(gòu)建的規(guī)則對圖像對象進行分類。eCongnition 中有多種分割方法,包括:棋盤分割、多尺度分割、四叉樹分割等。其中,四叉樹分割和棋盤分割均采用自上而下的分割規(guī)則,自上而下的分割是指將對象分割成更小的對象。(1)棋盤分割:棋盤分割是許多分割算法中最簡單的算法,即將圖像對象分成正方形的圖像對象,然后每個對象按照設(shè)計的方格尺寸沿網(wǎng)格線切割;(2)四叉樹分割:四叉樹分割是基于四邊形的分割算法,原理類似棋盤分割,但是創(chuàng)建的塊大小不同。四叉樹結(jié)構(gòu)的特殊點是每個正方形都有第1個可能的最大尺寸,而第2個正方形滿足由圖案和比例參數(shù)定義的同質(zhì)性標(biāo)準(zhǔn);(3)多尺度分割:多尺度分割是一種自下而上的分割方法,在目標(biāo)間平均異質(zhì)性最小、內(nèi)部像素間均勻度最大的前提下,通過對相鄰像素或小分割對象的合并,實現(xiàn)了基于區(qū)域融合技術(shù)的圖像分割。多尺度分割的最大優(yōu)點是可以設(shè)置尺度參數(shù)值,并且可以在任何應(yīng)用技術(shù)領(lǐng)域中提取和成型。
本試驗主要應(yīng)用了多尺度分割方法。多尺度分割算法的運行取決于各項分割參數(shù)的選擇,主要的分割參數(shù)有:圖像各波段權(quán)重、分割尺度(Scale)、均質(zhì)度標(biāo)準(zhǔn)[包含顏色參數(shù)(Color)和形狀參數(shù)(Shape)],其中形狀參數(shù)又包括緊致度(Compactness)和平滑度(Smoothness)[13]。
3.2.1 各波段權(quán)重的選擇 圖像各波段權(quán)重的設(shè)定主要由各波段所含信息量的大小、各波段的相關(guān)性以及目標(biāo)地物光譜信息的特征確定。通過賦予圖像各波段層不同的分割權(quán)重,強調(diào)對信息提取有用的波段,去掉冗余的波段,可以有效提高分割速度。
3.2.2 分割尺度的選擇 分割尺度是控制圖像對象異質(zhì)性和確定生成圖像對象大小的閾值。分割尺度越大,生成的多邊形越少,多邊形的平均面積越大,反之同理。所以,對于不同的目標(biāo)地物,選擇適合的分割尺度(最優(yōu)分割尺度)是非常重要的。針對圖像設(shè)置不同的分割尺度,生成不同尺度下的圖像對象層,構(gòu)建圖像對象網(wǎng)絡(luò)層次結(jié)構(gòu)。圖像對象層按照從大到小、從上到下方式進行排列:圖像像元層位于最底層,分割尺度最大的圖像對象層位于最高層。
3.2.3 均質(zhì)度標(biāo)準(zhǔn)的選擇 均質(zhì)度標(biāo)準(zhǔn)(homogeneity criteria)是由顏色參數(shù)和形狀參數(shù)綜合衡量的。顏色參數(shù)是參與生成圖像對象最重要的標(biāo)準(zhǔn),考慮到光譜信息是遙感圖像數(shù)據(jù)中所載的主要信息,在一般情況下需要設(shè)置較大顏色參數(shù)權(quán)重。形狀參數(shù)分為平滑度參數(shù)和緊致度參數(shù)。平滑度參數(shù)通過平滑邊界優(yōu)化圖像對象;通過圖像對象之間的緊湊性來優(yōu)化緊湊性。進行均質(zhì)度標(biāo)準(zhǔn)參數(shù)權(quán)重選擇時需要遵循2個原則:盡可能設(shè)定較大顏色參數(shù)的權(quán)重;對于外形規(guī)則的地物適當(dāng)提高形狀參數(shù)的權(quán)重。
GF-2是第1顆空間分辨率優(yōu)于1 m的民用光學(xué)遙感衛(wèi)星,衛(wèi)星攜帶了2個高分辨率的1 m 全色相機和4 m 多光譜相機。該衛(wèi)星具有空間分辨率高、定位精度高、姿態(tài)快、可操作性強等特點,有效地提高了衛(wèi)星的綜合觀測效率,達到國際先進水平。GF-2是我國高分辨率地球觀測系統(tǒng)(CHEOS)的第2顆高分辨率成像衛(wèi)星,是我國第1顆具有地面采樣距離(GSD)的民用高分辨率成像儀。與GF-1 相機相比,數(shù)據(jù)分辨率有所提升[14]。GF-2 因其數(shù)據(jù)高獲取能力和高空間分辨率越來越受到國內(nèi)學(xué)者的重視,GF-2 數(shù)據(jù)廣泛應(yīng)用于農(nóng)業(yè)資源管理[15]、精準(zhǔn)農(nóng)業(yè)[16]、林業(yè)[12]、建成區(qū)提取監(jiān)測[17-18]、水域監(jiān)測[8,19]等領(lǐng)域,是目前我國空間分辨率最高的衛(wèi)星數(shù)據(jù),對國土資源調(diào)查、災(zāi)害應(yīng)急管理等具有十分重要的價值。
本試驗數(shù)據(jù)為海南地區(qū)GF-2 衛(wèi)星數(shù)據(jù),全色分辨率為1 m,多光譜分辨率為4 m。研究區(qū)域為海南省屯昌鎮(zhèn)及其周邊區(qū)域,覆蓋范圍:5 735像元×5 429像元,主要包括建筑物、植被、道路、水體和裸地。
數(shù)據(jù)預(yù)處理:在ENVI5.3 平臺對數(shù)據(jù)進行了正射校正、輻射定標(biāo)、數(shù)據(jù)融合和大氣校正等預(yù)處理,得到標(biāo)準(zhǔn)化數(shù)據(jù),便于在eCognition軟件中進行分類和構(gòu)建特征值,圖1為真彩色合成的研究區(qū)示意圖。
米級分辨率和亞米級分辨率的衛(wèi)星影像多應(yīng)用于城市環(huán)境調(diào)查,如土地覆蓋和土地利用制圖[20]。目前,我國相繼發(fā)射的GF 系列衛(wèi)星為國內(nèi)土地利用分類研究提供了更加豐富的數(shù)據(jù)源,尤其是GF-2 米級分辨率為城市地區(qū)的土地利用變化監(jiān)測提供了更加可靠的數(shù)據(jù)支持。植被指數(shù)(VI)廣泛應(yīng)用于土地利用分類研究,隨著面向?qū)ο蠓诸惙ǖ目焖侔l(fā)展,將植被指數(shù)作為特征值參與到面向?qū)ο蟮姆诸愃惴ㄖ锌梢杂行У貜浹a遙感影像本身光譜值的不足,能夠放大特征值,達到針對某一地物更準(zhǔn)確的提取效果。李恒凱等[21]采用GF-1 遙感圖像作為數(shù)據(jù)源,采用面向?qū)ο蟮姆诸惙椒?,結(jié)合模糊分類和CART 決策樹分類方法,并在非水體類別中采用了歸一化植被指數(shù)(normalized difference vegetation index,NDVI),用于區(qū)分植被和非植被,取得了高精度的研究區(qū)土地利用分類結(jié)果。張貴花等[22]將植被指數(shù)與不同分辨率的遙感圖像結(jié)合起來,在eCongnition 平臺確定最佳分割尺度,并根據(jù)典型植被類型的物候特征、光譜和空間特征構(gòu)建了分類規(guī)則,并利用面向?qū)ο蠓謪^(qū)策略,對黃河三角洲植被類型進行了自上而下的分類,取得了較高的分類精度。本試驗在用eCognition Developer 進行分類時利用光譜值進行分類并不能達到理想的分類效果?;谝陨峡紤],并且由于GF-2 藍、綠、紅、近紅外4個波段的限制,在軟件平臺只引入以下3個特征值。
4.2.1 歸一化植被指數(shù)(normalized difference vegetation index,NDVI) NDVI是植被物候?qū)W中最常用的植被指數(shù)之一[23]。NDVI 利用綠色植物葉片的光譜特性,在紅光波段的強吸收和近紅外波段的強反射表達植被生長狀況。通過NDVI的計算和設(shè)定閾值進行分類能夠有效地區(qū)分城市地區(qū)和植被覆蓋地區(qū),在本試驗中NDVI 被定義為
4.2.2 土壤調(diào)節(jié)植被指數(shù)(soil-adjusted vegetation index,SAVI) SAVI的目的是解釋背景的光學(xué)特征并糾正NDVI 對土壤背景的敏感性[24]。SAVI 不同于NDVI的是增加了根據(jù)實際情況確定的取值范圍為0~1的土壤調(diào)整系數(shù)L。L=0,表示植被覆蓋度為零;L=1,表示土壤背景的影響為零,即植被覆蓋度越高,L的值越趨于1。近年來,SAVI 逐漸應(yīng)用于城市不透水面的提取,對于區(qū)分裸土和不透水面具有較高的貢獻率[25]??紤]到研究區(qū)影像為海南省5月20日的GF-2 衛(wèi)星數(shù)據(jù),植被覆蓋度較高,土壤背景的影響較小,所以在本試驗中將L 設(shè)置為0.8[26-27],公式為
4.2.3 歸一化差異水體指數(shù)(normalized difference water index,NDWI) NDWI是基于近紅外波段與綠波段的歸一化比值指數(shù)。該指數(shù)一般用來提取圖像中的水體信息,效果較好[28]。本試驗采用了Mcfeeters在1996年首次提取的NDWI計算方法,用于提取研究區(qū)水體信息,其公式為
以上3種特征值均用于區(qū)分試驗區(qū)的地物類型,本試驗首先基于像素(pixel based)在eCongnition中用多尺度分割法分割了影像。多尺度分割是eCongnition 中常用的分割算法?;趨^(qū)域融合技術(shù)的圖像分割是一種自下而上的分割方法,它將相鄰像素或小塊目標(biāo)組合在一起,保證了目標(biāo)間的最小平均異質(zhì)性和目標(biāo)間的最大同質(zhì)性。多尺度分割的最大優(yōu)點是可以設(shè)置尺度參數(shù),并且可以在任何應(yīng)用技術(shù)領(lǐng)域中進行提取和建模,技術(shù)流程見圖2。
由圖2可以看出,試驗第1 步在數(shù)據(jù)預(yù)處理和數(shù)據(jù)融合的基礎(chǔ)上首先建立了一個多尺度分類規(guī)則,命名為Level1,然后在NDVI、NDWI和SAVI 3個特征的基礎(chǔ)上,人為查看最佳提取閾值,發(fā)現(xiàn)NDVI在0.46 是一個較為明顯的臨界點,>0.46表明植被覆蓋度較高,在Level1 圖層中將符合條件的判定為林地。第2 步利用NDWI 提取水體,經(jīng)過反復(fù)查看,將NDWI為0.30 作為識別水體的閾值,即NDWI≥0.30時能夠較好地提取水體,包括城市地區(qū)的水體和河道淺水區(qū)。在以上2個步驟中,符合條件的判定為目標(biāo)地類,不符合條件的判定為未分類,第3個子規(guī)則在未分類地物中進行:將NDVI 設(shè)置為≥0.20,滿足條件為其他植被,不滿足則是未分類地區(qū);在提取城市地區(qū)不透水面中,歸一化建筑指數(shù)NDBI是較為有效的手段,廣泛應(yīng)用于城市土地利用變化監(jiān)測研究[29],但是受GF-2 波段的限制,未能計算NDBI 用于不透水面的提取,改用SAVI 區(qū)分城市地區(qū)和非城市地區(qū)(詳見4.2),經(jīng)過反復(fù)試驗,將SAVI<0.20 判定為城市地區(qū),其他的則為未分類;除了林地、水體和不透水面,試驗區(qū)還有農(nóng)田和低矮灌叢、城市地區(qū)綠化帶等其他植被類型,第4步同樣在未分類當(dāng)中進行,這里將NDVI≥0.20定義為其他植被;因為前3 步已將林地提取出,所以并沒有林地的干擾。在完成以上步驟后,發(fā)現(xiàn)還有未分類的地物,通過觀察發(fā)現(xiàn)均是草地、荒地或低矮灌叢等植被區(qū)域,所以,最后將SAVI值在0.20~1.00的地物定義為其他植被,并得到最終分類結(jié)果(圖3)。
試驗采取了海南省中部地區(qū)及周邊5 735像元×5 429像元大小的GF-2 圖像為數(shù)據(jù)源(融合后分辨率1 m),在eCongnition軟件平臺,首先使用多尺度分割算法切割圖像,并構(gòu)建了NDVI、NDWI、SAVI 3種植被指數(shù)特征用于分層分類的提取地類。在多尺度分割圖上設(shè)置了3種植被指數(shù)的提取關(guān)鍵閾值,搭建了4層子規(guī)則,逐步提取了林地、水體、不透水面和其他植被(農(nóng)田、灌叢和城市綠化)。分類結(jié)果為不透水面12.392 km2、水體2.534 km2、林地8.519 km2、其他植被7.690 km2。
通過混淆矩陣對分類結(jié)果進行了精度驗證,基于高分辨率高分數(shù)據(jù)的面向?qū)ο笸恋乩梅诸惸軌蜻_到很高的精度。該分類體系的Kappa 系數(shù)達到了0.95,總精度(overall accuracy)達到了0.96,制圖精度(PA)和用戶精度(CA)均在0.90 以上,獲得了很好的分類效果(表1)。
通過對分類結(jié)果的分析,林地提取結(jié)果最優(yōu),水體其次,不透水面和其他植被也有較好的分類結(jié)果。本文采用的指數(shù)特征在分類過程中的貢獻率表現(xiàn),NDVI 對林地和其他植被的貢獻率較高;SAVI 對于不透水面的貢獻率高,能夠很好地將建筑物和道路從其他地類中提取出來,但是在部分地區(qū)未能將裸地從不透水面中提取出來。由圖3的分類結(jié)果可以看出,結(jié)合植被指數(shù)和水體指數(shù)對試驗區(qū)的土地利用分類取得了十分理想的結(jié)果。其中,林地因其高NDVI值的特點,提取效果是最為理想的,水體其次,其他植被的分類過程中,有一小部分林地和農(nóng)田有混淆的情況,其原因可能是試驗選取的遙感圖像是海南地區(qū)的,而海南又屬于橡膠樹種植區(qū),人工種植的橡膠樹地塊容易跟天然林地混淆。在試驗初始階段,在基于光譜DN值和形狀特征、緊湊特征度等特征采用分類分割方法未能取得較好的分類結(jié)果,尤其沒能完整地提取圖3c 左上角的水體部分,對淺水的提取也不夠準(zhǔn)確完整。但是,通過計算NDWI值,設(shè)定閾值的方法能夠較完整地提取淺水地區(qū)和城市地區(qū)的水域。此外,使用SAVI 能夠較完整地提取不透水面(建筑物和道路)。
表1 精度驗證結(jié)果
本試驗的結(jié)果表明,在eCongnition軟件平臺,采用多尺度分割和多種指數(shù)結(jié)合的方法,逐層提取城市土地利用、覆蓋分類十分高效,且便于操作,適合在區(qū)域尺度上應(yīng)用。
城市土地覆蓋信息的提取是進行城市合理布局評價的首要內(nèi)容。然而,使用傳統(tǒng)的基于像素的分類方法對高分辨率遙感圖像的分類并未充分利用圖像的數(shù)據(jù)信息,造成分類精度較低。利用面向?qū)ο蟮倪b感信息提取方法,提高了高分辨率遙感圖像分類的精度和效率。
本試驗也有不足之處,例如天然林地和高大農(nóng)作物的混淆,不透水面和裸地的混淆,如圖3d所示,影像有一塊較為明顯的裸地。但是,通過分層分類的提取,3種植被指數(shù)未能有效地區(qū)分裸地,而且較為明顯,這也是作者未來在土地利用分類研究中重點研究的方向。