權(quán)學(xué)烽,唐新明,李國(guó)元,高顯連
(1.蘭州交通大學(xué),蘭州 730070;2.自然資源部國(guó)土衛(wèi)星遙感應(yīng)用中心,北京 100048;3.甘肅省地理國(guó)情監(jiān)測(cè)工程實(shí)驗(yàn)室,蘭州 730070;4.國(guó)家林業(yè)局衛(wèi)星林業(yè)應(yīng)用中心,北京 100714)
1971年美國(guó)的阿波羅-15號(hào)搭載了第一臺(tái)星載激光測(cè)高儀,并在隨后的時(shí)間里大力發(fā)展衛(wèi)星激光測(cè)高技術(shù)[1-7]。2003年美國(guó)發(fā)射了首顆對(duì)地觀測(cè)激光測(cè)高衛(wèi)星,冰、云和陸地高程衛(wèi)星ICESat/GLAS(ICE,Cloud and land Elevation Satellite/Geoscience Laser Altimeter System),該衛(wèi)星于2009年停止數(shù)據(jù)接收,在這期間共接收了近2億個(gè)激光測(cè)高點(diǎn),為土地覆蓋分類研究提供了豐富的數(shù)據(jù)。近幾年來(lái),隨著對(duì)地觀測(cè)技術(shù)的發(fā)展和國(guó)家戰(zhàn)略的需求,國(guó)家高分辨率對(duì)地觀測(cè)系統(tǒng)重大專項(xiàng)以及國(guó)家民用空間基礎(chǔ)設(shè)施中均明確提出我國(guó)將發(fā)射高分七號(hào)(GF-7)衛(wèi)星和陸地生態(tài)系統(tǒng)碳監(jiān)測(cè)衛(wèi)星[8]。這些衛(wèi)星都將搭載激光測(cè)高儀,為我國(guó)的星載激光測(cè)高數(shù)據(jù)應(yīng)用研究提供幫助。2016年5月30日,資源三號(hào)02星順利發(fā)射,02星上搭載了國(guó)內(nèi)首臺(tái)對(duì)地觀測(cè)的激光測(cè)高儀,主要用于測(cè)試激光測(cè)高儀在對(duì)地測(cè)量時(shí)的精度,以及探索激光測(cè)高數(shù)據(jù)與光學(xué)遙感影像結(jié)合實(shí)現(xiàn)無(wú)控立體測(cè)圖的可行性[9]。目前,國(guó)外圍繞基于星載全波形激光測(cè)高數(shù)據(jù)在土地覆蓋分類應(yīng)用開展了較多的研究,并且以美國(guó)的ICESat數(shù)據(jù)為主,國(guó)內(nèi)僅有少數(shù)團(tuán)隊(duì)在進(jìn)行星載激光測(cè)高數(shù)據(jù)的應(yīng)用研究,其中森林生物量反演和湖泊監(jiān)測(cè)等方向的研究人員較多,而土地覆蓋分類方向的研究還處于剛剛起步的階段。
土地覆蓋分類應(yīng)用研究主要目的是通過(guò)激光測(cè)高儀接收到地表回波的波形信息來(lái)進(jìn)行地表覆蓋物的分類,提升分類準(zhǔn)確率一直是該研究領(lǐng)域的熱點(diǎn)與難點(diǎn)。目前該方向的研究主要通過(guò)兩個(gè)部分來(lái)提升分類準(zhǔn)確率,一部分是在波形處理時(shí)使返回波波形更為精確以及提高回波波形的利用率,挖掘有效的波形參數(shù),其中波形處理的方法有利用高斯分解提取波形特征參數(shù)的波形特征參數(shù)法和將波形轉(zhuǎn)化為累計(jì)分布函數(shù)(cumulative distribution function,CDF)曲線的曲線匹配法2種方法;另一部分是通過(guò)對(duì)多種分類器的研究與改進(jìn)來(lái)提高分類的準(zhǔn)確率,目前應(yīng)用于星載激光測(cè)高數(shù)據(jù)在地表覆蓋分類的主要分類方法有K均值法(K-mean,KM)、圍繞中心剖分法(partitioning around medoids,PAM)、模糊C均值法(fuzzy C-means,F(xiàn)CM)、決策樹算法(decision tree,DT)、最大似然分類(maximum likelihood,ML)、人工神經(jīng)網(wǎng)絡(luò)(artificial neural networks,ANN)、隨機(jī)森林(random forest,RF)以及支持向量機(jī)(support vector machines,SVM)。Duong等人通過(guò)對(duì)原始波形進(jìn)行波形預(yù)處理后利用波形特征參數(shù)法進(jìn)行了土地覆蓋分類,實(shí)驗(yàn)分類準(zhǔn)確率為73%,表現(xiàn)出良好的一致性[10]。大多數(shù)國(guó)外學(xué)者在進(jìn)行土地覆蓋分類研究時(shí)也使用該方法,通過(guò)對(duì)不同地區(qū)的實(shí)驗(yàn)發(fā)現(xiàn),選取適當(dāng)?shù)姆诸惼骺梢蕴岣叻诸惖臏?zhǔn)確率,但是當(dāng)分類的種類增多時(shí),分類的準(zhǔn)確率出現(xiàn)下降,且該方法是對(duì)連續(xù)的波形進(jìn)行參數(shù)提取變?yōu)殡x散的數(shù)據(jù),在面對(duì)多種相似但不同的種類時(shí),該方法可能損失了部分有用的信息導(dǎo)致分類的準(zhǔn)確率下降,但是該方法在大多數(shù)情況下都是適用的[11-15]。Zhou等人提出了基于KS距離分類的CDF曲線匹配法,實(shí)驗(yàn)結(jié)果表明基于KS距離分類的土地覆蓋分類準(zhǔn)確率可以達(dá)到87.2%,Kappa系數(shù)為0.80[16]。這種方法優(yōu)于使用高斯分解參數(shù)的土地覆蓋分類方法3.5%,該方法在一定的區(qū)域內(nèi)提供了比特征參數(shù)法更高的分類準(zhǔn)確率,這可能是由于該方法是對(duì)完整波形的使用,獲得了更多的分類信息,從而使分類準(zhǔn)確率上升。2016年Zhou等人利用全波形數(shù)據(jù)來(lái)測(cè)試曲線匹配法區(qū)分不同垂直結(jié)構(gòu)物體的能力,在基于原來(lái)的曲線匹配算法的基礎(chǔ)上擴(kuò)展了2組新的曲線匹配方法,分類準(zhǔn)確率有所上升[17]。
本文使用ICESat/GLAS在北京地區(qū)的全波形數(shù)據(jù),采用改進(jìn)后的CDF和KS距離算法,開展土地覆蓋分類實(shí)驗(yàn)研究,以驗(yàn)證星載全波形激光數(shù)據(jù)在土地覆蓋分類的應(yīng)用前景,為我國(guó)后續(xù)的激光測(cè)高衛(wèi)星在土地覆蓋分類應(yīng)用提供參考。
實(shí)驗(yàn)區(qū)位于中國(guó)北京市市區(qū)周邊區(qū)域(115.4°E~117.5°E,39.4°N~41.1°N)。北京市中心位于116°23′E、38°54′N,位于華北平原西北邊緣,與天津相鄰且被河北省環(huán)繞包圍,如圖1所示。
圖1 北京市GLAS足印點(diǎn)分布圖
由于全波形數(shù)據(jù)對(duì)于復(fù)雜地物分類存在一定局限性,相似地物類型在分類時(shí)的效果較差[11],因此本研究將實(shí)驗(yàn)區(qū)地表類型分為4類,分別為裸地、水體、樹木和建筑物。該區(qū)域內(nèi)的建筑物構(gòu)造復(fù)雜,既有較高的樓房也有低矮的棚戶型建筑,因此分類難度較高。由于北京周邊地形復(fù)雜、有較高的高程變化,為了減弱地形對(duì)于分類結(jié)果的影響,故選取北京市城區(qū)進(jìn)行土地覆蓋分類實(shí)驗(yàn)。
1)ICESat/GLAS數(shù)據(jù)。實(shí)驗(yàn)中使用ICESat/GLAS數(shù)據(jù)為分類數(shù)據(jù),ICESat/GLAS是首顆對(duì)地觀測(cè)激光測(cè)高衛(wèi)星,且大量國(guó)外學(xué)者已經(jīng)驗(yàn)證了該數(shù)據(jù)的可靠性,因此使用該數(shù)據(jù)進(jìn)行土地覆蓋分類得到的結(jié)果具有一定的可靠性。本實(shí)驗(yàn)使用北京地區(qū)的2003—2008年的GLA01、GLA05和GLA14。GLA01數(shù)據(jù)產(chǎn)品包含發(fā)射和接收的波形數(shù)據(jù)、光斑號(hào)、時(shí)間、經(jīng)緯度、脈沖能量等信息;GLA05數(shù)據(jù)產(chǎn)品包含波形特征參數(shù)、激光足印的長(zhǎng)短軸參數(shù)和其他計(jì)算表面傾斜等地形特征時(shí)必須用到的參數(shù);GLA14數(shù)據(jù)產(chǎn)品包含經(jīng)波形分解得到的高斯波信息以及地表的高度信息、經(jīng)緯度和高程信息。
2)驗(yàn)證數(shù)據(jù)GLC30。本實(shí)驗(yàn)使用2003—2008年Landsat-7歷史遙感影像及GlobeLand30數(shù)據(jù)進(jìn)行驗(yàn)證,通過(guò)對(duì)足印點(diǎn)與遙感影像的疊加分析可以精確地判讀該區(qū)域內(nèi)的土地覆蓋信息。GlobeLand30分類數(shù)據(jù)利用的影像為30 m多光譜影像,包括美國(guó)陸地資源衛(wèi)星(Landsat)TM5、ETM+多光譜影像和中國(guó)環(huán)境減災(zāi)衛(wèi)星(HJ-1)多光譜影像。除了多光譜影像外,還使用了大量的輔助數(shù)據(jù)和參考資料,以支持樣本選取、輔助分類等工作。在GLC30數(shù)據(jù)集中代碼10為耕地、20為森林、60為水系、80為人造覆蓋物、90為裸地。本實(shí)驗(yàn)將耕地與裸地合并為裸地類,因?yàn)槠洳ㄐ螖?shù)據(jù)較為相似,且當(dāng)耕地農(nóng)閑時(shí)其地表特性與裸地相似;森林和部分單獨(dú)的樹木分類為樹木類。
本實(shí)驗(yàn)為3組實(shí)驗(yàn),第1組實(shí)驗(yàn)為初步實(shí)驗(yàn),驗(yàn)證CDF曲線KS距離匹配法在土地覆蓋分類方向應(yīng)用的可行性,并顯示不剔除坡度、地形因素的分類準(zhǔn)確率;第2組實(shí)驗(yàn)為剔除坡度與地形因素后的分類實(shí)驗(yàn),與第1組實(shí)驗(yàn)組成對(duì)比實(shí)驗(yàn),顯示出坡度與地形對(duì)地表覆蓋分類準(zhǔn)確率的影響;第3組為本文改進(jìn)方法的實(shí)驗(yàn),該實(shí)驗(yàn)在CDF曲線與KS距離匹配法的基礎(chǔ)上加入了波峰數(shù)和返回能量2個(gè)特征值,期望能進(jìn)一步提升分類的準(zhǔn)確率。本文改進(jìn)方法實(shí)驗(yàn)流程如圖2所示。
圖2 本研究方法流程圖
GLAS數(shù)據(jù)預(yù)處理是數(shù)據(jù)應(yīng)用的前提和保障,因此需要以下幾個(gè)步驟對(duì)數(shù)據(jù)進(jìn)行處理校正后才能進(jìn)行進(jìn)一步的應(yīng)用。
①電壓值轉(zhuǎn)換。GLAS數(shù)據(jù)被壓縮為1~256的計(jì)數(shù)波形,電壓值轉(zhuǎn)換是將計(jì)數(shù)波形轉(zhuǎn)換為真實(shí)波形的過(guò)程。
②波形正則化。在對(duì)比分析不同脈沖和環(huán)境下的波形時(shí)需要利用波形正則化將其統(tǒng)一。
③數(shù)據(jù)解壓縮。GLAS數(shù)據(jù)是將連續(xù)的1 000幀信號(hào)壓縮為544個(gè)(陸地)或200個(gè)(海洋)采樣值,數(shù)據(jù)解壓縮過(guò)程就是該過(guò)程的逆過(guò)程。
④波形濾波。波形濾波就是將波形中存在的噪聲進(jìn)行去除。
在進(jìn)行完上述標(biāo)準(zhǔn)步驟后,對(duì)足印點(diǎn)進(jìn)行進(jìn)一步的篩選,首先將返回能量值小于0.1的數(shù)據(jù)進(jìn)行剔除,這是因?yàn)樵摂?shù)據(jù)受到云層的影響較大,之后對(duì)坡度大于10°的數(shù)據(jù)進(jìn)行剔除,以消除坡度對(duì)地物分類的影響[18]。
CDF轉(zhuǎn)換是指將經(jīng)過(guò)數(shù)據(jù)預(yù)處理的波形數(shù)據(jù)轉(zhuǎn)化為累計(jì)分布函數(shù)圖像的過(guò)程,可以由公式(1)進(jìn)行轉(zhuǎn)換。
(1)
式中:jmin為閾值設(shè)置后波形開始的值(即開始接受能量的時(shí)刻)。
KS距離匹配(Kolmogorov-Smirnov distance text,KS)是用來(lái)測(cè)試樣本曲線與實(shí)驗(yàn)曲線之間的相似程度,通過(guò)實(shí)驗(yàn)曲線與樣本曲線之間的對(duì)比得到實(shí)驗(yàn)曲線與更接近于哪一組樣本曲線。KS距離匹配方法由公式(2)、公式(3)表示。
(2)
(3)
通過(guò)對(duì)不同足印點(diǎn)反射能量大小進(jìn)行對(duì)比可以進(jìn)一步準(zhǔn)確地對(duì)地物進(jìn)行分類,有效地區(qū)分裸地與水體、建筑物與樹木。返回能量由公式(5)近似表達(dá)。
(4)
式中:vi為ti時(shí)刻的電壓值,其中t為計(jì)數(shù)間隔,不影響不同地物返回能量之間的對(duì)比,所以可化簡(jiǎn)為
(5)
通過(guò)對(duì)已經(jīng)分類后的各個(gè)種類進(jìn)行能量計(jì)算后,對(duì)每個(gè)種類計(jì)算其期望值作為能量閾值,按大小排列。當(dāng)已知A類的能量閾值a,B類的能量閾值b,當(dāng)aB時(shí),將a1的數(shù)據(jù)分為B類。當(dāng)存在3類時(shí),C類的能量閾值為c且ab且a1
使用目視解譯法在篩選后的數(shù)據(jù)中選取20個(gè)具有良好代表性的激光點(diǎn)數(shù)據(jù)(每種類型5個(gè)點(diǎn))之后,隨機(jī)提取200個(gè)激光點(diǎn)作為測(cè)試數(shù)據(jù)進(jìn)行分類,使用KS距離匹配法進(jìn)行分類,分類結(jié)果如表1所示。
表1 樣本分類結(jié)果
其中有29個(gè)建筑物為正確分類,84個(gè)裸地為正確分類,4個(gè)水體為正確分類,22個(gè)植被為正確分類,將這139個(gè)波形數(shù)據(jù)作為樣本數(shù)據(jù)進(jìn)行之后的實(shí)驗(yàn)。
圖3為具有代表性的典型地物的地面真實(shí)影像與波形圖象、CDF曲線的匹配圖。
(圖中紅色橢圓為近似激光足印點(diǎn))圖3 影像、波形、CDF匹配圖
本實(shí)驗(yàn)使用曲線匹配法進(jìn)行分類,實(shí)驗(yàn)數(shù)據(jù)選取了2003—2009年的GLAS點(diǎn)共8 600個(gè)點(diǎn)進(jìn)行實(shí)驗(yàn)。該數(shù)據(jù)集離散地散落于整個(gè)北京市,整個(gè)數(shù)據(jù)集之間的空間關(guān)聯(lián)性較差,其分類結(jié)果如表2所示。
表2 實(shí)驗(yàn)1分類結(jié)果
其準(zhǔn)確率為0.67,其Kappa系數(shù)為0.415。通過(guò)對(duì)表2中錯(cuò)誤分類點(diǎn)的分析發(fā)現(xiàn),當(dāng)選取的實(shí)驗(yàn)點(diǎn)數(shù)據(jù)未處于平坦地形且空間關(guān)聯(lián)性較差時(shí),較高地形的樹木會(huì)錯(cuò)誤地分類為建筑物,相對(duì)應(yīng)的較低地形的建筑物也會(huì)錯(cuò)誤地分類為樹木,辨別建筑物與樹木主要是因?yàn)榻ㄖ锏腃DF曲線上升較快與樹木CDF曲線不同,且建筑物與樹木的起波點(diǎn)不同且轉(zhuǎn)折點(diǎn)位置不同,但是由于地形原因?qū)е聵淠九c建筑物的起波點(diǎn)相似,使得其整體不同差距變小,而不同地形的建筑物在起波點(diǎn)的差距導(dǎo)致其具有較大的不同性,使得樹木錯(cuò)誤地分類為建筑物,建筑物錯(cuò)誤地分類為樹木。實(shí)驗(yàn)發(fā)現(xiàn)裸地和水體之間,裸地和建筑物、樹木之間也有錯(cuò)誤分類的情況,分析后發(fā)現(xiàn)這可能是由于建筑物或樹木的地表反射能量較低,形成的上升曲線與裸地或水體的曲線較為相似從而錯(cuò)誤地分類,且也可能是由于裸地的起波點(diǎn)與樹木和建筑的起波點(diǎn)相似造成的錯(cuò)誤分類。而當(dāng)坡度較大時(shí)會(huì)造成無(wú)法判斷激光點(diǎn)的最后一個(gè)波峰是否為地面反射的波峰的情況,而且也會(huì)造成波形展寬的現(xiàn)象。
通過(guò)以上分析可以發(fā)現(xiàn)在不同地物之間的分類其起波點(diǎn)位置在分類中顯得尤為關(guān)鍵,也就是說(shuō)地形和地物高程的不同較為關(guān)鍵,因此在進(jìn)行地物分類時(shí)要選取同一地勢(shì)、坡度較小的區(qū)域進(jìn)行分類。
該實(shí)驗(yàn)繼續(xù)使用與實(shí)驗(yàn)1相同的方法,但在激光點(diǎn)選取時(shí)選取了同一地形、坡度不大于10°的激光點(diǎn)數(shù)據(jù)[18],并且對(duì)范圍內(nèi)的激光點(diǎn)數(shù)據(jù)進(jìn)行了進(jìn)一步篩選,最后得到篩選后的2 000個(gè)激光足印點(diǎn),分類結(jié)果見表3所示。
表3 實(shí)驗(yàn)2分類結(jié)果
其準(zhǔn)確率為0.81,其Kappa系數(shù)為0.58,分類準(zhǔn)確率和Kappa系數(shù)有較高的提升。因此,坡度和地形對(duì)于分類準(zhǔn)確率還是有較大的影響。本實(shí)驗(yàn)還通過(guò)對(duì)被篩選掉的數(shù)據(jù)分析發(fā)現(xiàn),大多數(shù)處于高坡度的地表覆蓋類型都是裸地或者樹木,基本沒(méi)有建筑物,即使存在建筑物也為臨時(shí)搭蓋的棚戶房。
通過(guò)對(duì)錯(cuò)誤分類的數(shù)據(jù)進(jìn)行分析發(fā)現(xiàn),在同一地形下,建筑物和樹木出現(xiàn)相互錯(cuò)誤分類的情況,通過(guò)在高分辨率遙感影像上發(fā)現(xiàn),這是由于部分建筑物為低矮建筑物,只有2~4 m,與樹木高度一致,導(dǎo)致起波點(diǎn)相似,在分類時(shí)不能很好地判別。水體、裸地與建筑物、植被之間也出現(xiàn)少量的分類錯(cuò)誤現(xiàn)象,這可能也是由于建筑物或樹木的高度較低,且地表返回能量較低導(dǎo)致形成的曲線與裸地、水體的CDF曲線較為相似導(dǎo)致的。
實(shí)驗(yàn)在Zhou的方法的基礎(chǔ)上加入了波峰數(shù)與返回能量值的參數(shù)分類。首先對(duì)CDF曲線進(jìn)行分類,分為波峰(水體、裸地)與多波峰(建筑物、樹木)兩類,該過(guò)程也可以在CDF曲線轉(zhuǎn)換之前進(jìn)行。在進(jìn)行KS距離匹配法之后,進(jìn)行返回能量判別。其分類結(jié)果如表4所示。
表4 本文方法分類結(jié)果
準(zhǔn)確率為0.90,Kappa系數(shù)為0.767,表現(xiàn)出較好的分類準(zhǔn)確率,但是Kappa系數(shù)較低。該結(jié)果驗(yàn)證了該改進(jìn)方法的可行性??梢园l(fā)現(xiàn)多數(shù)錯(cuò)誤的分類已被分為正確的類型。在本實(shí)驗(yàn)中發(fā)現(xiàn)當(dāng)分類數(shù)較少時(shí),其返回能量閾值之間的間距較大,不會(huì)產(chǎn)生重疊的情況,當(dāng)分類種類較多時(shí),返回能量閾值之間的間距會(huì)變小,區(qū)別性會(huì)降低,該方法的分類效果將會(huì)變低,但是分類數(shù)與分類準(zhǔn)確率之間的關(guān)系還需進(jìn)一步實(shí)驗(yàn)研究。實(shí)驗(yàn)結(jié)果中仍有個(gè)別的類型還是處于錯(cuò)誤分類之中,通過(guò)對(duì)比同時(shí)相的影像數(shù)據(jù)發(fā)現(xiàn),其中建筑物錯(cuò)誤地分類為裸地是由于驗(yàn)證樣本的時(shí)間與實(shí)驗(yàn)數(shù)據(jù)之間的不一致性導(dǎo)致的。通過(guò)對(duì)比歷史影像和GLC30分類圖發(fā)現(xiàn),GLC30為2010年的數(shù)據(jù)生成的地物類別地圖,而北京市在2003—2010年之間發(fā)生了較大的變化,其中北京南部郊區(qū)等地的地表覆蓋類型都由裸地轉(zhuǎn)變?yōu)榻ㄖ?,而使用GLAS數(shù)據(jù)可能正確地分類裸地但是在判斷時(shí)錯(cuò)誤地判斷為建筑物。除去這部分因素之后分類準(zhǔn)確率還會(huì)進(jìn)一步上升,其他的錯(cuò)誤分類還需進(jìn)一步研究。
通過(guò)表5可以清晰地發(fā)現(xiàn)去除坡度和地形因素地表覆蓋分類準(zhǔn)確率的上升,改進(jìn)后的方法在準(zhǔn)確率和kappa系數(shù)上都有較大的提升,表明了該方法的有效性。
表5 實(shí)驗(yàn)結(jié)果對(duì)比
本研究采用GLAS數(shù)據(jù),將CDF曲線匹配法與KS距離匹配法相結(jié)合的方法,驗(yàn)證了衛(wèi)星激光測(cè)高全波形數(shù)據(jù)在地表覆蓋類型分類中的可應(yīng)用性,并對(duì)該方法進(jìn)行了適當(dāng)?shù)母倪M(jìn)以提升其分類準(zhǔn)確率。實(shí)驗(yàn)結(jié)果表明該方法可以有效提高分類的準(zhǔn)確率,但是還存在一定的問(wèn)題。首先該方法去除了坡度與地形的影響,這說(shuō)明該方法僅適用于平原甚至是城市地區(qū),在坡度較大的地區(qū)無(wú)法進(jìn)行有效的分類,對(duì)分類的范圍有了制約;第二,在進(jìn)行閾值設(shè)定時(shí),需要分類類型之間具有較大的區(qū)別,因?yàn)橄嗨祁愋偷母采w物的能量閾值極為相似,不能有效進(jìn)行二次判別;第三,本實(shí)驗(yàn)選取的建筑物與植被閾值的可變性。通過(guò)實(shí)驗(yàn)發(fā)現(xiàn),就樹木與建筑物的返回能量而言,樹木的返回能量一般大于建筑物的返回能量,但是這與樹木冠層的大小、樹木的高度有關(guān),而區(qū)域性的樹木和城區(qū)范圍內(nèi)的樹木一般為同批次同種類栽種,其冠層大小與高度相似,因此其能量閾值設(shè)定較為規(guī)律與簡(jiǎn)單。而當(dāng)分類區(qū)域?yàn)橐巴鈺r(shí),樹木生長(zhǎng)的時(shí)間不一致并且種類混雜,其能量閾值的選取較為困難,有待進(jìn)一步實(shí)驗(yàn)進(jìn)行論證。