鹿豐玲, 鞏在武
(1.南京信息工程大學(xué)地理與遙感學(xué)院,南京 210044; 2.南京信息工程大學(xué)經(jīng)管學(xué)院,南京 210044)
?
基于隨機森林算法構(gòu)建云-云陰影-水體掩模
鹿豐玲1,2, 鞏在武2
(1.南京信息工程大學(xué)地理與遙感學(xué)院,南京210044; 2.南京信息工程大學(xué)經(jīng)管學(xué)院,南京210044)
摘要:遙感圖像數(shù)據(jù)中云和云陰影的存在是影響數(shù)據(jù)應(yīng)用的主要原因,專家已經(jīng)研發(fā)了多種去除云及其陰影的方法。在對不同目標(biāo)像元光譜曲線分析的基礎(chǔ)上,研究了基于隨機森林(random forests,RF)分類器的云-云陰影-水體掩模建立方法。由于云陰影是陰影與地表物體的疊加,其光譜曲線與水體的光譜曲線之間存在細(xì)微的差別,這使得決策樹(decision tree,DT)分類方法不能非常有效地應(yīng)對這種細(xì)微差別。RF分類器是建立在多個DT分類結(jié)果集成的基礎(chǔ)上,其算法原理保證了該算法的穩(wěn)健性和有效性。研究結(jié)果表明: 在樣本容量較少時,RF算法比DT具有更好的分類效果; 而在樣本容量增大到250~400個像元時,2種方法的分類效果沒有明顯區(qū)別。這表明RF算法可以成功地用于建立云-云陰影-水體掩模,這將在遙感數(shù)據(jù)處理中得到更加廣泛的應(yīng)用。
關(guān)鍵詞:掩模; 遙感; 云-云陰影; 決策樹(DT)分類器; 隨機森林(RF)分類器
0引言
遙感圖像數(shù)據(jù)在地表覆被變化、森林?jǐn)_動及環(huán)境監(jiān)測等研究中起著至關(guān)重要的作用。現(xiàn)有的多種衛(wèi)星數(shù)據(jù),如MODIS數(shù)據(jù)、TM/ETM+數(shù)據(jù)以及SPOT5衛(wèi)星數(shù)據(jù)等,為揭示人類生存環(huán)境與氣候變化之間的關(guān)系提供了可能。但是,由于衛(wèi)星數(shù)據(jù)在獲取過程中不可避免地會受到大氣和云的干擾,許多衛(wèi)星影像數(shù)據(jù)中存在部分云覆蓋及云陰影現(xiàn)象,這為準(zhǔn)確提取地表信息帶來困難,直接影響了遙感數(shù)據(jù)的實際應(yīng)用。
針對衛(wèi)星遙感圖像數(shù)據(jù)中存在云覆蓋及其陰影的現(xiàn)象,國內(nèi)外學(xué)者都進(jìn)行了相關(guān)研究,并提供了部分解決方法。例如Catalin[1]介紹了在其設(shè)計的軟件中構(gòu)造云-陰影掩模的一種方法,其原理是把多光譜圖像利用參數(shù)向量轉(zhuǎn)換為灰度圖像,通過對比灰度值與給定的閾值將云及其陰影的掩模構(gòu)建出來。事實上,由于云對太陽光線具有較強的反射率,其在多個波段圖像上都表現(xiàn)為白色,明顯區(qū)別于其他地物,因此云的掩??梢酝ㄟ^分析云的反射率和其他地物的反射率來建立。但是,構(gòu)造云陰影的掩模就比較困難,主要因為云陰影受到云厚度、地表覆蓋物和太陽入射角等多種因素的影響,其在遙感圖像中表現(xiàn)為云陰影與其他地表物體重疊的陰影區(qū)。蘇惠敏等[2]提出利用主成分變換對云和陰影分別去除的方法,取得了較好的目視效果; 李炳燮等[3]提出利用多期TM圖像數(shù)據(jù)對厚云及其陰影去除的方法,首先通過分類識別出被厚云及其陰影覆蓋的像元,然后利用其他時相的、同一位置的、未被云和陰影覆蓋的像元進(jìn)行替換; 鄭文武等[4]提出基于動態(tài)端元選擇的線性光譜分解算法,通過選擇云、綠色植被、云陰影和不透水表面4種端元達(dá)到去除TM圖像數(shù)據(jù)中的云和陰影的目的; 梁棟等[5]則利用支持向量機檢測遙感圖像中的云,并結(jié)合太陽入射角判定云陰影區(qū)域,在完成云及云陰影的初步去除后,對未能去除的云及云陰影通過補償?shù)姆椒ㄟM(jìn)行修復(fù)。
相關(guān)研究和所提出的算法在一定程度上實現(xiàn)了遙感圖像中云和云陰影的檢測與去除,在目視效果上有了改善[6-9]; 但對于遙感圖像數(shù)據(jù)在地球環(huán)境變化監(jiān)測方面,更重要的是要看去除云和陰影后的數(shù)據(jù)是否可以繼續(xù)使用(例如能否提供一致的歸一化植被指數(shù)、能否用來反應(yīng)森林?jǐn)_動現(xiàn)象)。因此,建立云和陰影的掩模,以便在后續(xù)的遙感數(shù)據(jù)應(yīng)用中把云和陰影去除,也是非常關(guān)鍵的。本文針對TM/ETM+圖像中存在的云-云陰影-水體,進(jìn)行掩模構(gòu)建分析。在相關(guān)的研究過程中發(fā)現(xiàn),當(dāng)遙感數(shù)據(jù)中存在少量的云或覆蓋面積不大的云團(tuán)時,這樣的數(shù)據(jù)還是可以用于進(jìn)一步信息提取的(如植被指數(shù)提取、地表溫度分析及城市不透水層分析等); 但是,當(dāng)遙感數(shù)據(jù)中包含有大量的云團(tuán)覆蓋時,這樣的數(shù)據(jù)基本上是不能使用的。本文研究的方法只針對前一種情況。
1數(shù)據(jù)與方法
1.1遙感數(shù)據(jù)
Landsat TM/ETM+遙感圖像數(shù)據(jù)在城市熱環(huán)境、植被物候變化及森林?jǐn)_動等方面研究中得到了廣泛應(yīng)用,Landsat8衛(wèi)星數(shù)據(jù)的成功獲取也為Landsat系列衛(wèi)星數(shù)據(jù)的其他應(yīng)用帶來了機會。由于大氣和云的影響,Landsat圖像數(shù)據(jù)應(yīng)用不可避免地會受到云及其陰影的干擾。如圖1所示,該圖像中部分區(qū)域含有云及其陰影,但其他未被云覆蓋的區(qū)域仍有較好的目視效果,在對云、陰影和水體進(jìn)行掩模處理后,可用于其他相關(guān)研究。為此,本文以圖1所示的Landsat TM多光譜圖像作為研究數(shù)據(jù),進(jìn)行云-云陰影-水體的掩模建立研究。該衛(wèi)星圖像的時相為2010年8月19日,軌道號/行號為120/38,中心位置地理坐標(biāo)為E119°7′56″,N31°51′7″,波段組合為TM5(R)TM4(G)TM3(B)。
圖1 Landsat TM5(R)TM4(G)TM3(B)
1.2云-云陰影-水體光譜分析
利用ENVI(Version4.7)軟件,提取了云、云陰影、水體以及其他地表物體的光譜曲線(圖2)。
(a) 云 (b) 云陰影 (c) 水體 (d) 其他地物
圖2云、云陰影、水體和其他地物光譜曲線
Fig.2Spectral curves of cloud, cloud shadow, water and other surface features
從圖2可以看出,在可見光波段中云的光譜曲線明顯區(qū)別于云陰影、水體和其他地物的光譜曲線,因此云很容易被區(qū)分出來; 但也有些云(如薄卷云),可能因其光譜特征不明顯而難以區(qū)分。水體和云陰影的光譜曲線極為相似,只是在近紅外波段上云陰影的DN值略大于水體的DN值。這是因為近紅外波段對綠色植被具有最大的反射峰值,能夠用來探測健康綠色植被和區(qū)分水陸邊界; 而水體對近紅外波段的吸收作用致使水體在該波段上DN值較??; 這使得近紅外波段成為區(qū)分水體和云陰影的關(guān)鍵波段。其他地物類型,如植被、裸露土壤及不透水層等的光譜曲線分布比較雜亂,各有特點,但都與水體和云的光譜曲線有較大差別。云、云陰影、水體和其他地物的光譜曲線在熱紅外波段(TM6)均不具可分性(光譜曲線匯集于一點),幾乎沒有區(qū)別。
將云、云陰影、水體和其他地物等4種地物類型各取500個樣本,分別制作出各類地物在6個波段上的盒形圖,如圖3所示。
(a) TM1波段(b) TM2波段(c) TM3波段
圖3-1云、云陰影、水體和其他地物光譜盒形圖
Fig.3-1Boxplots of spectrum of cloud, cloud shadow, water and other surface features
(d) TM4波段(e) TM5波段 (f) TM7波段
圖3-2云、云陰影、水體和其他地物光譜盒形圖
Fig.3-2Boxplots of spectrum of cloud, cloud shadow, water and other surface features
云在TM1―4波段上與其他3種類型地物都有著明顯的可分性; 其他地物類型與水體和云陰影在TM5和TM7波段上具有一定的可分性,但與云陰影存在一定的重疊; 這是由于云陰影的光譜特征是陰影與地表覆蓋物光譜特征的混合,因而導(dǎo)致云陰影與其他地物的光譜曲線沒有非常明顯的區(qū)別。云陰影和水體可以通過近紅外波段來區(qū)分。
1.3隨機森林算法
1.3.1決策樹分類器
決策樹(decision tree,DT)分類器是一種基于空間數(shù)據(jù)挖掘和知識發(fā)現(xiàn)的監(jiān)督分類方法[10],它不需要像最大似然分類器那樣對數(shù)據(jù)進(jìn)行正態(tài)分布的假設(shè),因而該方法被廣泛應(yīng)用于空間數(shù)據(jù)分類和文本數(shù)據(jù)分類等方面。隨著遙感技術(shù)的發(fā)展,DT分類方法也經(jīng)常被應(yīng)用于遙感數(shù)據(jù)的土地利用分類和信息提取研究中[11-16]。
根據(jù)圖3所示的盒形圖,在ENVI軟件中構(gòu)造了圖4所示的DT,并對DT進(jìn)行了修剪; 利用TM2,TM4和TM7波段的數(shù)據(jù)來構(gòu)造DT,其中各個節(jié)點處的閾值是通過樣本盒形圖分析得出的。
圖4 DT分類器
在數(shù)值實驗中發(fā)現(xiàn),有部分顏色較深的綠色植被被誤分為云陰影; 同時,也有部分深度較淺的水體被誤分為云陰影。出現(xiàn)這種情況的原因是因為云陰影與水體及其他地物類型在某些波段上的區(qū)分度不是太大,而人為選擇的閾值可能不盡合理而影響了對這幾種地物類型的區(qū)分。為了避免這種人為選取閾值帶來的誤差,本文選用隨機森林(random forests,RF)分類方法來建立云-云陰影-水體的掩模。
1.3.2RF分類器
RF是近幾年來出現(xiàn)的一種集成學(xué)習(xí)算法[17],所謂的集成是指把多個模型或多種不同類型模型所得到的結(jié)果通過一定的規(guī)則組合起來。RF的名稱來自于DT分類器,當(dāng)把很多棵DT放在一起時就構(gòu)成了一個森林,對多棵DT的分類結(jié)果的集成通常優(yōu)于單棵DT的分類結(jié)果。RF方法在人臉識別、指紋識別、紋理識別及分類中取得了較好的應(yīng)用效果[18-21]。
設(shè)h(x,θ)為一棵DT,其中θ表示DT中的參數(shù)向量。一個RF是由N棵隨機產(chǎn)生的DT構(gòu)成的。設(shè)隨機產(chǎn)生的N個隨機向量為θ1,θ2,…,θN,這些隨機向量是獨立同分布的,則由隨機向量θi構(gòu)造的DT為h(x,θi),RF為這些DT的集合{h(x,θi)}。每棵DT是一個分類器,其中的每個節(jié)點都是一個弱分類器。RF的決策結(jié)果是所有DT分類結(jié)果的集成。最常用的集成方法是張量投票方法,即RF選擇投票數(shù)最多的分類結(jié)果作為最終結(jié)果。圖5為RF分類器的示意圖。
圖5 RF分類器
RF的算法設(shè)計使得DT的選取是隨機的,樣本的選擇也是隨機的。對每棵DT的分類結(jié)果采取投票規(guī)則進(jìn)行集成,可以保證集成結(jié)果的客觀性和穩(wěn)健性。同時,在RF方法中不需要人為設(shè)置每個節(jié)點的閾值,完全由算法自動實現(xiàn)對每支樹枝的生長和剪枝過程,從而最大限度地避免了人為因素對最終結(jié)果的影響。
RF的生長過程為[18-21]:
1)從原始訓(xùn)練數(shù)據(jù)集中,應(yīng)用Bootstrap方法隨機抽取M個樣本集,并由此構(gòu)建M個DT;
2)對每棵DT隨機選取若干個樣本特征,計算特征中蘊含的信息量,并以此為準(zhǔn)則判斷每個節(jié)點是否進(jìn)行分裂;
3)讓每棵DT最大限度地生長,不做任何裁剪;
4)將生成的M棵DT組成RF,對M棵DT的結(jié)果進(jìn)行集成。
事實上,RF分類器和DT分類器都利用了各個類別的光譜特征信息; 但是它們內(nèi)部機制的不同決定了RF算法明顯優(yōu)于DT方法。
2結(jié)果與分析
以遙感圖像的DN值為輸入數(shù)據(jù),分別應(yīng)用RF和DT算法進(jìn)行了云-云陰影-水體掩模的提取。云、云陰影、水體和其他地物等4類樣本的總數(shù)量為681個像元。
首先,從681個像元中隨機選取300個像元作為訓(xùn)練樣本,其余381個像元作為檢驗樣本。在對RF和DT這2種分類器進(jìn)行訓(xùn)練后,分別對檢驗樣本進(jìn)行分類。分類結(jié)果的混淆矩陣見表1和表2。
表1 RF分類結(jié)果混淆矩陣
表2 DT分類結(jié)果混淆矩陣
從表1和表2可以看出,RF分類的總體精度略高于DT分類的總體精度,二者的Kappa系數(shù)差別不大。由于云和水體都具有明顯區(qū)別于其他地物及云陰影的光譜特征,這使得DT分類器和RF分類器都能比較容易地把云和水體區(qū)分出來。但對于云陰影,有2個像元被RF分類器誤判為其他地物,有4個像元被DT分類器誤判為其他地物,這一細(xì)微差別顯示了2種算法在處理光譜特征極為相似的不同地物類型時效果也有所差別。
其次,為了進(jìn)一步分析2種算法對不同大小訓(xùn)練樣本分類性能差別,分別建立了樣本容量為50,100,150,200,250,300,350和400像元的訓(xùn)練樣本集合,剩余的樣本作為檢驗樣本。以總體分類精度和Kappa系數(shù)作為評價指標(biāo),對DT和RF這2種算法的分類結(jié)果進(jìn)行了對比。不同容量下的樣本集合都是利用隨機生成的隨機數(shù)從樣本總體中隨機選取的,分類結(jié)果見表3。
表3 不同大小樣本分類精度比較
從表3可以看出,在處理較小的訓(xùn)練樣本時,RF算法給出了精度更高的分類結(jié)果。2種算法在面對不同樣本容量時具有比較明顯的區(qū)別: 當(dāng)訓(xùn)練樣本容量少于100個像元時,RF算法的總體精度和Kappa系數(shù)均明顯高于DT算法的總體精度和Kappa系數(shù); 當(dāng)樣本容量小于200個像元時,DT算法的分類精度接近于RF算法的分類精度; 當(dāng)樣本容量大于200個像元時,2種算法的分類精度幾乎沒有差別。
在訓(xùn)練樣本容量為300時,對2種算法進(jìn)行訓(xùn)練后應(yīng)用于整景圖像,得到云-云陰影-水體掩模(圖6)。
(a)RF分類器 (b)DT分類器
圖6由2種分類器得到的云-云陰影-水體掩模
Fig.6Cloud-shadow-watermaskderivedfromtwokindsofclassifiers
對比圖6和圖1可以看出,2種算法均可將云和云陰影分離出來,范圍較大的水體也能被區(qū)分出,總體上有3個特點: ①2種算法把部分水體的邊緣誤分為云陰影,這是由于水體邊緣部分是含有水草且顏色較淺的水體,其光譜特征與云陰影的光譜特征極為相似的緣故; ②在圖6(b)的左側(cè)和下側(cè),DT分類器把部分其他地物誤分為云; 與圖1對比可以看出,RF算法將其正確地分類為其他地物; ③DT分類結(jié)果中被分類為云陰影的像元分布比較密集,這表明該方法把一部分非云陰影像元誤分為云陰影; 而這種現(xiàn)象在RF分類結(jié)果中相對較少。這表明了單一的DT及決策規(guī)則在處理光譜特征極為相似的像元時面臨困難; 而在RF分類器所得到的分類結(jié)果中,上述誤分現(xiàn)象得到了明顯改善。
從上述分析可以看出,訓(xùn)練樣本的選擇對算法的精度評價和掩模的提取有著重要影響。這種影響是由人為主觀因素造成的,如對類別數(shù)的判斷、不同類別典型光譜的提取、地物特征的增減等。但在同樣容量的訓(xùn)練樣本情況下,2種算法還是具有較明顯區(qū)別的,RF算法要優(yōu)于DT算法,這種優(yōu)越性正是RF算法在理論上比DT算法先進(jìn)的表現(xiàn)。RF是多棵DT的綜合,是在訓(xùn)練樣本隨機抽取和DT隨機訓(xùn)練的基礎(chǔ)上對分類結(jié)果的綜合,這種理論和機制決定了RF方法的優(yōu)越性。
3結(jié)論
1)遙感影像中云及云陰影的存在為數(shù)據(jù)的應(yīng)用帶來了較多的問題。如何更加有效地建立云及云陰影掩模,以便在遙感數(shù)據(jù)應(yīng)用時把無用的像元排除在外是需要解決的一個重要問題。由于水體與云陰影具有極為相似的光譜曲線,利用DT分類器不能較好地區(qū)分云陰影與水體,故本文研究了利用RF算法構(gòu)建云-云陰影-水體掩模。RF分類器是多個DT分類器結(jié)果的集成,可以較好地避免單一DT分類器帶來的誤分類現(xiàn)象。
2)相對于DT分類器,RF分類器能夠更加有效地把云-云陰影-水體區(qū)分出來,建立相應(yīng)的掩模。但是,由于淺水體與云陰影具有相似的光譜特征,部分深度不大的水體容易被誤分為云陰影,這會給進(jìn)一步應(yīng)用帶來一定問題,是今后需要深入研究的內(nèi)容之一。
3)RF算法作為一種特征提取和分類方法已經(jīng)在多個研究領(lǐng)域中得到成功應(yīng)用。本文將RF算法用來建立云-云陰影-水體掩模,所得結(jié)果優(yōu)于DT方法,但仍存在一些值得探討的問題: ①RF算法的魯棒性,RF算法針對不同類型的云及其陰影建立掩模,其適用性和穩(wěn)定性需要繼續(xù)研究; ②將遙感圖像的DN值經(jīng)定標(biāo)及大氣輻射校正后轉(zhuǎn)換為反射率數(shù)據(jù)進(jìn)行分析,其結(jié)果是否會優(yōu)于本文結(jié)果; ③本文算法是否可以推廣到TM影像之外的其他類型遙感數(shù)據(jù)的掩模構(gòu)建中。這些問題都有待今后進(jìn)一步深入研究。
參考文獻(xiàn)(References):
[1]Catalin-DumitrescuC.Asimplemethodofdeterminingcloud-masksandcloud-shadow-masksfromsatelliteimagery[J].IEEEGeoscienceandRemoteSensingLetters,2014,11(1):10-13.
[2]蘇惠敏,薛亮.TM影像解譯中去除云層及其陰影方法研究[J].西北大學(xué)學(xué)報:自然科學(xué)版,2005,35(6):807-810.
SuHM,XueL.AstudyonthetechnologyofremovingcloudsandtheirshadowsduringTMimageinterpretation[J].JournalofNorthwestUniversity:NaturalScienceEdition,2005,35(6):807-810.
[3]李炳燮,馬張寶,齊清文,等.LandsatTM遙感影像中厚云和陰影去除[J].遙感學(xué)報,2010,14(3):534-545.
RiP,MaZB,QiQW,etal.CloudandshadowremovalfromLandsatTMdata[J].JournalofRemoteSensing,2010,14(3):534-545.
[4]鄭文武,鄧運員.基于LSMA的TM影像云和陰影的檢測與去除方法[J].測繪科學(xué),2010,35(3):62-65.
ZhengWW,DengYY.DetectingandremovingcloudandshadeonTMimagerybasedonLSMA[J].ScienceofSurveyingandMapping,2010,35(3):62-65.
[5]梁棟,孔頡,胡根生,等.基于支持向量機的遙感影像厚云及云陰影去除[J].測繪學(xué)報,2012,41(2):225-231,238.
LiangD,KongJ,HuGS,etal.Theremovalofthickcloudandcloudshadowofremotesensingimagebasedonsupportvectormachine[J].ActaGeodaeticaetCartographicaSinica,2012,41(2):225-231,238.
[6]GabardaS,CristóbalG.Cloudcoveringdenoisingthroughimagefusion[J].ImageandVisionComputing,2007,25(5):523-530.
[7]MaaloufA,CarrèP,AugereauB,etal.Abandelet-basedinpaintingtechniqueforcloudsremovalfromremotelysensedimages[J].IEEETransactionsonGeoscienceandRemoteSensing,2009,47(7):2363-2371.
[8]DybbroeA,KarlssonKG,ThossA.AVHRRclouddetectionandanalysisusingdynamicthresholdsandradiativetransfermodeling.PartI:Algorithmdescription[J].JournalofAppliedMeteorology,2005,44(1):39-54.
[9]DybbroeA,KarlssonKG,ThossA.AVHRRclouddetectionandanalysisusingdynamicthresholdsandradiativetransfermodeling.PartII:Tuningandvalidation[J].JournalofAppliedMeteorology,2005,44(1):55-71.
[10]申文明,王文杰,羅海江,等.基于決策樹分類技術(shù)的遙感影像分類方法研究[J].遙感技術(shù)與應(yīng)用,2007,22(3):333-338.
ShenWM,WangWJ,LuoHJ,etal.Classificationmethodsofremotesensingimagebasedondecisiontreetechnologies[J].RemoteSensingTechnologyandApplication,2007,22(3):333-338.
[11]李彤,吳驊.采用決策樹分類技術(shù)對北京市土地覆蓋現(xiàn)狀進(jìn)行研究[J].遙感技術(shù)與應(yīng)用,2004,19(6):485-487.
LiT,WuH.ApplicationofdecisiontreeclassificationtoPekinglandcover[J].RemoteSensingTechnologyandApplication,2004,19(6):485-487.
[12]齊紅超,祁元,徐瑱.基于C5.0決策樹算法的西北干旱區(qū)土地覆蓋分類研究——以甘肅省武威市為例[J].遙感技術(shù)與應(yīng)用,2009,24(5):648-653.
QiHC,QiY,XuZ.Thestudyofthenorthwestaridzoneland-coverclassificationbasedonC5.0decisiontreealgorithmatWuweiCity,GansuProvince[J].RemoteSensingTechnologyandApplication,2009,24(5):648-653.
[13]董金發(fā),劉慶生,劉高煥,等.基于決策樹分層分類法的粉煤灰堆場信息提取研究[J].遙感技術(shù)與應(yīng)用,2013,28(4):576-581.
DongJF,LiuQS,LiuGH,etal.Researchonusingthedecisiontreehierarchicalclassificationmethodtoextractflyashinformation[J].RemoteSensingTechnologyandApplication,2013,28(4):576-581.
[14]陳靜波,劉順喜,汪承義,等.基于知識決策樹的城市水體提取方法研究[J].遙感信息,2013,28(1):29-33,37.
ChenJB,LiuSX,WangCY,etal.Researchonurbanwaterbodyextractionusingknowledge-baseddecisiontree[J].RemoteSensingInformation,2013,28(1):29-33,37.
[15]謝麗軍,張友靜,張子衡,等.結(jié)合KPCA和多尺度紋理的IKONOS遙感影像決策樹分類[J].遙感信息,2010(3):88-93.
XieLJ,ZhangYJ,ZhangZH,etal.ThedecisiontreeclassificationbasedonKPCAandmulti-scaletextureusingIKONOSremotesensingimage[J].RemoteSensingInformation,2010(3):88-93.
[16]張曉娟,楊英健,蓋利亞,等.基于CART決策樹與最大似然比法的植被分類方法研究[J].遙感信息,2010,25(2):88-92.
ZhangXJ,YangYJ,GaiLY,etal.Researchonvegetationclassificationmethodbasedoncombineddecisiontreealgorithmandmaximumlikelihoodratio[J].RemoteSensingInformation,2010,25(2):88-92.
[17]BreimanL.Randomforests[J].MachineLearning,2001,45(1):5-32.
[18]KhaliliaM,ChakrabortyS,PopescuM.Predictingdiseaserisksfromhighlyimbalanceddatausingrandomforest[J].BMCMedicalInformaticsandDecisionMaking,2011,11:51.
[19]VerikasA,GelzinisA,BacauskieneM.Miningdatawithrandomforests:Asurveyandresultsofnewtests[J].PatternRecognition,2011,44(2):330-349.
[20]姚登舉,楊靜,詹曉娟.基于隨機森林的特征選擇算法[J].吉林大學(xué)學(xué)報:工學(xué)版,2014,44(1):137-141.
YaoDJ,YangJ,ZhanXJ.Featureselectionalgorithmbasedonrandomforest[J].JournalofJilinUniversity:EngineeringandTechnologyEdition,2014,44(1):137-141.
[21]范士俊.基于隨機森林的全波形點云數(shù)據(jù)分類研究[J].首都師范大學(xué)學(xué)報:自然科學(xué)版,2013,34(5):71-73,78.
FanSJ.ResearchonclassificationforairbornefullwaveformLiDARdatabasedonrandomforest[J].JournalofCapitalNormalUniversity:NaturalScienceEdition,2013,34(5):71-73,78.
(責(zé)任編輯: 邢宇)
Construction of cloud-shadow-water mask based on Random Forests algorithm
LU Fengling1,2, GONG Zaiwu2
(1. School of Geography and Remote Sensing, Nanjing University of Information Science and Technology, Nanjing 210044, China;2. School of Economics and Management, Nanjing University of Information Science and Technology, Nanjing 210044, China)
Abstract:Cloudsandtheirshadowsintheremotesensingimagesarethekeyfactorsthatinfluencetheapplicationofthedatainmanyfields.Severalmethods,suchasconstructingcloudmask,replacementofthepixels,linearmixturespectralanalysis,andprincipalcomponentanalysis,havebeenproposedinthepastdecadestosolvethisproblem.Inthisresearch,basedontheanalysisofspectralcurve,theauthorsutilizedDecisionTree(DT)classifierandRandomForest(RF)classifiertoobtainthecloud-shadow-watermask.Therewaslittledifferencebetweenthespectralcurveofshadowandwaterduetothemixtureofshadowandothersurfacematerialssuchasvegetationandimpervioussurface.Inthiscase,theDTclassifiercouldnoteffectivelydistinguishshadowandwaterbecausethedecisionruleandthresholdweredeterminedbyanalyzingthespectralcurvesofdifferentsamples.RFclassifierwasbasedontheensembleoftheresultsderivedfrommultipledecisiontreeclassifiers,whichwasmorerobustthanonedecisiontreeclassifier.Inthisstudy,whentherewereonlyafewtrainingsamples,resultsthatweremoreaccuratewerederivedfromRFclassifiercomparedwiththeresultsfromDTclassifier.Whenthesizeoftrainingsampleslayintherangeof250and400,nosignificantdifferencewasfoundbetweentheresultsderivedfromthesetwoalgorithms.ThisindicatesthatRFclassifiercouldbeusedtodeducethecloud-cloudshadow-watermasksuccessfully.
Keywords:mask;remotesensing;cloud-cloudshadow;decisiontree(DT)classifier;randomforests(RF)classifier
doi:10.6046/gtzyyg.2016.03.12
收稿日期:2015-03-10;
修訂日期:2015-04-20
中圖法分類號:TP 751.1
文獻(xiàn)標(biāo)志碼:A
文章編號:1001-070X(2016)03-0073-07
第一作者簡介:鹿豐玲(1973-),女,碩士,講師,主要從事公共氣象與氣象變化研究。Email:lfling63112@163.com。
引用格式: 鹿豐玲,鞏在武.基于隨機森林算法構(gòu)建云-云陰影-水體掩模[J].國土資源遙感,2016,28(3):73-79.(Lu F L,Gong Z W.Construction of cloud-shadow-water mask based on Random Forests algorithm[J].Remote Sensing for Land and Resources,2016,28(3):73-79.)