亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        利用CVGS-XGBoost遙感識別水體與山體陰影信息

        2020-03-09 06:54:34王修信
        桂林理工大學(xué)學(xué)報 2020年4期
        關(guān)鍵詞:山體柵格決策樹

        秦 琴, 王修信

        (1.廣西師范大學(xué) a.計算機科學(xué)與信息工程學(xué)院; b.廣西多源信息挖掘與安全重點實驗室, 廣西 桂林 541004;2.廣西區(qū)域多源信息集成與智能處理協(xié)同創(chuàng)新中心, 廣西 桂林 541004)

        0 引 言

        隨著科學(xué)技術(shù)的不斷進步, 人類生產(chǎn)活動對區(qū)域水體的影響愈發(fā)受到重視[1]。遙感技術(shù)能夠準確掌握水資源的實時情況, 對水資源的合理利用和規(guī)劃起到重要作用[2]?;贚andsat遙感影像提取水體信息的研究方法很多[3], 常見的有各種水體指數(shù)法[4-8]和監(jiān)督分類法[9-10]。這些方法都是基于水的光譜在不同波段的反射特性, 只有當水體和其他地面物體的光譜特性完全不同時, 才能獲得更好的提取效果。 然而, 在水體提取過程中, 由于區(qū)域陽光的照射, 往往會出現(xiàn)嚴重的物體遮擋和山體陰影的干擾。

        近年來, 面向?qū)ο蠹夹g(shù)已被應(yīng)用于提取水體信息[11-12], 通過圖像分割技術(shù)獲得水體的基元信息[13], 再利用基元的數(shù)據(jù)特征實現(xiàn)遙感圖像的信息提取。雖然它在一定程度上提高了遙感信息提取的準確性, 但是因其僅依賴于圖像的光譜特性, 在提取小河、 建筑陰影和茂密植被方面的性能受到限制。因此, 有學(xué)者將機器學(xué)習(xí)方法應(yīng)用于遙感圖像的分類。王知音等[14]提出了一種基于SAE的水體提取算法, 該算法可以自動探索遙感數(shù)據(jù)中包含的空間規(guī)則, 并且無需進行復(fù)雜的光譜特征分析與特征提取過程,雖然該方法大大縮短了預(yù)處理的復(fù)雜性, 提高了水提取的自動化程度, 但利用SAE算法提取水體仍然很費時, 需要提高效率。由于單一特征提取水體可能會導(dǎo)致對象混淆, 程晨等[15]構(gòu)建了圖像纓帽變換和波段組合特征的決策樹水體提取算法, 該算法在每個纓帽變換分量及波段組合過程中需要手動確定閾值, 因此遷移性較差, 提取結(jié)果受到較大的主觀影響。呂啟等[16]提出一種基于DBN算法的遙感圖像分類方法, 該方法充分結(jié)合了無監(jiān)督和有監(jiān)督學(xué)習(xí)的特點, 對高維數(shù)據(jù)具有較好的分類能力。由于算法無法直接提取高維數(shù)據(jù)的圖像特征, 因此建立算法的網(wǎng)絡(luò)結(jié)構(gòu)需要很長時間。卷積神經(jīng)網(wǎng)絡(luò)是一種深度學(xué)習(xí)神經(jīng)網(wǎng)絡(luò), 可以直接從輸入圖像中學(xué)習(xí)圖像的高級語義特征, 避免圖像的預(yù)處理。Scott等提出通過結(jié)合深度學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)的遷移學(xué)習(xí)和數(shù)據(jù)增強方法對遙感影像進行分類, 可以很好地克服遙感影像中樣本數(shù)量有限的問題[17]。它將圖像的眾多圖片作為算法的輸入, 但基于圖片像素級的分類, 存在樣本形式與網(wǎng)絡(luò)輸入輸出要求不匹配等問題, 導(dǎo)致算法無法直接應(yīng)用于基于圖片像素級的地物提取。

        桂林主要以喀斯特地貌為主, 地形往往山高崎嶇。在陽光照射下, 獲取到的遙感圖像會出現(xiàn)大量的山體陰影, 而山體陰影與水體在高分辨率遙感圖像中光譜往往相似, 因此會產(chǎn)生“異物同譜”現(xiàn)象, 給喀斯特地貌中的水體提取帶來一定的誤差, 容易造成水體的“誤識別”和“漏識別”, 很難保證喀斯特地貌水體提取的精度。因此, 選取最佳方法將水體與山體陰影分類是研究該地區(qū)水體空間分布的前提。

        XGBoost(eXtreme Gradient Boosting)是由Chen等設(shè)計開發(fā)的Boosting庫, 是一種基于決策樹的機器學(xué)習(xí)集成算法, 具有運行速度快、 分類效果好、 支持自定義損失函數(shù)和支持多種語言等特點[18]。然而, XGBoost算法存在逐個調(diào)參收斂速度慢和參數(shù)之間相互限制的問題。本文針對喀斯特地區(qū)遙感圖像中水體和山體陰影信息易混淆使得傳統(tǒng)機器學(xué)習(xí)算法分類精度低、 計算速度慢的缺點改進XGBoost算法,將交叉驗證與柵格搜索相結(jié)合用于XGBoost中,構(gòu)建CVGS-XGBoost分類算法, 以參數(shù)平均誤差最小化為最終目標, 提高參數(shù)優(yōu)選的準確性, 有效避免訓(xùn)練樣本的隨機抽樣對算法性能的影響。

        1 XGBoost算法原理介紹

        提升算法的主要思想是在判斷復(fù)雜的任務(wù)時, 多位專家的判斷結(jié)果要優(yōu)于一位專家的判斷結(jié)果。提升算法是加法算法和前向分布算法的結(jié)合, 由于決策樹的線性組合能夠非常好地擬合訓(xùn)練數(shù)據(jù), 因此決策提升樹是一個高性能的學(xué)習(xí)算法。在處理圖像分類問題時, 決策樹選擇二叉分類樹作為基分類器, 提升樹算法就表示由多個二叉分類決策樹組合而成的算法。給定一組數(shù)據(jù)樣本, 對訓(xùn)練樣本集進行劃分, 在算法訓(xùn)練過程中, 訓(xùn)練樣本的權(quán)重會不斷更新。每一輪訓(xùn)練結(jié)束后, 正確分類的訓(xùn)練樣本的權(quán)值減小, 錯誤分類的訓(xùn)練樣本的權(quán)值增大。經(jīng)過多次訓(xùn)練后, 錯誤分類的訓(xùn)練樣本會得到更多的關(guān)注, 而被正確分類的訓(xùn)練樣本的權(quán)重逐漸趨近于零。最后, 可以獲得多個簡單的分類器, 通過組合這些簡單的分類器, 可以獲得一個強大的分類器算法。

        XGBoost又稱極限梯度提升算法, 它是一種基于提升樹的機器學(xué)習(xí)集成算法, 用于研究梯度提升決策樹算法。XGBoost算法包含一組迭代殘差樹, 每一棵樹的最終預(yù)測值是學(xué)習(xí)前N-1棵樹的殘差后, 每棵樹預(yù)測的新樣本輸出值的總和。具體推導(dǎo)過程為: 設(shè)D={(xi,yi)}(i=1,2,…,n,xi∈Rd,yi∈R)是一個擁有n個訓(xùn)練樣本、 每個樣本有d個數(shù)據(jù)樣本特征,xi表示第i個樣本, 通過K個樹的加法函數(shù)來預(yù)測的最終結(jié)果。構(gòu)成樹的集成算法如下

        (1)

        其中,F表示決策樹的函數(shù)空間, 為了學(xué)習(xí)算法中的函數(shù)集, 將正則化目標函數(shù)定義為

        (2)

        (3)

        (4)

        用Ot表示第t棵樹的預(yù)測值和前t-1棵樹預(yù)測值之和,即樣本xi的最終預(yù)測值。求式(4)一階導(dǎo)數(shù)和二階導(dǎo)數(shù), 分別定義為gi和hi

        (5)

        (6)

        (7)

        常數(shù)項移除后, 第t次迭代后損失函數(shù)為

        (8)

        定義Ij={i|q(xi)=j}作為葉子節(jié)點j的實例集, 根據(jù)式(8)得

        (9)

        (10)

        (11)

        以上計算了樹結(jié)構(gòu)q的分數(shù), 用來衡量樹結(jié)構(gòu)的質(zhì)量, 使用了貪心算法迭代每個葉子節(jié)點以添加分支。 假定IL和IR劃分后是左右樹葉子節(jié)點的集合, 即I=IL∪IR,則劃分后的損失函數(shù)為

        (12)

        2 CVGS-XGBoost算法

        2.1 交叉驗證

        現(xiàn)實應(yīng)用中, 實驗數(shù)據(jù)集的獲取往往不足, 若單純地使用驗證法選擇算法, 則存在如何合理地將實驗數(shù)據(jù)集按比例分割成訓(xùn)練集和驗證集的問題。不同的數(shù)據(jù)集分配方式對算法的最終效果有很大影響[19]。若獲取的實驗數(shù)據(jù)集較多, 雖然算法的訓(xùn)練較為充分, 但也會存在算法驗證不足的情況。因此為了充分利用實驗數(shù)據(jù)集, 使得算法的訓(xùn)練和驗證都較為充分, 可采用交叉驗證的方法使算法廣泛適用。交叉驗證的基本思想是對原始數(shù)據(jù)樣本集進行分組, 大部分作為訓(xùn)練集, 其余的小部分用作驗證集。具體地, 先利用大部分訓(xùn)練集對分類算法進行訓(xùn)練, 然后利用剩余的小部分驗證集對訓(xùn)練后的算法進行測試, 以此評價分類器的性能。

        交叉驗證法優(yōu)化XGBoost算法參數(shù)的基本思路:①將實驗數(shù)據(jù)集隨機平均分割成k等份(S1,S2, …,Sk), 依次保留其中一份Si作為驗證集, 剩下的k-1份作為訓(xùn)練集; ②除去驗證集的其他訓(xùn)練集輸入XGBoost算法中進行訓(xùn)練, 然后將驗證集Si輸入當前訓(xùn)練好的算法中, 得到第i次XGBoost算法的評估性能; ③重復(fù)步驟①和步驟②, 進行k次后, 將k次XGBoost算法評估的平均值作為當前參數(shù)下算法的性能值。用數(shù)學(xué)語言描述為:設(shè)有n個樣本量的數(shù)據(jù)集Dn,A1,A2,…,Ak為數(shù)據(jù)集Dn的子集, 對于任意子集Ai都有M(Ai)≈n/k,M為第i個子集中樣本的個數(shù), 最后的泛化誤差估計為

        (13)

        圖1 k折交叉驗證實驗步驟流程

        2.2 柵格搜索

        柵格搜索是一種調(diào)參手段。在算法的所有候選參數(shù)中, 通過循環(huán)遍歷, 采用巖舉的搜索方法,嘗試每一種可能性, 對每個參數(shù)的可能值列出所有可能的組合,并生成列表,然后訓(xùn)練每個列表組合,使算法表現(xiàn)出最好的效果。即在各個參數(shù)數(shù)組中找到使算法達最優(yōu)的參數(shù)值。XGBoost算法有許多與數(shù)據(jù)特征相關(guān)的超參數(shù), 這些超參數(shù)對算法的訓(xùn)練結(jié)果有重要的意義。在XGBoost算法中, max_depth定義樹的最大深度, 用于防止過擬合, 深度越深, 算法就越容易產(chǎn)生局部最優(yōu); min_child_weight確定孩子節(jié)點中最小樣本的權(quán)重和, 權(quán)重和過大可能導(dǎo)致欠擬合; gamma指定了進行分割時所需要的最小損失的減少量, 根據(jù)損失函數(shù)調(diào)整其大小; eta為學(xué)習(xí)率, 通過減少每一步的權(quán)重, 可以提高算法的穩(wěn)定性。以上參數(shù)有的為整數(shù)或小數(shù), 有的為隨機值或連續(xù)值。原始的XGBoost算法在參數(shù)值選取時, 通常采取參數(shù)遍歷和專家經(jīng)驗調(diào)參等方式, 此過程不僅耗時, 而且參數(shù)之間往往存在制約。不合理的算法超參數(shù)會導(dǎo)致XGBoost算法過擬合或欠擬合, 利用柵格搜索可以高效、 準確地優(yōu)化XGBoost算法的超參數(shù)。因此,運用柵格搜索法進行參數(shù)選擇, 對尋求算法最優(yōu)參數(shù)至關(guān)重要。

        柵格搜索法優(yōu)化XGBoost算法參數(shù)的基本思路:①利用柵格搜索法找出用于建模的所有可調(diào)參數(shù)并進行參數(shù)組合; ②依次對所有參數(shù)組合進行XGBoost算法建模; ③以k折交叉驗證法下的建模精度為判斷依據(jù)得出最佳算法和可調(diào)參數(shù)。

        2.3 CVGS-XGBoost算法的搭建

        由于XGBoost算法存在大量的超參數(shù), 尋找最優(yōu)的算法參數(shù)對水體與山體陰影的識別具有重要的作用。XGBoost算法采用柵格搜索尋求最佳參數(shù)組合的方法具有良好的全局搜索能力, 可以避免XGBoost算法對多個參數(shù)逐個調(diào)優(yōu)導(dǎo)致收斂速度慢的缺點, 同時也避免了參數(shù)之間相互制約的影響。交叉驗證避免了單純地使用驗證法選擇最優(yōu)算法的偶然性。將交叉驗證與柵格搜索相結(jié)合應(yīng)用于XGBoost算法中, 以參數(shù)平均誤差最小化為最終目標, 提高了參數(shù)優(yōu)選的準確性, 同時避免了訓(xùn)練樣本的隨機抽樣對算法性能的影響。因此本文提出了一種用于水體與山體陰影識別的CVGS-XGBoost算法, 交叉驗證柵格搜索優(yōu)化XGBoost算法流程見圖2。具體步驟為:

        ①對遙感圖像從水體、 陰影和其他區(qū)域中分別找出能準確代表其典型區(qū)域的1 200個像素點用來訓(xùn)練, 利用同樣的方法在各典型區(qū)域分別找出900個像素點用來測試;

        ②手動選擇的不同樣本在各色彩通道下的R、 G、 B特征分量作為樣本自身特性分量;

        ③將步驟①中找出的1 200個種類樣本像素數(shù)據(jù)輸入到XGBoost算法中進行預(yù)訓(xùn)練, 構(gòu)建XGBoost預(yù)測算法;

        圖2 交叉驗證柵格搜索優(yōu)化XGBoost算法流程

        ④將交叉驗證柵格搜索應(yīng)用于XGBoost算法中, 對參數(shù)進行柵格搜索, 計算交叉驗證均方誤差, 確定最優(yōu)參數(shù)組合;

        ⑤使用步驟④訓(xùn)練好的CVGS-XGBoost算法對未知的900個測試樣本進行預(yù)測, 得出模型的最佳準確率;

        ⑥將CVGS-XGBoost算法應(yīng)用于整個遙感圖像中進行分類, 即將遙感圖像的每一個像素點輸入算法中, 對所有像素做出判斷并賦予數(shù)值標簽;

        ⑦ 對分類后遙感圖像進行可視化操作, 通過像素點的數(shù)值標簽(黑色代表水體、 灰色代表山體陰影、 其他用白色來顯示), 得到最終的分類效果圖。

        3 實驗測試

        3.1 實驗數(shù)據(jù)來源

        采用廣西桂林市的Landsat 8多光譜衛(wèi)星遙感圖像, 該圖描述了桂林市區(qū)中的水體、 橋體、 山體、 城區(qū)建筑等區(qū)域。覆蓋從紅外到可見光不同波長范圍, 有7個波段且空間分辨率為30 m的遙感圖像, 不同的波段有不同的特點。由于Landsat 8衛(wèi)星數(shù)據(jù)可見光波段1~4、 近紅外波段5~6之間的相關(guān)性較高, 存在很多冗余信息, 如果使用波段1~7的全部數(shù)據(jù)不僅將導(dǎo)致計算量較大, 而且將引入較大誤差。通過計算各波段間相關(guān)系數(shù), 選取相關(guān)性不顯著的7、6、3波段合成假彩色圖像, 在減少數(shù)據(jù)計算量的同時, 提高了計算速度。最后, 通過對假彩色圖像進行輻射校正、 幾何校正、 采樣、 增強、 量化、 去噪等處理, 得到對比度強、 圖像清晰的實驗圖像。

        3.2 訓(xùn)練樣本獲取

        訓(xùn)練樣本的選取是影響分類器性能的重要因素之一。實驗過程中必須保證有足夠數(shù)量廣泛分布的訓(xùn)練樣本。根據(jù)遙感圖像的色調(diào)、 形狀、 谷歌地圖等掌握了研究區(qū)域的特征類型, 并手動提取典型區(qū)域的訓(xùn)練樣本, 在實驗圖像上記錄了1 200個圖像像素值作為訓(xùn)練樣本集, 其中, 水體、 山體陰影及其他地物這3類樣本各400個, 同時用同樣的方法分別記錄水體、 山體陰影及其他地物3類樣本像元所對應(yīng)的坐標900個作為測試樣本集, 用來測試遙感圖像分類的效果。選取樣本后, 將水體區(qū)域歸為一類, 山體陰影區(qū)域歸為一類, 建筑物、 道路、 植被等歸為一類, 地物類別標簽標記分別記為“0”、“1”、“2”。由于遙感圖像中包含的信息相對比較復(fù)雜, 所以在選擇訓(xùn)練樣本時, 優(yōu)先選擇具有代表性的區(qū)域。

        3.3 顏色特征提取

        顏色特征是圖像應(yīng)用研究領(lǐng)域中最廣泛的視覺特征。與圖像中的其他特征相比, 顏色特征具有很強的穩(wěn)定性, 它不依賴圖像本身的大小, 不隨方向和視角的改變而改變。在遙感圖像分類中, 顏色特征得到了廣泛的應(yīng)用。本文通過對遙感圖像進行人工標注, 將水體標注成紅色、 山體陰影標注成黃色、 其他既不屬于水體也不屬于山體陰影的部分標注成玫紅色。將標記的特征坐標與原始遙感圖像對應(yīng)映射, 提取原始圖像中標記的所屬特征類別的像素值。將7、6、3三個波段合成假彩色的3個通道的像素分量值存放在特征列表中, 作為輸入到算法中的假彩色特征數(shù)據(jù),再使用XGBoost算法對假彩色特征數(shù)據(jù)進行分類。訓(xùn)練樣本和測試樣本標注結(jié)果圖3。

        4 實驗結(jié)果與分析

        文中提出的CVGS-XGBoost算法與各對比算法均使用python 3.6編程實現(xiàn), 且所有實驗均是在Windows 10, 64位操作系統(tǒng)下測試完成。本實驗所使用的硬件環(huán)境為:CPU:Intel(R)CoreTMi7-6700 CPU@3.40 GHz, 內(nèi)存8 GB。

        4.1 對比算法

        為了能更好地評估CVGS-XGBoost算法在本實驗中的性能, 與3種傳統(tǒng)的機器學(xué)習(xí)分類算法進行對比分析。具體對比算法詳細信息如下:

        (1)決策樹算法是基于將數(shù)據(jù)轉(zhuǎn)化為樹, 尋找最佳節(jié)點和最佳分枝的方法, 衡量“最佳”的標準稱為“不純度”。一般來說, “不純度”值越小, 決策樹對訓(xùn)練集的擬合效果越好。本文利用信息熵來確定樹中各節(jié)點的“不純度”, 并選擇最好的隨機切分作為分裂節(jié)點的策略, 指定隨機數(shù)生成器的種子為25, 通過十折交叉驗證柵格搜索的方法, 得出當樹的最大深度取值為8, 分裂1個內(nèi)部節(jié)點最少樣本數(shù)為8, 每個葉子節(jié)點最少樣本數(shù)為3時, 決策樹算法效果達到最優(yōu), 分類效果最好。

        (2)隨機森林是一種基于決策樹的集成算法, 它利用Bootstrap從原始樣本中抽取多個樣本子集, 利用得到的樣本子集建立決策樹。該方法綜合考慮多個評估器的建模結(jié)果, 平均投票或多數(shù)投票原則用于確定綜合評估師的結(jié)果, 以獲得比單一算法更好的分類性能。本文實驗中采用信息熵方法判斷節(jié)點是否繼續(xù)分裂, 并選擇有放回的采樣。通過學(xué)習(xí)曲線描述的結(jié)果, 得到使算法達到最優(yōu)時樹的數(shù)目為30, 采用十折交叉驗證柵格搜索方法, 確定當樹的最大深度為5, 分裂內(nèi)部節(jié)點需要的最少樣例數(shù)為2, 葉子上的最少樣例數(shù)為1, 隨機生成器種子設(shè)定為25時, 算法達到最優(yōu)。

        圖3 不同樣本集標注效果圖

        (3)支持向量機的基本思想是在數(shù)據(jù)空間中找出一個超平面作為決策邊界, 以便對數(shù)據(jù)算法的分類誤差盡可能小,特別是分類錯誤(泛化誤差)未知的數(shù)據(jù)集盡可能小。支持向量機通過找出邊際最大的決策邊界, 對數(shù)據(jù)進行分類,其決策函數(shù)公式為

        (14)

        其中:αi為拉格朗日乘子;yi為超平面上的樣本點;b表示偏移量;φ(xi)和φ(xtest)分別表示第i個特征向量和測試樣本從輸出空間到特征空間的映射。 在本文實驗中,選取徑向基核函數(shù)(RBF)作為支持向量機的類型,公式為

        K(xi,xj)=exp(-gamma‖xi-xj‖2)。

        其中:xi、xj分別表示向量樣本;gamma為核參數(shù)。為調(diào)節(jié)優(yōu)化方向中的間隔大小和分類準確度偏好的權(quán)重,即對誤差的寬容度, 規(guī)定了一個懲罰系數(shù)C。 在調(diào)參過程中, 對gamma和懲罰系數(shù)C分別繪制學(xué)習(xí)曲線, 得出當gamma取值為30,C取值為110時, 算法效果達到最好。

        4.2 評價指標

        衡量提取效果的指標有單模式分類精度和總體分類精度。單模式分類精度等于各類樣本分類正確的像元數(shù)與該類樣本總數(shù)的比值??傮w分類精度(OA)為分類正確的數(shù)據(jù)樣本個數(shù)與所有數(shù)據(jù)樣本個數(shù)的比例, 表述對每一個隨機樣本所分類的結(jié)果與真實數(shù)據(jù)所對應(yīng)區(qū)域的實際類型相一致的概率,其計算公式為

        (15)

        式中:xkk為沿著對角線上的類型組合的數(shù)量;N為單元格的總數(shù)量。

        4.3 算法對比

        圖4為算法分類效果圖, 通過構(gòu)造CVGS-XGBoost算法對數(shù)據(jù)集進行訓(xùn)練, 每次迭代選擇基于二叉決策樹的算法。使用十折交叉驗證的方法對參數(shù)進行柵格搜索以獲得超參數(shù)的最佳組合, 由此得出當估計器的數(shù)量為30, 樹的最大深度為5, 學(xué)習(xí)率為0.01, 正則化項系數(shù)為1, 懲罰項系數(shù)為0.3時, 算法效果達到最好, 最小葉子節(jié)點樣本權(quán)重和為1時, 避免了算法學(xué)習(xí)到局部的特殊樣本, 防止算法過擬合, 調(diào)參后得到如圖4f所示的提取結(jié)果。

        圖4 算法分類效果圖

        從圖4b中可以看出, 使用原始的XGBoost算法進行水體提取時, 通過驗證法確定算法中的每個參數(shù)值, 得出當估計器的數(shù)量為25, 樹的最大深度為5, 學(xué)習(xí)率為0.01, 正則化系數(shù)為1, 懲罰項系數(shù)為0.2時, 算法達最優(yōu)效果。該算法能有效提取出水體, 結(jié)果相對其他3種機器學(xué)習(xí)算法而言較理想, 能準確地得到水體和山體陰影的分類結(jié)果。但調(diào)參過程中, 受到參數(shù)之間的相互制約, 分類效果差于CVGS-XGBoost算法, 并且通過參數(shù)遍歷和經(jīng)驗調(diào)參, 在參數(shù)選擇方面需花費大量的時間, 運行速度相當緩慢。

        使用決策樹進行分類的效果存在大量的噪聲。從圖4c中可以看出,大量灰度值較高的山體陰影被錯誤地劃分成了水體,導(dǎo)致山體陰影存在大量漏提, 水體部分被誤提的情況, 而圖中灰度值接近于山體陰影的其他部分被錯誤地劃分成了山體陰影, 細小的河流分支幾乎沒有被提取出來, 總體分類精度不高, 分類效果不明顯。隨機森林是多個決策樹評估器的建模結(jié)果, 從圖4d的整體效果上看, 分類結(jié)果相比決策樹而言要好得多, 雖然被誤提的情況大大減少了, 部分細小河流被提取了出來, 但仍然存在部分水體和山體陰影被錯誤劃分和漏提的現(xiàn)象。從圖4e支持向量機的分類結(jié)果上看, 基本上能將水體與山體陰影識別出來, 噪聲明顯減少, 大部分細小河流被提取出來, 只存在少部分錯分漏分的情況, 總體分類精度明顯比決策樹和隨機森林高, 但其運行時間相當緩慢。

        對比原始的XGBoost, CVGS-XGBoost算法能夠快速、 準確、 有效地提取出水體信息(圖4f), 而且其提取總體分類效果明顯比其他3種算法好, 水體和山體陰影都被準確地識別了出來, 誤提和漏誤的情況明顯減少, 細小河流和農(nóng)田都能夠準確地識別, 是一種優(yōu)于其他機器學(xué)習(xí)的集成算法。

        選取廣西桂林山區(qū)地形的遙感圖像, 應(yīng)用本文算法對水體與山體陰影信息進行有效提取。隨機抽取一小塊150×150的子區(qū)域進行可視化, 該區(qū)域內(nèi)包含水體、山體陰影和其他物體, 將提取出來的特征向量輸入到已訓(xùn)練好的CVGS-XGBoost算法、 原始的XGBoost算法和3種機器學(xué)習(xí)算法中進行預(yù)測,進行可視化后的各種算法的效果圖如圖5所示。

        對整個遙感圖像的各算法提取目標地物的單模式分類精度和總體分類精度的評估結(jié)果以及算法的訓(xùn)練時間如表1所示??梢钥闯? 本文的CVGS-XGBoost算法的總體分類精度最高,達到了93.9%, 比原始的XGBoost算法提高了1.5%, 比決策樹提高了10%, 而與較為先進的隨機森林和支持向量機算法相比, 也分別提高了6.3%和3.1%。由此可見, CVGS-XGBoost算法在數(shù)據(jù)集上的分類效果上好于其他算法。在訓(xùn)練時間方面,在數(shù)據(jù)集不變的情況下, CVGS-XGBoost算法要遠遠低于支持向量機。綜上所述, CVGS-XGBoost算法不僅在準確率上優(yōu)于其他算法, 而且在效率上也遠高于分類效果較好的支持向量機。

        表1 分類算法分類精度評估結(jié)果和訓(xùn)練時間

        5 結(jié)束語

        本文通過改進XGBoost算法,提出CVGS-XGBoost算法, 將Landsat多光譜衛(wèi)星遙感圖像的7、6、3三個波段構(gòu)成假彩色特征作為算法的輸入特征, 利用算法提取水體和山體陰影信息。所提出的算法有以下兩個優(yōu)點:(1)CVGS-XGBoost算法在傳統(tǒng)的XGBoost算法的基礎(chǔ)上引入交叉驗證, 避免了算法驗證不足和僅通過一次數(shù)據(jù)集的劃分來確定最優(yōu)算法的偶然性; (2)XGBoost算法通過引入柵格搜索構(gòu)建CVGS-XGBoost算法尋求超參數(shù)的方式, 不僅在尋求最佳參數(shù)組合上具有良好的全局搜索能力, 而且能有效地避免原始XGBoost算法對多個參數(shù)逐個調(diào)優(yōu)導(dǎo)致收斂速度慢的缺點, 同時也避免了參數(shù)之間的相互制約。

        圖5 局部圖像算法分類效果圖

        基于單模式分類精度、 總體分類精度指標和算法訓(xùn)練時間, 與原始的XGBoost算法、 決策樹算法、 隨機森林算法和支持向量機等算法進行對比結(jié)果表明, CVGS-XGBoost算法在數(shù)據(jù)集上的分類效果上好于其他算法。在訓(xùn)練算法時, CVGS-XGBoost算法要比支持向量機更加高效, 運行時間更短。同時, CVGS-XGBoost算法避免了小支流和圖像相似灰度值的干擾, 具有較高的可靠性。下一步工作將提取遙感圖像中包含的更有效信息的特征, 以降低遙感圖像在進行分類時產(chǎn)生的誤提取和漏提取的可能性, 進一步優(yōu)化提取結(jié)果。

        猜你喜歡
        山體柵格決策樹
        基于鄰域柵格篩選的點云邊緣點提取方法*
        一種針對不均衡數(shù)據(jù)集的SVM決策樹算法
        濟南市山體修復(fù)中的植物應(yīng)用與技術(shù)——以濟南市臥虎山山體公園為例
        決策樹和隨機森林方法在管理決策中的應(yīng)用
        電子制作(2018年16期)2018-09-26 03:27:06
        基于決策樹的出租車乘客出行目的識別
        不同剖面形狀的柵格壁對柵格翼氣動特性的影響
        山體別墅設(shè)計分析
        人間(2015年21期)2015-03-11 15:23:42
        基于肺癌CT的決策樹模型在肺癌診斷中的應(yīng)用
        城市山體保護規(guī)劃的實踐與探索——以武漢市新洲區(qū)山體保護規(guī)劃為例
        基于CVT排布的非周期柵格密度加權(quán)陣設(shè)計
        欧美成人午夜免费影院手机在线看 | 成人免费看片又大又黄| 成人国产午夜在线视频| 亚洲精品综合在线影院| 精品嫩模福利一区二区蜜臀 | 男女裸交无遮挡啪啪激情试看| 色yeye免费视频免费看| 亚洲高清一区二区三区视频| 伊人青青草综合在线视频免费播放 | 国产精品三级国产精品高| 免费亚洲一区二区三区av| 色综合久久88色综合天天| 四虎精品视频| 亚洲av有码精品天堂| 一本色道久久综合亚洲| 久久精品国产亚洲av无码娇色 | 夜夜高潮夜夜爽国产伦精品| 人妻妺妺窝人体色www聚色窝| 日韩精品一区二区三区毛片| 激情五月六月婷婷俺来也| 色多多性虎精品无码av| 国产精品久久一区二区三区| www.久久av.com| 国产成人精品一区二区三区av | 中文字幕视频一区懂色| 内射干少妇亚洲69xxx| 成 人 网 站 免 费 av| 谁有在线观看av中文| 亚洲av色图一区二区三区| 国产乱国产乱老熟300部视频| AV永久天堂网| 成年男女免费视频网站点播| 国产免码va在线观看免费| 娇妻玩4p被三个男人伺候电影| 午夜视频免费观看一区二区| 中文字幕漂亮人妻在线| 亚洲一区二区三区中文字幂| 999久久66久6只有精品| 伊人久久大香线蕉av最新午夜| 人妻体内射精一区二区三四| 久久频道毛片免费不卡片|