亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        聯(lián)合星載高光譜影像和堆棧集成學(xué)習(xí)回歸算法的紅樹林冠層葉綠素含量遙感反演

        2022-07-06 07:32:56付波霖鄧良超張麗覃嬌玲劉曼賈明明何宏昌鄧騰芳高二濤范冬林
        遙感學(xué)報 2022年6期
        關(guān)鍵詞:紅樹林模型

        付波霖,鄧良超,張麗,覃嬌玲,劉曼,賈明明,何宏昌,鄧騰芳,高二濤,范冬林

        1.桂林理工大學(xué)測繪地理信息學(xué)院,桂林 541006;

        2.中國科學(xué)院空天信息創(chuàng)新研究院,北京 100094;

        3.中國科學(xué)院東北地理與農(nóng)業(yè)生態(tài)研究所,長春 130000

        1 引言

        紅樹林(Mangrove)主要生長在熱帶、亞熱帶海岸線潮間帶,由紅樹植被為主體的常綠灌木和喬木組成耐鹽濕地木本植被群落(Cao等,2018)。紅樹林具有“海岸腎”功能,有護(hù)堤固灘、防風(fēng)減浪、保護(hù)農(nóng)田、降低鹽害、凈化水質(zhì)、促淤造陸、固碳作用和鳥類棲息等生態(tài)價值。由2019年4月自然資源部、國家林草局聯(lián)合組織的紅樹林資源和適宜恢復(fù)地專項調(diào)查結(jié)果表明:廣西壯族自治區(qū)是中國紅樹林的重要分布區(qū),紅樹林總面積為9330.34 ha,占全國紅樹林總面積(2.89萬ha)的32%,居全國第二位;廣西壯族自治區(qū)欽州市紅樹林總面積達(dá)3078.73 ha,占全區(qū)總面積的32.99%,僅次于北海市(4192.78 ha)。病蟲害、物種入侵和海區(qū)污染等環(huán)境因素嚴(yán)重威脅著廣西壯族自治區(qū)欽州市紅樹林的健康生長,CCC 是衡量紅樹林健康狀況的重要指標(biāo)之一(Wang 等,2019;Ali 等,2020),因此,利用遙感方法進(jìn)行大規(guī)模高精度反演紅樹林的CCC對于監(jiān)測紅樹林的健康狀況具有重要意義。

        目前,獲取植被生物物理參量的方法主要包括地面測量方法和遙感反演方法。由于紅樹林多生長在含水的泥灘和潮灘上,傳統(tǒng)地面測量方法耗時費力,且難以對生物物理參量進(jìn)行大規(guī)模的測量(Kamal 等,2016),所以亟需一種對紅樹林生物物理參數(shù)進(jìn)行高精度估算的遙感方法。Lou等(2021)通過隨機(jī)森林(RF)回歸模型的參數(shù)優(yōu)化進(jìn)一步提高GF-1 WFV、Landsat 8 OLI 和Sentinel-2 MSI尺度上反演沼澤濕地植被CCC 的精度,其中MSI的反演精度最高,R2為0.79,RMSE為10.96 SPAD。多光譜衛(wèi)星影像光譜分辨率較低,不能充分包含與植被生物物理參量高度相關(guān)的光譜細(xì)節(jié)信息。Wu 等(2010)利用EO-1 Hyperion 高光譜衛(wèi)星數(shù)據(jù)計算的EVI植被指數(shù)可以表現(xiàn)出適度的抗飽和能力,在估算玉米冠層葉綠素含量中R2達(dá)到0.81。George 等(2018)利用EO-1 Hyperion 高光譜衛(wèi)星數(shù)據(jù)對印度安達(dá)曼島中紅樹林CCC 進(jìn)行光譜指數(shù)敏感性評估,發(fā)現(xiàn)Hyperion 數(shù)據(jù)波譜帶中549 nm、559 nm、702 nm、722 nm、742 nm 和763 nm 對紅樹林CCC 最為敏感,比值植被指數(shù)(SR)的相關(guān)性最高,R2為0.75。目前,國外的高光譜衛(wèi)星數(shù)據(jù)實現(xiàn)了對紅樹林CCC 的有效估算,但國產(chǎn)珠海一號高光譜衛(wèi)星數(shù)據(jù)在紅樹林CCC 反演中的可靠性仍有待進(jìn)一步驗證。

        高光譜衛(wèi)星傳感器提供了幾十、上百甚至幾千個光譜波段(童慶禧等,2016),盡管豐富的光譜信息可以提供植被覆蓋層或葉片的吸收特征更多的細(xì)節(jié)信息,但冗余波段反而會降低反演精度。Lee 等(2004)和Liu 等(2016)利用機(jī)載高光譜影像估算農(nóng)作物葉面積指數(shù)LAI(Leaf Area Index),論證了使用高相關(guān)性光譜波段和增加對LAI不敏感的波段,均會降低模型反演LAI 的準(zhǔn)確性。因此,高光譜影像特征降維在植被生物物理參數(shù)定量反演方面是不可或缺的。目前特征變換(PCA、MNF和ICA等)和特征選擇(REF、OIF和K-means等)算法已成為解決高光譜數(shù)據(jù)中信息冗余問題的主要方法(Jain 等,2000)。程志慶等(2015)基于最佳指數(shù)—相關(guān)系數(shù)法選取的高光譜數(shù)據(jù)最佳組合波段(760 nm、1860 nm 和1970 nm),在反演冬小麥葉片葉綠素含量中相較于最佳指數(shù)法和最大相關(guān)系數(shù)法的精度最高(R2=0.827,RMSE=5.44)。最大相關(guān)系數(shù)法方法僅考慮了變量與目標(biāo)值的相關(guān)性,容易忽略其他因素的間接作用,最佳指數(shù)法方法雖能獲得信息量豐富、冗余度小的波段組合,但不能保證所選波段與植被參量之間具有最大相關(guān)性,最佳指數(shù)—相關(guān)系數(shù)法雖然綜合了兩者的優(yōu)點,但是無法定量評估每個變量的重要性。Chen 等(2020)基于特征選擇的RF 算法與K 近鄰(KNN)回歸的組合模型(R2=0.834,RMSE=0.824)實現(xiàn)了玉米LAI 的可靠估計?;贑ART 的特征選擇方法,可以評價每個變量對于模型構(gòu)建的貢獻(xiàn)率(Sylvester 等,2018),但是在變量選擇中過多的數(shù)據(jù)維度會增加與波長選擇相關(guān)的信息損失,因此,應(yīng)先采用保持特征與目標(biāo)值之間最大相關(guān)性的數(shù)據(jù)降維方法最大程度降低數(shù)據(jù)的維度,再進(jìn)行特征重要性評價。目前在植被生物物理參數(shù)的反演中,綜合最大相關(guān)系數(shù)法與基于CART模型的特征選擇方法應(yīng)用于高光譜數(shù)據(jù)降維,提升模型反演精度的可能性仍有待進(jìn)一步驗證。

        目前遙感反演植被生物物理參數(shù)的經(jīng)驗統(tǒng)計回歸模型主要分為簡單線性和非線性回歸模型。為了探究多種植被指數(shù)反演葉片葉綠素a 含量LCC(Leaf Chlorophyll-a Content)的可行性,Zhen 等(2021)基于4 個時期的Sentinel-2 衛(wèi)星數(shù)據(jù),得到單波段反射率與兩波段反射率之和比值指數(shù)(RSSI)的線性回歸模型反演LCC 的調(diào)整R2為0.496、 0.742、 0.681 和0.801, RMSE 為5.75、4.29、4.00 和3.46 SPAD,優(yōu)于傳統(tǒng)波段指數(shù)的核嶺回歸(KRR)模型。線性回歸模型可以有效降低反演過程中的不確定性(Lin 和Lin,2019),但對于非線性或特征間具有高相關(guān)性的數(shù)據(jù),線性回歸模型難以建模。為了準(zhǔn)確估計紅樹林地區(qū)的LAI 指數(shù),Zhu 等(2017)利用人工神經(jīng)網(wǎng)絡(luò)(ANN)回歸、支持向量機(jī)(SVM)回歸和RF 回歸模型探討WorldView-2影像紅邊波段計算的植被指數(shù)對紅樹林LAI 的敏感性,結(jié)果表明RF 回歸模型的估算精度最高(RMSE=0.45),SVM 回歸模型的估算精度(RMSE=0.51)低于另外兩種反演模型。機(jī)器學(xué)習(xí)回歸算法可以平衡數(shù)據(jù)集的誤差,容易并行化,模型泛化能力比較強(qiáng)。非線性回歸模型能較好地解釋生物物理參數(shù)與模型參數(shù)之間的關(guān)系(唐少飛等,2020),但如果單一回歸模型的預(yù)測誤差都比較低,則經(jīng)常需要權(quán)衡模型的平衡性與準(zhǔn)確性(Christensen,2003)。Ghosh 等(2021)在估算富含碳的印度紅樹林地上生物量(AGB)時,采用多時相圖像堆棧數(shù)據(jù)集和單一RF回歸模型估算AGB 的RMSE 為74.493 t/ha,優(yōu)于單個數(shù)據(jù)集(RMSE=151.149 t/ha),多時相圖像堆棧數(shù)據(jù)集中采用堆棧算法反演AGB 的精度得到了進(jìn)一步的提高,RMSE 為72.864 t/ha,集成回歸模型可以集成不同算法的預(yù)測結(jié)果,并產(chǎn)生更穩(wěn)健的估算結(jié)果?;诙褩5募苫貧w算法可以集成多種基礎(chǔ)回歸模型,并且在回歸預(yù)測上提供更好的泛化能力(Dietterich,2000)。目前,利用基于堆棧的集成學(xué)習(xí)回歸模型反演紅樹林CCC 還有待深入研究。

        綜上所述,為了實現(xiàn)北部灣紅樹林CCC 高精度遙感反演,本文主要研究內(nèi)容如下:(1)構(gòu)建紅樹林CCC 反演多維特征數(shù)據(jù)集,并利用最大相關(guān)系數(shù)法與基于CART模型的特征選擇方法對紅樹林高維特征數(shù)據(jù)集降維處理;(2)構(gòu)建單一線性回歸、機(jī)器學(xué)習(xí)回歸模型與堆棧集成學(xué)習(xí)回歸模型反演紅樹林CCC,并驗證單一線性回歸、機(jī)器學(xué)習(xí)回歸模型與堆棧集成學(xué)習(xí)回歸模型反演紅樹林CCC 的精度;(3)驗證珠海一號高光譜衛(wèi)星和Sentinel-2A數(shù)據(jù)反演紅樹林CCC的適用性,并對比兩種數(shù)據(jù)源反演紅樹林CCC的精度差異;(4)評估SNAP-SL2P 算法反演紅樹林CCC 的適用性,并定量分析SNAP-SL2P 算法與最優(yōu)回歸模型估算紅樹林CCC的精度差異。

        2 研究區(qū)概況與數(shù)據(jù)源

        2.1 研究區(qū)概況

        研究區(qū)位于廣西北部灣大風(fēng)江沿岸(圖1(a))的欽州市犀牛腳鎮(zhèn)蘇屋村(圖1(b))和沙角村(圖1(c))。地理坐標(biāo)為21°37′00″N—21°38′20″N,108°48′15″E—108°52′15″E,屬于亞熱帶季風(fēng)型海洋性氣候。欽州市的夏季長達(dá)6個月之久,全年平均氣溫為22℃,年均降水量達(dá)2104.2 mm,相對濕度為81%,夏秋兩季是濕熱多雨的季節(jié),為紅樹林的生長提供了溫暖舒適的環(huán)境。研究區(qū)內(nèi)紅樹林總面積約為2.41 km2,主要分布著3 類樹種:白骨壤、桐花樹和秋茄,其中白骨壤分布面積最大。根據(jù)實地采集數(shù)據(jù)計算白骨壤的平均高度為1.81 m,平均冠幅為4.30 m2;桐花樹平均高度為1.41 m,平均冠幅為0.93 m2;秋茄的平均樹高為0.84 m,平均冠幅為1.25 m2,樹高和冠幅的優(yōu)勢使得白骨壤成為該地區(qū)的優(yōu)勢種群。研究區(qū)內(nèi)的紅樹林主要經(jīng)受外灘互花米草的入侵和病蟲害的脅迫。因此,利用遙感手段對紅樹林CCC 進(jìn)行大規(guī)模高精度的估算,對紅樹林的監(jiān)測和保護(hù)有著重要意義。

        圖1 研究區(qū)位置及實測點分布Fig.1 The location of the study area and the distribution of filed measurements

        2.2 珠海一號高光譜衛(wèi)星數(shù)據(jù)及預(yù)處理

        珠海一號高光譜衛(wèi)星(OHS)采用推掃模式單次拍攝影像成像,搭載CMOSMSS 傳感器,影像空間分辨率為10 m,光譜分辨率為2.5 nm,波段數(shù)為32 個,波長范圍為400—1000 nm。本文OHS數(shù)據(jù)下載網(wǎng)址為:https://www.obtdata.com/,獲取影像時間為2021年1月12日,產(chǎn)品級別為L1 級,整景影像云量為1%,研究區(qū)內(nèi)無云覆蓋。OHS 數(shù)據(jù)文件中包括32 個光譜波段的tif 格式的文件與其對應(yīng)的用于正射校正的RPC文件。

        OHS 數(shù)據(jù)預(yù)處理的流程如下:(1)分別利用ENVI 5.6 軟件下的Radiometric Calibration、FLAASH Atmospheric Correction 模塊進(jìn)行輻射定標(biāo)和大氣校正;(2)利用ENVI 5.6軟件的RPC Orthorectification Workflow 模塊和GMTED2010.jp2 DEM 數(shù)據(jù)進(jìn)行無控制點正射校正;(3)利用GNSS RTK 的控制點進(jìn)行影像配準(zhǔn),在ENVI 5.6 的Registration:Image to Map 模塊中生成WGS_1984_UTM_Zone_49N 坐標(biāo)系的影像,配準(zhǔn)誤差RMSE為0.42,并進(jìn)行裁剪。

        2.3 Sentinel-2A數(shù)據(jù)及預(yù)處理

        哨兵2 號(Sentinel-2)為多光譜成像衛(wèi)星,本文下載Sentinel-2A 數(shù)據(jù)的網(wǎng)址為:https://earthexplorer.usgs.gov/,獲取時間為2021年2月19日,產(chǎn)品級別為L1C 級,整幅影像云量為0.319%,研究區(qū)上空無云層覆蓋,需要進(jìn)行輻射定標(biāo)、大氣校正及重采樣等預(yù)處理。

        Sentinel-2A數(shù)據(jù)處理過程為:(1)使用Sen2Cor v2.8 軟件進(jìn)行輻射定標(biāo)和大氣校正;(2)利用SNAP 軟件下的S2 Resampling Processor 工具將所有波段重采樣成10 m 空間分辨率的影像;(3)利用GNSS RTK 的控制點進(jìn)行影像配準(zhǔn),在ENVI 5.6的Registration:Image to Map 模塊中生成WGS_1984_UTM_Zone_49N 坐標(biāo)系的影像,配準(zhǔn)誤差RMSE為0.58,并進(jìn)行裁剪。

        2.4 紅樹林LAI及LCC實地測量

        本次實測數(shù)據(jù)采集時間是2021年1月8日至2021年4月6日,一共采集了219個10 m×10 m的樣方,紅樹林CCC由LCC與LAI的乘積得到(Gitelson等,2005)。本文利用LAI-2200 Plant Canopy Analyzer 儀器測量紅樹林的LAI 數(shù)據(jù),利用Chlorophyll Meter SPAD-502 Plus 儀器測量紅樹林葉片的LCC 數(shù)據(jù),并用中海達(dá)V90 GNSS RTK 記錄采集地面點的地理位置。為了高精度地反演紅樹林CCC,10 m×10 m 的地面實測樣方盡量均勻分布整個研究區(qū)(圖1),采集數(shù)據(jù)見表1。研究區(qū)內(nèi)白骨壤、桐花樹及秋茄中LAI的數(shù)值范圍分別為0.75—2.83、1.62—4.03和1.44—2.72;白骨壤、桐花樹及秋茄中LCC的數(shù)值范圍分別為36.60—58.00 μg/cm2、40.40—57.00 μg/cm2和56.40—66.00 μg/cm2。

        表1 研究區(qū)內(nèi)地面實測的LAI和LCC數(shù)據(jù)統(tǒng)計Table 1 Statistics of LAI and LCC values derived from field measurements in the study area

        3 紅樹林CCC遙感反演方法

        3.1 多源數(shù)據(jù)集生成與統(tǒng)計檢驗

        3.1.1 植被指數(shù)與組合植被指數(shù)計算

        OHS 及Sentinel-2A 數(shù)據(jù)預(yù)處理后,影像的DN值轉(zhuǎn)換成了地面物體實際的反射率信息,提取后的反射率信息用于計算植被指數(shù)與組合植被指數(shù)。本文通過ENVI 5.6 軟件的Band Math 工具分別計算了OHS 和Sentinel-2A 數(shù)據(jù)的10 種傳統(tǒng)植被指數(shù),具體類型及公式見表2。

        表2 OHS和Sentinel-2A影像傳統(tǒng)植被指數(shù)的計算Table 2 Calculation of traditional vegetation indices from OHS and Sentinel-2A images

        為了獲取更為豐富的光譜信息,本文在Tensorflow 2.0 環(huán)境下利用Python 3.7 軟件的math 標(biāo)準(zhǔn)庫分別計算OHS 和Sentinel-2A 數(shù)據(jù)的組合植被指數(shù)(具體計算見式(1)、式(2)和式(3)),主要包括差值光譜指數(shù)DSI (Difference Spectral Index)、比值光譜指數(shù)RSI(Ratio Spectral Index)和歸一化差值植被指數(shù)NDSI(Normalized difference spectral index)(Wang等,2017;張亞坤等,2018)。OHS 影像有32 個波段共計算了1488 個組合植被指數(shù);Sentinel-2A數(shù)據(jù)有12個波段共計算了198個組合植被指數(shù)。綜合植被指數(shù)和組合植被指數(shù),OHS數(shù)據(jù)一共獲得了1498 個特征變量,Sentinel-2A 數(shù)據(jù)一共得到了208個特征變量。

        式中,λ1、λ2是OHS 數(shù)據(jù)或Sentinel-2A 數(shù)據(jù)中任意的兩個波段,ρλ1、ρλ2分別是λ1、λ2對應(yīng)兩個波段的紅樹林冠層反射率值。

        3.1.2 數(shù)據(jù)集正態(tài)分布檢驗

        本文以7.3∶2.7 的比例隨機(jī)選取159 個地面實測點作為模型訓(xùn)練數(shù)據(jù)集,60 個點作為驗證數(shù)據(jù)集,地面實測CCC數(shù)據(jù)作為目標(biāo)值(target),植被指數(shù)和組合植被指數(shù)作為特征變量。本文在Tensorflow 2.0 環(huán)境下利用Python 3.7 軟件的概率密度函數(shù)對特征變量測試集與訓(xùn)練集的進(jìn)行正態(tài)分布檢驗,OHS 與Sentinel-2A 數(shù)據(jù)符合正態(tài)分布的植被指數(shù)以及組合植被指數(shù)如圖2 和圖3所示。OHS 和Sentinel-2A 數(shù)據(jù)的傳統(tǒng)植被指數(shù)和組合植被指數(shù)均滿足正態(tài)分布,而OHS 與Sentinel-2A 數(shù)據(jù)MCARI、TCARI 與MCARI/OSAVI 的訓(xùn)練集與測試集正態(tài)分布性相對較差。

        圖2 OHS數(shù)據(jù)中符合正態(tài)分布的植被指數(shù)與組合植被指數(shù)Fig.2 Vegetation indices and combining vegetation indices conforming to normal distributions in OHS data

        圖3 Sentinel-2A數(shù)據(jù)中符合正態(tài)分布的植被指數(shù)與組合植被指數(shù)Fig.3 Vegetation indices and combining vegetation indices conforming to normal distributions in Sentinel-2A data

        3.2 特征降維無量綱化最優(yōu)數(shù)據(jù)集生成

        3.2.1 最大相關(guān)系數(shù)法降維

        高光譜數(shù)據(jù)進(jìn)行植被指數(shù)與組合植被指數(shù)計算產(chǎn)生了冗余的特征變量,增加了算法的時間復(fù)雜度,通過最大相關(guān)系數(shù)法可以減少冗余信息同時保留與目標(biāo)值相關(guān)性最高的特征變量。在Tensorflow 2.0 環(huán)境下利用Python 3.7 軟件的Corr 函數(shù)繪制熱力圖,判斷特征數(shù)據(jù)與目標(biāo)數(shù)據(jù)的相關(guān)性,植被指數(shù)與部分組合植被指數(shù)的熱力圖如圖4和圖5所示。在OHS 與Sentinel-2A 數(shù)據(jù)中,組合植被指數(shù)與紅樹林CCC 的相關(guān)性比植被指數(shù)略高。OHS 數(shù)據(jù)計算的DSI(6,12)與紅樹林CCC 的相關(guān)性最高,Corr 為-0.743。Sentinel-2A 數(shù)據(jù)相關(guān)性最高的指數(shù)為NDSI(2,4),Corr 為-0.720。OHS 數(shù)據(jù)MCARI 指數(shù)與目標(biāo)值的Corr 為0.633 大于0.5,而Sentinel-2A數(shù)據(jù)的相關(guān)系數(shù)為0.462,Corr小于0.5。傳統(tǒng)植被指數(shù)中MTCI、TCARI、TCARI/OSAVI 和MCARI/OSAVI 與目標(biāo)值的相關(guān)性最低,相關(guān)系數(shù)(Corr)均小于0.5,需要剔除這4 種植被指數(shù)。在Tensorflow 2.0 環(huán)境下利用Python 3.7 軟件feature_selection 庫的SelectKBest 類結(jié)合相關(guān)系數(shù)來選擇與目標(biāo)值相關(guān)性高的特征變量。經(jīng)過最大相關(guān)系數(shù)法降維,OHS 數(shù)據(jù)由1498 個特征變量減少到11 個,Sentinel-2A 數(shù)據(jù)由原始的208 個特征變量減少到11個。

        圖4 OHS數(shù)據(jù)特征變量與目標(biāo)值之間相關(guān)性熱力圖Fig.4 Heat map of correlation between feature variables and target values in OHS data

        圖5 Sentinel-2A數(shù)據(jù)特征變量與目標(biāo)值之間相關(guān)性熱力圖Fig.5 Heat map of correlation between feature variables and target values in Sentinel-2A data

        3.2.2 基于XGBoost算法的特征選擇降維

        通過梯度提升算法在紅樹林CCC 反演方法中獲取特征變量的重要性得分,對于重要的特征按重要性得分賦予相應(yīng)的權(quán)重帶入到回歸器中。通過使損失函數(shù)最小化的策略來確定下一棵梯度提升算法的決策樹的參數(shù)θk,梯度提升算法的表達(dá)式見式(4)。

        式中,θk為第k個紅樹林CCC 特征變量基學(xué)習(xí)器的參數(shù),L(yi,fk(xi))為假設(shè)的紅樹林CCC 特征變量提升樹算法的損失函數(shù),M為紅樹林CCC 特征變量訓(xùn)練集的個數(shù)。

        將兩種數(shù)據(jù)源最大相關(guān)系數(shù)法降維后的11 個特征變量輸入到極端梯度提升(XGBoost)算法中,在Tensorflow 2.0 環(huán)境下利用Python 3.7 軟件的feature_importance 函數(shù)輸出每個特征變量的重要性得分,輸出結(jié)果如圖6 和表3所示。本文經(jīng)過基于XGBoost 算法的特征選擇降維,OHS 和Sentinel-2A數(shù)據(jù)均得到8個最優(yōu)特征變量。OHS數(shù)據(jù)特征變量重要性得分最高的是RSI(12,17),得分為18,NDVI的重要性得分最低,得分為6;Sentinel-2A 數(shù)據(jù)中特征變量重要性得分最高的是EVI,得分為25,重要性得分最低的是EVI2 與RSI(4,8A),重要性得分均為1 (圖6)。說明OHS 數(shù)據(jù)的RSI(12,17)及Sentinel-2A 數(shù)據(jù)的EVI 對紅樹林CCC 更敏感,而OHS 數(shù)據(jù)的NDVI 與Sentinel-2A 數(shù)據(jù)的EVI2 和RSI(4,8A)對預(yù)測結(jié)果的影響較小。

        圖6 基于XGBoost 算法的特征選擇和數(shù)據(jù)降維結(jié)果Fig.6 Feature selection and dimensionality reduction for OHS and Sentinel-2A data using XGBoost algorithm

        3.2.3 無量綱化數(shù)據(jù)集生成

        為了消除特征變量與目標(biāo)值數(shù)值之間因數(shù)量級不同而產(chǎn)生的不具可比性,本文對特征變量與目標(biāo)值進(jìn)行無量綱化。對特征變量進(jìn)行歸一化處理,保留原始數(shù)據(jù)的特征,提高訓(xùn)練算法的收斂性能;對目標(biāo)值進(jìn)行指數(shù)轉(zhuǎn)換以提高目標(biāo)值的正態(tài)分布性。對OHS 和Sentinel-2A 數(shù)據(jù)的8 個最優(yōu)特征變量及目標(biāo)值進(jìn)行無量綱化處理,結(jié)果如表3所示。

        表3 OHS與Sentinl-2A數(shù)據(jù)最優(yōu)特征變量及無量綱化統(tǒng)計結(jié)果Table 3 Optimal feature variables and non-dimensional statistical results in OHS and Sentinl-2A data

        3.3 紅樹林CCC反演方法與精度評估指標(biāo)

        為了論證不同回歸模型對紅樹林CCC 反演的適用性,實現(xiàn)紅樹林CCC 高精度估算。本文利用OHS 和Sentinel-2A 數(shù)據(jù)無量綱化處理后的8 個最優(yōu)特征變量及目標(biāo)值,嘗試構(gòu)建了3種簡單一元線性回歸模型、4 種單一機(jī)器學(xué)習(xí)回歸模型和7 種堆棧集成學(xué)習(xí)回歸模型。

        3.3.1 構(gòu)建紅樹林CCC反演線性回歸模型

        線性回歸模型反演構(gòu)建過程中主要涉及模型參數(shù)調(diào)優(yōu),使用的策略是最小化損失函數(shù),線性回歸模型的損失函數(shù)見式(5),線性回歸模型的參數(shù)調(diào)優(yōu)問題采用梯度下降法求解,對損失函數(shù)求偏導(dǎo),其表達(dá)式見式(6)。

        式中,w為各個紅樹林CCC特征變量特征權(quán)重組成的系數(shù)向量,b為偏置常數(shù),M為紅樹林CCC 訓(xùn)練集的個數(shù),h(xi;w;b)是對輸入紅樹林CCC 訓(xùn)練數(shù)據(jù)xi的預(yù)測函數(shù),yi是紅樹林CCC 訓(xùn)練數(shù)據(jù)xi的實測值。

        本文采用套索算法(Lasso)回歸、嶺回歸(Ridge)及彈性網(wǎng)絡(luò)(ElasticNet)線性回歸模型反演紅樹林CCC,利用網(wǎng)格搜索方法進(jìn)行參數(shù)調(diào)優(yōu)。經(jīng)過網(wǎng)格搜索,將Lasso 模型參數(shù)正規(guī)化項前的常數(shù)調(diào)節(jié)因子(alpha)設(shè)置為0.00098;Ridge模型的alpha設(shè)為0.25;ElasticNet模型的alpha設(shè)為0.0001,最大迭代次數(shù)(max_iter)設(shè)為100000。

        3.3.2 構(gòu)建紅樹林CCC反演機(jī)器學(xué)習(xí)回歸模型

        本文采用KNN 回歸模型、RF 回歸模型、梯度提升回歸樹(GBRT)模型和XGBoost 回歸模型反演紅樹林CCC。KNN 回歸算法采用K個最近鄰多數(shù)投票的思想,在給定的距離度量下,最近的K個樣本的輸出平均值作為回歸預(yù)測值;RF回歸模型、GBRT 回歸模型和XGBoost 回歸模型均為集成機(jī)器學(xué)習(xí)算法,其中RF 回歸模型以決策樹為基學(xué)習(xí)器構(gòu)建Bagging 集成的基礎(chǔ)上,引入隨機(jī)特征選擇構(gòu)建決策樹進(jìn)行回歸預(yù)測;GBRT 回歸模型是基于Boosting 基學(xué)習(xí)器的回歸算法,利用損失函數(shù)的負(fù)梯度(梯度下降法)在前項模型的值作為當(dāng)前提升樹算法中殘差的近似值,擬合決策樹進(jìn)行回歸預(yù)測;XGBoost 回歸模型是在GBRT 基礎(chǔ)上改進(jìn)而來,在損失函數(shù)中增加了正則化項。

        機(jī)器學(xué)習(xí)回歸模型參數(shù)調(diào)優(yōu)的策略是最小化損失函數(shù),機(jī)器學(xué)習(xí)回歸模型的優(yōu)化問題采用梯度下降法求解,分別見式(7)和式(8)。

        式中,w為各個紅樹林CCC最優(yōu)特征變量特征權(quán)重組成的系數(shù)向量,b為偏置常數(shù),M為紅樹林CCC訓(xùn)練數(shù)據(jù)的個數(shù),f(xi)是建立的模型對紅樹林CCC測試集的預(yù)測函數(shù),yi是紅樹林CCC訓(xùn)練數(shù)據(jù)xi的實測值。

        利用網(wǎng)格搜索方法確定機(jī)器學(xué)習(xí)回歸模型的最優(yōu)參數(shù),設(shè)置KNN 模型的鄰近點個數(shù)(n_neighbors)為10;設(shè)置RF 模型的決策樹個數(shù)(n_estimators)為250,設(shè)置內(nèi)部節(jié)點在劃分時所需的最小樣本(min_samples_split)為4;設(shè)置GBRT模型的n_estimators=150,設(shè)置決策樹最大深度(max_depth)為1,設(shè)置min_samples_split=5;設(shè)置XGBoost模型的n_estimators=100,max_depth=1。

        3.3.3 構(gòu)建紅樹林CCC反演堆棧集成學(xué)習(xí)回歸模型

        堆棧集成學(xué)習(xí)回歸模型是采用K折交叉驗證單一回歸模型并輸出預(yù)測結(jié)果,將每個模型輸出的預(yù)測結(jié)果合并為新的特征(New Feature),并利用新的模型加以訓(xùn)練的回歸模型。堆棧集成學(xué)習(xí)回歸模型本質(zhì)上是一種分層結(jié)構(gòu),第1 層循環(huán)控制基模型的數(shù)目,第2層循環(huán)控制的是交叉驗證的次數(shù)K,其原理為:(1)輸入7 個單一回歸模型,對已有的數(shù)據(jù)集進(jìn)行K 折交叉驗證;(2)K折交叉驗證訓(xùn)練集,對每折輸出的結(jié)果保存、合并;(3)通過每一次訓(xùn)練模型,對整個測試集進(jìn)行預(yù)測,2 折交叉驗證后,將這兩列求平均值得到Test1。(4)每一個基模型訓(xùn)練K次,拼接得到預(yù)測結(jié)果Predictions,最優(yōu)堆棧集成學(xué)習(xí)回歸模型的結(jié)構(gòu)及原理如圖7所示。

        圖7 堆棧集成學(xué)習(xí)回歸模型原理結(jié)構(gòu)圖Fig.7 Principal structure diagram of stacking ensemble regression model

        堆棧集成學(xué)習(xí)回歸的主要過程:(1)利用Python邏輯語句對單一線性回歸及機(jī)器學(xué)習(xí)回歸算法中模型精度最高的模型結(jié)果進(jìn)行優(yōu)選;(2)網(wǎng)格搜索后,設(shè)置Lasso 回歸模型的alpha=0.0001;設(shè)置Ridge 模型的alpha=5.75;設(shè)置ElasticNet 模型的alpha=0.0009,max_iter=100000;設(shè)置KNN模型的n_neighbors=3;設(shè)置RF 模型的n_estimators=100,劃分考慮最大特征數(shù)(max_features)為5,min_samples_split=4;設(shè)置GBRT 模型的n_estimators=250,max_depth=2,min_samples_split=7;設(shè)置XGBoost模型的n_estimators=100,max_depth=2。

        堆棧集成學(xué)習(xí)回歸模型可以集成單一線性回歸、機(jī)器學(xué)習(xí)回歸模型等許多基礎(chǔ)回歸模型,產(chǎn)生更穩(wěn)健的估算結(jié)果,在反演過程中提供更好的泛化能力。

        利用SNAP 軟件神經(jīng)網(wǎng)絡(luò)簡化的L2 級產(chǎn)品原型處理器SNAP-SL2P (Simplified level2 product prototype processor)算法對Sentinel-2A 數(shù)據(jù)進(jìn)行處理,實現(xiàn)LCC 與LAI 的有效估算。SNAP-SL2P算法反演紅樹林CCC 的過程:(1)進(jìn)行輻射定標(biāo)、大氣校正與重采樣等預(yù)處理:(2)利用SNAP 軟件下的Biophysical Processor S2 模塊生成LAI、LCC兩個單波段影像;(3)將LCC 與LAI 兩個單波段影像與Sentinel-2A 影像的其他波段進(jìn)行圖層疊加和配準(zhǔn)。紅樹林CCC 反演的技術(shù)路線圖如圖8所示。

        3.3.5 精度評估指標(biāo)

        本文為了驗證上述3 種反演方法估算紅樹林CCC 的精度,利用模型得分、均方根誤差及決定系數(shù)等精度評估指標(biāo)進(jìn)行精度估計。

        模型得分(Score)可以有效評估不同估算模型預(yù)測紅樹林CCC 的準(zhǔn)確率,有助于篩選出預(yù)測精度較優(yōu)的紅樹林CCC 反演方法,Score 數(shù)值在[-1,1]之間(式(9)),Score值越大表示模型的預(yù)測精度越高。

        式中,n為輸入紅樹林CCC 訓(xùn)練數(shù)據(jù)集的個數(shù),yi表示紅樹林CCC 訓(xùn)練集xi的實測值,為測試集xi對應(yīng)的紅樹林CCC 反演方法的預(yù)測值,為測試集中對應(yīng)的紅樹林CCC實測值yi的平均值。

        均方根誤差(RMSE)可以表征預(yù)測值與實測值的曲線的擬合程度,用來衡量模型預(yù)測的準(zhǔn)確程度,RMSE 值越小,預(yù)測精度越高。RMSE 的表達(dá)式見式(10)(Inoue等,2016)。

        式中,n為輸入紅樹林CCC 訓(xùn)練集或測試集的個數(shù),為紅樹林CCC 反演方法的預(yù)測值,yi為紅樹林CCC的實測值。

        學(xué)術(shù)立場和觀點的分歧源于城市小區(qū)治理實踐的矛盾,而治理實踐的矛盾根源在于,隨著中國商品房制度改革以及由此帶來的城市小區(qū)居住空間結(jié)構(gòu)的變化、社會交往關(guān)系的變化、基于物權(quán)的權(quán)利關(guān)系及權(quán)利意識的變化等一系列現(xiàn)實和觀念的變化,國家對這些變化的認(rèn)識和制度調(diào)整卻相對滯后。對小區(qū)內(nèi)部出現(xiàn)的新的經(jīng)濟(jì)社會關(guān)系及其治理邏輯的辨識,有助于推動當(dāng)前城市小區(qū)治理走出困境。

        決定系數(shù)(R2)用來表示回歸曲線與實測值的擬合程度,R2數(shù)值在[0,1],R2越大表示擬合結(jié)果越好。R2的表達(dá)式見式(11)(Pham等,2021)。

        式中,n為輸入紅樹林CCC 測試集的個數(shù),是紅樹林CCC 反演方法的預(yù)測值,yi為紅樹林CCC 的實測值,為輸入紅樹林CCC測試集的均值。

        為了評估各回歸模型反演紅樹林CCC 的性能,模型訓(xùn)練中,從劃分的159 個訓(xùn)練集中隨機(jī)抽取70%(111 個點)作為模型訓(xùn)練的訓(xùn)練數(shù)據(jù),其對應(yīng)的target 數(shù)據(jù)集中的111 個點作為模型訓(xùn)練的驗證數(shù)據(jù),利用3 種單一線性回歸模型、4 種單一機(jī)器學(xué)習(xí)回歸模型及7種堆棧集成學(xué)習(xí)回歸模型對訓(xùn)練數(shù)據(jù)進(jìn)行擬合,輸出對應(yīng)訓(xùn)練數(shù)據(jù)的各回歸器擬合曲線上的擬合值,將擬合值與驗證數(shù)據(jù)進(jìn)行一元線性回歸,得到各回歸器的Score、RMSE 及Corr精度,通過評估Score、RMSE及Corr值的大小來驗證各回歸器擬合曲線擬合訓(xùn)練數(shù)據(jù)的精度。

        為了驗證不同數(shù)據(jù)源及不同模型算法反演紅樹林的CCC 精度,在60 個測試數(shù)據(jù)中,將基于OHS、Sentinel-2A 數(shù)據(jù)與最優(yōu)回歸模型輸出的預(yù)測值、SNAP-SL2P 算法的估算值分別與測試集的目標(biāo)值進(jìn)行一元線性回歸,利用R2、RMSE 評估其反演精度。

        4 精度驗證與結(jié)果分析

        4.1 紅樹林CCC回歸模型訓(xùn)練精度及對比分析

        單一線性回歸和機(jī)器學(xué)習(xí)回歸模型訓(xùn)練中(訓(xùn)練結(jié)果見表4),除了KNN 模型預(yù)測精度較低,基于CART的強(qiáng)機(jī)器學(xué)習(xí)回歸器精度明顯優(yōu)于線性回歸器的精度。OHS 數(shù)據(jù)中,最優(yōu)線性回歸模型為Lasso回歸器,Score為0.612(圖9(a)),RMSE為20.346 μg/cm2,Corr 為0.783,最優(yōu)的機(jī)器學(xué)習(xí)回歸模型是RF 回歸器,Score 為0.932,RMSE 為8.494 μg/cm2,Corr為0.971(圖10(c));最優(yōu)機(jī)器學(xué)習(xí)回歸器比最優(yōu)線性回歸器的Score提高了0.320,RMSE 降低了11.852 μg/cm2,Corr 提高了0.188。Sentinel-2A 數(shù)據(jù)中,最優(yōu)機(jī)器學(xué)習(xí)回歸模型是RF回歸器,Score 為0.884,RMSE 為11.148 μg/cm2,Corr 為0.943(圖10(d)),而最優(yōu)線性回歸模型是ElasticNet 回歸器,Score 為0.651,RMSE 為19.316 μg/cm2,Corr 為0.807(圖9(f));最優(yōu)RF機(jī)器學(xué)習(xí)回歸器比最優(yōu)ElasticNet 線性回歸器的Score 提高了0.233,RMSE 降低了8.168 μg/cm2,Corr 提高了0.136。說明單一線性回歸和機(jī)器學(xué)習(xí)回歸模型訓(xùn)練中,RF 回歸模型是訓(xùn)練精度最高的紅樹林CCC反演模型。

        圖9 OHS與Sentinel-2A數(shù)據(jù)單一線性回歸模訓(xùn)練精度Fig.9 Training accuracy of single linear regression models in OHS and Sentinel-2A data

        圖10 OHS與Sentinel-2A數(shù)據(jù)單一機(jī)器學(xué)習(xí)回歸模型精度Fig.10 Training accuracy of single machine learning regression models in OHS and Sentinel-2A data

        表4 OHS與Sentinel-2A數(shù)據(jù)單一線性回歸和機(jī)器學(xué)習(xí)回歸模型訓(xùn)練精度Table 4 Training accuracy of single linear regression and machine learning regression models in OHS and Sentinel-2A data

        堆棧集成學(xué)習(xí)回歸結(jié)果中(預(yù)測結(jié)果見表5),OHS數(shù)據(jù)最優(yōu)堆棧集成學(xué)習(xí)回歸模型是GBRT回歸器,Score 為0.999,RMSE 為0.963 μg/cm2,Corr 為0.999(圖12(e));3 種堆棧線性集成學(xué)習(xí)回歸器精度趨于一致,其中Ridge 回歸器Score 為0.981,RMSE 為4.445 μg/cm2,Corr 為0.991(圖11(c));最優(yōu)堆棧GBRT 集成學(xué)習(xí)回歸模型比最優(yōu)堆棧Ridge 線性回歸模型的Score 提高了0.018,RMSE降低了3.482 μg/cm2,Corr 提高了0.008。Sentinel-2A 數(shù)據(jù)的最優(yōu)堆棧集成學(xué)習(xí)回歸模型是XGBoost回歸器,Score 為0.991,RMSE 為3.012 μg/cm2,Corr 為0.996(圖12(h));3 種線性回歸模型精度趨于一致,其中Ridge 的Score 為0.944,RMSE 為7.748 μg/cm2,Corr 為0.971(圖11(d));XGBoost回歸器比Ridge 回歸器的Score 提高了0.047,RMSE降低了4.736 μg/cm2,Corr提高了0.025。

        圖11 OHS與Sentinel-2A數(shù)據(jù)堆棧線性回歸模型訓(xùn)練精度Fig.11 Training accuracy of stacking linear regression models in OHS and Sentinel-2A data

        圖12 OHS與Sentinel-2A數(shù)據(jù)堆棧機(jī)器學(xué)習(xí)回歸模型訓(xùn)練精度Fig.12 Training accuracy of stacking machine learning regression models in OHS and Sentinel-2A data

        表5 OHS與Sentinel-2A數(shù)據(jù)堆棧集成學(xué)習(xí)回歸模型訓(xùn)練精度Table 5 Training accuracy of stacking ensemble regression models in OHS and Sentinel-2A data

        OHS 數(shù)據(jù)擁有比Sentinel-2A 數(shù)據(jù)更豐富的波段,其特征數(shù)據(jù)集復(fù)雜程度更高,在單一線性回歸模型訓(xùn)練中,Sentinel-2A 數(shù)據(jù)最優(yōu)ElasticNet 線性回歸模型比OHS 數(shù)據(jù)最優(yōu)Lasso 線性回歸模型的精度略高(RMSE 降低了0.985 μg/cm2),這是因為單一線性回歸模型對于數(shù)據(jù)復(fù)雜的數(shù)據(jù)集難以建模。單一線性回歸和機(jī)器學(xué)習(xí)回歸模型訓(xùn)練中輸入數(shù)據(jù)是非線性和特征間具有相關(guān)性的數(shù)據(jù)集,RF 回歸模型具有較高的集成能力,對于復(fù)雜的數(shù)據(jù)集,RF 模型的擬合曲線較好地擬合了紅樹林CCC 實測值,相比之下,線性回歸模型的擬合能力較弱。在堆棧集成學(xué)習(xí)回歸模型中,線性回歸模型在預(yù)測過程中出現(xiàn)了精度飽和的情況,而堆棧GBRT 及XGBoost 集成學(xué)習(xí)回歸模型有效避免了過擬合的情況,具有更強(qiáng)的泛化能力,并在單一最優(yōu)機(jī)器學(xué)習(xí)回歸模型訓(xùn)練中得到較優(yōu)結(jié)果的基礎(chǔ)上再一次提升了紅樹林CCC的估算精度。

        堆棧集成學(xué)習(xí)回歸前后的兩次模型訓(xùn)練,機(jī)器學(xué)習(xí)回歸模型對數(shù)據(jù)的擬合程度都比線性回歸高,說明機(jī)器學(xué)習(xí)回歸模型在反演紅樹林CCC 的性能明顯優(yōu)于線性回歸模型;相較于單一最優(yōu)線性和最優(yōu)機(jī)器學(xué)習(xí)回歸模型,堆棧集成學(xué)習(xí)回歸模型集成了單一線性回歸、機(jī)器學(xué)習(xí)回歸模型的優(yōu)勢,反演紅樹林CCC的精度最高。

        4.2 OHS 與Sentinel-2A 數(shù)據(jù)紅樹林CCC 估算精度與結(jié)果分析

        在單一機(jī)器學(xué)習(xí)回歸模型訓(xùn)練過程中,基于OHS 數(shù)據(jù)的最優(yōu)RF 回歸器的Score 比基于Sentinel-2A 數(shù)據(jù)的最優(yōu)RF 回歸器高0.048,RMSE降低了2.654 μg/cm2,Corr提高了0.028(圖13(a),圖13(b));而在堆棧集成學(xué)習(xí)回歸模型中,基于OHS數(shù)據(jù)的最優(yōu)GBRT 模型的RMSE 比基于Sentinel-2A數(shù)據(jù)的最優(yōu)XGBoost 模型降低了2.049 μg/cm2(圖13(c),圖13(d))。說明OHS 數(shù)據(jù)為最優(yōu)堆棧集成學(xué)習(xí)回歸算法提供了最優(yōu)的擬合數(shù)據(jù)集,OHS 數(shù)據(jù)的RSI(12,17)、DSI(12,18)和NDSI(6,12)組合植被指數(shù)對紅樹林CCC的敏感性較高。

        圖13 OHS與Sentinel-2A數(shù)據(jù)反演紅樹林CCC訓(xùn)練精度對比Fig.13 Comparison of inversing training accuracy of mangrove CCC between OHS and Sentinel-2A data

        本文選取了60 個測試集的目標(biāo)數(shù)據(jù)驗證OHS與Sentinel-2A 數(shù)據(jù)反演紅樹林CCC 的精度(驗證結(jié)果見表6)。通過一元線性擬合,得到聯(lián)合OHS數(shù)據(jù)與最優(yōu)堆棧GBRT 集成學(xué)習(xí)回歸的R2為0.761,RMSE為16.738 μg/cm2(圖14(a));聯(lián)合Sentinel-2A數(shù)據(jù)與最優(yōu)堆棧XGBoost集成學(xué)習(xí)回歸模型的R2為0.615,RMSE 為20.701 μg/cm2(圖14(b));聯(lián)合OHS 數(shù)據(jù)和最優(yōu)堆棧集成學(xué)習(xí)回歸模型的紅樹林CCC 反演精度最高,比Sentinel-2A 數(shù)據(jù)的R2高0.146,RMSE 降低了3.963 μg/cm2。說明基于OHS、Sentinel-2A 數(shù)據(jù)與最優(yōu)堆棧集成學(xué)習(xí)回歸模型都能有效反演紅樹林CCC,而在最優(yōu)堆棧集成學(xué)習(xí)回歸模型下,OHS 數(shù)據(jù)比Sentinel-2A 數(shù)據(jù)的預(yù)測精度更高。基于OHS、Sentinel-2A 數(shù)據(jù)與最優(yōu)堆棧集成學(xué)習(xí)回歸模型預(yù)測值之間的R2>0.7、RMSE<14 μg/cm2和Corr>0.8(圖14(f)),說明兩種數(shù)據(jù)源的預(yù)測值之間具有很高的相關(guān)性。

        圖14 基于多源數(shù)據(jù)和最優(yōu)反演模型的紅樹林CCC精度對比Fig.14 Comparison of inversing accuracy of mangrove CCC between OHS and sentinel-2A data using optimal models

        聯(lián)合OHS、Sentinel-2A 數(shù)據(jù)與最優(yōu)堆棧集成學(xué)習(xí)回歸模型都實現(xiàn)了紅樹林CCC 的有效估算,將兩種數(shù)據(jù)源分別與最優(yōu)堆棧集成學(xué)習(xí)回歸模型輸出的預(yù)測值與紅樹林CCC 驗證數(shù)據(jù)集構(gòu)建一元線性擬合回歸方程,見式(12)和式(13)。

        式中,f(α)、f(β)是分別聯(lián)合OHS、Sentinel-2A數(shù)據(jù)與最優(yōu)堆棧集成學(xué)習(xí)回歸模型得到的回歸方程,α、β是分別聯(lián)合OHS、Sentinel-2A 數(shù)據(jù)與最優(yōu)堆棧集成學(xué)習(xí)回歸模型輸出的預(yù)測值。

        4.3 最優(yōu)紅樹林CCC 反演模型與SNAP-SL2P 算法精度驗證與結(jié)果分析

        本文利用60 個紅樹林CCC 驗證數(shù)據(jù)集評估分別基于OHS、Sentinel-2A 數(shù)據(jù)與最優(yōu)堆棧集成學(xué)習(xí)回歸模型、SNAP-SL2P 算法反演紅樹林CCC 的精度(驗證結(jié)果見表6)。SNAP-SL2P 算法估計紅樹林CCC 的R2為0.356,RMSE 為49.419 μg/cm2(圖14(c));基于OHS 數(shù)據(jù)的最優(yōu)堆棧GBRT 集成學(xué)習(xí)回歸模型比SNAP-SL2P 算法反演紅樹林CCC 的R2高0.405,RMSE 降低了32.681 μg/cm2;而在相同Sentinel-2A數(shù)據(jù)源下,最優(yōu)堆棧XGBoost集成學(xué)習(xí)回歸模型對比SNAP-SL2P 算法的R2提高了0.259,RMSE 降低了28.718 μg/cm2;SNAP-SL2P算法反演紅樹林CCC 的精度最低,R2小于0.4,RMSE大于40 μg/cm2,說明最優(yōu)堆棧集成學(xué)習(xí)回歸模型比SNAP-SL2P 算法在反演紅樹林CCC 中更具有可靠性。SNAP-SL2P算法在估算紅樹林CCC時,存在明顯的系統(tǒng)低估,尤其在估計LAI時,SNAPSL2P 算法估算的LAI 均值(1.226)比實測值(2.014)低估了近一倍。環(huán)境因素會對SNAP-SL2P算法中PROSAIL 模擬的冠層反射率值造成一定程度的影響,而由OHS 數(shù)據(jù)計算的最優(yōu)特征變量有效避免了紅樹林地區(qū)土壤、海區(qū)污染物和海水等環(huán)境因子的影響。

        表6 基于多源數(shù)據(jù)和不同回歸模型的紅樹林CCC反演精度對比分析Table 6 Comparison of inversing accuracy of mangrove CCC between different regression models and multi-sources data

        本文對3種紅樹林CCC反演方法的預(yù)測值進(jìn)行了回歸分析(圖14),聯(lián)合OHS數(shù)據(jù)和最優(yōu)堆棧集成學(xué)習(xí)回歸模型的預(yù)測值與SNAP-SL2P 算法的估算值R2為0.501,RMSE 為48.734 μg/cm2,相關(guān)系數(shù)Corr 為0.708(圖14(d));聯(lián)合Sentinel-2A 數(shù)據(jù)和最優(yōu)堆棧集成學(xué)習(xí)回歸模型的預(yù)測值與SNAP-SL2P 算法的估算值R2為0.723,RMSE 為43.432 μg/cm2,Corr 為0.850(圖14(e))。SNAPSL2P 算法估算值與分別基于OHS、Sentinel-2A 數(shù)據(jù)的最優(yōu)堆棧集成學(xué)習(xí)回歸模型預(yù)測值之間的Corr均大于0.7,說明3 種反演方法的預(yù)測值之間具有較高的相關(guān)性。雖然在相同的Sentinel-2A 數(shù)據(jù)源下,最優(yōu)堆棧集成學(xué)習(xí)回歸模型預(yù)測值與SNAPSL2P 算法估算值間有著較高的Corr(>0.8)和R2(>0.7),但是SNAP-SL2P 算法的RMSE 大于43 μg/cm2,說明SNAP-SL2P 算法在紅樹林CCC 反演中存在明顯的系統(tǒng)性低估。聯(lián)合OHS 數(shù)據(jù)和最優(yōu)堆棧集成學(xué)習(xí)回歸模型的預(yù)測值與SNAP-SL2P算法的估算值的R2(<0.6)、RMSE(>48 μg/cm2)和Corr(<0.8)最低,這是由于兩者的數(shù)據(jù)源和算法之間都存在差異性,說明基于OHS 數(shù)據(jù)的最優(yōu)堆棧集成學(xué)習(xí)回歸模型、SNAP-SL2P 算法不能同時有效反演紅樹林CCC。

        SNAP-SL2P 算法在紅樹林CCC 反演中出現(xiàn)了明顯的系統(tǒng)性低估。在研究區(qū)上,利用SNAPSL2P 算法繪制的LAI、LCC 專題圖(圖15)可以有效刻畫研究區(qū)紅樹林LAI和LCC的空間分布,有助于監(jiān)測紅樹林健康狀況。蘇屋村分布的樹種主要是白骨壤,研究區(qū)中間的河道附近的紅樹林LAI及LCC較高,而道路沿岸的紅樹林LAI與LCC較低(圖15(a),圖15(c))。沙角村主要分布著白骨壤、桐花樹和秋茄,研究區(qū)域內(nèi)高緯度地區(qū)主要分布著秋茄與桐花樹,而相對低緯度地區(qū)主要分布著白骨壤與秋茄(圖15(b),圖15(d))。高緯度地區(qū)的LAI與LCC值比低緯度的高,與該地區(qū)桐花樹的分布面積較大有關(guān)。

        圖15 基于SNAP-SL2P算法提取的研究區(qū)紅樹林LAI及LCC值Fig.15 LAI and LCC value of mangrove calculated by SNAP-SL2P algorithm

        5 結(jié)論

        本文以O(shè)HS 和Sentinel-2A 為數(shù)據(jù)源,通過數(shù)據(jù)降維和變量優(yōu)選,構(gòu)建了最優(yōu)堆棧集成學(xué)習(xí)回歸模型,實現(xiàn)了北部灣紅樹林CCC 的高精度反演,得出以下結(jié)論:

        (1)實現(xiàn)了正態(tài)分布檢驗、最大相關(guān)系數(shù)法和基于XGBoost 算法的特征選擇方法對OHS 數(shù)據(jù)1498 個高維數(shù)據(jù)集進(jìn)行特征降維和變量優(yōu)選,優(yōu)選出8 個最優(yōu)特征變量,其中RSI(12,17)、DSI(12,18)和NDSI(6,12)組合植被指數(shù)對紅樹林CCC 的敏感性較高;

        (2)對比了單一線性回歸和機(jī)器學(xué)習(xí)回歸模型與堆棧集成學(xué)習(xí)回歸模型的訓(xùn)練精度,OHS數(shù)據(jù)最優(yōu)堆棧GBRT 集成學(xué)習(xí)回歸模型(Score=0.999,RMSE=0.963 μg/cm2,Corr=0.999),比最優(yōu)機(jī)器學(xué)習(xí)RF 回歸器的RMSE 降低了7.531 μg/cm2,比最優(yōu)線性Lasso 回歸器的RMSE 降低了19.383 μg/cm2,堆棧集成學(xué)習(xí)回歸模型是訓(xùn)練精度最高的反演模型;

        (3)對比了OHS 和Sentinel-2A 數(shù)據(jù)反演紅樹林CCC 的精度,OHS 數(shù)據(jù)(R2=0.761,RMSE=16.738 μg/cm2)比Sentinel-2A 數(shù)據(jù)(R2=0.615,RMSE=20.701 μg/cm2)的R2提高0.146,RMSE 降低了3.963 μg/cm2,OHS 數(shù)據(jù)是反演紅樹林CCC 的最佳數(shù)據(jù)源;

        (4)對比了最優(yōu)堆棧集成學(xué)習(xí)回歸模型與SNAP-SL2P算法估算紅樹林CCC的精度,基于OHS、Sentinel-2A 數(shù)據(jù)的最優(yōu)堆棧集成學(xué)習(xí)回歸模型比SNAP-SL2P 算法(R2=0.356,RMSE=49.419 μg/cm2)的R2分別提高了0.405 和0.259,RMSE 降低了32.681 μg/cm2和28.718 μg/cm2,堆棧集成學(xué)習(xí)回歸模型是紅樹林CCC估算中精度最優(yōu)的反演模型。

        本文在紅樹林CCC 最優(yōu)反演模型和最佳數(shù)據(jù)源的選擇上進(jìn)行了系統(tǒng)性的研究,但是仍需要進(jìn)一步改進(jìn):在紅樹林最優(yōu)反演模型和最優(yōu)數(shù)據(jù)集的構(gòu)建過程中,下一步將采用深度學(xué)習(xí)回歸模型,實現(xiàn)CCC 的高精度智能估算;下一步將采用高空間分辨率的無人機(jī)、多光譜和高光譜數(shù)據(jù)實現(xiàn)紅樹林種群的CCC反演。

        志 謝此次實驗的高光譜衛(wèi)星影像采用了珠海歐比特宇航科技股份有限公司的珠海一號高光譜衛(wèi)星數(shù)據(jù)產(chǎn)品,在此表示衷心的感謝!

        猜你喜歡
        紅樹林模型
        一半模型
        走過紅樹林
        歌海(2024年6期)2024-03-18 00:00:00
        藏著寶藏的紅樹林
        海岸衛(wèi)士——紅樹林
        幼兒園(2021年4期)2021-07-28 07:38:04
        重要模型『一線三等角』
        重尾非線性自回歸模型自加權(quán)M-估計的漸近分布
        神奇的紅樹林
        走過紅樹林
        歌海(2018年4期)2018-05-14 12:46:15
        3D打印中的模型分割與打包
        FLUKA幾何模型到CAD幾何模型轉(zhuǎn)換方法初步研究
        69精品免费视频| 欧洲熟妇色xxxx欧美老妇软件| 少妇下面好紧好多水真爽播放| 亚洲另类激情综合偷自拍图| 超级碰碰人妻中文字幕| 日韩人妖干女同二区三区| 成人欧美一区二区三区在线观看| 无套内谢的新婚少妇国语播放| 欧美日韩中文亚洲另类春色| 国产精品三级在线不卡| 人妻丰满少妇一二三区| 成人影院在线观看视频免费| 亚洲精品www久久久久久| 无码丰满少妇2在线观看| 久久久亚洲精品免费视频| 久久av不卡人妻出轨一区二区| 麻豆精品国产精华液好用吗| 国产精品久免费的黄网站| 日韩在线中文字幕一区二区三区| 水蜜桃精品视频在线观看| 特黄特色的大片观看免费视频 | 人人狠狠综合久久亚洲| 日本精品一区二区三本中文| 国产精品美女主播在线| (无码视频)在线观看| 人妻夜夜爽天天爽| 国产伦精品一区二区三区视| 国产精品三级1区2区3区| 洲色熟女图激情另类图区| 日本不卡一区二区三区在线| 在线亚洲+欧美+日本专区| 亚洲中文字幕精品久久久| 含紧一点h边做边走动免费视频| 亚洲日韩乱码中文无码蜜桃臀| 免费观看视频在线播放| 国产成人一区二区三区乱| 亚洲色无码国产精品网站可下载 | 人妻少妇一区二区三区| 日韩精品极视频在线观看免费| 久久久无码精品亚洲日韩蜜臀浪潮 | 老师粉嫩小泬喷水视频90|