亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于光譜-環(huán)境隨機森林回歸模型的MODIS積雪面積比例反演研究

        2022-06-19 01:06:02孫興亮郝曉華趙宏宇紀文政
        冰川凍土 2022年1期
        關(guān)鍵詞:積雪反演光譜

        孫興亮, 郝曉華, 王 建, 趙宏宇, 紀文政

        (1.蘭州交通大學測繪與地理信息學院,甘肅蘭州 730070; 2.中國科學院西北生態(tài)環(huán)境資源研究院,甘肅蘭州 730000;3.地理國情監(jiān)測技術(shù)應用國家地方聯(lián)合工程研究中心,甘肅蘭州 730070; 4.甘肅省地理國情監(jiān)測工程實驗室,甘肅蘭州 730070; 5.北京師范大學地表過程與資源生態(tài)國家重點實驗室,北京 100875)

        0 引言

        積雪是冰凍圈重要的組成要素之一,是氣候變化的指示器。積雪面積作為積雪的一個重要特征,對于區(qū)域水文、地表能量過程具有重要的意義[1-3]。遙感積雪面積數(shù)據(jù)由于覆蓋面積大,時空分辨率較高,已被廣泛應用在積雪面積的反演研究中[4]。遙感積雪面積數(shù)據(jù)主要分為二值積雪面積數(shù)據(jù)和積雪面積比例數(shù)據(jù)。二值積雪面積數(shù)據(jù)反演的精度與雪深、地形和地表類型密切相關(guān),研究表明斑狀分布的積雪、山區(qū)或林區(qū)分布的積雪,由于混合像元的影響,二值積雪面積數(shù)據(jù)很難反映積雪分布特征[5-7]。FSC數(shù)據(jù)用像元內(nèi)積雪覆蓋的比例來表示積雪覆蓋的面積[8],可以在亞像元尺度上定量描述像元內(nèi)積雪的覆蓋程度,相比于二值積雪面積數(shù)據(jù)可以更加準確地估計積雪覆蓋面積[9-10]。

        MODIS FSC 比例數(shù)據(jù)已經(jīng)取代二值積雪面積數(shù)據(jù)作為許多水文和大氣模型的重要輸入?yún)?shù)[11-13]。目前,MODIS FSC 的提取方法主要包括三種:線性回歸模型、混合像元分解模型和機器學習模型。線性回歸模型主要是利用FSC 和與其相關(guān)的指數(shù)[如歸一化植被指數(shù)(Normalized Difference Vegetation Index,NDVI)、歸一化積雪指數(shù)(Normal?ized Difference Snow Index,NDSI)等]間的線性關(guān)系構(gòu)建回歸模型,許多學者都做了大量的研究[14-16]。代表性研究成果主要是Salomonson 等[16]構(gòu)建的線性回歸模型(FSC_NDSI),該模型被NASA 的MO?DIS 全球積雪覆蓋產(chǎn)品所采用?;旌舷裨纸饽P椭饕沁x擇圖像端元,通過線性光譜混合分析模型(LSMA)進行解混以獲取FSC。代表性研究主要包括:Painter 等[17]結(jié)合LSMA 模型和積雪輻射傳輸模型發(fā)展了一種針對MODIS 數(shù)據(jù)的FSC 提取的算法MODSCAG;施建成[18]發(fā)展了一種改進“多端元光譜混合分析”方法反演MODIS FSC,該算法通過對MOD09GA 數(shù)據(jù)進行圖像端元自動提取,并利用能夠代表圖像端元類的典型端元庫進行“多端元光譜混合分析”反演FSC 數(shù)據(jù);Zhao 等[19]考慮地表類型信息對FSC 提取的影響,提出了一種基于空間光譜環(huán)境(SSE)信息的端元提取算法,并結(jié)合LSMA 模型提取MODIS FSC 的算法(SSEmod)。機器學習也是目前獲取MODIS FSC 的新方法,其中代表性研究包括:Dobreva 等[20]首次利用人工神經(jīng)網(wǎng)絡(ANN)模型來反演MODIS FSC,取得了良好效果;Czyzowsk等[21]、Hou等[22-23]在此基礎上考慮了地形、溫度、海拔、地表覆蓋類型等環(huán)境信息,有效地提高了MODIS FSC 數(shù)據(jù)制備的精度。以上研究表明,機器學習方法能夠有效地反演FSC,進一步結(jié)合環(huán)境信息,可以提高FSC的反演精度。

        綜合提取MODIS FSC 的三種常用方法,線性回歸模型物理意義明確,易于實現(xiàn),但僅僅考慮NDSI 與FSC 之間的關(guān)系,忽略了地形、地表類型等環(huán)境信息對FSC 提取的影響?;旌舷裨纸饽P屯ㄟ^考慮地表類型信息可以有效提高積雪識別精度,但在地形復雜、地表覆蓋類型多樣的地區(qū)仍然會高估或者低估積雪覆蓋面積,需引入更多影響積雪識別的環(huán)境信息,使算法在估計積雪覆蓋面積上有更好的精度[24]。相比線性回歸模型和混合像元分解模型,機器學習模型結(jié)合環(huán)境信息(地形、地表覆蓋類型)在高山區(qū)反演FSC 具有更高的精度[22-23],但利用ANN 模型處理高維數(shù)據(jù)的回歸問題時收斂速度慢且易造成過擬合[25]。已有研究表明[26],相較于支持向量機(Support Vector Machine,SVM)和ANN模型,隨機森林(Random Forest)在山區(qū)積雪面積提取中更加準確,具有良好的魯棒性。在以往利用隨機森林模型反演FSC 的研究[26-27]中,特征數(shù)據(jù)的選擇多集中于地表反射率、積雪指數(shù)、DEM 等信息,忽略了地形、地表溫度、地表覆蓋類型等環(huán)境信息對FSC提取的影響。

        因此,本研究利用隨機森林回歸(Random For?est Regressor)模型易于架構(gòu)、抗噪性能強、防止過擬合的優(yōu)點,引入了成像角度(觀測角度)、地形、地表覆蓋類型、地表溫度、降雪等環(huán)境信息,構(gòu)建了的光譜-環(huán)境隨機森林回歸模型(Spectral Environment Random Forest Regressor,SE-RFR)并用于中國區(qū)域FSC 反演。并利用Landsat 8 地表反射率數(shù)據(jù)生成的FSC 對其進行了精度評估,分析了環(huán)境信息的引入對隨機森林回歸模型提取FSC 的作用,并且與三種MODIS FSC 反演算法(FSC_NDSI、MODSCAG、SSEmod)獲取的FSC 數(shù)據(jù)進行了對比,客觀地描述SE-RFR模型的反演精度。

        1 數(shù)據(jù)及預處理

        本研究中主要使用MOD09GA 地表反射率數(shù)據(jù)、MCD12Q1 地表類型數(shù)據(jù)、ERA5-Land 再分析數(shù)據(jù)、SRTM 數(shù)字高程數(shù)據(jù)和Landsat 8 地表反射率數(shù)據(jù)。MOD09GA、MCD12Q1、ERA5-LAND 和SRTM數(shù)據(jù)主要用于提取隨機森林回歸模型的輸入數(shù)據(jù)。Landsat 8 地表反射率數(shù)據(jù)用于制備“真值”FSC,一部分用作模型的輸入數(shù)據(jù),另一部分作為驗證數(shù)據(jù),來對模型進行精度評估。以上輸入數(shù)據(jù)在輸入SE-RFR 模型前需采用min-max 標準化法進行歸一化處理,以避免方差過大的特征對機器學習算法造成影響[28],所有輸入數(shù)據(jù)需選取與Landsat 8 數(shù)據(jù)時間、空間范圍一致的影像數(shù)據(jù),并采用與Landsat 8影像一致的投影系統(tǒng)將其重投影。

        1.1 MOD09GA

        MOD09GA 逐日地表反射率數(shù)據(jù)源于NASA(https://search. earthdata. nasa. gov),空間分辨率為500 m,正弦投影且已經(jīng)過大氣校正。該數(shù)據(jù)是本研究的主要數(shù)據(jù)源,輸入數(shù)據(jù)包括七個通道地表反射率數(shù)據(jù)(b01-b07),太陽天頂角、太陽方位角、傳感器天頂角、傳感器方位角四個角度數(shù)據(jù)和NDVI、NDSI、歸一化林地積雪指數(shù)(Normalized Difference Forest Snow Index,NDFSI)三個指數(shù)數(shù)據(jù)。在提取輸入數(shù)據(jù)前,需利用MOD09GA的質(zhì)量評估QA提供的云掩膜信息來去除云像元,以免對模型訓練造成影響。

        1.2 MCD12Q1

        MCD12Q1地表覆蓋類型數(shù)據(jù)[29]來源于NASA,空間分辨率為500 m,正弦投影,可以提供逐年全球地表覆蓋類型數(shù)據(jù),數(shù)據(jù)覆蓋時間自2001年至2019年,包含13 個科學數(shù)據(jù)集,5 個分類標準(IGBP,UMD,LAI,BGC,PFT)。本研究中使用了國際地圈-生物圈計劃(IGBP)分類標準的地表類型數(shù)據(jù),共包含17種地表類型,從1到9的IGBP代碼被視為代表林冠高度超過2 m且樹木覆蓋率高于30%的森林區(qū)域,而其他IGBP代碼被歸類為非森林區(qū)域。該數(shù)據(jù)是隨機森林回歸模型輸入數(shù)據(jù)中的重要環(huán)境信息,用于區(qū)分森林與非森林區(qū)域,同時也用來評估FSC數(shù)據(jù)在不同地表覆蓋類型下的精度。

        1.3 ERA5-Land與SRTM 數(shù)字高程數(shù)據(jù)

        ERA5-Land 再分析數(shù)據(jù)源于哥白尼氣候數(shù)據(jù)庫(Copernicus Climate Data Store),時間分辨率為1 h,空間分辨率為0.1 rad,GLL 經(jīng)緯度投影,數(shù)據(jù)覆蓋時間自1981 年1 月至2021 年5 月。本研究主要利用該數(shù)據(jù)集中的地表溫度和降雪數(shù)據(jù)作為隨機森林回歸模型的輸入數(shù)據(jù)。MODIS Terra 在當?shù)厣衔邕^境,為了將再分析資料與衛(wèi)星觀測數(shù)據(jù)相匹配,本研究中地表溫度數(shù)據(jù)為當日12:00 前的平均地表溫度,降雪數(shù)據(jù)為當日12:00 前的累積降雪。SRTM 數(shù)字高程數(shù)據(jù)源于NASA,空間分辨率為90 m,WGS 84 投影,主要用于提取高程數(shù)據(jù),并基于高程數(shù)據(jù)采用4鄰域法計算坡度、坡向。

        1.4 Landsat 8地表反射率數(shù)據(jù)

        Landsat 8 地表反射率數(shù)據(jù)由美國地質(zhì)調(diào)查局(United States Geological Survey,USGS)提供,已經(jīng)過大氣校正,空間分辨率為30 m,時間分辨率為16 d,WGS84 UTM 投影。本數(shù)據(jù)主要用于制備Landsat 8 FSC 數(shù)據(jù)(L8-FSC)。制備L8-FSC 時先根據(jù)Wang 等[30]開發(fā)改進的SNOMAP 算法從Landsat 8 地表反射率數(shù)據(jù)中提取積雪二值影像,改進的SNOMAP 算 法 采 用NDVI、NDSI 和NDFSI 相 結(jié) 合的方法來提取積雪像元。然后將30 m 的積雪二值數(shù)據(jù)聚合成分辨率為500 m 的FSC 數(shù)據(jù)[7]。聚合公式由式(1)給出。

        式中:[]表示取整;n 表示一個500 m 分辨率像元內(nèi)30 m分辨率像元的個數(shù);s表示一個500 m分辨率像元內(nèi)30 m分辨率積雪像元的個數(shù)。

        本研究在2014—2020 年積雪期(本年11 月1 日至次年3月31日)期間共選取了中國區(qū)域內(nèi)的32景Landsat 8 地表反射率影像數(shù)據(jù)來制備L8-FSC。選取原則:影像數(shù)據(jù)無云(云覆蓋率小于2%)且積雪覆蓋率在30%~90%之間。其中,20 景影像用于SERFR模型的訓練,約有230多萬個有效像元;12景影像用于驗證SE-RFR模型的準確性,約有130多萬個有效像元。其中訓練樣本與驗證樣本相互獨立,訓練樣本及驗證樣本主要選自東北-內(nèi)蒙古、北疆、青藏高原三大積雪區(qū),積雪區(qū)及樣本的空間分布如圖1所示。

        圖1 研究區(qū)概況及樣本數(shù)據(jù)的空間分布Fig.1 The location of the study and the spatial distribution of samples data

        2 研究方法

        2.1 光譜-環(huán)境隨機森林回歸模型的構(gòu)建

        2.1.1 隨機森林回歸模型

        隨機森林回歸模型[31]是一種基于回歸決策樹的集成學習模型,取各決策樹{h(x,θt)}的均值回歸預測的結(jié)果:

        式中:x為自變量;θt為服從獨立同分布的隨機變量;T 為決策樹數(shù)量;h(x,θt)為基于x 和θt的輸出。此外,隨機森林回歸算法引入了Bagging 思想[32],隨機獨立地抽取子樣本集、獨立地構(gòu)建決策樹進行計算,并且在構(gòu)建決策樹時,每個節(jié)點隨機選取特征子集,從中選取最優(yōu)特征進行分裂。這使得模型擁有更好的預測能力,對噪聲、異常值有很好的容忍度,并在一定程度上避免過擬合。

        2.1.2 構(gòu)建光譜-環(huán)境隨機森林回歸模型

        考慮環(huán)境信息對提取FSC 數(shù)據(jù)的影響,本研究結(jié)合光譜信息(地表反射率、NDVI、NDSI、NDFSI)和環(huán)境信息(成像角度、地形、地表類型、地表溫度及降雪)構(gòu)建了SE-RFR 模型。光譜-環(huán)境信息作為特征數(shù)據(jù),詳細信息如表1 所示,L8-FSC 作為“真值”數(shù)據(jù),兩者輸入到隨機森林回歸模型中進行訓練,進而優(yōu)化參數(shù)獲取性能較好的光譜-環(huán)境隨機森林回歸(SE-RFR)模型。

        表1 特征數(shù)據(jù)的詳細信息Table 1 The detailed information of feature data

        隨機森林回歸模型有放回的抽取樣本數(shù)據(jù)(袋內(nèi)樣本)用于決策樹的訓練,其余數(shù)據(jù)(袋外樣本,OOB)便可作為測試集數(shù)據(jù)與真值計算得到泛化分數(shù)(1 和泛化誤差的差),用于估計模型的精度,避免使用交叉驗證等方法來評價模型精度,大大節(jié)省了模型訓練花費的時間。影響隨機森林回歸模型精度的參數(shù)主要有兩個:決策樹數(shù)目(n_trees)和樹的最大深度(max_depth),即決策樹的最大節(jié)點數(shù)。因此采用OOB 泛化分數(shù)(OOB_Score)為指標,選擇最優(yōu)的參數(shù)組合n_trees 和max_depth,SE-RFR 模型的實現(xiàn)及FSC的反演流程如圖2所示。

        圖2 SE-RFR模型的實現(xiàn)及FSC的反演流程Fig.2 Processing flowchart of SE-RFR model

        訓練過程主要分為兩步,首先根據(jù)OOB_Score選取合適的參數(shù)max_depth,再根據(jù)選好的參數(shù)max_depth 選擇合適的參數(shù)n_trees。圖3(a)、3(b)分別為參數(shù)max_depth、n_trees 的訓練過程,隨著樹的增多,模型精度的增益會很小[33],因此本研究中SE-RFR的n_trees和max_depth被設置為1 500、40。

        圖3 OOB_Score值隨參數(shù)max_depth、n_trees的變化情況Fig.3 The change of OOB_Score value with the change of parameters max_depth and n_trees

        2.2 其他MODIS FSC反演算法

        本研究中為了客觀評價SE-RFR 模型的精度,本文將其與三種常用的MODIS FSC 反演算法(FSC_NDSI、MODSCAG、SSEmod)進行比較,這三種反演算法的模型介紹如下。

        FSC_NDSI 線性回歸模型,由Salomonson 等[8]利用歸一化積雪指數(shù)(NDSI)與FSC 之間的線性關(guān)系構(gòu)建的簡單線性回歸模型,該算法被NASA 的MODIS 全球積雪覆蓋產(chǎn)品(MOD10A1)所采用,計算簡單,但具有較大的不確定性,其計算公式如式(3)所示。

        FSC=1.45NDSI-0.01 (3)

        MODSCAG 模型[17]是根據(jù)野外和實驗室采集光譜獲取非積雪端元光譜庫,主要非積雪端元包含植被、巖石和土壤端元,對于積雪端元,通過輻射傳輸模型模擬不同粒徑的積雪光譜建立光譜庫。本研究通過漸進輻射傳輸模型(Asymptotic Radia?tive Transfer,ART)模擬了不同粒徑的積雪光譜[34-35],通過多端元線性光譜混合分析模型,根據(jù)誤差最小迭代原則計算獲取了最優(yōu)的FSC。該算法物理機制明確,但未考慮非積雪端元隨影像動態(tài)變化,并且模型模擬的積雪光譜與實際積雪光譜存在差異。

        SSEmod 模型[19]是考慮地表類型信息對FSC 提取的影響,提出了一種基于空間光譜環(huán)境(SSE)信息的動態(tài)積雪和非積雪端元自動提取算法,并結(jié)合線性光譜混合分析模型來提取MODIS FSC。該模型主要特點是引入地表類型信息來初步估計端元的數(shù)量,減少候選端元的譜冗余。此外,在林區(qū)和非林區(qū)提取了不同數(shù)量和類型的積雪端元,通過動態(tài)閾值分割方法選擇其他端元,并根據(jù)候選端元像素的光譜差異來調(diào)整最終的端元,從算法原理上具有較高的精度,主要受限于MODIS 地表反射率產(chǎn)品(MOD09GA)波段的數(shù)量,導致該算法在復雜地表類型條件下精度較低。

        2.3 精度評估方法

        12 景Landsat 8 地表反射率數(shù)據(jù)生成的L8-FSC作為真值來驗證SE-RFR 模型反演FSC 的精度。采用均方根誤差(Root Mean Square Error,RMSE)和平均絕對誤差(Mean Absolute Error,MAE)作為模型精度的評價因子。RMSE、MAE 可根據(jù)式(4)、(5)計算

        式中:xi和yi分別為FSC數(shù)據(jù)像元的真值和反演值;n為數(shù)據(jù)的樣本個數(shù)。

        3 結(jié)果與討論

        3.1 光譜-環(huán)境隨機森林模型的精度評估

        本文利用中國12 景L8-FSC 數(shù)據(jù)作為真值對SE-RFR 模型進行精度評估,精度驗證結(jié)果如表2所示。結(jié)果表明12 景驗證數(shù)據(jù)總體上RMSE 和MEA分別為0.160、0.104,產(chǎn)品的精度較高。由于積雪特征存在顯著的空間差異,本研究驗證了模型在不同積雪區(qū)的精度,可以看到,模型在北疆積雪區(qū)RMSE 和MAE 分別為0.110、0.058,在東北-內(nèi)蒙古積雪區(qū)RMSE 和MEA 分別為0.169、0.113,在青藏高原積雪區(qū)RMSE 和MAE 分別為0.181、0.129。僅看RMSE 指標,北疆雪區(qū)精度最高,東北-內(nèi)蒙古雪區(qū)次之,青藏高原雪區(qū)較差。模型精度的差異是由積雪區(qū)不同的積雪特征引起的,北疆雪區(qū)由于地勢平坦,積雪大范圍分布,混合像元相對較少;東北雪區(qū)由于森林分布廣泛,林區(qū)內(nèi)混合像元較多,導致精度略低;青藏高原雪區(qū)降雪較少且地形復雜,積雪多呈現(xiàn)斑狀塊分布,混合像元較多,因而相對來說精度最低。

        表2 中國三大積雪區(qū)內(nèi)SE-RFR模型的平均精度驗證結(jié)果Table 2 The average accuracy validation results of the SE-RFR model in three snow-covered regions of China

        為了驗證SE-RFR 模型在不同地表覆蓋類型條件下的反演精度,按1.2 節(jié)中的地表覆蓋類型數(shù)據(jù)將12景驗證影像分為林區(qū)與非林區(qū)像元,對其進行精度評估。精度驗證結(jié)果如表3 所示,非林區(qū)的RMSE 和MEA 分別為0.139、0.085;林區(qū)的RMSE和MEA 分別為0.235、0.192。SE-RFR 模型在林區(qū)和非林區(qū)精度都較高,但非林區(qū)具有更高的精度。

        表3 林區(qū)與非林區(qū)SE-RFR模型的平均精度驗證結(jié)果Table 3 The average accuracy validation results of the SE-RFR model in forest areas and non-forest areas

        為研究SE-RFR 模型對FSC 低值區(qū)、中值區(qū)、高值區(qū)的反演精度,本研究將FSC 根據(jù)數(shù)值大小分為三級,第一級為(0.15,0.50],表示低值區(qū);第二級為(0.50,0.80],表示中值區(qū);第三級為(0.80,1.00],表示高值區(qū)。對于FSC 值小于0.15的區(qū)間,由于數(shù)值太低,存在較大的不確定性,不參與精度評估。對SE-RFR 模型反演的FSC 進行驗證,驗證結(jié)果如表4 所示。低值區(qū)RMSE 和MAE 分別為0.222、0.177,中值區(qū)RMSE 和MAE 分別為0.183、0.146,高值區(qū)RMSE 和MAE 分別為0.122、0.071,高值區(qū)精度最高,低值區(qū)最低。表明該模型對于中、高值區(qū)反演校準,而低值區(qū)精度略低,因此該模型具有較高的可靠性。圖4進一步展示了不同分級FSC 的反演值和真值的空間密度分布圖,可以看到中高值區(qū)間內(nèi)沿對角線分布的六邊形顏色呈紅色,表明像元分布較多,反演精度較高,特別是高值區(qū)內(nèi)大部分呈紅色,說明反演值與真值基本一致,表明了算法的穩(wěn)定性和可靠性。

        圖4 不同分級FSC反演值和真值的六邊形分箱圖Fig.4 The spatial density distribution map of the inversion value and true value of different grades of FSC

        表4 各區(qū)間SE-RFR模型反演FSC的精度驗證結(jié)果Table 4 The average accuracy validation results of SE-RFR FSC in different sections

        3.2 光譜-環(huán)境隨機森林回歸模型對環(huán)境信息的依賴性

        為了評估環(huán)境信息對于隨機森林回歸模型的重要性,本文分別對引入環(huán)境信息(成像角度、地形、地表溫度、地表覆蓋類型、降雪等)前后的隨機森林回歸模型進行比較分析(引入環(huán)境信息前的隨機森林回歸模型本文簡稱為S-RFR)。本研究同樣用12 景L8-FSC 驗證數(shù)據(jù)對S-RFR 和SE-RFR 模型進行精度評估,表5 展示了精度驗證結(jié)果。S-RFR和SE-RFR 模型RMSE 分別為0.171、0.160,MAE分別為0.107、0.104,加入環(huán)境信息后,RMSE 降低了0.011,MAE 降低了0.003。北疆與東北-內(nèi)蒙古積雪區(qū)精度提高較少,RMSE 分別從0.125、0.172降低到0.110、0.169,青藏高原積雪區(qū)精度提高較大,RMSE 從0.200降低到0.181,降低了0.019。結(jié)果表明地形、地表溫度、地表覆蓋類型等環(huán)境信息的引入,可以有效提高隨機森林回歸模型對青藏高原山區(qū)斑狀積雪的識別精度。圖5進一步展示了青藏高原山區(qū)斑狀積雪的反演結(jié)果,可以明顯看出SRFR 模型反演的FSC 對斑狀積雪高估,尤其在地形起伏變化較大的山區(qū),SE-RFR模型反演的FSC與真值更為接近,說明引入了環(huán)境信息的SE-RFR 模型有效地提高了青藏高原山區(qū)斑狀積雪的識別精度。

        表5 中國不同積雪區(qū)S-RFR、SE-RFR模型的平均精度驗證結(jié)果Table 5 The average accuracy validation results of the S-RFR and SE-RFR model in three snow-covered regions of China

        3.3 與其他MODIS FSC反演算法的比較

        為了客觀評價SE-RFR 模型的精度,我們又將SE-RFR 模型與線性回歸模型FSC_NDSI,混合像元分解模型MDOSCAG、SSEmod 進行比較分析。在此使用相同的12 景L8-FSC 驗證數(shù)據(jù)對各模型進行精度驗證。

        圖6 展 示 了 由FSC_NDSI、MODSCAG、SSE?mod和SE-RFR 模型反演的12景驗證數(shù)據(jù)的平均精度(RMSE),可以明顯看出與其他模型相比SE-RFR模型的反演精度最高,且具有較好的準確性與穩(wěn)定性。表6 進一步統(tǒng)計了各模型的平均RMSE 和平均MAE,可以看到FSC_NDSI、MODSCAG、SSEmod和SE-RFR 模型的平均RMSE 分別為0.280、0.243、0.215 和0.160,平 均MAE 分 別 為0.208、0.136、0.117 和0.104。結(jié)果表明,相較于FSC_NDSI、MODSCAG 和SSEmod 模型,SE-RFR 模型的平均RMSE 提高了12.0%、8.3%和5.5%,平均MAE 分別提高了10.4%、3.2%和1.3%。總體來說,SERFR 模型的精度最高,SSEmod 模型次之,其次是MODSCAG 模型,F(xiàn)SC_NDSI 模型精度最差。圖7展 示 了 使 用SE-RFR、SSEmod、MODSCAG 和FSC_NDSI 模型在三大積雪區(qū)獲取的FSC 影像,可以明顯看出SE-RFR 模型反演的FSC 更接近于真值。結(jié)果表明,在提取MODIS FSC 時,基于物理機制的混合像元分解模型要優(yōu)于基于統(tǒng)計關(guān)系的FSC_NDSI 模型;考慮動態(tài)光譜庫的混合像元分解模型SSEmod 要優(yōu)于端元固定的混合像元分解模型MODSCAG;在目前MODIS 地表反射率產(chǎn)品(MOD09GA)僅有7 個波段的條件限制下,考慮物理過程約束(光譜、環(huán)境信息)的SE-RFR 模型具有更高的FSC提取精度。

        圖6 FSC_NDSI、MODSCAG、SSEmod和SE-RFR FSC的精度驗證結(jié)果(NC表示東北地區(qū)-內(nèi)蒙古積雪區(qū),TP表示青藏高原積雪區(qū),NX表示北疆積雪區(qū))Fig.6 The accuracy validation result of FSC_NDSI,MODSCAG,SSEmod,and SE-RFR FSC(NC,TP,NX respectively represent the Northeast China-Inner Mongolia snow area,the Qinghai-Tibet Plateau snow area,and the northern Xinjiang snow area)

        圖7 L8-FSC、SE-RFR FSC、SSEmod FSC、MODSCAG FSC和FSC_NDSI FSC在中國不同積雪區(qū)的結(jié)果Fig.7 The result of L8-FSC,SE-RFR FSC,SSEmod FSC,MODSCAG FSC and FSC_NDSI FSC in different snow cover regions of China

        表6 中國區(qū)域不同F(xiàn)SC反演算法的平均精度驗證結(jié)果Table 6 The average accuracy validation results of different methods for FSC retrieval in China

        SE-RFR 模型充分考慮了光譜和環(huán)境信息,并且訓練樣本具有很好的代表性,隨機森林回歸算法隨機獨立地選取特征子集構(gòu)建決策樹,可以充分利用最優(yōu)的特征數(shù)據(jù)進行FSC 反演,模型擁有更好的魯棒性,并在一定程度上避免過擬合?;旌舷裨纸饽P偷木群艽蟪潭壬弦蕾囉诙嗽倪x擇,通過改進端元提取的方法可以提高FSC 估計的精度[10]。SSEmod 模型針對每一幅影像通過動態(tài)閾值分割法自動地提取端元,通過線性光譜混合分析模型獲取FSC,受制于MOD09GA 影像的端元數(shù)量不足,導致算法的精度不高;MODSCAG 模型雖然考慮了不同粒徑的積雪端元,但其非雪端元是固定的,除受制于MOD09GA 影像的端元數(shù)量不足外,對于不同區(qū)域的影像,其端元存在著不確定性和不一致性,導致算法的精度不高。FSC_NDSI 算法僅僅利用了NDSI 與FSC 之間的統(tǒng)計關(guān)系構(gòu)建了經(jīng)驗模型,普適性強,但精度較低。

        3.4 光譜-環(huán)境隨機森林模型的不確定性及展望

        地形、地表溫度、地表類型等環(huán)境信息是影響積雪檢測的重要因素[36]。在東北-內(nèi)蒙古雪區(qū)森林資源豐富,盡管與線性回歸模型相比,混合像元分解模型對林區(qū)積雪提取有了一定改進,但也會低估FSC,主要原因如下,由于林區(qū)樹冠遮擋造成陰影,致使產(chǎn)生一系列的暗像元,削減衛(wèi)星接收的輻射能量,而這些暗像元一般為雪。而SE-RFR 模型在引入地形、地表類型、地表溫度等通用的環(huán)境信息外,又引入成像角度、降雪信息來反演FSC,提高了精度。當然這種問題在引入環(huán)境信息后不可能完全解決,故SERFR FSC 也存在一些高估或低估現(xiàn)象。同樣,青藏高原受地形影響嚴重,山區(qū)陰影也對積雪提取造成影響,降低了混合像元分解模型、線性回歸模型的精度。北疆雪區(qū)地勢較為平坦,地表多為裸土、草原,各模型對其區(qū)域內(nèi)積雪低估程度較小。

        相較于混合像元分解模型,利用隨機森林模型結(jié)合環(huán)境信息反演FSC,使得模型易于構(gòu)建。本研究中SE-RFR 模型共輸入了20 種特征數(shù)據(jù),包括光譜信息與環(huán)境信息,其中三種指數(shù)數(shù)據(jù)是由地表反射率波段信息計算而來,這造成了一定的冗余信息。在后續(xù)研究工作中,需要進一步提高模型的計算效率,使其適于制備產(chǎn)品。

        4 結(jié)論

        本研究利用MODIS 數(shù)據(jù),構(gòu)建了一個考慮光譜信息、環(huán)境信息的光譜-環(huán)境隨機森林回歸模型(SE-RFR)來反演中國區(qū)域的FSC。利用中國典型積雪區(qū)的Landsat 8 FSC 數(shù)據(jù)作為參考值驗證了SERFR 模型的反演精度,評估了SE-RFR 模型對環(huán)境信息的依賴性,同時與FSC_NDSI、MODSCAG 和SSEmod 等國內(nèi)外常用的MODIS FSC 反演模型進行了比較,得到以下結(jié)論:

        (1)利用SE-RFR 模型反演的MODIS FSC 在中國區(qū)域精度較高,平均RMSE、MAE 分別為0.160、0.104。北疆積雪區(qū)精度最高,RMSE 為0.110;東北-內(nèi)蒙古積雪區(qū)次之,RMSE 為0.172;青藏高原積雪區(qū)較差,RMSE為0.181。

        (2)對引入環(huán)境信息前后的隨機森林回歸模型獲取的MODIS FSC 進行了對比,發(fā)現(xiàn)成像角度、地形、地表類型、地表溫度、降雪等環(huán)境信息的引入可以在一定程度上提高FSC 的反演精度。特別是在積雪受地形影響較大的青藏高原地區(qū),RMSE 從0.200 降低到0.181,提高了1.9%,有效解決了斑狀積雪的高估問題。

        (3)將SE-RFR 模型與線性回歸模型(FSC_NDSI)、混合像元分解模型(MODSCAG、SSEmod)進行了對比,表明SE-RFR 模型的精度最高。對于所有積雪區(qū)的平均RMSE,SE-RFR 模型為0.160,與FSC_NDSI、MODSCAG 和SSEmod 模型的平均RMSE(0.280、0.243、0.215)相 比,分 別 提 高 了12.0%、8.3%、5.5%。

        總體而言,SE-RFR 模型算法可以更準確地反演MODIS FSC,并且模型結(jié)構(gòu)簡單易于構(gòu)建,魯棒性強,對于區(qū)域乃至全球MODIS FSC 產(chǎn)品制備具有廣泛的應用前景,從而為區(qū)域水文、氣候模型提供更準確的輸入數(shù)據(jù)。

        猜你喜歡
        積雪反演光譜
        基于三維Saab變換的高光譜圖像壓縮方法
        反演對稱變換在解決平面幾何問題中的應用
        我們
        福建文學(2019年12期)2019-08-06 14:59:46
        大糧積雪 誰解老將廉頗心
        炎黃地理(2017年10期)2018-01-31 02:15:05
        基于低頻軟約束的疊前AVA稀疏層反演
        基于自適應遺傳算法的CSAMT一維反演
        積雪
        2000~2014年西藏高原積雪覆蓋時空變化
        星載近紅外高光譜CO2遙感進展
        中國光學(2015年5期)2015-12-09 09:00:28
        疊前同步反演在港中油田的應用
        日韩精品有码在线视频| 色八区人妻在线视频免费| 日本强好片久久久久久aaa| 在线观看精品国产福利片87| 国产午夜精品综合久久久| 日韩女同视频在线网站| 欧美裸体xxxx极品少妇| 久久综合网天天 | 中文字幕日本韩国精品免费观看 | 亚洲欧美日韩一区二区在线观看| 国产一区二区三区特区| 日本边添边摸边做边爱| 国产美女自慰在线观看| 四虎影视久久久免费| 亚洲第一页在线免费观看| 绝顶高潮合集videos| 久久精品娱乐亚洲领先| 亚洲国产另类久久久精品小说 | 依依成人精品视频在线观看 | 久久久亚洲av午夜精品| 国模精品一区二区三区| 亚洲欧美精品伊人久久| 青青草免费激情自拍视频| 国产精品大片一区二区三区四区| 男人的天堂无码动漫av| 日本色噜噜| 人妻色中文字幕免费视频| 亚洲午夜狼人综合影院| 欧美大屁股xxxxhd黑色| 日韩av一区二区三区四区av| 精品视频手机在线免费观看| 男人女人做爽爽18禁网站| 无码人妻丰满熟妇精品区| 国产三级在线看完整版| 青青草免费手机视频在线观看| 亚洲国产成人久久综合下载 | 亚洲高清美女久久av| 国产一区二区视频免费在线观看| 国产精品毛片久久久久久久| 亚洲国产一区二区三区在线视频 | 黄色大片一区二区中文字幕|