孟鑫垚,劉焱雄,陳義蘭,王燕紅,陸應(yīng)誠(chéng)
(1. 南京大學(xué) 地理與海洋科學(xué)學(xué)院,江蘇 南京 210023;2. 自然資源部 第一海洋研究所,山東 青島 266061)
水深信息是海洋環(huán)境的重要參數(shù)之一,在海上運(yùn)輸、海岸帶管理、珊瑚礁生態(tài)系統(tǒng)保護(hù)和淺海資源開發(fā)方面具有重要意義。船載聲吶測(cè)深系統(tǒng)和機(jī)載激光測(cè)深系統(tǒng)[1]作為傳統(tǒng)水深測(cè)量方式,可以獲取高質(zhì)量、高精度的水深數(shù)據(jù),但是耗時(shí)長(zhǎng)、成本高、覆蓋范圍有限。自20 世紀(jì)60 年代以來(lái),隨著衛(wèi)星遙感的不斷發(fā)展,遙感測(cè)深一直受到廣泛關(guān)注[2]。遙感測(cè)深不受天氣和時(shí)間的約束,能夠?qū)崿F(xiàn)全天候不間斷檢測(cè),具有適用范圍廣、覆蓋面積大、費(fèi)用低、效率高且獲取方便等特點(diǎn)。
目前,利用多光譜遙感數(shù)據(jù)反演水深的模型主要包括理論解析模型[3]、統(tǒng)計(jì)模型[4]和半理論半經(jīng)驗(yàn)?zāi)P蚚5-6]。其中,理論解析模型根據(jù)輻射傳輸方程原理和水體光譜特征構(gòu)建,模型參數(shù)復(fù)雜且難以進(jìn)行推廣;統(tǒng)計(jì)相關(guān)模型根據(jù)實(shí)測(cè)水深資料和遙感影像的灰度值進(jìn)行統(tǒng)計(jì)分析,缺乏相應(yīng)的物理意義;半理論半經(jīng)驗(yàn)?zāi)P蛻?yīng)用最為廣泛,其利用理論模型的簡(jiǎn)化模式,結(jié)合統(tǒng)計(jì)數(shù)據(jù)擬合經(jīng)驗(yàn)參數(shù),提高了反演精度且可移植性強(qiáng)。現(xiàn)有模型在淺海水深的光學(xué)反演方面取得了較好的效果[7]。計(jì)算機(jī)領(lǐng)域技術(shù)的發(fā)展為研究水深反演方法提供了機(jī)遇和條件,如機(jī)器學(xué)習(xí)算法在解決多變量、非線性復(fù)雜問(wèn)題等方面具有出色的模擬能力,能夠克服人為因素的局限性,近年來(lái)被廣泛應(yīng)用于多光譜水深反演。Ai 等[8]根據(jù)像素之間的空間自相關(guān)性采用卷積神經(jīng)網(wǎng)絡(luò)構(gòu)建模型,并對(duì)北島水深分布情況進(jìn)行了反演。Sagawa 等[9]采用隨機(jī)森林算法和多時(shí)相衛(wèi)星圖像創(chuàng)建深度反演模型,結(jié)果表明模型適用于水質(zhì)清澈條件下的各種淺水區(qū)域。Misra 等[10]使用支持向量機(jī)(Support Vector Machine, SVM)模型對(duì)荷蘭圣馬丁島水深進(jìn)行反演,驗(yàn)證了支持向量機(jī)在淺海水深反演中的性能。Wang 等[11]采用空間位置和光譜信息作為多層感知機(jī)的輸入,構(gòu)建的深度估計(jì)模型很好地解決了由海底不均勻底質(zhì)帶來(lái)的不確定性。Lai 等[12]提出了一種采用多層感知機(jī)直接從大氣頂部(Top of the Atmosphere, TOA)數(shù)據(jù)中檢索水深的方法,結(jié)果表明該方法可以繞過(guò)校正氣溶膠影響的要求,并具備可移植性。眾多研究表明,機(jī)器學(xué)習(xí)模型具有簡(jiǎn)單、高效和可擴(kuò)展性強(qiáng)等優(yōu)點(diǎn),在淺海水深反演方面應(yīng)用廣泛。
現(xiàn)有遙感水深反演模型多以光譜值及其變化參數(shù)作為主要參數(shù)。受海洋水體環(huán)境和底質(zhì)的影響[13-14],相同的波段光譜值對(duì)應(yīng)著不同的水深值,僅依賴光譜特征不足以精確反演水深。理想條件下,在反演模型中加入葉綠素濃度、懸浮物濃度等海洋環(huán)境參數(shù),可以獲取高精度的反演水深。然而,海洋環(huán)境參數(shù)復(fù)雜且難以獲取,直接加入反演模型會(huì)導(dǎo)致模型過(guò)于復(fù)雜,不具備可移植性??臻g特征對(duì)于遙感影像也是一個(gè)有效的特征,以往的研究鮮有考慮把影像的空間特征作為參數(shù)用于水深反演,也尚未分析空間特征對(duì)反演的影響??臻g相鄰點(diǎn)通常具有相似的水深、底部類型和水質(zhì),它們具有很強(qiáng)的空間聚集性。同時(shí)海洋環(huán)境和海洋空間特征相關(guān),反映到光譜上表現(xiàn)為相同的波段光譜值在不同的空間特征對(duì)應(yīng)著不同的水深值,因此,可以在遙感水深反演模型中加入空間特征以彌補(bǔ)光譜特征的不足。為此,本文開展了基于空間特征的機(jī)器學(xué)習(xí)模型淺海水深反演研究。
本文以海南省三亞市蜈支洲島附近淺海水域作為研究區(qū)域,結(jié)合光譜特征與其空間特征,選擇多層感知機(jī)(Multi-Layer Perception, MLP)、隨機(jī)森林(Random Forest, RF)和SVM 三種模型構(gòu)建水深反演模型,采用少量的實(shí)測(cè)點(diǎn)獲取高分辨率水深模型,并利用實(shí)測(cè)水深數(shù)據(jù)對(duì)反演結(jié)果進(jìn)行精度評(píng)價(jià),探究空間特征和光譜特征對(duì)水深反演的影響。
本文提出的基于多光譜數(shù)據(jù)及其空間特征的水深反演模型主要包括數(shù)據(jù)預(yù)處理和模型構(gòu)建兩個(gè)主要步驟,整體流程如圖1 所示。在數(shù)據(jù)預(yù)處理階段,對(duì)WorldView-2 影像數(shù)據(jù)進(jìn)行輻射定標(biāo)、大氣校正和水陸分離,對(duì)實(shí)測(cè)水深數(shù)據(jù)進(jìn)行潮汐改正。在模型構(gòu)建階段,提取特征并構(gòu)建水深反演模型對(duì)特征集進(jìn)行訓(xùn)練和反演,得到最終的水深反演值。
圖1 反演方法流程Fig. 1 Flow diagram of proposed method
蜈支洲島(109°45′16″~109°46′10″E,18°18′21″~18°18′58″N)位于海南省三亞市北部,其形狀呈不規(guī)則的蝴蝶狀,東西長(zhǎng)1 400 m,南北長(zhǎng)1 100 m,占地面積約1.48 km2。島東南側(cè)近岸海域?yàn)榛钌汉鹘?巖礁底質(zhì)復(fù)合區(qū),海底地形陡峭,東南側(cè)區(qū)域10 m 以淺水域狹窄;島西南側(cè)以沙底質(zhì)為主,珊瑚覆蓋度較低;島北側(cè)近岸海域?yàn)榛钌汉鹘笁K-沙質(zhì)底質(zhì)復(fù)合分布區(qū),海底平緩[15]。島周圍水質(zhì)清澈,水體透明度高,適用于遙感水深反演研究。研究區(qū)位置如圖2 所示。
圖2 研究區(qū)位置Fig. 2 Location of study area
采用WorldView-2 衛(wèi)星數(shù)據(jù)作為研究區(qū)影像數(shù)據(jù),影像獲取于2012 年9 月28 日3 時(shí)31 分,分辨率為2 m,影像包含8 個(gè)多光譜波段,分別為藍(lán)波段(450~510 nm)、綠波段(510~580 nm)、紅波段(630~690 nm)、近紅外波段(770~895 nm)、海岸波段(400~450 nm)、黃色波段(585~625 nm),以及紅色邊緣波段(705~745 nm)和近紅外2 波段(860~1 040 nm)。模型訓(xùn)練和驗(yàn)證水深數(shù)據(jù)采用船載測(cè)深儀實(shí)測(cè)數(shù)據(jù),獲取時(shí)間為2016 年,深度基準(zhǔn)為理論深度基準(zhǔn)面,水深分辨率約為6 m,水深范圍為0~33.8 m,平均水深為20.6 m。研究區(qū)地形穩(wěn)定,水深隨時(shí)間變化不大。根據(jù)實(shí)測(cè)水深數(shù)據(jù)提取研究區(qū)域坡度數(shù)據(jù)。研究區(qū)影像數(shù)據(jù)及部分實(shí)測(cè)點(diǎn)如圖3 所示。
圖3 研究區(qū)的WorldView-2 影像及部分實(shí)測(cè)水深點(diǎn)位置Fig. 3 WorldView-2 image of the study area and a few in-situ water depth points
1.2.1 輻射定標(biāo)
原始影像上的灰度值(Digital Number, DN 值)為無(wú)量綱的數(shù)字表達(dá)形式,需要將其轉(zhuǎn)換為有意義的輻亮度。對(duì)WorldView-2 影像而言,轉(zhuǎn)換公式如下:
式中: i=1,2,···,N , N 為光譜波段數(shù); L(λi)為 第 i波 段的輻亮度值,單位為W/(m2·sr·μm);absCalFactori為第i波段的絕對(duì)定標(biāo)系數(shù); DNi為 第i波 段的像元灰度值; Δλi為第i波段的等效波段寬度。
本文采用ENVI(The Environment for Visualizing Images)中的WorldView Radiance 模塊對(duì)影像進(jìn)行輻射定標(biāo)。
1.2.2 大氣校正及水陸分離
大氣對(duì)不同波長(zhǎng)的光具有選擇性衰減作用,因而大氣對(duì)不同波段影像的影響程度不同,需要通過(guò)大氣校正去除大氣散射及氣溶膠的影響,獲取地物的真實(shí)反射率。本文采用ENVI 中的FLAASH模塊對(duì)影像進(jìn)行大氣校正,然后根據(jù)歸一化水體指數(shù)(Normalized Difference Water Index, NDWI)對(duì)圖像進(jìn)行閾值分割,劃分出研究區(qū)水域。其計(jì)算公式如下:
式中: RGreen為 WorldView-2 影像中綠波段的反射率; RNIR2為WorldView-2 影像中近紅外2 波段的反射率。
1.2.3 潮汐改正
實(shí)測(cè)水深數(shù)據(jù)是以理論深度基準(zhǔn)面為基準(zhǔn)的穩(wěn)態(tài)水深,而水深反演模型獲取的水深為影像過(guò)境時(shí)間對(duì)應(yīng)的瞬時(shí)水深,二者存在差異,需要對(duì)實(shí)測(cè)水深進(jìn)行潮汐改正。假設(shè)海域穩(wěn)態(tài)水深為H,影像過(guò)境瞬時(shí)水深為 Z,則其轉(zhuǎn)換關(guān)系為:
式中, TL(Tidal Level)指影像過(guò)境時(shí)距離深度基準(zhǔn)的瞬時(shí)潮位。根據(jù)影像過(guò)境時(shí)間的潮汐表[16],可以得到影像獲取時(shí)的瞬時(shí)潮高為0.92 m。通過(guò)式(3)可以計(jì)算出影像過(guò)境時(shí)刻的瞬時(shí)水深。
1.3.1 特征參數(shù)選取
WorldView-2 影像包含8 個(gè)多光譜波段,因此需要選擇最優(yōu)的波段組合作為模型的光譜參數(shù)。Kerr[17]揭示了線性比值模型的最佳WorldView-2 頻帶比。Wang 等[11]采用藍(lán)波段、綠波段、紅波段和近紅外波段四個(gè)WorldView-2 影像常用波段作為多層感知機(jī)模型的輸入?yún)?shù)反演淺海水深。然而,這些研究?jī)H采用了WorldView-2 影像的部分波段,并未充分利用WorldView-2 影像的光譜信息??紤]到某些波段比其他波段包含更多的底部反射率信息或更少的噪聲,例如海岸波段,其對(duì)水深變化敏感,且能滲透到更深的水中,故本文采用WorldView-2 影像的藍(lán)波段、綠波段、紅波段、近紅外波段、海岸波段、黃波段、紅色邊緣波段和近紅外2 波段作為模型光譜參數(shù)。選擇空間位置信息和坡度信息作為空間特征:空間位置作為最簡(jiǎn)單的空間特征,描述水平方向上的空間關(guān)系;坡度刻畫地物的高程變化,描述垂直方向上的空間關(guān)系;二者均能直接有效地表示地物點(diǎn)的空間分布。對(duì)研究區(qū)實(shí)測(cè)水深數(shù)據(jù)和研究區(qū)影像數(shù)據(jù)進(jìn)行有效性檢驗(yàn)和歸一化處理后提取相應(yīng)特征。最終模型輸入?yún)?shù)為8 個(gè)光譜特征和3 個(gè)空間特征(表示為空間位置X、Y,坡度slope)。
1.3.2 模型構(gòu)建方法
1.3.2.1 MLP
MLP 又稱深度神經(jīng)網(wǎng)絡(luò),一般包含輸入層、隱藏層和輸出層三層結(jié)構(gòu),屬于前向結(jié)構(gòu)化的人工神經(jīng)網(wǎng)絡(luò),能夠處理非線性可分離問(wèn)題,且模型易于實(shí)現(xiàn)、可擴(kuò)展性強(qiáng)、擬合速度快、穩(wěn)定性高、學(xué)習(xí)過(guò)程高效[18]。其理論模型如下:
式中: H 為隱藏層輸出; ?為激活函數(shù); X 為輸入?yún)?shù); wh和 bh分 別為隱藏層的權(quán)重和偏差參數(shù); O為模型輸出; wo和 bo分 別為輸出層的權(quán)重和偏差參數(shù)。
經(jīng)過(guò)調(diào)試,構(gòu)建了包含1 個(gè)輸入層、3 個(gè)隱藏層和1 個(gè)輸出層的模型。其中輸入層的節(jié)點(diǎn)包含8 個(gè)光譜特征和3 個(gè)空間特征。每個(gè)隱藏層包含的節(jié)點(diǎn)數(shù)目分別為8、16 和16,層與層之間的激活函數(shù)選擇為tanh,優(yōu)化器選擇為Adadetla。由于本文構(gòu)建模型為預(yù)測(cè)模型,最后一層和輸出層之間不添加激活函數(shù),且輸出層只有1 個(gè)節(jié)點(diǎn),輸出參數(shù)為預(yù)測(cè)水深。多層感知機(jī)(MLP)網(wǎng)絡(luò)結(jié)構(gòu)如圖4 所示。
圖4 MLP 網(wǎng)絡(luò)結(jié)構(gòu)Fig. 4 MLP network structure
1.3.2.2 RF
隨機(jī)森林是決策樹的集成算法。非線性回歸的隨機(jī)森林是根據(jù)隨機(jī)向量生長(zhǎng)樹木形成的,使得樹木預(yù)測(cè)器采用數(shù)值而不是類標(biāo)簽。這種非線性回歸屬于決策樹學(xué)習(xí)家族的機(jī)器學(xué)習(xí)方法[19]。隨機(jī)森林包含多個(gè)決策樹以降低過(guò)擬合的風(fēng)險(xiǎn),具有易解釋性、可處理類別特征、易擴(kuò)展到多分類問(wèn)題、不需特征縮放等性質(zhì)。
經(jīng)過(guò)調(diào)試,構(gòu)建了1 個(gè)包含20 個(gè)決策樹的隨機(jī)森林模型,其中模型的輸入?yún)?shù)為8 個(gè)光譜特征和3 個(gè)空間特征,輸出參數(shù)為預(yù)測(cè)水深。
1.3.2.3 SVM
支持向量回歸(Support Vector Regression, SVR)是在SVM 基礎(chǔ)上發(fā)展的一種回歸算法,是一種小樣本學(xué)習(xí)方法,具有良好的非線性處理能力,能夠有效避免迭代過(guò)程陷入局部最小值。該方法通過(guò)和函數(shù)進(jìn)行特征升維,在高維空間構(gòu)造決策函數(shù)實(shí)現(xiàn)線性回歸[20]。從幾何角度分析,SVR 算法就是在n 維空間找到1 個(gè)回歸參考平面,使各點(diǎn)到超平面的距離最小。其回歸方程為:
式中: xn為 樣本輸入; ω、 b為 參數(shù);T 為轉(zhuǎn)置; δi、 δj為松弛變量;i=1, 2, · ··, n;j=1, 2, · ··, n;n 為樣本數(shù)量; C為誤差懲罰參數(shù)。最終問(wèn)題為求最小的 ||ω||。
經(jīng)過(guò)調(diào)試,構(gòu)建了1 個(gè)卷積核為 rbf 、誤差懲罰參數(shù) C為5.0 的模型。其中模型的輸入?yún)?shù)為8個(gè)光譜特征和3 個(gè)空間特征,輸出參數(shù)為預(yù)測(cè)水深。
本文隨機(jī)從實(shí)測(cè)點(diǎn)中選取訓(xùn)練點(diǎn)和驗(yàn)證點(diǎn),保證測(cè)深點(diǎn)隨機(jī)且均勻分布于實(shí)驗(yàn)區(qū)域。設(shè)置不同水深訓(xùn)練點(diǎn)數(shù)量實(shí)驗(yàn)組,探究訓(xùn)練點(diǎn)數(shù)量對(duì)模型訓(xùn)練的影響。同時(shí)采用多層感知機(jī)(MLP)、隨機(jī)森林(RF)和支持向量回歸(SVR)三種模型作為實(shí)驗(yàn)?zāi)P?。選擇影像光譜特征作為模型固定輸入?yún)?shù),分別結(jié)合不同的研究區(qū)域空間特征,分析研究區(qū)域空間特征對(duì)遙感反演水深的影響。
設(shè)置了4 組對(duì)照實(shí)驗(yàn),分別為以光譜特征作為輸入的模型(簡(jiǎn)稱光譜模型)、以光譜特征和坡度特征作為輸入的模型(簡(jiǎn)稱坡度模型)、以光譜特征和空間位置特征作為輸入的模型(簡(jiǎn)稱位置模型),以及以光譜特征、空間位置特征與坡度特征作為輸入的模型(簡(jiǎn)稱空間模型)。輸入?yún)?shù)如表1 所示。
表1 模型輸入?yún)?shù)Table 1 Input parameters for the model
統(tǒng)計(jì)學(xué)指標(biāo)通過(guò)數(shù)據(jù)的變化來(lái)表征模型擬合的好壞。為了評(píng)價(jià)不同模型的精度,本文選取相關(guān)系數(shù)(correlation coefficient,R2)、均方根誤差(Root Mean Square Error,RMSE),平均相對(duì)誤差(Mean Relative Error,MRE)、平均絕對(duì)誤差(Mean Absolute Error,MAE)、平均誤差(Mean Error,ME)五種指標(biāo)作為評(píng)估參數(shù)。其中, R2表 示確定系數(shù),用于衡量模型的擬合效果; RMSE衡量觀測(cè)值與真實(shí)值之間的偏差,常用來(lái)作為機(jī)器學(xué)習(xí)模型預(yù)測(cè)結(jié)果衡量的標(biāo)準(zhǔn);MRE 是相對(duì)誤差的平均值,可以反映預(yù)測(cè)值誤差的相對(duì)分布;MAE 是絕對(duì)誤差的平均值,可以反映預(yù)測(cè)值誤差的實(shí)際情況;ME 是誤差的平均值,可以反映預(yù)測(cè)值誤差的分布情況。5 種指標(biāo)的計(jì)算方法為:
式中: i=1,2,···,N , N 為水深點(diǎn)數(shù)量; yi為 實(shí)測(cè)水深;為模型預(yù)測(cè)水深;為實(shí)測(cè)水深的平均值。
2.3.1 不同數(shù)量訓(xùn)練點(diǎn)模型精度評(píng)定
由不同數(shù)量訓(xùn)練點(diǎn)模型的精度評(píng)價(jià)結(jié)果(表2)可知,隨著訓(xùn)練點(diǎn)數(shù)量的增加,模型精度呈現(xiàn)先上升、然后趨于穩(wěn)定、最后下降的趨勢(shì)。模型精度在訓(xùn)練點(diǎn)數(shù)量為2 000 時(shí)達(dá)到最優(yōu)。隨著訓(xùn)練點(diǎn)數(shù)量的進(jìn)一步增加,模型精度不再提升。當(dāng)訓(xùn)練點(diǎn)數(shù)量為3 000 時(shí),模型出現(xiàn)過(guò)擬合現(xiàn)象,精度呈現(xiàn)較大幅度的降低。結(jié)果表明,訓(xùn)練點(diǎn)數(shù)量的不斷增加并不能使得訓(xùn)練模型精度不斷增加,使用少量的訓(xùn)練樣本對(duì)水深反演更有意義。3 種模型在訓(xùn)練過(guò)程中均出現(xiàn)上述趨勢(shì),故本文后續(xù)實(shí)驗(yàn)從實(shí)測(cè)水深點(diǎn)中隨機(jī)選取2 000 個(gè)水深點(diǎn)作為訓(xùn)練數(shù)據(jù)集用于訓(xùn)練構(gòu)建的模型,另外在剩余水深點(diǎn)中隨機(jī)選擇400 個(gè)點(diǎn)作為驗(yàn)證數(shù)據(jù)集來(lái)驗(yàn)證和評(píng)估模型性能。
表2 不同數(shù)量訓(xùn)練點(diǎn)模型的精度評(píng)價(jià)Table 2 Model accuracy evaluation of different number of training points
2.3.2 不同機(jī)器學(xué)習(xí)模型精度評(píng)定
選取不同的機(jī)器學(xué)習(xí)模型的精度評(píng)價(jià)結(jié)果如表3 所示。選取8 個(gè)光譜特征和3 個(gè)空間特征為3 種模型的輸入?yún)?shù),可以看出3 種機(jī)器學(xué)習(xí)的精度均較高,在訓(xùn)練點(diǎn)數(shù)量和輸入?yún)?shù)相同的情況下,多層感知機(jī)模型精度最優(yōu),其次為隨機(jī)森林模型,支持向量機(jī)模型精度相對(duì)較低。結(jié)果表明,多層感知機(jī)模型效果最佳,其在面對(duì)訓(xùn)練數(shù)據(jù)中包含的噪聲和缺失值時(shí)具有更強(qiáng)的抵抗性。故本文后續(xù)實(shí)驗(yàn)選取多層感知機(jī)模型作為水深反演模型。
表3 不同機(jī)器學(xué)習(xí)模型精度評(píng)價(jià)結(jié)果Table 3 Model accuracy evaluation of different machine learning models
2.3.3 不同輸入?yún)?shù)模型精度評(píng)定
由統(tǒng)計(jì)模型估計(jì)值與測(cè)量值之間的相關(guān)系數(shù)(圖5)可知,光譜模型的相關(guān)系數(shù)為0.70,位置模型的相關(guān)系數(shù)為0.87,坡度模型的相關(guān)系數(shù)為0.72,空間模型的相關(guān)系數(shù)為0.89。結(jié)果表明,在加入空間特征之后,模型相關(guān)性均有不同程度的提高。相較于光譜模型,位置模型相關(guān)系數(shù)提升了約24.3%,而坡度模型提升了約2.9%,表明空間位置信息對(duì)相關(guān)性的提升幅度較坡度信息更為明顯。空間模型結(jié)合2 種特征,相關(guān)系數(shù)提升了約27.1%,效果最優(yōu)。
圖5 模型預(yù)測(cè)值與實(shí)測(cè)值之間的相關(guān)關(guān)系Fig. 5 Correlation between the predicted value of the model and the in-situ measured value
分析不同模型的精度評(píng)價(jià)結(jié)果(表4)可知,相較于光譜模型,加入空間特征之后,模型精度均有不同程度的提升。加入空間位置特征之后,反演模型(位置模型)的RMSE 減小了2.04 m,MAE 減小了2.02 m,MRE 減小了9.62%,精度提升幅度較大。
表4 模型精度評(píng)價(jià)結(jié)果Table 4 The result of model accuracy evaluation
加入坡度特征之后,反演模型(坡度模型)的RMSE 減小了0.95 m,MAE 減小了0.90 m,MRE 減小了4.71%,精度提升的幅度相對(duì)較小。相對(duì)于空間位置特征,坡度特征在大部分區(qū)域較小,僅在局部范圍內(nèi)存在較大變化,故其對(duì)水深反演的影響較小。空間模型結(jié)合2 種特征,實(shí)驗(yàn)結(jié)果最優(yōu),其RMSE 為2.41 m,MAE 為1.47 m,MRE 為10.41%。
以空間模型的反演結(jié)果為例,得到研究區(qū)域分辨率為2 m 的海底水深模型,并生成海底地形圖,如圖6 所示??臻g模型反演的研究區(qū)域水深可達(dá)35 m,能夠清晰反映研究區(qū)域海底地形的起伏特征。
圖6 海底水深預(yù)測(cè)結(jié)果Fig. 6 Result of bathymetry prediction
為探究空間特征對(duì)模型精度的影響,選取實(shí)驗(yàn)驗(yàn)證點(diǎn)對(duì)光譜模型和空間模型做殘差分析。模型殘差分析直方圖能夠直觀地表達(dá)模型預(yù)測(cè)值與真實(shí)值之間的殘差分布。統(tǒng)計(jì)學(xué)中ME 和RMSE 的大小反映了模型預(yù)測(cè)值精度的高低,即ME 越趨近于0,RMSE 越小,統(tǒng)計(jì)直方圖越接近于正態(tài)分布,模型擬合效果越好。由殘差分析(圖7)可見,光譜模型ME 為3.06 m,RMSE 為5.02 m;空間模型ME 為0.76 m,RMSE 為2.41 m。從ME 分析,空間模型的ME 更趨近于0,直方圖殘差值高峰位于0 值附近;從RMSE 分析,空間模型的RMSE 小于光譜模型,且從圖上可以看出空間模型正態(tài)分布曲線更加瘦高,說(shuō)明模型的殘差分布更加集中。根據(jù)模型殘差分析直方圖可知,空間模型殘差分布更接近正態(tài)分布,ME 更加趨近于0,RMSE 更小,表示擬合效果更好。
圖7 光譜模型和空間模型殘差分析Fig. 7 Residual analysis of spectral model and spatial model
根據(jù)模型估值的偏離方向和精度評(píng)價(jià)結(jié)果,將驗(yàn)證水深點(diǎn)按照模型殘差大?。⊿)、正負(fù)分為5 類,分別為S<—4 m、—4 m≤S≤—2 m、—2 m<S<2 m、2 m≤S≤4 m 和S>4 m,其空間分布如圖8所示。可以看出,空間模型相較于光譜模型,殘差較大的點(diǎn)(圖8 中較大的點(diǎn), |S|>2 m)數(shù)量減少,殘差較小的點(diǎn)(圖8 中較小的點(diǎn), |S|<2 m)數(shù)量增加。從正負(fù)殘差的空間分布情況分析,空間模型正殘差較大點(diǎn)(深紅色表示,估計(jì)值與實(shí)際值的差>4 m)明顯減少,結(jié)合圖6 可知,在水深超過(guò)20 m區(qū)域,正殘差較大點(diǎn)幾乎消失,剩余正殘差較大點(diǎn)主要分布在島嶼北側(cè);負(fù)殘差較大點(diǎn)(深綠色表示,估計(jì)值與實(shí)際值的差<—4 m)也有一定程度的減少,剩余負(fù)殘差較大點(diǎn)主要分布在島嶼周圍近海的東側(cè)及南側(cè)區(qū)域,出現(xiàn)聚集情況。主要原因是東南側(cè)近岸海域?yàn)榛钌汉鹘?巖礁底質(zhì)復(fù)合區(qū),海底地形陡峭,地形變化大,導(dǎo)致模型整體估計(jì)值偏小;島北側(cè)近岸海域?yàn)榛钌汉鹘笁K-沙質(zhì)底質(zhì)復(fù)合分布區(qū),海底平緩,存在較多的人工魚礁等設(shè)施,導(dǎo)致底部實(shí)際反射率減小,模型估計(jì)值整體偏大。
圖8 預(yù)測(cè)殘差(S)空間分布Fig. 8 Spatial distribution of prediction residuals
根據(jù)2.3.3 節(jié)反演結(jié)果發(fā)現(xiàn),研究區(qū)域地形在水深約為20 m 處存在明顯的轉(zhuǎn)折,即20 m 以淺地形復(fù)雜、坡度陡峭,20 m 以深地形平坦、坡度較緩。所以,將水深分為20 m 以淺和20 m 以深,分別進(jìn)行模型精度評(píng)價(jià),結(jié)果如表5 所示。在20 m 以淺區(qū)域,空間模型RMSE(3.22 m)、MAE(2.49 m)和MRE(24.63%)均最小,說(shuō)明該模型精度最高。在添加坡度特征和空間位置特征之后,模型MRE分別提升了9.78%和24.70%。在20 m 以深區(qū)域,空間模型的RMSE(1.59 m)、MAE(1.04 m)和MRE為4.27%也最小,說(shuō)明該模型在高于20 m區(qū)域的精度也最高。在添加坡度特征和空間位置特征之后,模型MRE 分別提升了20.01%和64.11%。結(jié)果表明空間特征能夠有效提升不同深度區(qū)間的水深反演精度。
表5 模型深度分段精度評(píng)價(jià)結(jié)果Table 5 Results of segmented bathymetric accuracy retrieved by proposed model
對(duì)比20 m 以淺和20 m 以深區(qū)域精度,后者精度明顯高于前者,其RMSE 減小了1.63~2.20 m,MAE 減小了1.45~1.98 m,MRE 減小了20.36%~26.94%。這與淺水區(qū)域的海底地形情況復(fù)雜和底質(zhì)類型分布有關(guān)。但是從RMSE 的絕對(duì)提升值來(lái)看,在20 m 以淺空間模型的提升精度要略高于20 m以深區(qū)域,表明了加入空間特征對(duì)海底復(fù)雜地形的提升效果還是較好的。
以蜈支洲島為研究區(qū),利用WorldView-2 影像和實(shí)測(cè)水深數(shù)據(jù),采用MLP、RF 和SVM 三種方法構(gòu)建了基于光譜特征和空間特征的水深反演模型。同時(shí)利用實(shí)測(cè)驗(yàn)證數(shù)據(jù)分析了空間特征在復(fù)雜海洋環(huán)境下對(duì)模型反演的影響效果,得出以下結(jié)論。
1)機(jī)器學(xué)習(xí)模型可以利用少量的已知水深點(diǎn)進(jìn)行水深反演,相對(duì)于傳統(tǒng)模型而言,機(jī)器學(xué)習(xí)模型易于實(shí)現(xiàn),可擴(kuò)展性強(qiáng),擬合速度快,穩(wěn)定性高,且能夠處理噪聲和采樣不足等問(wèn)題,反演效果較好。
2)在3 種模型中,多層感知機(jī)模型反演精度最高,在不同的水深情況下體現(xiàn)了相對(duì)穩(wěn)定的反演能力,具有較強(qiáng)的適用性。隨機(jī)森林模型反演精度次之,支持向量機(jī)模型精度最低。
3)采用多層感知機(jī)模型,多光譜信息結(jié)合空間特征能夠有效地進(jìn)行光學(xué)遙感水深反演,與僅基于光譜信息構(gòu)建的模型相比較,添加空間特征的模型精度得到顯著提升??臻g特征的加入能夠有效地減弱復(fù)雜海洋環(huán)境對(duì)模型反演的影響,且空間位置信息對(duì)模型精度的提升更為顯著。
本文的坡度信息來(lái)自樣本數(shù)據(jù),在樣本數(shù)據(jù)較少時(shí),不足以作為輸入特征值。可以采用不需要樣本數(shù)據(jù)的高光譜數(shù)據(jù)初步反演水深[21-22],并計(jì)算研究區(qū)的地形因子作為多光譜水深反演的因子。在下一步的研究中,將采用無(wú)或少量水深控制點(diǎn),結(jié)合高光譜和多光譜影像反演淺海水深,進(jìn)而提高遙感測(cè)深精度。