吳芳芳,傅智一,胡林舒,張豐*,杜震洪,劉仁義
( 1.浙江大學(xué) 浙江省資源與環(huán)境信息系統(tǒng)重點(diǎn)實(shí)驗(yàn)室,浙江 杭州 310028;2.浙江大學(xué) 地球科學(xué)學(xué)院,浙江 杭州 310027)
鹽度是海水的基本物理參數(shù)之一,可用于追蹤陸源物質(zhì)的路徑,研究陸源河流沖淡水和近海海水混合變化過(guò)程、藻類暴發(fā)過(guò)程以及缺氧區(qū)的生態(tài)環(huán)境等[1-5]。傳統(tǒng)鹽度數(shù)據(jù)的獲取方式包括現(xiàn)場(chǎng)測(cè)量獲取以及利用浮標(biāo)獲取,難以實(shí)現(xiàn)海表鹽度的時(shí)空連續(xù)觀測(cè)。衛(wèi)星遙感憑借其大范圍、連續(xù)性的時(shí)空優(yōu)勢(shì)可及時(shí)有效地監(jiān)測(cè)海表鹽度,對(duì)于海洋的相關(guān)研究、海洋資源的管理與決策具有重要意義。
微波遙感在復(fù)雜天氣條件下具有一定的優(yōu)勢(shì),常被用于大面積開(kāi)闊海域的海表鹽度反演研究[6],但其時(shí)空分辨率低且易受射頻干擾,不適用于沿海水域。在沿海水域及近岸-河口地區(qū),海表鹽度的監(jiān)測(cè)與研究通常利用光學(xué)遙感。與現(xiàn)有的鹽度衛(wèi)星相比,光學(xué)衛(wèi)星具有較高的分辨率與較短的重返周期并可避免射頻干擾的問(wèn)題。Vandermeulen等[7]利用SNPP-VIIRS衛(wèi)星410 nm、443 nm、486 nm、551 nm和671 nm波段的遙感反射率(Remote Sensing Reflectance, Rrs)(Rrs410、Rrs443、Rrs486、Rrs551、Rrs671)反演了墨西哥灣河口區(qū)域的海表鹽度。Liu等[8]基于靜止軌道衛(wèi)星(GOCI)的遙感反射率(Rrs412、Rrs443、Rrs490)反演了渤海的海表鹽度。這些研究通常將有色溶解有機(jī)物(Chromophoric Dissolved Organic Matter, CDOM)的吸收系數(shù)作為海表鹽度反演的中介參數(shù),來(lái)建立遙感反射率與海表鹽度之間的關(guān)系,但僅靠單一的遙感反射率數(shù)據(jù)并不能得到較好的鹽度反演結(jié)果。近年來(lái),也有學(xué)者利用遙感反射率數(shù)據(jù)和海表溫度數(shù)據(jù)反演海表鹽度,并證明海表溫度是反演海表鹽度的重要參數(shù)[9-10]。
現(xiàn)有的鹽度遙感反演方法多采用數(shù)理統(tǒng)計(jì)模型,如比值模型[11]、多元線性回歸模型[12],利用遙感反射率數(shù)據(jù)實(shí)現(xiàn)對(duì)海表鹽度的反演。但基于數(shù)理統(tǒng)計(jì)模型的方法存在模型反演精度低、應(yīng)用范圍有限的缺點(diǎn),無(wú)法適用于鹽度呈復(fù)雜非線性特征或遙感信息間存在時(shí)空自相關(guān)性[13]等的復(fù)雜場(chǎng)景?;跈C(jī)器學(xué)習(xí)的方法能有效分析出數(shù)據(jù)內(nèi)部的關(guān)聯(lián)性,提高預(yù)測(cè)精度。Geiger等[9]利用MODIS-Aqua的歸一化離水輻亮度、海表溫度數(shù)據(jù)以及位置信息建立了反演大西洋中部海表鹽度的神經(jīng)網(wǎng)絡(luò)模型。Chen等[14]基于MODIS和SeaWiFS衛(wèi)星的遙感反射率數(shù)據(jù)和海表溫度數(shù)據(jù),構(gòu)建了基于多層感知神經(jīng)網(wǎng)絡(luò)(Multilayer Perceptron Neural Network, MPNN)的海表鹽度反演模型。雖然基于神經(jīng)網(wǎng)絡(luò)模型可以有效地提高鹽度的反演精度,但模型的構(gòu)建方法復(fù)雜,內(nèi)部運(yùn)行機(jī)理未知,難以對(duì)變量進(jìn)行合理地解釋。隨機(jī)森林算法是基于決策樹(shù)的一種集成學(xué)習(xí)算法[15],它可以高效地劃分多顆決策樹(shù)。樹(shù)中的各節(jié)點(diǎn)可用于反映不同區(qū)域、不同環(huán)境下的鹽度狀況,可應(yīng)用于復(fù)雜環(huán)境下的鹽度反演研究。墨西哥灣受入海河流的淡水輸送、環(huán)流以及風(fēng)力的共同影響,是一個(gè)具有復(fù)雜水動(dòng)力環(huán)境的典型半封閉海域。另外,該區(qū)域內(nèi)實(shí)測(cè)數(shù)據(jù)豐富且易獲取,因此,選擇墨西哥灣作為研究區(qū)域,構(gòu)建適用于復(fù)雜環(huán)境的海表鹽度反演模型。
本文選取MODIS-Aqua衛(wèi)星的遙感反射率數(shù)據(jù)(Rrs412、Rrs443、Rrs488、Rrs555、Rrs667)和海表溫度數(shù)據(jù),協(xié)同實(shí)測(cè)鹽度數(shù)據(jù),利用隨機(jī)森林方法構(gòu)建墨西哥灣海表鹽度反演模型,反演2018年墨西哥灣的海表鹽度?;诤1睇}度的反演結(jié)果,研究灣區(qū)內(nèi)海表鹽度的時(shí)空變化特征,探究不同空間區(qū)域內(nèi)各影響因子與海表鹽度的相關(guān)性,對(duì)其空間異質(zhì)性進(jìn)行分析,為復(fù)雜環(huán)境下的海表鹽度反演模型提供模型變量的選取思路,為其他海域的海表鹽度反演研究提供參考。
墨西哥灣為北美洲大陸東南沿海水域,灣內(nèi)主要受北部河流輸入的影響,密西西比河、阿查法拉亞河等眾多河流為墨西哥灣輸送了大量淡水、泥沙、營(yíng)養(yǎng)物質(zhì)和有機(jī)物[16]。位于墨西哥灣東南部的環(huán)流系統(tǒng)是墨西哥灣區(qū)環(huán)流的主要驅(qū)動(dòng)力,該環(huán)流將加勒比海的高溫、高鹽水向北輸送到墨西哥灣,再?gòu)姆鹆_里達(dá)海峽輸出至北大西洋。另外,環(huán)流也將北部的淡水沿著北部大陸架和西佛羅里達(dá)大陸架向東和向南輸送[17-18]。整體上,墨西哥灣由于受到入海河流淡水輸送、環(huán)流和風(fēng)力等因素的影響,其物理和生物化學(xué)過(guò)程活躍,海水鹽度也呈現(xiàn)空間異質(zhì)性(圖1,參考Otis等[17]的研究)。
圖1 研究區(qū)概況Fig.1 Overview of the study area
3.1.1 實(shí)測(cè)鹽度數(shù)據(jù)
實(shí)測(cè)鹽度數(shù)據(jù)來(lái)自2018年美國(guó)國(guó)家海洋和大氣管理局(National Oceanic and Atmospheric Administration, NOAA)在墨西哥灣海域開(kāi)展的15個(gè)共享航次,該數(shù)據(jù)從海洋碳數(shù)據(jù)系統(tǒng)(Ocean Carbon Data System,OCADS)(https://www.nodc.noaa.gov/ocads)中 下 載 。鹽度觀測(cè)儀器為美國(guó)Sea-Bird公司的溫鹽深儀(CTD),測(cè)量的方式為走航測(cè)量。根據(jù)世界海洋環(huán)流實(shí)驗(yàn)(World Ocean Circulation Experiment, WOCE)指南,數(shù)據(jù)均被標(biāo)上質(zhì)量控制標(biāo)識(shí),共有3個(gè)標(biāo)識(shí)值:“2”表示質(zhì)量良好;“3”表示可疑數(shù)據(jù);“4”表示質(zhì)量較差。為保證數(shù)據(jù)的準(zhǔn)確性,本研究保留具有質(zhì)量良好標(biāo)識(shí)“2”的實(shí)測(cè)鹽度數(shù)據(jù)。數(shù)據(jù)來(lái)源的航次信息如表1所示,空間分布情況如圖2所示。
圖2 實(shí)測(cè)海表鹽度數(shù)據(jù)分布Fig.2 Spatial distribution of field sea surface salinity
表1 實(shí)測(cè)海表鹽度數(shù)據(jù)來(lái)源航次信息Table 1 The source and voyage information of field sea surface salinity
3.1.2 衛(wèi)星數(shù)據(jù)
衛(wèi)星數(shù)據(jù)來(lái)自搭載于Aqua衛(wèi)星上的中分辨率成像光譜輻射計(jì)(MODIS),該數(shù)據(jù)具有較高的光譜分辨率和中等空間分辨率,可滿足研究的需求。本文選取MODIS的遙感反射率數(shù)據(jù)(Rrs412、Rrs443、Rrs488、Rrs555、Rrs667)以及海表溫度(Sea Surface Temperature, SST)數(shù)據(jù)用于反演海表鹽度,具體的統(tǒng)計(jì)信息如表2所示。數(shù)據(jù)來(lái)源于美國(guó)航天局戈達(dá)德航天飛行中心(Goddard Space Flight Center, GSFC),是空間分辨率約1 km的標(biāo)準(zhǔn)L2級(jí)單軌產(chǎn)品。按照美國(guó)航天局質(zhì)量控制標(biāo)準(zhǔn),剔除含有云、雜散光等低質(zhì)量的衛(wèi)星數(shù)據(jù),剔除質(zhì)量等級(jí)大于1的L2級(jí)低質(zhì)量海表溫度影像。基于3×3像元窗口,獲取與實(shí)測(cè)鹽度采樣時(shí)間間隔為±6 h內(nèi)的L2級(jí)遙感反射率和海表溫度數(shù)據(jù)。利用Arcmap軟件的Extract Values to Points工具,將衛(wèi)星數(shù)據(jù)和實(shí)測(cè)鹽度數(shù)據(jù)進(jìn)行匹配,以便進(jìn)行鹽度反演。本文數(shù)據(jù)經(jīng)過(guò)預(yù)處理后,共獲得7 963組匹配數(shù)據(jù),用于海表鹽度反演模型的開(kāi)發(fā)與驗(yàn)證。
表2 實(shí)測(cè)數(shù)據(jù)與衛(wèi)星數(shù)據(jù)統(tǒng)計(jì)信息Table 2 Statistics of measured data and satellite data
隨機(jī)森林是一種用于分類和回歸的集成學(xué)習(xí)方法,其將Bagging方法、隨機(jī)子空間方法與決策樹(shù)方法相結(jié)合[19-21],為解決單棵決策樹(shù)存在過(guò)擬合的瓶頸問(wèn)題,集成多顆決策樹(shù)來(lái)提高預(yù)測(cè)性能。算法融入自助聚集(bootstrap aggregating)方法生成子集,即從原樣本集D中通過(guò)bootstrap有放回地隨機(jī)抽取M個(gè)與原樣本集同樣大小的訓(xùn)練樣本集Dm(m=1,2,3,···,n),據(jù)此構(gòu)建多顆決策樹(shù)。在對(duì)決策樹(shù)的每個(gè)節(jié)點(diǎn)進(jìn)行分裂時(shí),引入隨機(jī)子空間方法,從全部K個(gè)特征中均勻隨機(jī)地抽取一個(gè)特征子集,從該子集中選擇一個(gè)最優(yōu)分裂特征[15]。最后采用多顆決策樹(shù)并行的方式,求取多棵決策樹(shù)結(jié)果的均值作為最終預(yù)測(cè)結(jié)果,可簡(jiǎn)要表示為
隨機(jī)森林的優(yōu)點(diǎn)在于利用bootstrap緩解高方差的問(wèn)題,弱化決策樹(shù)間的相關(guān)性;利用隨機(jī)子空間方法選取特征的隨機(jī)性優(yōu)勢(shì),增強(qiáng)模型的泛化能力;平均多顆決策樹(shù)預(yù)測(cè)值提高預(yù)測(cè)精度,實(shí)現(xiàn)數(shù)據(jù)的準(zhǔn)確分類和預(yù)測(cè)。隨機(jī)森林方法簡(jiǎn)單高效,只需調(diào)整森林中樹(shù)的數(shù)量(ntree)和每個(gè)結(jié)點(diǎn)的特征數(shù)(mtry)就可以快速有效地生成合理的模型。與其他機(jī)器學(xué)習(xí)方法相比,隨機(jī)森林抗過(guò)擬合能力強(qiáng),異常值和噪聲的容忍度高[15],在參數(shù)優(yōu)化、變量排序以及后續(xù)變量分析解釋等方面存在明顯優(yōu)勢(shì)[22]。因此,本文選擇隨機(jī)森林算法整合多元參數(shù)來(lái)反演海表鹽度,模型構(gòu)建流程如圖3所示。
圖3 基于隨機(jī)森林算法的海表鹽度反演模型構(gòu)建流程圖Fig.3 Flow chart of sea surface salinity retrieval model based on random forest algorithm
本文利用R軟件中的randomForest包來(lái)實(shí)現(xiàn)海表鹽度反演模型的構(gòu)建,將遙感反射率以及海表溫度作為模型的輸入,海表鹽度作為模型的輸出,通過(guò)多次迭代訓(xùn)練建立各影響因子與海表鹽度之間的映射關(guān)系。模型結(jié)果使用均方根誤差(Root Mean Square Error, RMSE)、決定系數(shù)(R2)、平均誤差(Mean Bias,MB)、平均絕對(duì)誤差(Mean Absolute Error, MAE)進(jìn)行評(píng)估。
將數(shù)據(jù)集按照8∶2的比例隨機(jī)分為訓(xùn)練集和測(cè)試集,利用本文建立的隨機(jī)森林模型進(jìn)行海表鹽度反演,圖4為訓(xùn)練集和測(cè)試集的實(shí)測(cè)鹽度與模型反演鹽度的線性回歸密度散點(diǎn)圖。在訓(xùn)練集中,R2為0.986,RMSE為 0.203,MAE為 0.073,MB為-0.001。在測(cè)試集中,R2為 0.931,RMSE為 0.335,MAE為 0.154,MB為-0.002。從結(jié)果可知,實(shí)測(cè)鹽度與模型反演的鹽度之間相關(guān)性高、誤差小,模型的擬合度高,驗(yàn)證了隨機(jī)森林模型反演海表鹽度的可行性。
圖4 隨機(jī)森林模型性能對(duì)比Fig.4 Performance comparison of random forest model
為進(jìn)一步評(píng)估模型在不同地理區(qū)域的性能,探究隨機(jī)森林在不同環(huán)境下的適用性,本文選取墨西哥灣典型的河口區(qū)域(圖5d中的A區(qū)域)以及環(huán)流影響的區(qū)域(圖5d中的B區(qū)域)作為子研究區(qū),得到各子區(qū)域的實(shí)測(cè)鹽度與模型反演鹽度的線性回歸結(jié)果,見(jiàn)圖5a和圖5b。如圖所示,模型在河口區(qū)域與環(huán)流區(qū)域都得到了較好的擬合結(jié)果,RMSE均小于0.3,R2均大于0.8,圖5c表明,92.4%的誤差在-0.2~0.2范圍內(nèi)。模型在河口區(qū)域取得更好結(jié)果的原因可能是河口區(qū)域接收了北部大量含有CDOM或其他陸源成分的河流淡水。淡水在紅光波段具有反射特性,同時(shí),陸源成分在藍(lán)光波段和綠光波段分別具有強(qiáng)吸收以及強(qiáng)反射的特性,而模型的輸入?yún)?shù)(遙感反射率)能有效地捕捉到這些由光學(xué)特性表征的海水-淡水混合信息,因此該模型能很好地反演河口的鹽度。環(huán)流區(qū)域由于羽流的擴(kuò)散[14],其海水-淡水混合信息能被模型很好地捕捉,故在該區(qū)域也得到了理想的擬合結(jié)果。
圖5 隨機(jī)森林模型在河口區(qū)域與環(huán)流區(qū)域的性能對(duì)比Fig.5 Random forest model performance comparison in estuary region and circulation region
為驗(yàn)證隨機(jī)森林模型的可行性,本文將隨機(jī)森林模型與多元線性回歸、人工神經(jīng)網(wǎng)絡(luò)、支持向量機(jī)模型的反演結(jié)果進(jìn)行比較,用RMSE、R2、MAE、MB評(píng)價(jià)指標(biāo)衡量模型的反演效果和穩(wěn)健性。由圖6結(jié)果可知,隨機(jī)森林模型的R2最高,RMSE最小。綜合相關(guān)性和誤差,隨機(jī)森林模型相比其他方法而言具有更強(qiáng)的泛化能力以及更佳的預(yù)測(cè)能力。
圖6 4種模型反演的海表鹽度驗(yàn)證Fig.6 Validation of sea surface salinity retrieved by four models
探究鹽度的空間分布特征可揭示淡水以及陸源物質(zhì)的輸送范圍,對(duì)于研究與管理海洋環(huán)境具有重要意義。空間分辨率為約1 km的MODIS衛(wèi)星數(shù)據(jù)能較好地展現(xiàn)海表鹽度在空間上的差異性,捕捉鹽度變化的細(xì)微特征。隨機(jī)森林模型不同的樹(shù)節(jié)點(diǎn)對(duì)應(yīng)不同區(qū)域、不同環(huán)境下的鹽度狀況,可較為準(zhǔn)確地反演出灣區(qū)內(nèi)鹽度的分布模式?;诖?,將模型應(yīng)用于MODIS衛(wèi)星數(shù)據(jù),得到墨西哥灣海域海表鹽度反演分布結(jié)果,并對(duì)其時(shí)空分布特征進(jìn)行分析。
由2018年墨西哥灣海表鹽度的反演結(jié)果(圖7)可知,墨西哥灣海表鹽度的空間分布呈近岸-河口低、離岸高,環(huán)狀向內(nèi)增值的態(tài)勢(shì)。受密西西比河、阿查法拉亞河等河流輸入的影響,鹽度在近岸-河口較低。灣區(qū)北部呈現(xiàn)明顯的低鹽度水和高鹽度水混合的現(xiàn)象,在風(fēng)、環(huán)流以及渦流的影響下[23],河流入??诘牡望}度水向南擴(kuò)散和沿著大陸岸線向東西兩側(cè)擴(kuò)散。由于河流的到達(dá)范圍有限,離岸區(qū)域的鹽度較高且相對(duì)均質(zhì),鹽度值大部分為33~36,以上分析結(jié)果表明,入海河流的淡水輸送及擴(kuò)散直接影響灣區(qū)內(nèi)鹽度的分布狀況。
圖7 隨機(jī)森林模型生成的2018年墨西哥灣年平均海表鹽度反演圖Fig.7 Annual mean sea surface salinity generated by the random forest model in the Gulf of Mexio in 2018
2018年墨西哥灣逐月的海表鹽度分布(圖8)顯示,灣區(qū)鹽度空間形態(tài)分布特征相似,均呈現(xiàn)近岸-河口低、離岸高的態(tài)勢(shì)。離岸區(qū)域的鹽度值大部分為 33~36。
圖8 隨機(jī)森林模型生成的2018年墨西哥灣月平均海表鹽度反演圖Fig.8 Monthly mean sea surface salinity generated by the random forest model in the Gulf of Mexio in 2018
受河流流量的影響,灣區(qū)北部鹽度較低且變化最為顯著。春季,灣區(qū)北部的鹽度受密西西比河以及阿查法亞河等河流流量影響,出現(xiàn)明顯的鹽度低值區(qū)。夏季,在西南風(fēng)和環(huán)流的作用下[24],低鹽度羽流向東和向南擴(kuò)散,并沿環(huán)流東緣流向佛羅里達(dá)海峽。在河流流量以及風(fēng)力的作用下,低鹽度水的擴(kuò)散效應(yīng)持續(xù)至9月,此后,由于河流流量的減小[25],秋季鹽度的變化較小。河流流量在冬季持續(xù)減小,并在1月中旬左右達(dá)到年度最低值[26],河口鹽度低值區(qū)持續(xù)收縮。鹽度空間分布成因分析表明,鹽度的變化與河流流量存在季節(jié)性響應(yīng),在風(fēng)力的影響下,低鹽度羽流于夏季出現(xiàn)明顯的擴(kuò)散現(xiàn)象。另外,環(huán)流帶來(lái)的加勒比海的海水也會(huì)影響灣區(qū)內(nèi)的鹽度。
輸入變量的重要性可用于表示不同輸入變量對(duì)模型的影響程度,本文利用InMSE方法和IncNode-Purity方法得到輸入變量排序,以此來(lái)增強(qiáng)隨機(jī)森林模型的可解釋性,進(jìn)而揭示海表溫度和遙感反射率對(duì)于海表鹽度反演的重要性。InMSE與IncNodePurity同為randomForest包自帶的評(píng)估變量重要性的方法。InMSE表示逐一加入各變量后均方誤差的增加,IncNodePurity指節(jié)點(diǎn)在分裂前后的殘差平方和的增加,兩種方法均通過(guò)量化誤差來(lái)衡量輸入變量的重要程度。海表溫度以及遙感反射率數(shù)據(jù)(紫光波段(Rrs412)、藍(lán)綠光波段(Rrs443、Rrs488、Rrs555)、紅光波段(Rrs667))的重要性排序結(jié)果如圖9所示,兩種不同重要性排序方法得出的結(jié)果都說(shuō)明海表溫度對(duì)海表鹽度反演精度的影響最大,Rrs488的對(duì)海表鹽度反演精度的影響最小,而在不同的方法下,Rrs412、Rrs443、Rrs555、Rrs667的重要性不完全一致。
圖9 影響因子重要性排序Fig.9 Importance ranking of influence factors
海表溫度與海表鹽度的響應(yīng)程度很高主要是因?yàn)槿牒:恿鬏斎氲牡秃Kg會(huì)產(chǎn)生溫差,通過(guò)溫差可捕捉河流的入海信息。而遙感反射率與鹽度兩者在本質(zhì)上并無(wú)直接關(guān)系,需要引入CDOM作為中介物進(jìn)行分析。海表鹽度與CDOM的吸收系數(shù)之間存在顯著的負(fù)相關(guān)關(guān)系[27-28],而CDOM的吸收系數(shù)可通過(guò)遙感反射率反演得出[29],因此,遙感反射率能間接反演鹽度信息。CDOM的吸收系數(shù)在可見(jiàn)光波段內(nèi)呈指數(shù)衰減的特性,通常表示為遙感反射率的線性函數(shù),例如,可被表示為藍(lán)綠光波段的比值[30]或紫光、藍(lán)綠光的線性組合[31]。特別是在河口和近岸海域,CDOM的濃度較高,其對(duì)光的強(qiáng)吸收從紫光波段延伸到藍(lán)綠光波段[30]。同時(shí),紅光波段對(duì)鹽度的反演也很重要[10]。綜上所述,反演CDOM的算法大多依賴于紫光波段、藍(lán)綠光波段以及紅光波段的遙感反射率數(shù)據(jù),故以上波段對(duì)海表鹽度的反演起到了重要作用。
從InMSE方法排序結(jié)果可知,在本文中海表溫度對(duì)海表鹽度反演精度的影響最大,其次為綠光波段的遙感反射率(Rrs555)以及紅光波段的遙感反射率(Rrs667),最后為紫光波段和藍(lán)光波段的遙感反射率(Rrs412、Rrs443、Rrs488)。從 IncNodePurity方法的排序結(jié)果可知,海表溫度仍然對(duì)海表鹽度反演精度的影響最大,其次為藍(lán)光波段、紫光波段、紅光波段的遙感反射率(Rrs443、Rrs412、Rrs667),最后為藍(lán)綠光波段的遙感反射率(Rrs555、Rrs488)。InMSE方法與IncNodePurity方法定義變量重要性標(biāo)準(zhǔn)的概念不同,所以變量的排名也不盡相同。
區(qū)域差異是地理學(xué)的傳統(tǒng)研究視角,為探索海表鹽度影響因子的區(qū)域差異,本文對(duì)河口區(qū)域、環(huán)流區(qū)域以及整個(gè)墨西哥灣區(qū)域影響因子與海表鹽度間的相關(guān)性進(jìn)行研究,各影響因子與海表鹽度的相關(guān)性如圖10所示。研究表明,在河口區(qū)域和環(huán)流區(qū)域,海表溫度與海表鹽度的相關(guān)性最大,而對(duì)于整個(gè)墨西哥灣海域,Rrs667與海表鹽度的相關(guān)性最大。
圖10 不同地理分區(qū)海表鹽度影響因子的貢獻(xiàn)度Fig.10 Contribution of each factor to sea surface salinity in different geographical regions
相比于同區(qū)域的遙感反射率,海表溫度對(duì)海表鹽度的影響在河口區(qū)域和環(huán)流區(qū)域較大,這主要是由于水流混合導(dǎo)致的溫度梯度造成的。河口區(qū)域低鹽淡水和海水混合,環(huán)流將高溫、高鹽的加勒比海水輸送至墨西哥灣,較大的溫差導(dǎo)致鹽度產(chǎn)生局部地變異。但對(duì)于整個(gè)墨西哥灣海域,海表溫度對(duì)海表鹽度的影響較小,因?yàn)榇竺娣e的離岸區(qū)域溫度較為穩(wěn)定,從而弱化了溫度的影響。針對(duì)不同的地理分區(qū),海表溫度在河口區(qū)域?qū)1睇}度的影響最大,在環(huán)流區(qū)域的影響最小。該結(jié)果顯示,在墨西哥灣海域,沖淡水對(duì)海表鹽度的影響比環(huán)流更加明顯,這主要是由于入海河流輸入的淡水與灣區(qū)內(nèi)海水的鹽度差和溫度差相較于加勒比海水與灣區(qū)內(nèi)海水更大。
在富含沉積物的河口區(qū)域,各波段的遙感反射率對(duì)海表鹽度的影響較大,其原因?yàn)檫b感反射率能很好地捕捉到陸源物質(zhì)。而在環(huán)流區(qū)域,同質(zhì)海水使得遙感反射率對(duì)海表鹽度的影響并不顯著,從而強(qiáng)化了溫度的影響。在全部海域,各波段的遙感反射率對(duì)海表鹽度的影響也較大,主要是因?yàn)樵搮^(qū)域不僅包含受沖淡水影響的河口區(qū)域、由暖流控制的環(huán)流區(qū)域,還包括了同樣富含陸源物質(zhì)的大陸架與受溫度影響較小的離岸區(qū)域,因此,對(duì)于整個(gè)墨西哥灣,遙感反射率對(duì)海表鹽度反演的影響也較為顯著。
本文將海表溫度作為模型的輸入變量之一,利用隨機(jī)森林提供變量排序、變量解釋的優(yōu)勢(shì),證明了海表溫度跟海表鹽度之間具有較強(qiáng)的相關(guān)性,并驗(yàn)證了各影響因子與海表鹽度的相關(guān)性存在空間異質(zhì)性?;?018年遙感與實(shí)測(cè)匹配的遙感反射率數(shù)據(jù)和海表溫度數(shù)據(jù)構(gòu)建的隨機(jī)森林模型,對(duì)墨西哥灣的海表鹽度進(jìn)行反演,結(jié)合比較其他方法得出以下結(jié)論:
(1)隨機(jī)森林模型的反演精度高于多元線性回歸、支持向量機(jī)以及人工神經(jīng)網(wǎng)絡(luò)模型,其RMSE為0.335,R2為0.931,更精確地反演了墨西哥灣海表鹽度;(2)墨西哥灣海表鹽度時(shí)空分布特征結(jié)果表明,灣區(qū)內(nèi)海表鹽度的空間分布呈近岸-河口低、離岸高,環(huán)狀向內(nèi)增值的態(tài)勢(shì)。海表鹽度空間分布成因分析表明,灣區(qū)內(nèi)海表鹽度的變化與河流流量存在季節(jié)性響應(yīng),在風(fēng)和環(huán)流的影響下,入海河流的淡水輸送及擴(kuò)散直接影響灣區(qū)內(nèi)海表鹽度的分布狀況;(3)對(duì)模型的影響因子進(jìn)行排序,發(fā)現(xiàn)了海表溫度是墨西哥灣海域反演海表鹽度的重要因素;(4)對(duì)不同的區(qū)域內(nèi)海表溫度和遙感反射率與海表鹽度的相關(guān)性進(jìn)行探析,驗(yàn)證了影響因子與海表鹽度間的相關(guān)性存在空間異質(zhì)性,其中,河口區(qū)域的海表溫度和Rrs667與海表鹽度的相關(guān)性最強(qiáng)。
本研究發(fā)現(xiàn)了海表溫度與海表鹽度存在較強(qiáng)的相關(guān)性,各影響因子與海表鹽度存在空間異質(zhì)性,可為沿海水域海表鹽度反演模型提供變量選取的思路。建立的高精度海表鹽度反演模型可適用于類似地理?xiàng)l件的區(qū)域,進(jìn)一步的拓展應(yīng)用還需進(jìn)行相應(yīng)海域及不同時(shí)相數(shù)據(jù)的分析和檢驗(yàn)。
致謝:感謝NOAA國(guó)家環(huán)境信息中心(NCEI)(https://www.ncei.noaa.gov/access/ocean-carbon-data-system/)提供的2018年墨西哥灣實(shí)測(cè)鹽度數(shù)據(jù)。