江佳樂,劉湘南,劉美玲,畢曉慶
(中國(guó)地質(zhì)大學(xué)(北京)信息工程學(xué)院,北京 100083)
近年來,海洋鹽度的反演研究逐漸增多,其遙感反演方法主要分為間接法和直接法。間接法主要是基于特定海域鹽度與某些光敏感性物質(zhì)的關(guān)系,建立其遙感反演模型 (Binding et al,2003;Silió-Calzada et al,2008;王林 等,2012;高國(guó)棟等,2011)。而直接法則主要利用鹽度敏感波段(可見光、近紅外波段以及微波L和S波段),通過微分光譜技術(shù)、海表輻射模型、多元統(tǒng)計(jì)回歸模型等獲得鹽度與光譜數(shù)據(jù)的關(guān)系,實(shí)現(xiàn)海表鹽度的遙感反演(Klein etal,1997;李志等,2007;殷曉斌等,2006)。然而,上述方法存在著反演因子單一、優(yōu)質(zhì)數(shù)據(jù)挖掘困難以及過度擬合等問題。
隨機(jī)森林 (Random Forest,RF)由 Breiman(2001)提出,是一種基于分類與回歸決策樹(Classification And Regression Tree,CART)的組合算法,具有如下定理:隨著決策樹的增加,對(duì)所有隨機(jī)向量θi,分類器的泛化誤差PE*收斂于
即隨著樹的增多,PE*將趨于一個(gè)上界。該定理表明隨機(jī)森林不會(huì)產(chǎn)生過擬合。此外,隨機(jī)森林學(xué)習(xí)過程快速,運(yùn)算速度快、穩(wěn)定性好,在處理大數(shù)據(jù)集上十分高效,且預(yù)測(cè)精度高(Verikas etal,2011)。較之神經(jīng)網(wǎng)絡(luò)、CART樹和線性回歸中的子集選擇存在的不穩(wěn)定性,Bagging算法可以對(duì)不穩(wěn)定情況進(jìn)行正常處理 (Breiman,1996)。而Bagging和隨機(jī)選擇特征分裂的結(jié)合使其對(duì)異常值和噪聲具有很好的容忍度(Breiman,2001)。該算法還可以提供內(nèi)部誤差估計(jì)、強(qiáng)度、相關(guān)系數(shù)以及變量重要性等有用信息,對(duì)于結(jié)果具有可解釋性(Breiman,2001)。隨機(jī)森林應(yīng)用廣泛,特別在遙感方面,隨機(jī)森林已成功應(yīng)用于多光譜數(shù)據(jù)(Pal,2005)、多時(shí)相合成孔徑雷達(dá)(SAR)影像(Waske etal,2009)、高光譜數(shù)據(jù) (Ham etal,2005)、多源遙感數(shù)據(jù) (Gislason etal,2006)等。
海鹽并非光敏感性物質(zhì),在自然水體中吸收、散射光能微弱(王林等,2012)。尤其是在河口-近岸海域,由于大氣環(huán)境復(fù)雜、海水自身?xiàng)l件不穩(wěn)定,加之人為因素影響,使得微波遙感對(duì)鹽度的反演遇到了一定的阻礙,而光學(xué)遙感在此類復(fù)雜區(qū)域的鹽度反演精度更高。因此,本研究利用隨機(jī)森林算法,并結(jié)合ASTER多光譜數(shù)據(jù),采用間接法反演海表鹽度。
香港特別行政區(qū)位于 114°15′E,22°15′N,珠江口以東,擁有很長(zhǎng)的海岸線,水域面積達(dá)1651km2,屬海洋性副亞熱帶季風(fēng)氣候。香港環(huán)境保護(hù)署自1986年起在其海域?qū)嵤┤娴暮K|(zhì)監(jiān)測(cè)計(jì)劃,每月在全港76個(gè)水質(zhì)監(jiān)測(cè)站進(jìn)行海水監(jiān)測(cè),本研究以其所搜集度量的表層海水水質(zhì)數(shù)據(jù)為實(shí)測(cè)數(shù)據(jù)。
先進(jìn)星載熱發(fā)射和反射輻射儀(The Advanced Spaceborne Thermal Emission and Reflection Radiometer,ASTER)是搭載于 1999年發(fā)射的Terra衛(wèi)星上的多光譜成像儀。本研究基于ASTER LEVEL 1B(L1B)數(shù)據(jù)對(duì)影像進(jìn)行輻射定標(biāo),其中將VNIR、SWIR定標(biāo)為輻射亮度,單位是W/m2/sr/μm,TIR數(shù)據(jù)定標(biāo)為大氣表觀溫度值,以開爾文為單位,繼而對(duì)其進(jìn)行FLAASH大氣校正,以及拼接、裁剪等處理??紤]到研究區(qū)域的覆蓋率及影像質(zhì)量,本研究選取了2003-2008年共6期L1B影像數(shù)據(jù),并利用其覆蓋的監(jiān)測(cè)站點(diǎn)的數(shù)據(jù)進(jìn)行相關(guān)應(yīng)用與分析。
圖1 研究區(qū)域及監(jiān)測(cè)站點(diǎn)分布
隨機(jī)森林是一種統(tǒng)計(jì)學(xué)習(xí)理論,包括隨機(jī)森林分類 (Random Forest Classification,RFC)和隨機(jī)森林回歸(Random ForestRegression,RFR)。它是決策樹的組合,用Bagging算法產(chǎn)生不同的訓(xùn)練集,即利用Bootstrap重抽樣方法從原始訓(xùn)練集中抽樣生成多個(gè)樣本,對(duì)每個(gè)新的訓(xùn)練集進(jìn)行決策樹建模,且決策樹在生長(zhǎng)過程中不進(jìn)行剪枝,然后組合多棵決策樹的預(yù)測(cè),最后通過簡(jiǎn)單多數(shù)投票法(因變量為分類變量時(shí),RFC)、或單棵樹輸出結(jié)果的簡(jiǎn)單平均(因變量為數(shù)值變量時(shí),RFR)得出最終預(yù)測(cè)結(jié)果(Breiman,2001)。
表1 ASTER影像數(shù)據(jù)覆蓋的監(jiān)測(cè)站點(diǎn)
由于作為因變量的敏感因子光譜參數(shù)及海表鹽度都是數(shù)值變量,在鹽度預(yù)測(cè)RF的建模過程中,采用的是隨機(jī)森林回歸模型。隨機(jī)森林利用Bagging方法生成訓(xùn)練集,即每棵分類決策樹的訓(xùn)練樣本都是從原始總樣本數(shù)據(jù)集中隨機(jī)選取,直至生成k棵決策樹,所有決策樹的集合形成一個(gè)鹽度預(yù)測(cè)的隨機(jī)森林,最終產(chǎn)生k個(gè)決策樹結(jié)果,通過平均法得到最優(yōu)鹽度預(yù)測(cè)結(jié)果。在訓(xùn)練集生成過程中,一些樣本在特別的Bootstrap采樣中不止用了一次,而另一些數(shù)據(jù)可能并未用到,這樣原始樣本中接近37%的樣本不會(huì)出現(xiàn)在訓(xùn)練集中,這些數(shù)據(jù)稱為袋外(Out-Of-Bag,OOB)數(shù)據(jù)。使用這些數(shù)據(jù)可用來估計(jì)模型的性能(OOB估計(jì)),即估計(jì)單個(gè)變量的重要性,以及估計(jì)模型的泛化誤差,用于結(jié)果的解釋。
海洋環(huán)境復(fù)雜,存在多方面影響海洋鹽度變化的因子,影響層次也不盡相同,因此要研究鹽度的反演,需要對(duì)潛在的影響因子進(jìn)行分析、篩選,為模型的建立提供依據(jù)。
圖2 算法流程結(jié)構(gòu)示意圖
在對(duì)海鹽的遙感探測(cè)過程中存在一定的干擾因子,增加了衛(wèi)星遙感觀測(cè)海表面鹽度的復(fù)雜性、影響了其精確程度,但這些因素大多數(shù)可通過一定的技術(shù)手段消除或降低至可忽略水平。海洋表面作為海洋和大氣的交界面,其條件不穩(wěn)定,而近岸海域易受氣候與大陸的影響,多數(shù)因子涉及面廣,條件復(fù)雜,且難以量化,可用相關(guān)參數(shù)進(jìn)行表征。除了上述宏觀因素外,對(duì)于光學(xué)遙感而言,在海水物質(zhì)成分中還存在一些與鹽度密切相關(guān)的組分,它們是海表宏觀因子的微觀表征,同時(shí)也在一定程度上影響著海表鹽度。
考慮到實(shí)際測(cè)量數(shù)據(jù)的獲取途徑及光學(xué)遙感特性,首先篩選出在鹽度反演中重要的參數(shù):代表黃色物質(zhì)的氮素,與河川徑流相關(guān)的懸浮固體,表征浮游植物量的葉綠素a,以及海表溫度(T)。黃色物質(zhì)即“有色可溶性有機(jī)物質(zhì)(Colored Dissolvable Organic Matter,CDOM)”,是遙感監(jiān)測(cè)水質(zhì)的主要參數(shù)之一,是不同于浮游植物種群的、與枯衰植物有關(guān)的溶解有機(jī)物。前人研究分析了黃色物質(zhì)的淵源,認(rèn)為海水中的黃色物質(zhì)的來源有二:(1)來源于大陸,主要是江河攜帶;(2)直接由海洋浮游植物有機(jī)體化學(xué)降解而形成。懸浮固體(Suspended Solid,SS)是指水中呈懸浮狀態(tài)的固體。在河口-近岸海域,河川徑流入海時(shí),會(huì)攜帶大量懸浮物質(zhì),使其附近海水中固體懸浮物明顯增大,因此懸浮固體與徑流密切相關(guān)。浮游植物廣泛存在于河流、湖泊和海洋中,植物生長(zhǎng)需要吸收必需的營(yíng)養(yǎng)元素及營(yíng)養(yǎng)鹽,在一定程度上降低了附近水域環(huán)境的營(yíng)養(yǎng)鹽含量,稀釋鹽度。而地球上約一半的光合作用是由浮游植物進(jìn)行的,因此,葉綠素a、氮、磷等含量可作為表征浮游生物量的參數(shù)。海水的溫度是海洋熱能的一種表現(xiàn),溫度對(duì)蒸發(fā)量起決定作用,它通過改變?nèi)芙舛榷绊扄}度,一般而言,溫度越低,溶解度越小,溶解的鹽越少,鹽度就越大。
為檢驗(yàn)各潛在影響因子與海表鹽度的相關(guān)程度,采用影像數(shù)據(jù)所對(duì)應(yīng)的研究區(qū)域監(jiān)測(cè)站,共1 535個(gè)實(shí)測(cè)數(shù)據(jù)(包括鹽度、總氮、懸浮固體、葉綠素a以及溫度,已剔除數(shù)據(jù)異常值),利用統(tǒng)計(jì)軟件SPSS對(duì)鹽度與各因子之間進(jìn)行Pearson相關(guān)分析及雙側(cè)檢驗(yàn),得到結(jié)果如表2所示。
表2 鹽度與各潛在影響因子的相關(guān)關(guān)系
表2給出了Pearson相關(guān)系數(shù),及相關(guān)檢驗(yàn)t統(tǒng)計(jì)量對(duì)應(yīng)的雙尾檢驗(yàn)概率P值。從敏感因子與鹽度的相關(guān)性比較中可以看出,鹽度與總氮、懸浮固體顯著相關(guān),顯著水平達(dá)到0.01,其中與總氮相關(guān)性最高(相關(guān)系數(shù)都在0.8以上,對(duì)應(yīng)的P值均為0.000<0.05)??偟侨芤褐兴泻衔锏目偡Q,即硝酸鹽氮、亞硝酸鹽氮等無機(jī)氮以及大部分有機(jī)含氮化合物的總和。在近海區(qū)域,河川徑流入海時(shí)攜帶了大量的氮、磷等營(yíng)養(yǎng)元素,由此總氮含量可以在一定程度上代表淡水注入量,并與鹽度存在反比關(guān)系。此外,作為浮游植物生長(zhǎng)的重要物質(zhì)基礎(chǔ),氮在大多數(shù)海域中是限制浮游植物生長(zhǎng)的主要營(yíng)養(yǎng)元素,尤其在熱帶和亞熱帶海域作用更加明顯 (Beman etal,2005)。
固體懸浮物含量越大,代表注入的淡水量越大,相應(yīng)區(qū)域內(nèi)的海水鹽度降低。已有多項(xiàng)研究表明溫度對(duì)海表鹽度具有重要影響(Brassington etal,2009;Ravichandran etal,2012)。溫度可直接影響海表水蒸發(fā)量,從而改變鹽度,并能影響水體理化性質(zhì),進(jìn)而改變鹽類在水體中的溶解度,與鹽度形成負(fù)相關(guān)關(guān)系。Davies(2004)研究發(fā)現(xiàn),在海水表面存在高溫、低鹽度的關(guān)系。同時(shí),近岸海水屬于二類水體,懸浮泥沙、黃色物質(zhì)和葉綠素a濃度成為相互獨(dú)立的三要素,共同影響著水體光學(xué)特性,因而懸浮泥沙和黃色物質(zhì)都將對(duì)葉綠素a濃度造成影響,導(dǎo)致葉綠素a對(duì)鹽度的影響復(fù)雜化,不足以直接作用于鹽度。
總體而言,總氮、懸浮固體、溫度與鹽度的相關(guān)性較高,對(duì)鹽度的反演貢獻(xiàn)較大。葉綠素a與鹽度雖然存在一定的相關(guān)性,但較之同時(shí)期的總氮和懸浮固體而言,相關(guān)系數(shù)較小。盡管在少數(shù)年份中存在相關(guān)系數(shù)葉綠素a比溫度大,但兩者僅相差0.019(2004年)、0.064(2005年),而在其他年份中相關(guān)系數(shù)溫度遠(yuǎn)高于葉綠素a。
利用以上相關(guān)關(guān)系及顯著性水平作為篩選參考,并結(jié)合理論分析,剔除葉綠素a,選取總氮(TN)、懸浮固體(SS)、溫度(T)作為鹽度敏感因子用于模型的建立。
在構(gòu)建模型之前,需要設(shè)定模型參數(shù),包括輸入數(shù)據(jù)集以及算法參數(shù)。這里,輸入數(shù)據(jù)集由敏感因子(TN、SS、T)組成,數(shù)據(jù)來自對(duì)ASTER遙感數(shù)據(jù)光譜信息的提取計(jì)算。
2.2.1 光譜參數(shù)提取
Binding等(2003)在研究中發(fā)現(xiàn)黃色物質(zhì)的光學(xué)性質(zhì)可以用波段R665/R490比值來表示;龔紹琦等(2008)在研究中發(fā)現(xiàn)水體中氮、磷對(duì)不同波段光譜反射具有顯著的特征,其中氮在波長(zhǎng)404 nm和477 nm處各有一反射峰。根據(jù)上述實(shí)驗(yàn)結(jié)論,經(jīng)過多種波段組合的嘗試,最終得出與總氮實(shí)測(cè)值的相關(guān)系數(shù)達(dá)到0.633的波段組合:
其中:b1、b2、b3分別對(duì)應(yīng) ASTER數(shù)據(jù)第 1(0.52-0.60μm)、2(0.63-0.69μm)、3N(0.78-0.86μm)波段,以此作為總氮在模型應(yīng)用時(shí)的輸入?yún)?shù)。
香港海域?qū)儆诙愃w,渾濁度高。根據(jù)不同類型水體的實(shí)測(cè)光譜曲線,綠波段對(duì)低懸浮物濃度有很高的相關(guān)度,而且可以校正葉綠素a所產(chǎn)生的干擾,紅波段則對(duì)中高懸浮物濃度敏感(馬超飛等,2005)。因而考慮單波段與比值相結(jié)合的方法反演懸浮固體。
對(duì)于地表溫度,前人多采用劈窗算法、多通道法、插值法、人工神經(jīng)網(wǎng)絡(luò)等方法進(jìn)行反演(劉培等,2008;孫靜等,2010;毛克彪等,2006;張大明等,2005;毛克彪等,2007),但海洋表面環(huán)境復(fù)雜,遠(yuǎn)不如地表穩(wěn)定,因此將以上算法應(yīng)用于海表溫度,效果并不理想。而ASTER數(shù)據(jù)擁有5個(gè)熱紅外通道,能有效地反演溫度。首先利用普朗克公式計(jì)算出各波段亮溫:
其中:λ為波段的中心波長(zhǎng),Bλ(T)是衛(wèi)星測(cè)量輻射強(qiáng)度,C1=1.191 043 56×10-16W·m2,C2=1.438 768 69×10-2m·K。上式可簡(jiǎn)化為:
基于溫度與單波段亮溫的相關(guān)性分析,通過多次計(jì)算驗(yàn)證,最終得出溫度反演線性方程:
其中:T(b10)、T(b12)、T(b13)分別表示ASTER數(shù)據(jù)的第 10(8.125-8.475μm)、12(8.925-9.275μm)、13(10.25-10.95μm)波段的亮溫。
2.2.2 算法參數(shù)設(shè)定
隨機(jī)森林有3個(gè)重要參數(shù):ntree為森林中樹的數(shù)目,nodesize為每個(gè)終端節(jié)點(diǎn)數(shù)據(jù)點(diǎn)的最小數(shù)目,mtry為每個(gè)樹節(jié)點(diǎn)隨機(jī)采樣的數(shù)目。對(duì)于回歸問題,nodesize默認(rèn)值為5,ntree的默認(rèn)值為500,mtry默認(rèn)值為1/3的自變量數(shù)目。
圖3 OOB均方差誤差率圖
將遙感影像提取出的懸浮固體、總氮、溫度數(shù)據(jù)以及對(duì)應(yīng)的鹽度實(shí)測(cè)值作為原始數(shù)據(jù)集輸入分析,得出OOB均方差誤差率圖(圖3)??梢钥闯?,OOB均方誤差隨著樹的數(shù)目增長(zhǎng)而收斂。結(jié)合ntree、nodesize參數(shù)不同取值下R2及MSE的比較(表3、4)可知,當(dāng)nodesize取默認(rèn)值5,ntree=500、1 000、5 000時(shí),R2取值相對(duì)較大,而MSE相對(duì)較小,而當(dāng)ntree=500,nodesize=2及ntree=5 000,nodesize=2時(shí),模型評(píng)價(jià)效果最佳。但兩者相比,ntree取值5 000時(shí),OOB均方誤差曲線(圖3)近乎穩(wěn)定。因此,為了讓森林的整體誤差率趨于穩(wěn)定,并保證RF收斂,在提高算法效率的基礎(chǔ)上,本研究選取ntree=5 000,nodesize=2,同時(shí)將mtry設(shè)為默認(rèn)值,結(jié)合實(shí)測(cè)鹽度值、敏感因子(TN、SS、T)光譜參數(shù)四組數(shù)據(jù)組成原始數(shù)據(jù)集輸入,進(jìn)而利用R語言對(duì)鹽度進(jìn)行回歸建模。
為了評(píng)價(jià)隨機(jī)森林建模結(jié)果,采用決定系數(shù)(R2)和均方誤差(MSE)作為反演模型的評(píng)價(jià)依據(jù)。由圖4可以看出,2005、2006年的決定系數(shù)R2均在0.98以上,而2004年數(shù)據(jù)反演結(jié)果R2則相對(duì)較低(0.856)。由于海表面環(huán)境復(fù)雜,衛(wèi)星過境時(shí)間的不同、實(shí)地采樣的天氣情況差異等因素均會(huì)對(duì)反演結(jié)果精度產(chǎn)生一定程度上的偏差。同時(shí),表層鹽度也會(huì)有季節(jié)循環(huán)和年度躍變形式的變化(石強(qiáng),2013)。
表4 隨機(jī)森林算法ntree、nodesize參數(shù)不同取值的比較
圖4 鹽度預(yù)測(cè)值與實(shí)測(cè)值對(duì)比散點(diǎn)圖(a-f依次代表2003-2008年結(jié)果對(duì)比圖)
經(jīng)過比較發(fā)現(xiàn),圖4中雖然存在偏高或偏低的預(yù)測(cè)值,但總體接近實(shí)測(cè)值、誤差較小,基本服從線性成比例分配。可以看出,鹽度預(yù)測(cè)值與實(shí)測(cè)值之間相關(guān)性強(qiáng),該模型擬合度高,用以描述實(shí)驗(yàn)數(shù)據(jù)具有良好的精確度,能很好地對(duì)實(shí)測(cè)值進(jìn)行預(yù)估。
根據(jù)上述分析結(jié)果,將隨機(jī)森林海表鹽度反演模型應(yīng)用于ASTER遙感影像數(shù)據(jù),得到2003-2008年香港海域鹽度分布(圖5)??梢钥闯鳆}度值集中在27-33 psu之間,在接近大陸區(qū)域的鹽度較低,河流的入海口尤其是鄰接珠江口的后海灣海域,鹽度最低,而開闊海域鹽度相對(duì)較高。研究區(qū)域鹽度分布呈自東南向西北遞減、近岸向遠(yuǎn)岸遞增的總體趨勢(shì),符合現(xiàn)實(shí)情況。
雖然隨機(jī)森林反演模型結(jié)果精度較高,但依然存在著一定的誤差。香港海域是一個(gè)開放性的復(fù)雜環(huán)境,大氣及海洋條件下的宏觀因子均會(huì)對(duì)模型結(jié)果造成一定的影響。從建模的整個(gè)過程來看,誤差來源包括參數(shù)誤差及模型本身誤差。遙感數(shù)據(jù)存在一定的復(fù)雜性,表征溫度、總氮、懸浮固體的數(shù)據(jù)集雖然與之相關(guān)性顯著,但畢竟存在差異,這也會(huì)導(dǎo)致模型精度降低。
圖5 隨機(jī)森林香港海域鹽度反演分布圖
隨機(jī)森林相對(duì)于其他集成學(xué)習(xí)算法的最主要優(yōu)勢(shì)在于對(duì)結(jié)果的可解釋性,即對(duì)變量重要性的測(cè)算,重要性越大,變量特征就越重要。為了得到可靠穩(wěn)定的模型,本研究采用如下測(cè)算方法,即計(jì)算每棵樹OOB誤差和挑選自變量序列后每棵樹的OOB誤差的差:
式中:βc(t)與第t棵樹的OOB樣本相關(guān),其中 t∈和預(yù)測(cè)的樣本 xi在轉(zhuǎn)換特征 f前后的預(yù)測(cè)類別。需要指出的是,如果特征f不在第 t棵樹中時(shí),特征 f作為全部樹的變量重要性計(jì)算如下:
式中:T為樹的數(shù)目。
由此,每一個(gè)隨機(jī)挑選序列的自變量OOB變化便是這個(gè)特定自變量的重要性標(biāo)志。如果一個(gè)自變量是不相關(guān)的,那么隨機(jī)挑選序列的OOB值應(yīng)該有非常小的OOB誤差。
變量重要性度量就是假設(shè)將某個(gè)變量剔除,會(huì)對(duì)模型的結(jié)果精度造成多大的影響。表5體現(xiàn)了變量的重要性,其中節(jié)點(diǎn)不純度由殘差平方和計(jì)算得到,表示變量在每個(gè)分裂節(jié)點(diǎn)的不純度減少值。表中值越大表明該元素對(duì)預(yù)測(cè)結(jié)果影響越大,重要性越高??傮w而言,總氮對(duì)鹽度預(yù)測(cè)的貢獻(xiàn)度很高,而溫度對(duì)其結(jié)果的影響程度較小。可以看出,反演結(jié)果與相關(guān)性分析基本一致,符合客觀事實(shí),且能反映出模型是以總氮為主導(dǎo)因子,懸浮固體、溫度為輔助因子建立的。
表5 變量重要性
本文以ASTER數(shù)據(jù)為例,將隨機(jī)森林算法應(yīng)用于海表面鹽度的反演。預(yù)測(cè)結(jié)果表明,預(yù)測(cè)的鹽度值與實(shí)測(cè)值相關(guān)性強(qiáng),平均相對(duì)誤差小,反演分布結(jié)果符合客觀實(shí)際,基本保證了較高的準(zhǔn)確率與可信度。
由于本研究采用的是間接法,敏感因子的反演過程會(huì)產(chǎn)生一定程度的誤差。因此,在后續(xù)工作中,可基于敏感因子利用影像協(xié)同反演或其他分析方法、模型,以提高各敏感因子的反演精度。此外,根據(jù)隨機(jī)森林算法提供的變量重要性分析,可得到不同潛在敏感因子的貢獻(xiàn)度,據(jù)此適當(dāng)調(diào)整輸入數(shù)據(jù)集的結(jié)構(gòu),簡(jiǎn)化并優(yōu)化隨機(jī)森林模型,增強(qiáng)其實(shí)用性。鑒于同步獲取大量海上實(shí)測(cè)數(shù)據(jù)及遙感數(shù)據(jù)均存在困難,本文僅針對(duì)2003-2008年特定月份的香港海域數(shù)據(jù)進(jìn)行相關(guān)分析,為了拓展模型的應(yīng)用范圍,還需要進(jìn)行其他海域和不同時(shí)相數(shù)據(jù)的分析和檢驗(yàn),來加強(qiáng)模型性能、提高反演精度。
上述結(jié)論說明了利用隨機(jī)森林反演海表鹽度具有可行性,也為進(jìn)一步建立精確的海鹽遙感反演模型提供了參考。
Beman J M,Arrigo K R,Matson P A,2005.Agriculturalrunofffuels large phytoplankton blooms in vulnerable areas ofthe ocean.Nature,434:211-214.
Binding C E,Bowers D G,2003.Measuring the salinity of the Clyde Sea from remotely sensed ocean colour.Estuarine Coastal and Shelf Science 57:605-611.
Brassington G B,Divakaran P,2009.The theoretical impact of remotely sensed sea surface salinity observations in a multi-variate assimilation system.Ocean Modelling,27:70-81.
Breiman L,1996.Bagging predictors.Machine Learning,24:123-140.
Breiman L,2001.Random forests.Machine Learning,45:5-32.
Davies P,2004.Nutrient processes and chlorophyll in the estuaries and plume ofthe Gulf of Papua.Continental Shelf Research,24:2317-2341.
Gislason P O,Benediktsson J A,Sveinsson J R,2006.Random Forests for land coverclassification.Pattern Recognition Letters,27:294-300.
Ham J,Chen Y C,Crawford M M,etal,2005.Investigation ofthe random forest framework for classification of hyperspectral data.Ieee Transactions on Geoscience and Remote Sensing,43:492-501.
Klein L A,Swift C T,1997.An Improved Model for the Dielectric Constant of Sea Water at Microwave Frequencies.IEEE J Ocean Eng,2:14-111.
Pal M,2005.Random forest classifier for remote sensing classification.InternationalJournalofRemote Sensing,26:217-222.
Ravichandran M,Girishkumar M S,Riser S,2012.Observed variability of chlorophyll-a using Argo profiling floats in the southeastern Arabian Sea.Deep-Sea Research Part I-Oceanographic Research Papers,65:15-25.
Silio Calzada A,Bricaud A,Gentili B,2008.Estimates of sea surface nitrate concentrations from sea surface temperature and chlorophyll concentration in upwelling areas:A case study for the Benguela system.Remote Sensing ofEnvironment,112:3173-3180.
Verikas A,Gelzinis A,Bacauskiene M,2011.Mining data with random forests:A survey and results of new tests.Pattern Recognition,44:330-349.
Waske B,Braun M,2009.Classifier ensembles for land cover mapping using multitemporal SAR imagery.Isprs Journal of Photogrammetry and Remote Sensing,64:450-457.
高國(guó)棟,張文孝,慕光宇,2011.RBF網(wǎng)絡(luò)和BP網(wǎng)絡(luò)在海水鹽度建模中的比較研究.海洋通報(bào),30(1):12-15.
龔紹琦,黃家柱,李云梅,等,2008.水體氮磷高光譜遙感實(shí)驗(yàn)研究初探.光譜學(xué)與光譜分析,28(4):839-842.
李志,魏恩泊,田紀(jì)偉,2007.一個(gè)L波段海表鹽度遙感反演的新經(jīng)驗(yàn)?zāi)J?物理學(xué)報(bào),56(05):3028-3030.
劉培,杜培軍,張華鵬,2008.基于劈窗算法從ASTER遙感數(shù)據(jù)反演地表溫度.測(cè)繪標(biāo)準(zhǔn)化,24(2):5-9.
馬超飛,蔣興偉,唐軍武,等,2005.HY-1 CCD寬波段水色要素反演算法.海洋學(xué)報(bào),27(4):38-44.
毛克彪,施建成,覃志豪,等,2006.一個(gè)針對(duì)ASTER數(shù)據(jù)同時(shí)反演地表溫度和比輻射率的四通道算法.遙感學(xué)報(bào),10(4):593-599.
毛克彪,唐華俊,陳仲新,等,2007.一個(gè)用神經(jīng)網(wǎng)絡(luò)優(yōu)化的針對(duì)ASTER數(shù)據(jù)反演地表溫度和發(fā)射率的多波段算法.國(guó)土資源遙感,3:18-22.
石強(qiáng),2013.渤海溫鹽場(chǎng)季節(jié)循環(huán)時(shí)空參數(shù)模型.海洋通報(bào),32(2):152-159.
孫靜,趙萍,葉琦,2010.一種ASTER數(shù)據(jù)地表溫度反演的劈窗算法.遙感技術(shù)與應(yīng)用,27(5):728-734.
王林,趙冬至,楊建洪,2012.基于環(huán)境一號(hào)衛(wèi)星的大洋河河口海域營(yíng)養(yǎng)鹽遙感反演.中國(guó)環(huán)境科學(xué),32(1):136-141.
殷曉斌,劉玉光,王振占,等,2006.一種用于微波輻射計(jì)遙感海表面鹽度和溫度的反演算法.地球科學(xué),36(10):968-976.
張大明,許東峰,章本照,2005.最優(yōu)插值法及其在熱帶太平洋海表溫度數(shù)據(jù)同化中的應(yīng)用.海洋學(xué)研究,23(4):1-7.