武爽,馮險(xiǎn)峰,陳點(diǎn)點(diǎn),陳振,陳蕓芝
(1.中國(guó)科學(xué)院地理科學(xué)與資源研究所 資源與環(huán)境信息國(guó)家重點(diǎn)實(shí)驗(yàn)室,北京 100101;2.中國(guó)科學(xué)院大學(xué),北京 100049;3.天津市城市規(guī)劃設(shè)計(jì)研究總院有限公司,天津 300190;4.福州大學(xué) 數(shù)字中國(guó)研究院(福建),福州 350108)
河流作為水資源的重要組成部分,在調(diào)節(jié)區(qū)域氣候等方面發(fā)揮著非常重要的作用,是區(qū)域生態(tài)環(huán)境可持續(xù)發(fā)展的重要因素[1-2]。隨著城鎮(zhèn)化和工農(nóng)業(yè)發(fā)展進(jìn)程加快,大量工業(yè)廢水及生活污水被排入河流[3],我國(guó)河流污染問題日益突出,因而研究河流水質(zhì)變化,為河流治理提供意見顯得尤為重要。
葉綠素a與水體富營(yíng)養(yǎng)化和水生生物平衡密切相關(guān),是衡量水環(huán)境質(zhì)量的重要指標(biāo)。水質(zhì)監(jiān)測(cè)是水質(zhì)評(píng)價(jià)與水污染防治的重要依據(jù)[4],因此對(duì)河流中葉綠素a進(jìn)行實(shí)時(shí)監(jiān)測(cè)及污染物遷移動(dòng)態(tài)監(jiān)測(cè),是河流水質(zhì)治理的關(guān)鍵步驟。遙感技術(shù)由于具備監(jiān)測(cè)范圍廣、速度快、成本低等優(yōu)勢(shì)已經(jīng)被廣泛用于水體水質(zhì)監(jiān)測(cè)中[5-6],彌補(bǔ)了傳統(tǒng)監(jiān)測(cè)方法無法實(shí)現(xiàn)長(zhǎng)期動(dòng)態(tài)監(jiān)測(cè)水質(zhì)的不足。
水中葉綠素a濃度的高低會(huì)導(dǎo)致水體光譜信息出現(xiàn)差異,根據(jù)這一特性,國(guó)內(nèi)外學(xué)者基于遙感影像及實(shí)測(cè)數(shù)據(jù),利用統(tǒng)計(jì)回歸[7-10]以及機(jī)器學(xué)習(xí)方法[11-14]建立了不同區(qū)域的葉綠素a反演模型。隨著遙感影像時(shí)空分辨率的提升,以及內(nèi)陸水體光譜特征研究的逐漸深入,葉綠素a反演逐漸被應(yīng)用于內(nèi)陸水體,而河流由于其流動(dòng)性較強(qiáng),渾濁度較高,因而遙感監(jiān)測(cè)河流葉綠素a濃度難度較高[15-16]。水體中葉綠素a的光譜特征在不同季節(jié)以及豐、枯水期均存在差異[17],而關(guān)于內(nèi)陸水體葉綠素a反演研究大多是單時(shí)相反演模型應(yīng)用到各個(gè)時(shí)期的葉綠素a反演,目前僅有部分學(xué)者對(duì)湖泊[18]以及河口、海灣等地區(qū)[19-20]進(jìn)行分期葉綠素a反演模型構(gòu)建,雖有效提升了葉綠素a反演精度,但由于受到采樣數(shù)據(jù)限制,針對(duì)河流的分期葉綠素a反演研究仍較少。
閩江是福建省第一大河,其在省生態(tài)建設(shè)中占有舉足輕重的地位,也是國(guó)家生態(tài)環(huán)境部批準(zhǔn)的河流治理示范點(diǎn)[21]。近幾年閩江水環(huán)境整治工作取得了一定成效,閩江整體水質(zhì)良好,均為Ⅰ~Ⅲ類水,但由于城市化進(jìn)程的加快,農(nóng)業(yè)、養(yǎng)殖業(yè)和工業(yè)的迅速發(fā)展及閩江水量的減少,部分河段、水庫(kù)的環(huán)境問題突出[22-24]。本文以閩江干流為例,基于Landsat影像,利用閩江實(shí)測(cè)光譜特征差異分別建立豐、枯水期閩江干流葉綠素a的遙感反演模型并進(jìn)行精度檢驗(yàn),對(duì)閩江干流水質(zhì)進(jìn)行遙感監(jiān)測(cè)。
本文利用遙感技術(shù)監(jiān)測(cè)閩江水質(zhì)變化,而閩江上游水域狹小,難以利用遙感影像進(jìn)行相應(yīng)研究,因而本文以閩江干流及其連通水域如大樟溪、尤溪、古田水庫(kù)等作為研究區(qū),地理范圍為117°58′E~119°35′E、25°28′N~26°44′N,其中閩江干流為沙溪匯入富屯溪后經(jīng)延平至瑯岐島入海的河段,長(zhǎng)約230 km。為方便行文表述,本文將研究區(qū)概述為閩江干流。
主要包括兩種數(shù)據(jù),一種是實(shí)測(cè)數(shù)據(jù),包括水質(zhì)數(shù)據(jù)及光譜數(shù)據(jù),另一種是遙感影像數(shù)據(jù)。
1)實(shí)測(cè)水質(zhì)數(shù)據(jù)。本文在2014、2017、2019年野外采樣數(shù)據(jù)基礎(chǔ)上,于2020年11月10日和11月11日分別進(jìn)行了兩次野外采樣,采樣時(shí)間與選取衛(wèi)星的過境時(shí)間基本同步,采樣水質(zhì)數(shù)據(jù)為水溫及葉綠素a濃度數(shù)據(jù)。在采樣點(diǎn)位布設(shè)過程中,考慮了與往年采樣點(diǎn)位的一致性,并且結(jié)合實(shí)際需要,在重點(diǎn)區(qū)域增加了點(diǎn)位布設(shè)(圖1)。綜合往年采樣以及本次野外采樣情況,共在閩江下游白沙至瑯岐島段采樣了135組數(shù)據(jù)。
2)實(shí)測(cè)光譜數(shù)據(jù)。采用美國(guó)ASD公司生產(chǎn)的Field Spec4手持便攜式光譜分析儀進(jìn)行光譜測(cè)量,獲得了研究區(qū)水體的光譜反射率。
3)遙感影像數(shù)據(jù)。通過對(duì)比國(guó)內(nèi)外主要遙感衛(wèi)星數(shù)據(jù),綜合考慮了數(shù)據(jù)覆蓋時(shí)間、空間分辨率、時(shí)間分辨率、光譜分辨率、幅寬等因素,本文確定了Landsat影像作為基礎(chǔ)數(shù)據(jù)。
本文基于Landsat影像,利用實(shí)測(cè)光譜及葉綠素a濃度數(shù)據(jù)通過相關(guān)分析,確定對(duì)葉綠素a變化響應(yīng)敏感的影像波段/波段組合,基于敏感波段/波段組合和葉綠素a實(shí)測(cè)濃度分別建立了多元回歸以及機(jī)器學(xué)習(xí)模型,通過對(duì)比分析不同模型的結(jié)果,確定閩江干流的最佳葉綠素a反演模型。
1)相關(guān)分析。通過計(jì)算實(shí)測(cè)葉綠素a濃度與影像波段/波段組合間相關(guān)系數(shù)Rxy進(jìn)行相關(guān)分析,確定對(duì)于實(shí)測(cè)葉綠素a濃度響應(yīng)敏感的影像波段/波段組合。相關(guān)系數(shù)的取值區(qū)間在-1到1之間,1表示兩個(gè)變量完全線性相關(guān),-1表示兩個(gè)變量完全負(fù)相關(guān),0表示兩個(gè)變量不相關(guān)。
2)多元線性回歸模型。多元線性回歸模型是多個(gè)自變量的回歸,本研究以葉綠素a濃度作為y值,多個(gè)敏感波段/波段組合作為xi值。
3)機(jī)器學(xué)習(xí)。本文利用機(jī)器學(xué)習(xí)方法對(duì)葉綠素a濃度進(jìn)行反演模型構(gòu)建,并進(jìn)行精度驗(yàn)證。根據(jù)文獻(xiàn)[25-27]研究經(jīng)驗(yàn),采用的機(jī)器學(xué)習(xí)方法包括BP神經(jīng)網(wǎng)絡(luò)、隨機(jī)森林、粒子群算法優(yōu)化的徑向基神經(jīng)網(wǎng)絡(luò)、粒子群算法優(yōu)化的最小二乘支持向量機(jī)等。
(1)BP神經(jīng)網(wǎng)絡(luò)?;谌龑由窠?jīng)網(wǎng)絡(luò)結(jié)構(gòu),將葉綠素a實(shí)測(cè)濃度數(shù)據(jù)作為輸出層,敏感波段/波段組合作為輸入層,輸入層神經(jīng)元個(gè)數(shù)為4,通過不斷調(diào)整隱含層節(jié)點(diǎn)數(shù),分別構(gòu)建豐水期及枯水期葉綠素a反演模型,進(jìn)行研究區(qū)葉綠素a反演。
(3)PSO-RBF是將徑向基神經(jīng)網(wǎng)絡(luò)(radial basis function,RBF)的初始化參數(shù)作為粒子群算法的粒子個(gè)體,利用PSO(particle swarm optimization)算法進(jìn)行優(yōu)化,從而提升RBF神經(jīng)網(wǎng)絡(luò)模型的性能。本文將葉綠素a實(shí)測(cè)濃度數(shù)據(jù)作為輸出層,敏感波段/波段組合作為輸入層,運(yùn)用PSO-RBF方法構(gòu)建豐、枯水期的葉綠素a反演模型。
(4)PSO-LSSVM運(yùn)用PSO算法優(yōu)化最小二乘支持向量機(jī)(least squares support vector machine,LSSVM)的兩個(gè)參數(shù),可以有效提高模型的預(yù)測(cè)精度和收斂速度。本文基于葉綠素a實(shí)測(cè)數(shù)據(jù)及遙感影像敏感波段/波段組合,利用PSO-LSSVM方法進(jìn)行反演模型構(gòu)建,其中粒子群個(gè)數(shù)經(jīng)過調(diào)整設(shè)置為50,迭代次數(shù)為400。
4)精度驗(yàn)證。利用平均絕對(duì)誤差、平均相對(duì)誤差、均方根誤差以及擬合優(yōu)度R2對(duì)葉綠素a反演結(jié)果進(jìn)行精度驗(yàn)證,確定出最佳的反演模型方法。
1)光譜曲線平滑。通過實(shí)際測(cè)量,獲得了2014—2020年閩江干流水體光譜反射率曲線共129組,原始曲線中噪點(diǎn)較多,本文利用Savitzky-Golay平滑器,通過移動(dòng)窗口,利用最小二乘法進(jìn)行最佳擬合,用以平滑實(shí)測(cè)水體光譜反射率曲線中的噪聲數(shù)據(jù)。
2)光譜特征分析。結(jié)合實(shí)測(cè)光譜數(shù)據(jù)、現(xiàn)場(chǎng)采樣照片及水質(zhì)數(shù)據(jù),可將閩江干流水體光譜特征分為兩類(圖2),第一類水體懸浮泥沙含量較高,懸浮物濃度為140~200 mg/L,水體較為渾濁,在550~700 nm范圍內(nèi)反射率呈水平波動(dòng);第二類為葉綠素a濃度中等的較為清澈水體,懸浮物濃度為10~40 mg/L,其在550~700 nm范圍內(nèi)反射率呈逐漸下降趨勢(shì)。
3)可反演影像區(qū)域篩選。由于水體光譜特征在可見光及近紅外波段較為明顯,因而本文僅針對(duì)Landsat系列影像中的可見光及近紅外范圍內(nèi)的波段進(jìn)行分析。為方便表述,以Bblue代表藍(lán)光波段反射率、Bgreen代表綠光波段反射率、Bred代表紅光波段反射率、Bnir代表近紅外波段反射率,通過對(duì)單波段以及加、減、比值、指數(shù)等共計(jì)28種不同的單波段或波段組合與葉綠素a濃度進(jìn)行相關(guān)分析,完成影像敏感波段選擇。
利用剔除異常值后的數(shù)據(jù)進(jìn)行相關(guān)分析,結(jié)果發(fā)現(xiàn),利用總體樣本得到的相關(guān)性結(jié)果并不理想(|R2|≤0.5)。而將豐、枯水期的樣本數(shù)據(jù)進(jìn)行分別相關(guān)性分析,發(fā)現(xiàn)豐水期具有比較明顯的敏感波段,而枯水期波段與葉綠素a濃度間相關(guān)性依然不顯著(|R2|≤0.5)。
結(jié)合光譜特征分析結(jié)果,初步確定Landsat影像中的綠光波段(Bgreen)、紅光波段(Bred)是反映閩江干流水體光譜特征的對(duì)應(yīng)波段,根據(jù)懸浮泥沙含量對(duì)葉綠素a反演的影響,以及其光譜特征,本文假設(shè)Bgreen-Bred值達(dá)到一定標(biāo)準(zhǔn)的水體區(qū)域葉綠素a濃度反演效果較好,豐水期所有采樣點(diǎn)均滿足Bgreen>Bred,并且二者間存在一定差值,其相關(guān)性分析結(jié)果較佳。因而針對(duì)枯水期波段與葉綠素a濃度間相關(guān)性不顯著問題,研究以Bgreen-Bred值的不同大小為標(biāo)準(zhǔn),通過相關(guān)分析,篩選可用于枯水期反演的采樣點(diǎn)。
相關(guān)分析結(jié)果表明,枯水期滿足0 4)影像敏感波段選擇。通過對(duì)比豐、枯水期的相關(guān)分析結(jié)果,豐水期所有樣點(diǎn)均滿足葉綠素a光譜特征,可進(jìn)行葉綠素a反演模型的構(gòu)建,其敏感波段組合為Bblue/Bred、(Bblue-Bred)/(Bblue+Bred)、Bgreen/Bred、Bgreen/Bnir,敏感波段及波段組合的|Rxy|均大于0.5,Rxy最大的Rxy為-0.68,對(duì)應(yīng)的是Bblue/Bred;枯水期僅有部分樣點(diǎn)滿足葉綠素a光譜特征,可用于葉綠素a反演,因而研究根據(jù)Bgreen-Bred值的范圍結(jié)合相關(guān)分析結(jié)果,將采樣點(diǎn)分為0 綜合上述結(jié)果來看,豐、枯水期影像敏感波段不同,并且豐水期及分區(qū)域的枯水期相關(guān)分析結(jié)果較佳,結(jié)合實(shí)測(cè)水質(zhì)結(jié)果分析,豐、枯水期葉綠素a濃度存在很大差異,豐水期葉綠素a濃度整體偏高,均值為11.47 ug/L,而枯水期葉綠素a濃度整體偏低,均值為2.35 ug/L,另外根據(jù)熒光峰位置(670~700 nm)與葉綠素a濃度間關(guān)系,豐、枯水期水體中葉綠素a與光譜間響應(yīng)關(guān)系不同,豐水期葉綠素a光譜特征呈現(xiàn)顯著的隨著葉綠素a濃度增加,熒光峰向長(zhǎng)波方向移動(dòng),而枯水期熒光峰與葉綠素a濃度間無顯著相關(guān)。綜合考慮這些因素,本文對(duì)豐、枯水期以及不同影像區(qū)域分別構(gòu)建葉綠素a反演模型。 1)不同回歸模型反演精度對(duì)比。基于實(shí)測(cè)數(shù)據(jù),對(duì)豐水期及枯水期分別利用多元線性回歸及機(jī)器學(xué)習(xí)方法構(gòu)建閩江干流葉綠素a反演模型,并對(duì)反演結(jié)果進(jìn)行精度驗(yàn)證。 通過對(duì)比多元線性回歸模型以及機(jī)器學(xué)習(xí)模型的反演精度,確定豐、枯水期葉綠素a反演的最佳模型。由于枯水期反演結(jié)果存在著對(duì)于實(shí)測(cè)值結(jié)果極低時(shí)預(yù)測(cè)精度較差的情況,因而在進(jìn)行精度驗(yàn)證中計(jì)算的枯水期精度指標(biāo)是去除實(shí)測(cè)值極低后的結(jié)果,即去除了枯水期Ⅰ(0 通過對(duì)不同方法構(gòu)建的模型進(jìn)行精度對(duì)比可知(表1),豐水期及枯水期Ⅰ的葉綠素a最佳反演模型為機(jī)器學(xué)習(xí)中的隨機(jī)森林方法,而枯水期Ⅱ的葉綠素a最佳反演模型根據(jù)精度驗(yàn)證結(jié)果為多元線性回歸方法,但是由于其實(shí)際估測(cè)結(jié)果中出現(xiàn)了較多負(fù)值,因而枯水期Ⅱ的葉綠素a反演模型選擇了機(jī)器學(xué)習(xí)中的BP神經(jīng)網(wǎng)絡(luò)方法。 表1 不同回歸模型預(yù)測(cè)葉綠素a的精度情況 2)前人研究模型精度對(duì)比。前人基于2017年采樣數(shù)據(jù),利用最佳三波段因子構(gòu)建了生物光學(xué)模型[28],本文通過對(duì)比實(shí)測(cè)值及三波段光學(xué)模型結(jié)果以及本文的隨機(jī)森林模型結(jié)果,如圖3所示,可以看出,隨機(jī)森林模型能夠較好地反映葉綠素a的真實(shí)結(jié)果。 隨著遙感影像時(shí)空分辨率的提升以及內(nèi)陸水體光譜特征研究的逐漸深入,葉綠素a反演逐漸被應(yīng)用于內(nèi)陸水體如湖泊、河流等。內(nèi)陸水體情況復(fù)雜,傳統(tǒng)的統(tǒng)計(jì)回歸方法難以滿足葉綠素a反演精度要求,機(jī)器學(xué)習(xí)算法對(duì)葉綠素a反演精度較高,并且具有一定的抗干擾能力。本文基于Landsat影像,通過分析豐、枯水期閩江干流水體實(shí)測(cè)葉綠素a光譜特征,確定對(duì)葉綠素a濃度變化響應(yīng)敏感的影像波段/波段組合,并利用多元線性回歸及機(jī)器學(xué)習(xí)方法構(gòu)建葉綠素a遙感反演模型。研究結(jié)果表明:水體光譜特征為綠光波段反射率-紅光波段反射率>0的影像區(qū)域適用于進(jìn)行葉綠素a反演;基于豐、枯水期葉綠素a濃度及光譜特征差異,確定了豐、枯水期及不同影像區(qū)域敏感波段不同;豐、枯水期03.2 葉綠素a反演模型精度對(duì)比
4 結(jié)束語