夏曉蕓,解啟蒙,楊國范,吳永玉,張麗華
(沈陽農(nóng)業(yè)大學(xué),沈陽 110866)
水中葉綠素a含量反映水體富營養(yǎng)水平,是水質(zhì)監(jiān)測(cè)中一項(xiàng)重要的指標(biāo)?,F(xiàn)階段葉綠素a監(jiān)測(cè)仍以斷面實(shí)地采集為主,無法進(jìn)行整個(gè)水體的大面積監(jiān)測(cè)。衛(wèi)星技術(shù)不斷發(fā)展,遙感水質(zhì)反演逐漸彌補(bǔ)常規(guī)水質(zhì)監(jiān)測(cè)的不足,實(shí)現(xiàn)了時(shí)效性強(qiáng)、大范圍的水質(zhì)監(jiān)測(cè)[1]。Fraser[2]研究了美國22個(gè)內(nèi)陸湖泊的水質(zhì)反演規(guī)律,研究發(fā)現(xiàn)葉綠素a濃度與反射率的一階微分值有較好的相關(guān)性。Rosa[3]應(yīng)用TM、ETM+等數(shù)據(jù)對(duì)二類水體維多利亞湖的葉綠素a含量進(jìn)行了反演研究。鄭高強(qiáng)等[4]基于環(huán)境衛(wèi)星CCD數(shù)據(jù)建立了廈門海域的葉綠素a濃度反演模型,能反映葉綠素a的變化范圍與時(shí)間。杜娟等[1]以遼寧省大凌河為研究對(duì)象,應(yīng)用HJ-1B遙感數(shù)據(jù)分別建立了線性回歸模型和RBF神經(jīng)網(wǎng)絡(luò)模型,定量反演葉綠素a濃度。目前,國內(nèi)學(xué)者多在太湖等大型湖泊進(jìn)行葉綠素a反演研究[5-9],針對(duì)水體較清澈的北方水源地型水庫的研究相對(duì)比較少。
大伙房水庫位于遼寧省東北部(123°39′42″E~125°28′58″E,41°41′10″N~42°38′32″N),距沈陽市68 km。有渾河(清原段)、蘇子河和社河3條河流匯入庫區(qū),總庫容22.68 億m3,千年一遇設(shè)計(jì),可能最大洪水校核。水庫東西長(zhǎng)約35 km,是沈陽、撫順等7座省內(nèi)城市約2200萬人口的主要水源地。本研究以2016年9月21日、2016年10月22日、2017年4月26日、2017年5月18日、2017年6月13日、2017年7月18日和2017年8月24日的環(huán)境衛(wèi)星影像為數(shù)據(jù)源,實(shí)地采集大伙房庫區(qū)水體水樣,實(shí)驗(yàn)室測(cè)定葉綠素a濃度,結(jié)合衛(wèi)星影像數(shù)據(jù)分析葉綠素a的敏感波段組合,建立大伙房水庫葉綠素a濃度的反演模型。旨在提高模型反演精度,突破線性回歸模型的局限性,準(zhǔn)確、高效的服務(wù)于水庫管理部門,為北方其他水源地型水庫水質(zhì)監(jiān)測(cè)提供參考。
在ArcGIS 10.2中利用正方形網(wǎng)格對(duì)庫區(qū)進(jìn)行劃分,考慮行船方便等實(shí)際情況,均勻布設(shè)水質(zhì)參數(shù)實(shí)測(cè)點(diǎn),同時(shí)加入庫區(qū)原有監(jiān)測(cè)點(diǎn)。最后確定網(wǎng)格大小(1 400 m×1 400 m)選擇了30個(gè)樣本采集點(diǎn),如圖1所示布設(shè)。采樣過程中使用的器材有:采樣器、30組500 mL棕色玻璃瓶,簽字筆,GPS(South750),藥品箱,采樣記錄表等記錄工具。采集水樣時(shí)將船開到樣點(diǎn),GPS記錄水樣采集點(diǎn)的經(jīng)緯度坐標(biāo),利用采樣器采集水面下50 cm處水樣,同時(shí)每個(gè)采樣瓶加入0.5 mL 1%的碳酸鎂懸濁液,防止酸化引起色素溶解,將水樣注入棕色瓶中直至水樣瓶裝滿,記錄樣點(diǎn)序號(hào),采集完成后立即送至實(shí)驗(yàn)室完成葉綠素a濃度的測(cè)定。每月與撫順市水文局工作人員采集一次水樣。
圖1 采樣點(diǎn)分布圖Fig.1 Locations of sampling sites
研究選用的環(huán)境衛(wèi)星2008年9月6日開始服役,該衛(wèi)星包含A、B兩顆小衛(wèi)星,搭載的CCD傳感器空間分辨率可達(dá)30 m,數(shù)據(jù)可以在中國資源衛(wèi)星應(yīng)用中心(http:∥www.secmep.cn)下載。與landsat 8 OLI數(shù)據(jù)16天的過境周期相比,環(huán)境衛(wèi)星2天的時(shí)間分辨率更利于影像數(shù)據(jù)的獲取,便于進(jìn)行長(zhǎng)序列的水質(zhì)監(jiān)測(cè)。
根據(jù)實(shí)地取樣時(shí)間,獲取了2016年9月21日、2016年10月22日、2017年4月26日、2017年5月18日、2017年6月13日、2017年7月18日和2017年8月24日的環(huán)境衛(wèi)星影像,盡量選擇無云的影像確保反演精度,對(duì)影像數(shù)據(jù)進(jìn)行預(yù)處理。在ENVI中首先進(jìn)行影像的輻射定標(biāo),將灰度值轉(zhuǎn)為亮度值;對(duì)影像進(jìn)行幾何校正,幾何校正時(shí)在美國地質(zhì)調(diào)查局網(wǎng)站(http:∥glovis.usgs.gov/)下載1景l(fā)andsat 8衛(wèi)星OLI數(shù)據(jù)作為校正的基本影像;制作波譜曲線完成大氣校正,消除大氣散射的影響;最后對(duì)影像數(shù)據(jù)進(jìn)行裁剪得到研究區(qū)的遙感影像。
分析星上點(diǎn)與水樣實(shí)測(cè)點(diǎn)的對(duì)應(yīng)關(guān)系,構(gòu)建葉綠素a濃度與水體反射率的關(guān)系模型,可以進(jìn)行葉綠素a濃度的定量反演。由于采樣器皿等問題,部分月份實(shí)地采樣時(shí)未采集夠30個(gè)樣點(diǎn),分析遙感影像時(shí)進(jìn)行了異常采樣點(diǎn)的剔除,最后得到186組采樣數(shù)據(jù)。各月隨機(jī)分配后取140組作為建模數(shù)據(jù),46組作為驗(yàn)證數(shù)據(jù)。選擇與葉綠素a濃度顯著相關(guān)的波段或波段組合,分別構(gòu)建大伙房的線性回歸模型與最小二乘支持向量機(jī)(LS-SVM)模型,進(jìn)行葉綠素a濃度的反演并驗(yàn)證模型精度。
環(huán)境衛(wèi)星數(shù)據(jù)的CCD傳感器分紅、綠、藍(lán)和近紅外4個(gè)波段。在不同的遙感數(shù)據(jù)源、水體等條件下會(huì)構(gòu)建不同的反演模型,所以選擇合適的敏感波段進(jìn)行大伙房水庫葉綠素a濃度反演模型的構(gòu)建十分重要。本研究應(yīng)用SPSS軟件進(jìn)行敏感波段的選擇。將建模數(shù)據(jù)的坐標(biāo)導(dǎo)入預(yù)處理后的遙感影像中,獲得各實(shí)測(cè)點(diǎn)的單波段地表反射率值,將單波段隨機(jī)組合,進(jìn)行單波段或波段組合與實(shí)測(cè)葉綠素a濃度的相關(guān)關(guān)系分析,結(jié)果如表1所示。
表1 單波段或波段組合與葉綠素a濃度的相關(guān)關(guān)系(n=140)Tab.1 Correlation between single band or band combination and chla
表1為與葉綠素a濃度相關(guān)性較好的單波段或波段組合。不同的波段組合后可以提高模型的準(zhǔn)確性,將大伙房水庫與葉綠素a濃度相關(guān)性較高的波段進(jìn)行波段重新組合后,可以看出波段組合與葉綠素a濃度的相關(guān)性高于單波段。本研究選擇的敏感波段組合為(B2-B1),與葉綠素a濃度呈正相關(guān),相關(guān)性達(dá)到0.626,并在0.01水平上顯著相關(guān)。
以敏感波段組合(B2-B1)為自變量,葉綠素a實(shí)測(cè)濃度為因變量,建立回歸方程如下:
y= 0.044x+ 6.4149R2=0.411 8
(1)
Williams[10]研究發(fā)現(xiàn)模型的好壞可以根據(jù)決定系數(shù)的大小來評(píng)價(jià),一般R2在0.5~0.65范圍內(nèi)為較差模型,在0.66~0.81范圍內(nèi)為一般模型,在0.82~0.9范圍內(nèi)為較好模型,在0.91~1范圍內(nèi)為精準(zhǔn)模型。構(gòu)建的線性回歸模型無法滿足研究需要。
SuykensJAK&VandewalleJ[11]于1999年提出了最小二乘支持向量機(jī)(LeastSquaresSupportVectorMachine,LS-SVM)。LS-SVM在標(biāo)準(zhǔn)支持向量機(jī)的基礎(chǔ)上引入了誤差平方和的概念,使得其在對(duì)目標(biāo)計(jì)算的過程中計(jì)算量更少、求解難度更低、速度更快。LS-SVM的計(jì)算原理是將非線性映射輸入向量從低維空間映射到高維空間并進(jìn)行擬合[12]。LS-SVM數(shù)學(xué)表述如下:
設(shè)訓(xùn)練樣本集:D={(xk,yk)|k=1,2,K N},xk∈Rn,yk∈R,xk是輸入數(shù)據(jù),yk是輸出數(shù)據(jù)。在w空間中的函數(shù)估計(jì)問題可以描述并解決的問題為:
誤差變量;ek∈R;b是偏差量;γ是正則化參數(shù)。
約束條件:
yk=wTφ(xk)+b=ek,k=1,K,N
(3)
拉格朗日函數(shù)表示方式如式:
其中:拉格朗日乘子ak∈R。對(duì)上式進(jìn)行優(yōu)化,根據(jù)KTT條件:
對(duì)于k=1,…,N,消去w和e,得到如下方程:
式中:M為一個(gè)方陣,1=[1,…,1]T,Y=[t1,…,yN]T,a=[a1,…,aN]T其第i行j列的元素為Mij=φ(xi)Tφ(xj)=M(xi,yi),M(x,y)為核函數(shù)。用最小二乘法求出a和b,由此得到預(yù)測(cè)輸出:
本文選擇了140組建模數(shù)據(jù)建立了兩種不同的遙感反演模型,剩余46組驗(yàn)證數(shù)據(jù)分別帶入到兩種模型中得到模型的預(yù)測(cè)值,模型預(yù)測(cè)值與實(shí)測(cè)值的相對(duì)誤差結(jié)果見表2,相關(guān)性分析見圖2。LS-SVM模型計(jì)算值與實(shí)際值的可決系數(shù)R2=0.816 7大于波段組合模型R2=0.591 8,在葉綠素a的反演中,LS-SVM模型的計(jì)算效果較好。
本研究分別建立了線性回歸模型與LS-SVM模型反演大伙房水庫庫區(qū)葉綠素a含量,由表2可知,線性回歸模型的預(yù)測(cè)值相對(duì)誤差平均值為65.4%,反演誤差超過50%的點(diǎn)有18個(gè);而LS-SVM模型的預(yù)測(cè)值相對(duì)誤差平均值為24.49%,遠(yuǎn)小于線性回歸模型相對(duì)誤差的平均值,其反演誤差超過50%的點(diǎn)僅有2個(gè)。因此,本研究建立的LS-SVM模型的預(yù)測(cè)效果遠(yuǎn)好于線性回歸模型。
表2 葉綠素a濃度預(yù)測(cè)值與實(shí)測(cè)值相對(duì)誤差Tab.2 The relative error of the predicted values and the measured values of Chla
圖2 葉綠素a濃度實(shí)測(cè)值與預(yù)測(cè)值的相關(guān)性Fig.2 Correlation between predicted value
圖3是將LS-SVM模型應(yīng)用于2016年9-10月和2017年4-8月的大伙房水庫葉綠素a濃度分布圖。2016年9至10月,庫區(qū)葉綠素a濃度主要為1~10 μg/L,渾河與蘇子河入庫口附近葉綠素a濃度較高。2017年4月,庫區(qū)葉綠素a濃度主要為1~10 μg/L,最多不超過26 μg/L。5月,庫區(qū)葉綠素a濃度主要為1~10 μg/L,與4月情況相近,濃度均不大于26 μg/L。6月,庫區(qū)葉綠素a濃度主要為26~64 μg/L,葉綠素a濃度與4、5月相比明顯升高。7月,庫區(qū)葉綠素a濃度主要為26~64 μg/L,渾河、蘇子河入庫口附近水質(zhì)情況較差。8月,庫區(qū)葉綠素a濃度主要為10~26 μg/L,水質(zhì)情況與7月相比略微改善。
遙感水質(zhì)監(jiān)測(cè)時(shí)效性強(qiáng)、監(jiān)測(cè)面積廣,與常規(guī)水質(zhì)監(jiān)測(cè)相互補(bǔ)充可實(shí)現(xiàn)科學(xué)的水質(zhì)管理。本文利用實(shí)時(shí)遙感影像數(shù)據(jù)與實(shí)測(cè)數(shù)據(jù)建立了適用于反演大伙房水庫葉綠素a的線性回歸模型和最小二乘支持向量機(jī)模型。由于水體結(jié)構(gòu)復(fù)雜,影響水質(zhì)參數(shù)光學(xué)性質(zhì)的因素較多,非線性的最小二乘支持向量機(jī)模型的反演精度明顯高于簡(jiǎn)單的線性回歸模型,該模型的建立也為北方其他水庫水質(zhì)參數(shù)的反演研究提供了參考。本次研究所用的建模數(shù)據(jù)與驗(yàn)證數(shù)據(jù)較少,日后可加密采樣點(diǎn),增加采樣周期以增大訓(xùn)練數(shù)據(jù)量,使模型的精度更高;本文僅對(duì)葉綠素a濃度進(jìn)行反演,可進(jìn)一步研究其他水質(zhì)參數(shù)的反演。
圖3 大伙房水庫葉綠素a濃度分布圖Fig.3 Chla distribution map of Linghe River