閻孟冬,楊國范,2,殷 飛,3(.沈陽農(nóng)業(yè)大學(xué)水利學(xué)院,沈陽 0866;2.沈陽工學(xué)院能源與水利學(xué)院,遼寧 撫順 322;3.吉林農(nóng)業(yè)科技學(xué)院,吉林 吉林 320)
清河水庫作為遼河中游一級支流清河干流上的大II型水庫,承擔(dān)著防洪、灌溉、養(yǎng)魚和備用水源的重要任務(wù);如果水體處于富營養(yǎng)化狀態(tài),則會使水體表面形成“綠色浮渣”造成魚類死亡,進(jìn)而嚴(yán)重影響水體的水質(zhì)和水庫的運行。懸浮物是水質(zhì)富營養(yǎng)化評價的一個重要指標(biāo),懸浮物是由無機(jī)懸浮物顆粒與有機(jī)質(zhì)共同組成,有機(jī)質(zhì)含量的高低主要由浮游植物與浮游動物的殘體所影響[1]。常規(guī)的水環(huán)境監(jiān)測是通過對實測站點采集的水樣進(jìn)行室內(nèi)水質(zhì)化學(xué)分析實現(xiàn)的,這種方法不僅耗時耗力,而且缺乏時間和空間上的連續(xù)性[2], 遙感水質(zhì)懸浮物反演技術(shù)由于具有宏觀性強、速度快、成本低、監(jiān)測面積大等優(yōu)勢在水質(zhì)監(jiān)測中發(fā)揮了重要的作用,目前懸浮物反演技術(shù)常用方法有經(jīng)驗法[3,4]、半分析法[5,6]、分析法[7]。在國外,Miller[8]等基于MODIS影像數(shù)據(jù)建立了適用于墨西哥灣北部的懸浮物濃度的線性模型;Dekker[9]等利用Landsat TM數(shù)據(jù)的2、3波段的波段組合對弗里斯蘭湖區(qū)的懸浮物濃度進(jìn)行了定量反演研究。在國內(nèi),溫小樂[10]等以Landsant TM 數(shù)據(jù)的TM2+TM3為自變量建立了閩江下游懸浮物濃度估算模型;管義國[11]等以Landsant TM/ETM+的3、4波段組合為自變量建立模型對巢湖懸浮物濃度進(jìn)行了估算;張毅博[12]以Landsant OLI數(shù)據(jù)的2、3、8波段組合作為自變量建立了適用于新安江水庫的一維線性模型。近年來遙感反演研究主要國內(nèi)針對太湖、巢湖、珠江等大型湖泊,河流,針對北方內(nèi)陸小面積水體的遙感水質(zhì)研究較少[13-15]。因此,分析衛(wèi)星數(shù)據(jù)光譜特性與水質(zhì)參數(shù)的濃度之間的關(guān)系并以此建立反演模型對內(nèi)陸小面積水體進(jìn)行遙感水質(zhì)監(jiān)測方面具有重要的意義。本文以清河水庫為研究區(qū),利用Landsat衛(wèi)星OLI數(shù)據(jù)對清河水庫的懸浮物進(jìn)行了定量反演研究,分析波段組合與懸浮物的相關(guān)性,選取相關(guān)性最高的組合與懸浮物建立最合適的反演模型,為清河水庫的懸浮物遙感定量反演提供理論基礎(chǔ)。
清河水庫位于遼寧省鐵嶺市,東經(jīng)124°10′~124°26′,北緯42°29′~42°36′,占地面積465.09 km2(水域面積47.6 km2),是遼河中游左側(cè)一級支流清河上的一座大型水庫,水庫最大容量為9.71 億m3,具有發(fā)電、灌溉、防洪、養(yǎng)殖、旅游等多種功能。2010年遼寧省人民政府正式將清河水庫列為備用水源地,因此,對清河水庫的水質(zhì)進(jìn)行全面及時監(jiān)測、分析與評價顯得尤為重要。
本研究所選用的數(shù)據(jù)包括成像時間為2015年6月23日的Landsat衛(wèi)星OLI數(shù)據(jù)以及當(dāng)日獲取的清河水庫水質(zhì)采樣數(shù)據(jù)。
1.2.1Landsat衛(wèi)星OLI數(shù)據(jù)的獲取及預(yù)處理
Landsat-8衛(wèi)星是由美國國家航天宇航局(NASA)和美國地質(zhì)調(diào)查局(USGS)聯(lián)合發(fā)射運行的衛(wèi)星,該衛(wèi)星主要對資源、水、森林、環(huán)境和城市規(guī)劃等提供可靠數(shù)據(jù)。利用ENVI軟件對OLI數(shù)據(jù)進(jìn)行輻射定標(biāo)、大氣校正、幾何裁剪等預(yù)處理。大氣校正的主要輸入?yún)?shù)見表1。
表1 大氣校正輸入?yún)?shù)Tab.1 Parameters of atmospheric correction
1.2.2清河水庫采樣點數(shù)據(jù)的獲取及預(yù)處理
為獲取清河水庫采樣點數(shù)據(jù),本研究在清河水庫均勻選取25個采樣點,如圖1所示。采樣時間為2015年6月23日上午9∶00-12∶00,天氣晴朗,利用水庫船只進(jìn)行實測采樣,采樣深度為水面以下50 cm,將采集的水樣用棕色瓶盛裝標(biāo)號,同時記錄采樣點的經(jīng)緯度。利用孔徑為0.45 μm的濾膜及真空泵對水樣進(jìn)行抽濾,停止抽濾后取出載有懸浮物的濾膜放入恒重的稱量瓶里,移入烘箱中于103~105 ℃下烘干1 h后移入干燥器中,使其冷卻至室溫,稱重,反復(fù)烘干、冷卻、稱重直至兩次重量差小于0.4 mg為止,并計算懸浮物濃度。
圖1 研究區(qū)各采樣點地理分布Fig.1 Map show the location of sampling points
Landsat衛(wèi)星OLI數(shù)據(jù)共有9個波段,在進(jìn)行清河懸浮物濃度反演時,選取合適的波段構(gòu)建適合清河水庫的模型顯得尤為重要。本文利用預(yù)處理后的OLI數(shù)據(jù)的單波段的地表反射率的真實值與清河水庫采樣點的懸浮物濃度值進(jìn)行Pearson相關(guān)性分析,分析發(fā)現(xiàn)對懸浮物濃度比較敏感的波段有藍(lán)色波段(B2)、近紅外波段(B5)和綠色波段(B3),其可決系數(shù)R2分別為0.51、0.505和0.399。以B2、B3、B5為自變量回歸分析與單波段回歸模型如圖2,從圖中可以看出以單波段為自變量的回歸預(yù)測模型精度不高,不能滿足清河水庫懸浮物濃度的估算要求。
圖2 總懸浮物濃度估算值與實際值回歸分析Fig.2 Regression analysis between the estimated and measured TSM concentrations (CTSM)
由于以單波段為自變量的線性回歸模型精度較低,為了提高懸浮物濃度估算精度,通過對以上3個波段進(jìn)行波段組合,選出與懸浮物濃度更高的波段組合作為自變量建立適合清河水庫懸浮物濃度估算的模型。通過S1=Band(a)/Band(b)組合所得結(jié)果為B2/B5的波段比值為比值組合中相關(guān)性最高的,以其為自變量建立的模型可決系數(shù)僅為0.331,通過S2=Band(a)+Band(b)的組合形式得到的結(jié)果為B3+B5的波段組合與懸浮物相關(guān)性最高,以其為自變量建立的模型可決系數(shù)僅為0.686,通過S3=Band(a)+Band(b)+Band(c)的組合形式可以得到以B2+B3+B5組合為自變量建立的模型可決系數(shù)為0.646,其3種形式建立的模型如圖3。Williams[16]研究認(rèn)為可決系數(shù)的大小可以用來評價模型的好壞,0.5≤R2≤0.65的模型為較差的模型,R2在0.66~0.81之間的模型為一般模型,R2在0.82~0.9的模型為較好模型,R2在0.9~1的模型為精準(zhǔn)模型。由圖3可以看出以B2、B3、B5為自變量建立的線性回歸模型中可決系數(shù)最大的為0.686,其模型的標(biāo)準(zhǔn)為一般模型。
圖3 總懸浮物濃度估算值與實際值回歸分析Fig.3 Regression analysis between the estimated and measured TSM concentrations (CTSM)
由圖3可知線性回歸模型對清河水庫懸浮物的預(yù)測精度并不能達(dá)到精確的要求,本研究為了更加精準(zhǔn)的預(yù)測清河水庫懸浮物的濃度選擇了一種非線性的最小二乘支持向量機(jī)模型(LS-SVM)支持向量機(jī)(Support Vector Machines,SVM)模型的預(yù)測在小樣本、非線性和高維模式識別問題中有很大的優(yōu)勢[17,18]。最小二乘支持向量機(jī)(LS-SVM)是在標(biāo)準(zhǔn)支持向量機(jī)的目標(biāo)函數(shù)中增加了誤差平方和項,是標(biāo)準(zhǔn)的支持向量機(jī)回歸方程的一種修飾版本,比標(biāo)準(zhǔn)的SVM有著更快的求解速度,所需的計算資源較少[19]。其基本原理是通過非線性映射將輸入向量從原空間映射到高維空間并在高維空間進(jìn)行線性回歸擬合。用于函數(shù)估計的最小二乘支持向量機(jī)算法過程如下:
設(shè)訓(xùn)練樣本集:D={(xk,yk)|k=1,2,…,N},xk∈Rn,yk∈R,xk是輸入數(shù)據(jù),yk是輸出數(shù)據(jù)。在w空間中的函數(shù)估計問題可以描述求解下面問題:
式中:誤差變量ek∈R;b為偏差量;γ為正則化參數(shù)。
約束條件:yk=wTφ(xk)+b=ek,k=1,…,N
定義拉格朗日函數(shù):
其中:拉格朗日乘子αk∈R。
對上式進(jìn)行優(yōu)化,根據(jù)KTT條件:
對于k=1,…,N,消去w和e,得到如下方程:
其中:1=[1,…,1]T,Y=[y1,…,yN]T,a=[a1,…,aN]T。M為一個方陣,其第i行j列的元素為Mij=φ(xk)Tφ(xj)=M(xi,xj),M(x,y)為核函數(shù)。用最小二乘法求出a和b,由此得到預(yù)測輸出:
本文利用MATLAB對所有的25組數(shù)據(jù)進(jìn)行處理,選用Get_Predict函數(shù)作為LS-SVM模型的核函數(shù),以B2、B3、B5的波段值為自變量,實測懸浮物濃度為因變量,選取其中17組數(shù)據(jù)作為建模數(shù)據(jù),剩余8組數(shù)據(jù)作為驗證數(shù)據(jù)。利用LS-SVM模型所得懸浮物濃度預(yù)測值及相對誤差如表2,將LS-SVM模型所得懸浮物濃度預(yù)測值與懸浮物濃度實測值進(jìn)行相關(guān)性分析如圖4。
表2 樣本懸浮物實測值與預(yù)測值的相對誤差Tab.2 Relative error between the estimated and measured TSM concentrations (CTSM)
圖4 LS-SVM模型總懸浮物預(yù)測值與實測值的回歸分析Fig.4 Regression analysis between the LS-SVM estimated CTSM and the measured CTSM
宋慶君[6]通過對比幾種水體遙感反射比光譜估算總懸浮物濃度的方法,得到相關(guān)性較好的波段在750 nm,且這一單波段算法具有較好的估算精度;馬馳[4]以ASTER數(shù)據(jù)的第三波段波段值作為自變量建立模型對松遼平原水體的懸浮物濃度進(jìn)行了估算,本文對Landsat-8的所有單波段與懸浮物濃度進(jìn)行相關(guān)性分析,得出相關(guān)性較高的波段B2、B3、B5并分別建立單波段模型對清河水庫懸浮物進(jìn)行預(yù)測,其可決系數(shù)分別為R2=0.51、R2=0.399、R2=0.505,如圖5所示其平均相對誤差分別為5.29% 、6.52%、4.86 %,由此以得出單波段為自變量建立的模型可決系數(shù)較低且相對誤差較大,并不適用于清河水庫的懸浮物濃度預(yù)測,其主要原因為以上學(xué)者所研究的水體都是渾濁水體,并不適用清河水庫的清潔水體。李云梅[20]利用TM2、TM3的波段組合建立Gordan對太湖懸浮物濃度進(jìn)行了估測并取得了較好的效果,管義國[11]利用TM/ETM+3、4波段對巢湖水體懸浮物進(jìn)行了估測,大多數(shù)估測值的相對誤差在10%以內(nèi);趙碧云[21]以TM4/TM為自變量建立模型對滇池懸浮物進(jìn)行了估算,其估算效果遠(yuǎn)高于單波段模型。通過以上學(xué)者的研究發(fā)現(xiàn)波段的組合運算能提高水質(zhì)參數(shù)預(yù)測的準(zhǔn)確性,因此本文以B2、B3、B5波段的波段組合為自變量分別建立線性回歸模型與非線性的LS-SVM模型對清河水庫進(jìn)行懸浮物濃度反演,線性回歸模型中以B3、B5為自變量建立的模型CTSM=0.06B3+0.087B5+26.77其可決系數(shù)最大,R2=0.686,其平均相對誤差為3.52%,模型優(yōu)于以B2、B3、B5為自變量的CTSM=0.1B2-0.081B3+0.025B5+15.948與以B2/B5為自變量的CTSM= -51.137B2/B5+85.94。以B2、B3、B5為自變量,實測懸浮物濃度為因變量建立的LS-SVM模型對清河水庫懸浮物預(yù)測可決系數(shù)R2=0.88,顯著性P<0.05,其平均相對誤差為3.16%,因此,LS-SVM模型的預(yù)測效果遠(yuǎn)遠(yuǎn)好于線性回歸模型。
圖5 平均相對誤差與相對誤差圖Fig.5 The average relative error and relative error
據(jù)此,利用LS-SVM模型對2015年6月23日的清河水庫懸浮物濃度進(jìn)行反演,其濃度分布如圖6所示。水中懸浮物濃度在25 mg/L以內(nèi)對淡水魚無害,25~80 mg/L內(nèi)可允許魚類生長。由圖6可以看出清河水庫的懸浮物濃度均在80 mg/L范圍內(nèi),懸浮物濃度在27.1~37.6 mg/L的綠色與黃色部分占清河水庫庫區(qū)的大半部分,紅色部分代表藻類、魚類活動比較旺盛的區(qū)域,主要分布在庫區(qū)中央部分。由于反演時間為2015年6月23日,6月為鐵嶺較為干燥的季節(jié),降水較少,藻類生長、魚類活動較為旺盛,因此反演清河水庫的懸浮物濃度相對較高。
圖6 2015年6月23日清河水庫總懸浮物濃度分布圖Fig.6 TSM distribution map of Qinghe Reservoir on 23 Jun,2015
由于遙感反演水質(zhì)參數(shù)受多種因素影響,簡單的線性模型很難適應(yīng)復(fù)雜水體結(jié)構(gòu),作為非線性的LS-SVM模型的預(yù)測結(jié)果與清河水庫實測的懸浮物濃度較為接近,其可決系數(shù)與平均相對誤差較線性模型都有不同程度的優(yōu)化。但本文只選擇了夏季的一天作為研究目標(biāo),為了實現(xiàn)反演模型的普適性,實驗還應(yīng)增加不同季節(jié)的懸浮物濃度的反演用以建立適應(yīng)各個季節(jié)的反演模型。
□
[1] 張運林,秦伯強,陳偉民,等.太湖水體中懸浮物研究[J].長江流域資源與環(huán)境,2004,13(3):266-271.
[2] 查桂紅.基于GOCI影像的內(nèi)陸水體懸浮物濃度遙感估算研究[D]. 南京:南京師范大學(xué),2013.
[3] Ostlund C, Flink P, Strombeck N, et al. Mapping of the water quality of Lake Erken, Sweden, from Imaging Spectrometry and Landsat The-matic Mapper [J]. The Science of the Total Environment, 2001,268:139-154.
[4] 馬 馳,姜琦剛,李遠(yuǎn)華,等.利用ASTER影像反演松遼平原水體懸浮物濃度[J].水資源保護(hù),2009,25(2):72-74.
[5] Binding C E, Bowers D G, Mitchelson-Jacob E G Estimating suspended sediment concentration from ocean colour measurements in moderately turbid waters; the impact of variable particle scattering properties [J]. Remote Sensing of Environment, 2005,94:373-383.
[6] 宋慶君,馬榮華,唐軍武,等.秋季太湖懸浮物高光譜估算模型[J].湖泊科學(xué),2008,20(2):196-202.
[7] Dekker A G. Analytical algorithms for lake water TSM estimation for retrospective analyses of TM and SPOT sensor data [J]. Journal of Remote Sensing, 2002,23:15-35.
[8] Miller R L, McKee B A. Using MODIS Terra 250 m imagery to map concentration of total suspended matter in coast waters [J]. Remote Sensing of Environment, 2004,93(1-1):259-266.
[9] Dekker A G, Vos R J, Peters S W M. Comparsion of remote sensing data, model results and in situ data for total suspended matter(TSM) in the southern Frisian lakes [J]. Science of the Total Environment,2001,268(1-3):197-214.
[10] 溫小樂,徐涵秋.基于多元同步數(shù)據(jù)的閩江下游懸浮物定量遙感[J].環(huán)境科學(xué),2008,29(9):2 441-2 447.
[11] 管義國,王心源,吉文帥.巢湖水體懸浮物的遙感分析[J].遙感信息,2007,(5):39-43.
[12] 張毅博,張運林,査 勇,等.基于Landsat8影像估算新安江水庫總懸浮物濃度[J].環(huán)境科學(xué),2015,36(1):56-63.
[13] 李 淵,李云梅,施 坤,等. 基于光譜分類的總懸浮物濃度估算[J].光譜學(xué)與光譜分析,2013,33(10):2 721-2 726.
[14] 李 穎.基于環(huán)境1號衛(wèi)星多光譜數(shù)據(jù)的太湖總懸浮物濃度估算模型研究[D]. 南京:南京師范大學(xué),2011.
[15] 劉大召,陳楚群,劉汾汾,等.利用混合光譜分解估測珠江口懸浮泥沙濃度[J].熱帶海洋學(xué)報,2009,28(5):43-48.
[16] Williams P C. Implementation of near-infrared technology: in the agricultural and food industries[C]∥ USA: American Association of Cereal Chemists,Ins,2001.
[17] 徐紅敏.基于支持向量機(jī)理論的水環(huán)境質(zhì)量預(yù)測與評價方法研究[D].長春:吉林大學(xué),2007.
[18] 送召青,崔 和,胡云安.支持向量機(jī)理論的研究與進(jìn)展 [J].海軍航空工程學(xué)院學(xué)報,2008,23(2):143-148,152.
[19] 閻威武,邵惠鶴.支持向量機(jī)和最小二乘支持向量機(jī)的比較及應(yīng)用研究[J].控制與決策,2003,18(3):358-360.
[20] 李云梅,黃家柱,陸皖寧,等. 基于分析模型的太湖懸浮物濃度遙感監(jiān)測[J].海洋與湖沼,2006,37(2):171-177.
[21] 趙碧云,賀 彬,朱云燕,等.滇池水體中總懸浮物含量的遙感定量模型[J].環(huán)境科學(xué)與技術(shù),2001,94(2):16-18.