解啟蒙,林茂森,楊國(guó)范,2,夏曉蕓,張 曦,閻孟冬
(1. 沈陽(yáng)農(nóng)業(yè)大學(xué)水利學(xué)院,沈陽(yáng) 110866;2. 沈陽(yáng)工學(xué)院能源與水利學(xué)院,遼寧 撫順 113122;3.朝陽(yáng)市水務(wù)局,遼寧 朝陽(yáng) 122000)
清河水庫(kù)是遼河流域重要的水利樞紐工程之一,水庫(kù)擔(dān)負(fù)著防洪、灌溉、漁業(yè)、工業(yè)供水等任務(wù),如果水庫(kù)水體處于富營(yíng)養(yǎng)化,不僅威脅水庫(kù)的供水安全,也制約水庫(kù)功能的正常運(yùn)轉(zhuǎn)。而高錳酸鹽指數(shù)(CODMn)是綜合評(píng)價(jià)水體污染程度的重要指標(biāo)之一,也是水質(zhì)監(jiān)測(cè)的重要項(xiàng)目[1-4]。由于清河水庫(kù)所在地交通和測(cè)量方面存在很大的不便,如果人工進(jìn)行實(shí)地監(jiān)測(cè),需要耗費(fèi)大量的人力、物力、財(cái)力,且在空間全局性、時(shí)效性等方面存在一定的局限性,而應(yīng)用遙感技術(shù)很好地解決了這一問(wèn)題。借助遙感技術(shù),根據(jù)水體所含不同成分的光譜反射特征,尋找不同成分的敏感波段,分析其與實(shí)測(cè)CODMn的相關(guān)關(guān)系,通過(guò)單波段或波段組合作為自變量建立遙感監(jiān)測(cè)模型,對(duì)水體CODMn進(jìn)行定量遙感反演,這一技術(shù)具有速度快、效率高、數(shù)據(jù)同步性好、觀測(cè)范圍大、監(jiān)測(cè)成本低等優(yōu)勢(shì),已成為水質(zhì)監(jiān)測(cè)的重要手段之一[5-6]。目前CODMn反演技術(shù)常用的方法有經(jīng)驗(yàn)法[7]、半經(jīng)驗(yàn)法[8]、分析法[9],李旭文[10]等(1993)利用TM數(shù)據(jù)評(píng)價(jià)了蘇州運(yùn)河的有機(jī)污染,通過(guò)回歸分析表明TM1、2、3與CODMn相關(guān)性最好;王學(xué)軍(2000)[11]選取了太湖水質(zhì)中CODMn等7個(gè)監(jiān)測(cè)參數(shù),利用TM數(shù)據(jù)的單波段或多波段組合與實(shí)測(cè)數(shù)據(jù)相關(guān)關(guān)系分析及主成分分析來(lái)監(jiān)測(cè)太湖的水質(zhì)污染,并建立了每種水質(zhì)參數(shù)的預(yù)測(cè)模型;趙玉芹、汪西莉[12]利用SPOT-5遙感影像數(shù)據(jù)和現(xiàn)場(chǎng)水質(zhì)監(jiān)測(cè)數(shù)據(jù)建立BP和RBF兩種神經(jīng)網(wǎng)絡(luò)反演模型,對(duì)水質(zhì)參數(shù)CODMn進(jìn)行反演,反演結(jié)果表明該模型的精度滿(mǎn)足要求,反演結(jié)果比線(xiàn)性回歸模型好;郝海森[13]以波段組合TM2/TM5為自變量建立高弗地區(qū)平原水庫(kù)CODMn定量遙感反演模型;葉圓圓[14]以波段組合B1+B2為自變量建立的日顧橋沉陷水域CODMn定量遙感反演模型;趙旭陽(yáng)[15]以HJ-1數(shù)據(jù)的B4波段為自變量建立的大洋河河口水域CODMn定量遙感反演模型;王建平[16]等在通過(guò)遙感技術(shù)對(duì)鄱陽(yáng)湖環(huán)境監(jiān)測(cè)的過(guò)程中,利用人工神經(jīng)網(wǎng)絡(luò)技術(shù)對(duì)湖泊水色進(jìn)行了定量遙感反演研究,在同步實(shí)驗(yàn)的基礎(chǔ)上構(gòu)造了包含一個(gè)隱含層的BP神經(jīng)網(wǎng)絡(luò)模型,再利用TM衛(wèi)星影像數(shù)據(jù)反演CODMn,反演精度較高,相對(duì)誤差大多在25%以下。由此可見(jiàn),現(xiàn)有模型大多數(shù)是針對(duì)湖泊、運(yùn)河、沉陷區(qū)、河口等渾濁水體,以及平原地區(qū),不具有普遍性,對(duì)北方內(nèi)陸清潔水體會(huì)存在一定的局限性,可能會(huì)導(dǎo)致反演精度過(guò)低、誤差偏大。
故本研究以清河水庫(kù)為研究區(qū),利用Landsat8衛(wèi)星的OLI數(shù)據(jù),分析其與清河水庫(kù)高錳酸鹽實(shí)測(cè)數(shù)據(jù)的相關(guān)性,通過(guò)單波段、波段組合等方法,建立最小二乘支持向量機(jī)(LS-SVM)模型清河水庫(kù)水體CODMn反演監(jiān)測(cè),同時(shí)為清河水庫(kù)及其他水庫(kù)CODMn定量反演提供理論依據(jù)。
清河水庫(kù)位于遼寧省鐵嶺市清河區(qū),東經(jīng)124°10′~124°26′,北緯42°29′~42°36′,占地面積465.09 km2,控制流域面積為2 376 km2,設(shè)計(jì)總庫(kù)容為9.71 億m3,是遼河中游左側(cè)一級(jí)支流(清河)上的一座大Ⅱ型水庫(kù)。
研究選用由美國(guó)國(guó)家航天宇航局(NASA)和美國(guó)地質(zhì)調(diào)查局(USGS)聯(lián)合發(fā)射運(yùn)行的空間分辨率為30 m、重訪(fǎng)周期為16天的Landsat8衛(wèi)星OLI數(shù)據(jù),OLI包括了ETM+的所有波段,為了避免大氣吸收部分特征,OLI對(duì)波段進(jìn)行了重新調(diào)整,新增兩個(gè)波段:海藍(lán)波段 (band 1;0.433~0.453 μm)主要應(yīng)用海岸帶觀測(cè);短波紅外波段,又稱(chēng)卷云波段(band 9;1.360~1.390 μm)包含水汽強(qiáng)吸收特征,可用于云檢測(cè),具體波段劃分如表1所示。
本研究影像數(shù)據(jù)獲取時(shí)間為2015年6月23日(云量顯示為0.08 %,滿(mǎn)足數(shù)據(jù)對(duì)云量的要求),利用ENVI軟件對(duì)OLI數(shù)據(jù)進(jìn)行輻射定標(biāo)、大氣校正、幾何裁剪等預(yù)處理,得到清河水庫(kù)衛(wèi)星影像及庫(kù)區(qū)采樣點(diǎn)波普曲線(xiàn)(如圖1-4所示)。
為獲取清河水庫(kù)采樣點(diǎn)數(shù)據(jù),本研究采用網(wǎng)格法將25個(gè)采樣點(diǎn)均勻分布覆蓋在整個(gè)庫(kù)區(qū),如圖5所示。于2015年6月23日上午,天氣晴朗,利用水庫(kù)船只對(duì)庫(kù)區(qū)水面以下0.5 m處進(jìn)行實(shí)地水樣采集,將采集的水樣裝入棕色瓶?jī)?nèi)并標(biāo)號(hào),同時(shí)用GPS記錄采樣點(diǎn)的經(jīng)緯度。在實(shí)驗(yàn)室采用滴定法,向水樣中加入定量且過(guò)量的高錳酸鉀溶液,并在沸水浴中加熱反應(yīng)一定時(shí)間,剩余的高錳酸鉀用過(guò)量的草酸鈉還原,再用高錳酸鉀溶液回滴過(guò)量的草酸鈉,通過(guò)計(jì)算求出CODMn。
表1 Landsat8-OLI波段劃分Tab.1 Landsat8-OLI Band division
圖1 清河水庫(kù)衛(wèi)星影像數(shù)據(jù)輻射定標(biāo)結(jié)果Fig.1 Radiometric calibration results of satellite image data in Qinghe Reservoir
圖2 清河水庫(kù)衛(wèi)星影像數(shù)據(jù)大氣校正結(jié)果Fig.2 Atmospheric correction results of satellite image data in Qinghe Reservoir
圖3 清河水庫(kù)庫(kù)區(qū)采樣點(diǎn)輻射亮度值Fig.3 The radiant intensity of sampling points in Qinghe Reservoir
圖4 清河水庫(kù)庫(kù)區(qū)采樣點(diǎn)真實(shí)反射率Fig.4 Real reflection of sampling points in Qinghe Reservoir
圖5 研究區(qū)各采樣點(diǎn)地理分布Fig.5 All sampling points in the study area distribution
本文的采樣點(diǎn)為25個(gè),通過(guò)ENVI對(duì)landsat8的OLI數(shù)據(jù)做輻射定標(biāo)、大氣校正、裁剪處理之后,得到每個(gè)波段在采樣點(diǎn)的水體真實(shí)反射率,并分別將每個(gè)波段的水體真實(shí)反射率與實(shí)測(cè)值組成25組數(shù)據(jù),從中隨機(jī)選出17組數(shù)據(jù)進(jìn)行建模,另外8組數(shù)據(jù)作為驗(yàn)證。利用SPSS對(duì)建模數(shù)據(jù)進(jìn)行Perason相關(guān)性分析,結(jié)果發(fā)現(xiàn)藍(lán)色波段(b2)、綠色波段(b3)、紅色波段(b4)、近紅外波段(b5)對(duì)CODMn較為敏感,如表2所示。
表2 波段敏感性Tab.2 Band sensitivity
從相關(guān)性系數(shù)來(lái)看,b4波段的敏感性最好為0.447,但系數(shù)相對(duì)來(lái)說(shuō)過(guò)低,不能用于對(duì)清河水庫(kù)CODMn進(jìn)行遙感反演研究。因此,將landsat8的OLI數(shù)據(jù)的9個(gè)波段進(jìn)行波段組合,發(fā)現(xiàn)S1=b4-b2、S2=(b4-b2)/(b3-b2)、S3=b2/b4、S4=b4/b2這4種波段組合與CODMn敏感性較高,系數(shù)分別為0.568、0.632、0.687、0.701。選取Pearson系數(shù)最高的波段組合S4=b4/b2作為自變量X,實(shí)測(cè)的高錳酸鹽指數(shù)Y作為因變量,構(gòu)建比值線(xiàn)性回歸模型與比值非線(xiàn)性最小二乘支持向量機(jī)模型(LS-SVM),從中選取最適合清河水庫(kù)CODMn反演的模型。
對(duì)波段組合S4=b4/b2,其線(xiàn)性回歸模型可分別用一元一次、指數(shù)及一元二次3種形式進(jìn)行表達(dá),如表3所示。
表3 比值線(xiàn)性回歸模型Tab.3 Ratio linear regression model
但Williams[17]研究認(rèn)為相關(guān)系數(shù)的大小可以評(píng)價(jià)模型的好壞,當(dāng)R2在0.5~0.65之間為較差模型,R2在0.66~0.81之間為一般模型,R2在0.82~0.9之間為較好模型,R2在0.91~1之間為精準(zhǔn)模型。則由表3可知,一元二次模型y=7.760 9x2-19.249x+14.921的相關(guān)系數(shù)最高,為0.711,但其模型標(biāo)準(zhǔn)為一般模型。
本方法基于Matlab領(lǐng)域,選用RBF函數(shù)作為L(zhǎng)S-SVM的核函數(shù),對(duì)25組數(shù)據(jù)中的17組數(shù)據(jù)通過(guò)最小二乘支持向量機(jī)算法建立清河水庫(kù)CODMn的遙感反演監(jiān)測(cè)模型。由于一元回歸和多元回歸的方法及原理相對(duì)簡(jiǎn)單,不能適應(yīng)非線(xiàn)性的預(yù)測(cè),但支持向量機(jī)(Support Vector Machines,SVM)模型的預(yù)測(cè)在非線(xiàn)性、樣本小及高維模式識(shí)別問(wèn)題中具有更大的優(yōu)勢(shì)[18]。支持向量機(jī)是由AT&Bell實(shí)驗(yàn)室的技術(shù)人員提出的,以統(tǒng)計(jì)學(xué)理論的VC維理論和最小結(jié)構(gòu)風(fēng)險(xiǎn)為原則,由訓(xùn)練樣本及核函數(shù)確定建立的。最小二乘支持向量機(jī)(Least square support vector machine,LS-SVM)是在標(biāo)準(zhǔn)的支持向量機(jī)的目標(biāo)函數(shù)中增加了誤差平方和,對(duì)標(biāo)準(zhǔn)的支持向量機(jī)回歸方法進(jìn)行優(yōu)化,把非線(xiàn)性空間的問(wèn)題轉(zhuǎn)換到線(xiàn)性空間,減小其復(fù)雜程度,減低求解難度,提高求解速度[19]。其算法如下:
設(shè)訓(xùn)練樣本集為:B={(xj,yj)|j=1,2,…,K},xj∈Rn,yj∈R,xj是輸入數(shù)據(jù),yj是輸出數(shù)據(jù)。在ω空間中的函數(shù)問(wèn)題可以描述為:
(1)
其中:誤差變量ej∈R,b是偏差量,γ是正則化參數(shù)。
約束條件:
(2)
其對(duì)偶問(wèn)題的lagrange多項(xiàng)式函數(shù)為:
(3)
式中:αj∈R,為lagrange乘子。對(duì)上式求最優(yōu)解的KTT條件為:
(4)
首先,消去e和ω,再利用Mercer條件,得到如下方程:
(5)
其中:1=[1,…,1]T,Y=[y1,…,yN]T,a=[a1,…,aN]T。M為一個(gè)方陣,其第i行第j列的元素為Mij=φ(xi)Tφ(xj)=M(xi,xj);M(x,y)為核函數(shù)。用最小二乘法算出a和b,由此得到預(yù)測(cè)輸出:
(6)
式中:y(x)為預(yù)測(cè)輸出值;M(x,xj)為核函數(shù);αj為拉格朗日乘子。
本文通過(guò)對(duì)landsat8的OLI影像數(shù)據(jù)的輻射定標(biāo)、大氣校正、幾何裁剪預(yù)處理,并與實(shí)測(cè)數(shù)據(jù)構(gòu)成25組數(shù)據(jù),用其中17組數(shù)據(jù)建立兩種不同遙感反演模型,把剩余8組數(shù)據(jù)的波段比值分別放入兩種模型計(jì)算CODMn的預(yù)測(cè)值,將預(yù)測(cè)值與實(shí)際值進(jìn)行相關(guān)性分析如圖6所示,計(jì)算相對(duì)誤差結(jié)果如表4所示。
圖6 CODMn預(yù)測(cè)值與實(shí)際值的相關(guān)性Fig.6 Correlation between predicted value and actual value of CODMn
CODMn實(shí)測(cè)值/(mg·L-1)比值線(xiàn)性回歸模型預(yù)測(cè)值/(mg·L-1)相對(duì)誤差/%比值非線(xiàn)性L(fǎng)S-SVM模型預(yù)測(cè)值/(mg·L-1)相對(duì)誤差/%3.403.513.203.7811.183.103.4812.423.213.543.703.2512.063.884.963.603.2310.283.743.843.403.196.043.739.723.203.375.223.385.863.303.009.093.516.403.003.144.833.144.55
(1)本研究利用郝海森[13]以波段組合TM2/TM5為自變量建立高弗地區(qū)平原水庫(kù)CODMn定量遙感反演模型、葉圓圓[14]以波段組合B1+B2為自變量建立的日顧橋沉陷水域CODMn定量遙感反演模型、趙旭陽(yáng)[15]以HJ-1數(shù)據(jù)的B4波段為自變量建立的大洋河河口水域CODMn定量遙感反演模型分別對(duì)清河水庫(kù)CODMn進(jìn)行定量反演,其預(yù)測(cè)結(jié)果與實(shí)測(cè)值的平均相對(duì)誤差分別為17.82%、22.56%、27.43%,模型的精度相對(duì)較低不能滿(mǎn)足清河水庫(kù)CODMn的預(yù)測(cè)要求,主要原因是以上學(xué)者所研究的區(qū)域是對(duì)平原地區(qū)水庫(kù)、沉陷區(qū)水體及大河河口處,并不適用于內(nèi)陸清潔水體的清河水庫(kù)。
(2)本研究對(duì)清河水庫(kù)這種內(nèi)陸清潔水體選用landsat8-OLI數(shù)據(jù)的波段組合值與清河水庫(kù)CODMn實(shí)測(cè)值進(jìn)行相關(guān)性分析,并以相關(guān)性最高的S4=b4/b2為自變量分別建立比值線(xiàn)性回歸模型與比值非線(xiàn)性L(fǎng)S-SVM模型對(duì)清河水庫(kù)進(jìn)行定量反演。從表4可看出以比值非線(xiàn)性L(fǎng)S-SVM模型反演結(jié)果的最大誤差為11.18%、最小誤差為3.54%、平均相對(duì)誤差為6.26%,反演相對(duì)誤差在10%以下的7個(gè);以比值線(xiàn)性回歸模型中相關(guān)性最高的一元二次多項(xiàng)式模型反演結(jié)果的最大誤差為12.42%、最小誤差為3.20%、平均相對(duì)誤差為7.89%,反演相對(duì)誤差在10%以下的5個(gè);且比值非線(xiàn)性L(fǎng)S-SVM模型預(yù)測(cè)值與實(shí)測(cè)值的相關(guān)性R2=0.942 7大于比值線(xiàn)性一元二次多項(xiàng)式模型預(yù)測(cè)值與實(shí)測(cè)值的相關(guān)性R2=0.693 1,而比值非線(xiàn)性L(fǎng)S-SVM模型的誤差算數(shù)平方根RMSE=2.71、平均相對(duì)誤差6.26%也小于比值線(xiàn)性一元二次多項(xiàng)式模型的誤差算數(shù)平方根RMSE=4.76、平均相對(duì)誤差7.89%。
由此可知比值非線(xiàn)性L(fǎng)S-SVM模型的預(yù)測(cè)效果要遠(yuǎn)好于比值線(xiàn)性一元二次多項(xiàng)式模型,因此利用比值非線(xiàn)性L(fǎng)S-SVM模型對(duì)2015年6月23日的清河水庫(kù)庫(kù)區(qū)CODMn進(jìn)行反演,其濃度分布如圖7所示。
圖7 清河水庫(kù)CODMn分布Fig.7 The distribution map of Qinghe Reservoir of CODMn
從圖7中可以清楚看出清河水庫(kù)庫(kù)區(qū)在壩前的CODMn大部分處于4~6 mg/L之間,對(duì)于二類(lèi)水的清河水庫(kù)來(lái)說(shuō)相對(duì)較高;而在入庫(kù)口處,CODMn也主要是出于2~3 mg/L;在庫(kù)區(qū)的邊緣個(gè)別部分的CODMn較高,不是很多;但在整個(gè)庫(kù)區(qū)中CODMn大部分還是處于3~6 mg/L,這主要是由于反演時(shí)間為2015年6月23日,6月為鐵嶺氣候干燥,降雨較少,水庫(kù)庫(kù)容較少的時(shí)候,再加上周邊的工廠(chǎng)、養(yǎng)殖場(chǎng)及生活污水?dāng)y帶大量的有機(jī)物質(zhì)進(jìn)入庫(kù)區(qū),導(dǎo)致庫(kù)區(qū)中有機(jī)腐殖含量較高,因此清河水庫(kù)庫(kù)區(qū)反演的CODMn相對(duì)較高。
本文用實(shí)時(shí)遙感影像數(shù)據(jù)與實(shí)測(cè)數(shù)據(jù)建立適用于清河水庫(kù)CODMn反演監(jiān)測(cè)的最小二乘支持向量機(jī)模型。但由于水體中存在多種復(fù)雜、相互影響的光學(xué)活性物質(zhì),在很大程度上影響了水質(zhì)參數(shù)的反演精度,且本次所用的建模數(shù)據(jù)與檢驗(yàn)數(shù)據(jù)相對(duì)較少,在今后的研究中應(yīng)再加密采樣點(diǎn),加大訓(xùn)練數(shù)據(jù)量,同時(shí)增加采樣周期,使模型的精度更高,反演效果更好。
□
[1] Ministry of Health,Labour and Welfare.Health Minisrty Ordinance 101
Guidelines for Japanese Drinking Water Quality[M].Tokyo: Act Press,2004.
[2] 邢 竹,朱德新.關(guān)于高錳酸鉀指數(shù)測(cè)定中影響因素的初探[J].廣東化工,2012,39(2):203.
[3] Merman Ministry of Health Regulation on the Quality of Water for Human Consumption[Z]. Hamburg :Felix Meiner Press,2001.
[4] 煙貫發(fā),齊少群,張思沖,等.松花江哈爾濱江段高錳酸鹽指數(shù)的遙感反演[J].環(huán)境化學(xué),2013,32(9):1 798-1 804.
[5] 宋 瑜,宋曉東,江 洪,等.基于定量遙感反演的內(nèi)陸水體藻類(lèi)監(jiān)測(cè)[J].光譜學(xué)與光譜分析,2010,30(4):1 075-1 079.
[6] 尹 改,王 橋,鄭丙輝,等.國(guó)家環(huán)??偩謱?duì)中國(guó)資源衛(wèi)星的需求與分析(上)[J].中國(guó)航天,1999,(9):3-7.
[7] A.G.Dekker,S.W.M.Peter. The use of the Thematic Mapper for the analysis of eutorphic lakes: a case study in the Netherlands[J]. International Journal of Remote Sensing,1993,14(5):799-821.
[8] John M,Melack,Mary Gastil.Airborne remote sensing of chlorophyll distributions in Mono Lake[J].California Hydrobiologia,2001,466:31-38.
[9] Hoogenboom H J,Dekker A G,Dehaan J F.Retrieval of chlorophyll and suspended matter in inland waters from CASI data by matrix inversion[J].Canadian Journal of Remote Sensing, 1998,24(2):144-152.
[10] 祝令亞.湖泊水質(zhì)遙感監(jiān)測(cè)與評(píng)價(jià)方法研究[D].北京:中國(guó)科學(xué)院,2006.
[11] 蔣金雄.內(nèi)陸水體水質(zhì)遙感監(jiān)測(cè)[D]. 北京:北京交通大學(xué),2009.
[12] 趙玉芹,汪西莉,蔣 賽,等.渭河水質(zhì)遙感反演的人工神經(jīng)網(wǎng)絡(luò)模型研究[J].遙感技術(shù)與應(yīng)用,2009,(1):63-67.
[13] 郝海森,曹志勇,莫金平,等.高弗地區(qū)平原水庫(kù)高錳酸鉀指數(shù)的定量遙感研究[J].中國(guó)農(nóng)村水利水電,2011,(6):44-48.
[14] 葉圓圓.基于RS淮南采煤沉陷水域水質(zhì)實(shí)時(shí)監(jiān)測(cè)技術(shù)研究[D]. 安徽淮南:安徽理工大學(xué),2014.
[15] 王 皓.基于HJ_1星數(shù)據(jù)的大洋河河口水域水質(zhì)參數(shù)反演研究[D]. 遼寧大連:遼寧師范大學(xué),2012.
[16] 胡舉波.黃浦江上游水域水質(zhì)遙感監(jiān)測(cè)模型的研究[D]. 上海:同濟(jì)大學(xué),2006.
[17] Williams A.N, Grabau W E. Sediment Concentration Mapping in Tidal Estuaries.Third Earth Resources Technology Satellite-1 Symposium[Z]. NASA SP-351,1973,1:1 347-1 386.
[18] 徐紅敏.基于支持向量機(jī)理論的水環(huán)境質(zhì)量預(yù)測(cè)與評(píng)價(jià)方法研究[D]. 長(zhǎng)春:吉林大學(xué),2007.
[19] 閻威武,邵惠鶴.支持向量機(jī)和最小二乘支持向量機(jī)的比較及應(yīng)用研究[J]. 控制與決策,2003,18(3):358-360.