喻臻鈺,楊 昆,羅 毅,*,商春雪,趙 磊
1 云南師范大學地理學部,昆明 650500 2 云南師范大學西部資源環(huán)境地理信息技術(shù)教育部工程研究中心,昆明 650500 3 云南師范大學教務處,昆明 650500 4 云南師范大學信息學院,昆明 650500
湖泊既是重要的生態(tài)資源,同時也是一系列社會經(jīng)濟過程的載體,湖泊水生態(tài)環(huán)境不僅決定著區(qū)域生態(tài)環(huán)境質(zhì)量,也是城市的可持續(xù)發(fā)展的重要自然資源保障[1- 3],湖泊水生態(tài)環(huán)境能夠反映該地區(qū)環(huán)境狀況[4- 6]。水體透明度(Secchi depth, SD)是指水體的澄清程度,水體透明度會隨著水體中的懸浮物和膠體濃度增加而降低,在富營養(yǎng)湖泊中,以藻類為主的懸浮物越多,其透明度越低[7]。水體透明度通過微粒和溶解物質(zhì)的光吸收影響上層水體的傳熱,水體透明度觀測往往是湖泊水質(zhì)監(jiān)測的組成部分[7-8]。因此,水體透明度是衡量水質(zhì)標準的重要組成部分,也是評價水體富營養(yǎng)化和水生態(tài)健康的重要指標[8],同時在調(diào)節(jié)水層和初級生產(chǎn)力方面發(fā)揮著重要作用[9]。近年來,由于外來物種入侵、污染物點源排放、不透水面增加、營養(yǎng)物質(zhì)負荷過重以及由此造成的有害藻類大量繁殖等綜合影響,滇池水體透明度出現(xiàn)了明顯的波動[10-11]。水體透明度與水質(zhì)關(guān)系密切[12-13],常用作度量湖泊總體水質(zhì)的直觀指標。
原位觀測是掌握湖泊水體透明度常用的方法,具有數(shù)據(jù)時間尺度連續(xù)、精度較高等優(yōu)點,但存在傳感器布設和維護成本高、數(shù)據(jù)空間尺度離散等缺點[14- 16]。遙感技術(shù)的發(fā)展為區(qū)域環(huán)境監(jiān)測提供了有效支撐,遙感影像的地表反射率數(shù)據(jù)為湖泊水體透明度的時空變化檢測提供了基礎[9]。Kloiber等[15]以Landsat 系列影像為數(shù)據(jù),提出了Pearson相關(guān)系數(shù)矩陣和多元逐步回歸的透明度反演經(jīng)驗模型,Olmanson等[17]以此模型對明尼蘇達州的10000多個湖泊水體透明度進行了反演,并分析了其20年間的時空變化特征,表明Landsat系列影像數(shù)據(jù)在透明度反演中具有較高精度;Wu等[9]以Landsat和MODIS為數(shù)據(jù),以多元線性回歸模型對鄱陽湖的透明度反演結(jié)果表明,MODIS效果優(yōu)于Landsat;馬建行等[18]及Knight等[19]以HJ- 1衛(wèi)星CCD和MODIS為數(shù)據(jù),基于灰色關(guān)聯(lián)度和多元回歸反演模型,對吉林省中西部湖泊透明度進行反演和對比,結(jié)果表明MODIS反演精度高于HJ1A-CCD。MODIS影像雖然空間分辨率不高,但在水體透明度反演中表現(xiàn)較好,且其具有較高時間分辨率,為較大尺度的湖泊水體透明度實時變化監(jiān)測提供了可能。
在水體透明度反演模型中,半分析方法和經(jīng)驗方法較為常用,其中半分析方法考慮了透明度與水體光學特性之間的關(guān)系,具有較高反演精度,而經(jīng)驗方法對云污染、大氣影響不敏感,具有更強魯棒性[18]。隨著機器學習領域的發(fā)展,深度學習方法的提出,遙感影像反演精度得以大幅提升,現(xiàn)已被用于地表溫度反演[20]、海表溫度反演[21]、葉綠素a濃度反演[22]等,但尚未檢索到有關(guān)深度學習理論應用于水體透明度反演的報道。
地表反射率與水體透明度的數(shù)據(jù)均具有混沌特征,多項式擬合的方法并不能最大限度的挖掘其有效特征。為此,在前期相關(guān)工作的基礎上[11,23- 29],以原位監(jiān)測和MODIS遙感影像為數(shù)據(jù),基于深度神經(jīng)網(wǎng)絡方法,對滇池2001年1月1日—2018年12月31日的水體透明度進行反演,并利用地理空間分析方法對其時空變化特征進行探究,填補了深度學習在水體透明度反演的空白,有效提高了常用水體透明度反演模型的精度,為開展湖泊水質(zhì)研究提供了新的思路和方法。
滇池位于云貴高原中部,呈南北向分布,是全國第六大淡水湖,湖面海拔約1886 m,面積約330 km2,平均水深約為5 m,屬于半封閉型湖泊,僅有西南部的海口為出水口,處于亞熱帶高原西南季風氣候區(qū),氣候變化主要受西南季風和熱帶大陸氣團交替控制。同時,滇池是昆明地區(qū)灌溉、調(diào)畜、受納的主要水體,也是城市發(fā)展的基礎條件,對滇池流域的氣候調(diào)節(jié)具有重要作用。研究發(fā)現(xiàn),近30年來,在城鎮(zhèn)化的快速推進和全球氣候變暖雙重脅迫下,以湖泊表面水溫上升、藍藻水華頻繁、富營養(yǎng)化加劇為代表的水質(zhì)惡化狀況明顯加劇[11,23- 24,26,28],湖泊水環(huán)境不容樂觀。另外,隨著國家“一帶一路”戰(zhàn)略的提出,云南省正深度融入國家戰(zhàn)略,作為云南省省會的昆明市,已經(jīng)成為面向南亞、東南亞重要的輻射中心,控制與改善滇池水生態(tài)環(huán)境是落實和推進國家“一帶一路”戰(zhàn)略的環(huán)境基礎。為此,選擇滇池作為研究區(qū)具有區(qū)域特色(高原城市型湖泊)與時代特色(“一帶一路”戰(zhàn)略),研究區(qū)及監(jiān)測站點地理位置分布如圖1所示。
圖1 研究區(qū)位圖Fig.1 Study area
時間區(qū)間為2001年1月1日—2018年12月31日,主要數(shù)據(jù)包括水體透明度實際觀測數(shù)據(jù)和MOD09GA遙感影像。其中,實際觀測值為2001—2010年10個站點(白魚口、草海中心、滇池南、斷橋、觀音山東、觀音山西、觀音山中、??谖?、暉灣中、羅家營)的日監(jiān)測值和2018年2個區(qū)域(草海、外海)的月監(jiān)測值,來源于云南省環(huán)境科學研究院;MODIS數(shù)據(jù)來源于NASA LAADS Web (http://ladsweb.nascom.nasa.gov),時間分辨率為每日,空間分辨率為500 m,利用MRT (https://lpdaac.usgs.gov/tools/modis_reprojection_tool)重采樣為500 m分辨率影像,并將其重投影、鑲嵌并替換有云影響的像元值為Null,遙感影像缺失數(shù)據(jù)的時間分布如圖2所示,對于紅色標注的缺失像元以線性插值法補齊。
圖2 MODIS遙感影像缺失數(shù)據(jù)的時間分布Fig.2 Time distribution of missing value in MODIS remote sensing images
灰色系統(tǒng)理論利用關(guān)聯(lián)度度量因素之間的關(guān)聯(lián)性,不同灰色關(guān)聯(lián)度方法的計算存在一定局限性[30-31]。本文采用一般關(guān)聯(lián)度、絕對關(guān)聯(lián)度、斜率關(guān)聯(lián)度三種方法得到灰色關(guān)聯(lián)度的相關(guān)系數(shù),考慮到三種關(guān)聯(lián)度的計算無法體現(xiàn)因素的負相關(guān)特性,因此采用Pearson相關(guān)系數(shù)分析負相關(guān)特性。
每個Cell包括輸入門、遺忘門和輸出門(如圖3所示),每個信息進入LSTM的網(wǎng)絡,可以根據(jù)規(guī)則判斷是否有用,只有符合規(guī)則的信息才會留下,不符的信息則通過遺忘門被遺忘,這對于具有長期序列依賴問題的數(shù)據(jù)非常有效[32]。
it=σ(Wxixt+Whiht-1+bi)
(1)
ft=σ(Wxfxt+Whfht-1+bf)
(2)
ot=σ(Wxoxt+Whoht-1+bo)
(3)
ct=ft⊙ct-1+it⊙tanh(Wxcxt+Whcht-1+bc)
(4)
ht=ot⊙tanh(ct)
(5)
其中:⊙指矩陣逐元素點乘;bγ是各層輸出的偏差向量,例如bi是輸入門限層的偏差向量,bf是遺忘門限層的偏差向量;σ(x)是激活函數(shù);Wαβ是對應層的權(quán)重矩陣,例如Wxf是輸入層到遺忘門限層的權(quán)重矩陣,Whi是隱藏層到輸入門限層的權(quán)重矩陣,Who是隱藏層到輸出門限層的權(quán)重矩陣;ct用來更新細胞狀態(tài)。由式(4)可知,遺忘門ft控制有多少上一時刻的記憶細胞中的信息ct-1可以傳輸?shù)疆斍皶r刻的記憶細胞中;輸入門it控制有多少信息可以流入記憶細胞ct中;而輸出門ot控制有多少當前時刻的記憶細胞ct中的信息可以流入當前隱藏層ht中[33]。
數(shù)據(jù)包括MOD09GA和透明度的實測數(shù)據(jù),其中MOD09GA為2001—2018年的日數(shù)據(jù),實測數(shù)據(jù)為2001—2010年10個站點的日監(jiān)測數(shù)據(jù)和2018年2個區(qū)域的月監(jiān)測數(shù)據(jù)。以2001—2010年的實測數(shù)據(jù)與對應時間的MOD09GA數(shù)據(jù)進行建模,并以此模型對滇池2001—2018年的水體透明度進行估算,以2018年的實測數(shù)據(jù)對估算數(shù)據(jù)進行測試,技術(shù)路線如圖3所示。
(1)相關(guān)性分析(Correlation Analysis, C)。以灰色關(guān)聯(lián)度對MOD09GA的7個波段組合進行分析,得到排名前7的波段,即b5/b6、1/b4、b3/b6、b2/b6、b1/b6、b2/b3、1/b5,并組合為數(shù)據(jù)集X,其中bi為第i波段。
(2)異常值處理(Outlier Processing, O)。根據(jù)數(shù)據(jù)集的特征,臨近時間點的數(shù)據(jù)存在較為緊密的線性關(guān)系,所以使用線性插值法對缺失值進行插補。
(6)
異常值以3σ準則進行檢驗,并將大于μ+3σ的離群值以99%分位數(shù)插補,小于μ-3σ的離群值以1%分位數(shù)插補,其中μ為均值,σ為標準差,如式(6)所示,此插補方法即蓋帽法。
(3)去噪處理(Denoising Processing, D)。實際觀測值與遙感影像均不能排除儀器設備及人為因素的干擾,本文使用高斯低通濾波器對數(shù)據(jù)進行去噪處理。高斯低通濾波器(Gaussian Low Pass Filter)是一類傳遞函數(shù)為高斯函數(shù)的線性平滑濾波器,其傳遞函數(shù)如式(7)。
地理定位信息系統(tǒng)的主要原理是將與地理相關(guān)的內(nèi)容進行電子化的轉(zhuǎn)換,使其以動態(tài)的圖形的形式呈現(xiàn)出來。這種信息系統(tǒng)在旅游管理中的應用主要體現(xiàn)在對游客所在的位置進行實時監(jiān)控[1]。旅游管理人員通過這樣的方式掌握游客的位置信息,可以為游客提供安全保障。所以,在旅游管理中應用地理定位信息系統(tǒng),不僅能使游客感受到更加優(yōu)質(zhì)和完善的服務,還能為促進旅游管理信息化建設提供推動力。
(7)
其中δ為標準差,x為待濾波數(shù)據(jù),G(x)為濾波后的數(shù)據(jù)。
(4)估算模型構(gòu)建。經(jīng)過以上步驟處理的數(shù)據(jù)作為LSTM模型的輸入,數(shù)據(jù)總數(shù)為36520行(10×365×10+2×1×10),其中80%(29216行)作為訓練集(DataT),20%(7304行)作為驗證集(DataV)。模型參數(shù)設置:經(jīng)過以上3個步驟的7個波段組合數(shù)據(jù)X作為模型的輸入(輸入維度為7),隱含層為10,學習率為0.0006,每批次大小(Batch size)為7,待估算的水體透明度數(shù)據(jù)為模型的輸出(輸出維度為1)。
(5)結(jié)果與分析。對輸出的水體透明度以Theil-Sen估算進行時序變化特征分析,以反距離加權(quán)(Inverse Distance Weight, IDW)空間插值方法進行空間分布特征分析。
Theil-Sen斜率(TSslope)估計是一種非參數(shù)估計法,用于估計時間序列數(shù)據(jù)的變化率,本文用于表征水體透明度的變化趨勢。該估計具有處理刪失回歸模型的能力,并且對異常值不敏感。對于偏斜和異方差數(shù)據(jù),可比非魯棒簡單線性回歸更準確,即使對于正態(tài)分布的數(shù)據(jù)也能與非魯棒最小二乘法競爭。尤其對于具有混沌特性的數(shù)據(jù),其表達具有明顯優(yōu)勢。Theil-Sen斜率的表達公式為:
(8)
式中,median為中位數(shù)函數(shù),xj、xi為序列數(shù)據(jù);tj、ti為序列數(shù)據(jù)對應的時間數(shù)據(jù);序列長度為n、i、j為序號(1≤i≤j≤n)。當TSslope>0,表示上升趨勢,反之為下降趨勢;|TSslope|值越大則趨勢越劇烈。
為了能夠綜合表達不同尺度湖泊水體透明度的變化率,本文提出了綜合變化率,避免了單一維度的局限性。綜合變化率為年均變化率(TS年)、季節(jié)(春、夏、秋、冬)變化率(TS季)及月(1—12月)變化率(TS月)的均值,如式(9)所示。
TS綜合=mean(TS年+TS季+TS月)
(9)
其中mean為均值函數(shù)。
圖3 技術(shù)路線圖Fig.3 Model processing flow chart
圖4 遙感影像MOD09GA波段之間的相關(guān)性分析 Fig.4 Correlation analysis among bands of MOD09GA remote sensing imagesGRA: 灰色關(guān)聯(lián)度分析Grey Relational Analysis
灰色關(guān)聯(lián)度及Pearson相關(guān)系數(shù)分析結(jié)果如圖4所示。由于波段之間的線性相關(guān)性較低,Pearson相關(guān)系數(shù)均處于較低水平,但可反映出波段間正負相關(guān)的性質(zhì),作為波段選擇的輔助參考。由灰色關(guān)聯(lián)度可得,b5/b6、1/b4、b3/b6、b2/b6、b1/b6、b2/b3和1/b5與水體透明度的相關(guān)性較高,能夠較好的表達水體透明度的數(shù)據(jù)特征,所以選用此7個波段組合為模型構(gòu)建的輸入數(shù)據(jù),對水體透明度進行反演。
圖5 模型反演結(jié)果對比Fig.5 Comparison of model inversion results
以滇池2001—2010年的實測值與MOD09GA波段篩選后的數(shù)據(jù)為訓練集與驗證集構(gòu)建水體透明度反演模型,并將此模型應用于2001—2018年滇池水體透明度的估算,模型評價參數(shù)如圖5及表1所示,評價指標選用為均方根誤差(Root Mean Squared Error, RMSE)和平均絕對誤差(Mean Absolute Error, MAE)。對于具有混沌特性的數(shù)據(jù)而言,機器學習算法對數(shù)據(jù)特征的學習能力優(yōu)于多項式模型,神經(jīng)網(wǎng)絡模型通過多隱含層多節(jié)點的學習,能夠充分提取MOD09GA與水體透明度的特征。本文提出的估算方法(COD-LSTM)與其他模型對比結(jié)果表示,COD-LSTM模型估算效果最佳,且與實測值的趨勢擬合較好(RMSE=0.1359, MAE=0.1134)。Binding等[34]僅考慮了單波段與水體透明度的對應關(guān)系,具有較大局限性;Wu等[9]和Knight等[19]同時考慮了兩個波段與水體透明度的映射關(guān)系,擬合效果較優(yōu)于Binding等[34]提出的方法,但對于水體透明度趨勢的擬合具有較大局限;馬建行等[18]提出的方法相對較優(yōu)于以上三種方法,但水體透明度具有混沌特性,僅考慮多項式擬合較難挖掘數(shù)據(jù)特征,此方法仍較難準確估算水體透明度數(shù)值。本文基于深度神經(jīng)網(wǎng)絡提出的COD-LSTM模型,依靠遙感影像大數(shù)據(jù)的條件,以相關(guān)性分析、剔除異常值及去噪等方法充分過濾無效數(shù)據(jù)的干擾,并在多隱含層多節(jié)點的學習下,便于提取更多的數(shù)據(jù)特征,使得估算準確性得以大幅提高,因此在水體透明度的估算中具有更大優(yōu)勢。
表1 本文估算方法與其他反演方法及結(jié)果的對比
圖6 2001—2018年滇池水體透明度反演結(jié)果 Fig.6 The Secchi depth inversion results of Dianchi Lake from 2001 to 2018
2001—2018年滇池水體透明度的反演結(jié)果如圖6所示,其中,綜合變化率為年均變化率、季節(jié)(春、夏、秋、冬)變化率及月變化率的均值,這一指標能夠綜合表達不同尺度湖泊水體透明度的變化率,避免了單一維度的局限性。總體上看,滇池水體透明度呈下降趨勢,綜合變化率為-0.08 m/10 a,年均變化率為-0.05 m/10 a,季均變化率為-0.09 m/10 a,月均變化率為-0.08 m/10 a。按季節(jié)尺度分析,春季變化率最高,為-0.11 m/10 a,其次是秋季,為-0.09 m/10 a,夏季與冬季均為-0.08 m/10 a。按月分析,6月份變化率最高,為-0.15 m/10 a,最低變化率為-0.03 m/10 a,出現(xiàn)于10月份,高于月平均變化率的月份有5個(2—3月、5—6月、9月),低于月平均變化率的月份有6個(1月、4月、7—8月、10—11月),12月與月平均變化率持平。
2006年前后滇池水體透明度出現(xiàn)不同的變化趨勢,2001年1月—2005年12月呈上升趨勢,變化率為0.015 m/10 a;2006年1月—2018年12月呈下降趨勢,變化率為-0.007 m/10 a,這可能與2003年開始實施的“一湖四片、南延北拓”的城鎮(zhèn)化戰(zhàn)略有關(guān)[35]。牛欄江-滇池補水工程于2008年12月30日開工建設,2013年底建成并投入試運行[36]。2009年1月—2013年12月呈下降趨勢,變化率為-0.007 m/10 a;2014年1月—2018年12月呈上升趨勢,變化率為0.001 m/10 a。由此表明,引水工程的實施對滇池水質(zhì)的治理工作取得了一定成效。
2001—2018年滇池水體透明度年均值及綜合變化率的空間分布如圖7所示。水體透明度變化率的空間分布能夠反映水體長時間尺度下透明度變化程度和趨勢,能夠為厘清透明度變化的空間異質(zhì)性、有效保護治理水環(huán)境提供專題數(shù)據(jù)。研究結(jié)果表明,滇池水體透明度均呈下降趨勢,水體透明度相對較高的區(qū)域,變化幅度相對較大,表明近18年來滇池水質(zhì)總體呈不同程度的惡化趨勢。滇池北部沿岸水體透明度較低,草海區(qū)域為全湖最低,但變化幅度較小,未表現(xiàn)出明顯惡化趨勢。南部和中部的水體透明度相對較高,但南部和中部的變化速率明顯高于北部。滇池僅東北沿岸出現(xiàn)兩個區(qū)域的水體透明度改善趨勢,這可能與此區(qū)域建設的多個濕地公園有關(guān)。
水體透明度較低的區(qū)域分別位于主城區(qū)(滇池東部和北部)和海口鎮(zhèn)(滇池西南部),變化速率較快的區(qū)域位于晉寧區(qū)(滇池南部),近年來,此區(qū)域的城鎮(zhèn)化進程加快,可能是導致湖泊水質(zhì)惡化的主要因素。滇池入水口位于北部,而北部恰好是城鎮(zhèn)化擴張較為嚴重的區(qū)域,對流入滇池的水源的污染是巨大的。滇池水體透明度在2006—2013年間呈持續(xù)下降趨勢,自2013年開始,昆明市政府投入約83.3億元實施的牛欄江-滇池補水工程,但隨著滇池流域“一湖四片、南延北拓”等城鎮(zhèn)化戰(zhàn)略的實施,滇池南岸和東岸近年來不透水表面擴張顯著[23,27, 29],昆明市城市中心由1個變?yōu)榱?個,2014年后水體透明度呈現(xiàn)明顯的波動變化,表明高強度的城鎮(zhèn)化過程導致的水質(zhì)惡化抵消了牛欄江引水工程等水質(zhì)保護和改善工程的效果,所以滇池水體透明度仍未有實質(zhì)性的改觀。
總體看來,2001—2018年間,滇池水體透明度呈下降趨勢,從水體透明度時序變化特征能夠反映出滇池水質(zhì)仍處于惡化狀態(tài),尤其是距離城區(qū)較近的區(qū)域水體透明度相對較低,表明人類活動是造成水體透明度下降的主要因素;水體透明度較高的區(qū)域下降速度相對較快,可能是由于大部分區(qū)域的水質(zhì)長期處于較差狀態(tài),在湖泊水動力過程的作用下導致狀態(tài)較好的區(qū)域的水質(zhì)發(fā)生了穩(wěn)態(tài)轉(zhuǎn)變。2014年后湖泊水體透明度下降速度得到了有效抑制,這與近年來政府部門的大力度監(jiān)管與治理有直接關(guān)系。
圖7 2001—2018年滇池水體平均透明度年均值及綜合變化率的空間分布Fig.7 Spatial distribution of annual mean Secchi depth and comprehensive change rate of Dianchi Lake from 2001 to 2018
水體透明度是評價水質(zhì)標準的重要指標,但對較大空間尺度的監(jiān)測具有一定困難,且由于研究區(qū)內(nèi)針對湖泊水質(zhì)原位監(jiān)測工作起步較晚,導致湖泊水體透明度歷史數(shù)據(jù)的缺失。為此,以MODIS遙感影像為數(shù)據(jù),基于深度神經(jīng)網(wǎng)絡方法的長短期記憶神經(jīng)網(wǎng)絡模型(LSTM),對滇池2001年1月1日—2018年12月31日的水體透明度進行反演,并利用地理空間分析方法對其時空變化特征進行探究,填補了深度學習在水體透明度反演的空白,有效地提高了常用反演模型的精度,同時探討了水體透明度的時空變化特征,為開展湖泊水質(zhì)研究提供了新的思路和方法。
(1)本文基于深度學習方法提出的COD-LSTM模型在水體透明度反演中具有較好的性能(RMSE=0.1359, MAE=0.1134),能夠充分提取遙感影像數(shù)據(jù)與水體透明度的特征,相對多項式擬合而言,具有較大優(yōu)勢。
(2)時序變化特征分析結(jié)果表明,滇池水體透明度總體呈下降趨勢,綜合變化率為-0.08 m/10 a,年均變化率為-0.05 m/10 a,季均變化率為-0.09 m/10 a,月均變化率為-0.08 m/10 a。2014—2018年間,滇池水體透明度以0.001 m/10 a的速率出現(xiàn)上升趨勢,體現(xiàn)了牛欄江-滇池補水工程的治理成效。城市擴張的負反饋效應和牛欄江引水工程等環(huán)境治理工程的正反饋效應的疊加,抑制了水體透明度的下降速率,但水體透明度狀況尚未發(fā)生質(zhì)的改變。
(3)空間變化特征分析結(jié)果表明,水體透明度較高的區(qū)域下降率較大,水體透明度較低的區(qū)域變化趨勢相對穩(wěn)定,距離城區(qū)及居民區(qū)較近的水體透明度相對較低。人類活動將成為影響滇池水體透明度變化的重要因素,同時也是造成滇池水體污染的主要因素。隨著中國城鎮(zhèn)化的不斷推進,人類活動對湖泊水體透明度下降的貢獻將越來越大。
致謝:云南省環(huán)境科學研究院提供數(shù)據(jù)支撐,科技部國家遙感中心提供技術(shù)支持。