李 港,陳 誠,何欣霞,2,何夢男,鄧 躍,陳求穩(wěn),2
(1.南京水利科學(xué)研究院生態(tài)環(huán)境研究所,江蘇 南京 210029; 2.重慶交通大學(xué)河海學(xué)院,重慶 400074;3.中建四局第五建筑工程有限公司,廣東 深圳 518000)
湖泊是重要的淡水資源庫,近些年來,由于營養(yǎng)鹽的大量排放以及氣候變化的影響,湖泊富營養(yǎng)化及水華問題日益嚴(yán)重[1]。據(jù)2018年中國生態(tài)環(huán)境狀況公報顯示,我國約有1/3的湖庫達(dá)到了富營養(yǎng)化狀態(tài)[2],其中太湖、滇池、巢湖等重要水源地富營養(yǎng)化形勢嚴(yán)峻,嚴(yán)重威脅飲用水安全和人體健康[3]。水華的精確模擬預(yù)測是富營養(yǎng)化湖泊風(fēng)險管控的基礎(chǔ),對于富營養(yǎng)化湖泊的治理具有重要意義。
富營養(yǎng)化模型是進(jìn)行湖泊水華模擬預(yù)測的重要工具。國內(nèi)外學(xué)者開發(fā)了EFDC(environmental fluid dynamics code)、WASP(water quality analysis simulation program)、Delft3D-Eco和三維水生態(tài)動力學(xué)(three-dimensional hydro-ecological dynamics, 3DHED)模型等一系列湖泊水質(zhì)模型[4-7],已成功應(yīng)用于滇池[8]、Langelmavesi-Roine湖[9]、維多利亞湖[10]等富營養(yǎng)化湖泊的藻類模擬預(yù)測。但由于大范圍藍(lán)藻生物量的空間分布獲取困難,模型使用站點觀測數(shù)據(jù)作為輸入數(shù)據(jù)時,會產(chǎn)生較大的初值誤差,同時,模型運行過程中模擬誤差也會不斷積累,使得模擬精度無法得到有效保證[11]。數(shù)據(jù)同化(data assimilation, DA)技術(shù)通過將觀測數(shù)據(jù)融入模型計算過程,校正模型模擬結(jié)果,同步更新模型參數(shù),降低了輸入數(shù)據(jù)和模型結(jié)構(gòu)不確定性的影響[12]。該技術(shù)包含連續(xù)數(shù)據(jù)同化和順序數(shù)據(jù)同化兩大類,其中連續(xù)順序同化算法利用同化時間窗口內(nèi)的所有觀測數(shù)據(jù)和模型狀態(tài)值進(jìn)行最優(yōu)估計,不斷調(diào)整模型初始場,最終將模型軌跡擬合至同化窗口周期內(nèi)的觀測值上,主要以變分算法為主[13]。相較于變分算法,以集合卡爾曼濾波為代表的順序數(shù)據(jù)同化算法能夠提供狀態(tài)量的均值及其相應(yīng)的誤差協(xié)方差,其預(yù)報誤差也可以隨著模型動態(tài)變化,同時由于引入了集合的思想,不需要伴隨或線性算子,具有適用于非線性系統(tǒng)、程序設(shè)計相對簡單以及易實現(xiàn)并行運算等特點[14],近年來得到了廣泛的應(yīng)用。Loos等[15]結(jié)合HSFP、EFDC以及WQFS(water quality forecast system),建立了基于EnKF (ensemble Kalman filter)的Yeongsan河藻類數(shù)值模型和數(shù)據(jù)同化系統(tǒng)。劉卓等[16]采用2009—2011年太湖站點監(jiān)測數(shù)據(jù)對Delft3D-BLOOM模型進(jìn)行EnKF數(shù)據(jù)同化,提高了Delft3D-BLOOM模型對太湖藍(lán)藻的模擬精度。對于大型湖泊而言,數(shù)據(jù)同化技術(shù)雖然能將初始場的使用時間減少到一個觀測周期內(nèi),降低了模型誤差的累積,但加入的同化數(shù)據(jù)是稀疏站點數(shù)據(jù)插值得到的藍(lán)藻生物量數(shù)據(jù),忽略了藍(lán)藻生物量的空間異質(zhì)性,存在較大的初值誤差。遙感數(shù)據(jù)由于具有較好的空間代表性[17],尤其對大型湖區(qū)的藍(lán)藻生物量表征能力優(yōu)于站點觀測數(shù)據(jù),所以將其與數(shù)據(jù)同化技術(shù)相結(jié)合,以降低初值誤差,有效提高模型模擬與預(yù)測精度。但某些時刻遙感數(shù)據(jù)質(zhì)量受云霧等氣象條件的影響,觀測誤差較大,此時加入低質(zhì)量的遙感數(shù)據(jù)進(jìn)行數(shù)據(jù)同化,反而會造成一個觀測周期內(nèi)的模擬精度降低。
基于此,本文以太湖為研究區(qū)域,采用2014—2016年水環(huán)境監(jiān)測數(shù)據(jù)率定的3DHED模型進(jìn)行藻類時空模擬,加入藍(lán)藻生物量遙感反演數(shù)據(jù)進(jìn)行模型的EnKF數(shù)據(jù)同化,并提出一種數(shù)據(jù)同化改進(jìn)策略,通過比較兩種方式模擬結(jié)果與實測數(shù)據(jù)的均方根誤差(RMSE),進(jìn)行數(shù)據(jù)同化時遙感數(shù)據(jù)的有效篩選,避免因部分時刻遙感數(shù)據(jù)誤差較大給模型帶來的影響,提升藍(lán)藻生物量模擬精度,以期為富營養(yǎng)化湖泊水華的精確模擬預(yù)測和風(fēng)險管控提供技術(shù)支撐。
太湖是中國第三大淡水湖泊,總面積為 2 338 km2,平均水深約2 m[18],分為梅梁灣、竺山湖、貢湖、西北湖、湖心區(qū)、東部湖區(qū)、西南湖和東太湖8個湖區(qū)(圖1)。1980年以來,隨著太湖周邊城市化進(jìn)程的不斷加快,湖泊的不合理利用開發(fā)加劇[19],如工業(yè)生產(chǎn)、圍湖造田以及沿岸漁業(yè)發(fā)展等,導(dǎo)致大量污染物匯入太湖,使得太湖生態(tài)系統(tǒng)逐步退化,水體自凈能力下降,水質(zhì)日趨惡化,藍(lán)藻水華頻發(fā)[20]。2007年藍(lán)藻水華暴發(fā)造成了無錫市近百萬人的飲用水危機,引起全社會廣泛關(guān)注[21]。2017年,太湖再次暴發(fā)大面積藍(lán)藻水華,嚴(yán)重影響周邊群眾生產(chǎn)生活[22],太湖富營養(yǎng)化形勢依然嚴(yán)峻。
圖1 研究區(qū)域及采樣點分布
3DHED模型通過耦合SELFE模型與SALMO模型,考慮了動力條件對藻類分布的影響,可以有效模擬藻類時空變化[7]。其耦合原理為:①通過SELFE模型將湖泊劃分為若干個三角網(wǎng)格,并將SALMO模型應(yīng)用到其中的每個網(wǎng)格;②通過SELFE模型計算得到全湖所有網(wǎng)格的水動力數(shù)據(jù),然后將其提供給SALMO模型;③根據(jù)水動力數(shù)據(jù)與模型水質(zhì)初始場信息,利用SALMO模型在每個網(wǎng)格上進(jìn)行水質(zhì)模擬。3DHED模型參數(shù)率定參考郭靜等[24]的前期研究成果,采用2014—2016年的水環(huán)境生態(tài)監(jiān)測數(shù)據(jù)對模型影響較大的20個參數(shù)進(jìn)行率定。選定的參數(shù)及其率定結(jié)果如表1所示。
EnKF計算過程包括預(yù)測和分析兩個步驟:設(shè)有N個集合,在k=0時刻對每個集合進(jìn)行初始化。式(1)為預(yù)測階段,式(2)~(6)為分析階段。
(1)
式中:Xai,k為k時刻第i集合狀態(tài)變量分析值;Xfi,k+1為k+1時刻狀態(tài)變量預(yù)測值;Mk,k+1為模型算子,本文選取3DHED模型;wi,k為模型結(jié)構(gòu)不確定性引起的模擬誤差,服從均值為0、協(xié)方差矩陣為Qk的正態(tài)分布。
Xai,k+1=Xfi,k+1+Kk+1[Y0k+1-Hk+1(Xfk+1)]
(2)
(3)
表1 模型參數(shù)率定結(jié)果
(4)
(5)
(6)
同時進(jìn)行狀態(tài)變量和模型參數(shù)同化,對模型模擬精度的提高有明顯效果[25]。本文以太湖優(yōu)勢藻種藍(lán)藻生物量作為狀態(tài)變量,以敏感性最高的藍(lán)藻最佳生長溫度作為模型參數(shù)[16],同時進(jìn)行狀態(tài)變量和模型參數(shù)數(shù)據(jù)同化。采用EnKF算法進(jìn)行數(shù)據(jù)同化時,合理的同化方案和合適的參數(shù)設(shè)置是保證同化效果的前提。EnKF算法利用集合思想解決了實際應(yīng)用中背景協(xié)方差矩陣估計和預(yù)報困難的問題,集合數(shù)越多,集合均值協(xié)方差與真值協(xié)方差越接近,但計算負(fù)荷會顯著增加;集合數(shù)過少,則可能導(dǎo)致模型誤差協(xié)方差估計錯誤。本研究將集合數(shù)設(shè)置為30、50、70、100、200和500進(jìn)行數(shù)值試驗,結(jié)果發(fā)現(xiàn)集合數(shù)為100時可較好地兼顧模擬精度和計算效率。采用數(shù)據(jù)同化方法將觀測數(shù)據(jù)與模擬數(shù)據(jù)相融合,發(fā)現(xiàn)融合的優(yōu)劣性與模擬誤差協(xié)方差和觀測誤差協(xié)方差緊密相關(guān)[26],所以選擇合適的模擬誤差和觀測誤差對提高同化精度至關(guān)重要。本文參考Chen等[27-28]的研究結(jié)果,將觀測誤差與模擬誤差分別設(shè)置為1%、10%、20%、30%,篩選觀測誤差和模擬誤差的最優(yōu)組合,進(jìn)行同化參數(shù)設(shè)置。
同化模型中背景場和觀測數(shù)據(jù)的誤差均會導(dǎo)致模型的預(yù)報誤差,而背景場與觀測誤差均與實測數(shù)據(jù)相關(guān),因此本研究提出一種改進(jìn)的數(shù)據(jù)同化(modified data assimilation, mDA)策略。首先在有遙感數(shù)據(jù)的時刻,加入遙感數(shù)據(jù)進(jìn)行模型的數(shù)據(jù)同化計算,同時進(jìn)行模型模擬計算,直到有站點實測數(shù)據(jù)的下一時刻,以站點實測數(shù)據(jù)為參考,計算并比較該時刻同化結(jié)果和模型模擬結(jié)果的RMSE,從而進(jìn)行同化時刻數(shù)據(jù)源的篩選。提出的mDA能夠有效剔除低質(zhì)量的遙感數(shù)據(jù),避免遙感數(shù)據(jù)質(zhì)量較差所導(dǎo)致的同化結(jié)果精度降低的問題,從而提高同化模型的魯棒性。改進(jìn)數(shù)據(jù)同化流程如圖2所示。
圖2 改進(jìn)的數(shù)據(jù)同化流程
本文采用RMSE和一致性系數(shù)IOA(index of agreement)定量評價藍(lán)藻生物量的觀測數(shù)據(jù)與模擬結(jié)果的擬合度。RMSE表示模擬結(jié)果與站點實測數(shù)據(jù)的偏差,其值越小說明模擬結(jié)果與站點實測數(shù)據(jù)越接近。IOA表示模擬結(jié)果與站點實測站點數(shù)據(jù)的吻合程度,描述了模擬結(jié)果與站點實測數(shù)據(jù)在變化趨勢上的一致性,IOA值介于0~1之間,越接近1表示模擬結(jié)果與實測數(shù)據(jù)吻合度越高。
(7)
(8)
表2為16種不同觀測誤差和模擬誤差組合下模擬結(jié)果與觀測數(shù)據(jù)的RMSE值。從表2中可以看出,當(dāng)觀測誤差設(shè)置為1%且模擬誤差設(shè)置為10%時,數(shù)據(jù)同化結(jié)果的RMSE最小,因此本文以觀測誤差1%、模擬誤差10%作為EnKF數(shù)據(jù)同化方法的參數(shù)設(shè)置。
表2 不同觀測誤差與模擬誤差下的RMSE值
針對太湖8個湖區(qū)各湖區(qū)選擇一個代表性站點進(jìn)行3DHED模擬結(jié)果和DA模擬結(jié)果的比較,圖3為8個代表性站點藍(lán)藻生物量觀測值、3DHED模擬結(jié)果以及DA模擬結(jié)果的對比。從圖3可以看出,3DHED模擬結(jié)果雖能在一定程度上反映藍(lán)藻生物量的變化趨勢,但對藍(lán)藻生物量峰值的捕捉能力欠佳,而加入遙感數(shù)據(jù)進(jìn)行同化后,同化時刻初值誤差有所降低,模型誤差累積周期縮短,使得DA模擬結(jié)果的藍(lán)藻生物量變化趨勢與峰值的模擬效果均較3DHED模擬結(jié)果有顯著提高。8個代表性站點的3DHED模擬結(jié)果、DA模擬結(jié)果與站點實測數(shù)據(jù)的RMSE和IOA及其平均值見表3。從表3可以看出,8個代表性站點3DHED模擬結(jié)果的RMSE均值為 1.44 mg/L,IOA均值為0.43;DA模擬結(jié)果的RMSE均值為1.34 mg/L,IOA均值為0.60。相較于3DHED模擬結(jié)果,8個代表性站點IOA平均值提升了39.5%,RMSE平均值降低了6.9%,表明數(shù)據(jù)同化方法能夠有效提高模型的模擬精度。
圖3 藍(lán)藻生物量觀測值、3DHED模擬結(jié)果和DA模擬結(jié)果對比
圖4為8個湖區(qū)代表性站點藍(lán)藻生物量觀測值、DA模擬結(jié)果以及mDA模擬結(jié)果的對比。從圖4可以看出,DA模擬結(jié)果和mDA模擬結(jié)果均能較為準(zhǔn)確地模擬藍(lán)藻生物量的變化趨勢,但mDA捕捉到藍(lán)藻生物量峰值的次數(shù)有一定增加,表明采用DA方法進(jìn)行數(shù)據(jù)同化時,部分同化時刻遙感數(shù)據(jù)存在較大誤差,mDA方法可進(jìn)行高質(zhì)量遙感數(shù)據(jù)的篩選,有效提升模擬精度。mDA模擬結(jié)果的RMSE值介于0.79~1.68 mg/L,8個站點RMSE均值為 1.21 mg/L,在DA模擬結(jié)果基礎(chǔ)上降低了9.7%,mDA模擬結(jié)果的IOA值介于0.53~0.89,均值為0.68,在DA模擬結(jié)果基礎(chǔ)上提高了13.3%。
圖4 藍(lán)藻生物量觀測值、DA模擬結(jié)果和mDA模擬結(jié)果對比
圖5為太湖30個采樣點3DHED模擬結(jié)果、DA模擬結(jié)果和mDA模擬結(jié)果的IOA值及RMSE值對比。3種模擬方式下30個站點的IOA均值分別為0.43、0.64和0.71,RMSE均值為1.42 mg/L、1.27 mg/L和1.16 mg/L。各站點IOA值由大到小順序為mDA、DA、3DHED,RMSE值由小到大順序為mDA、DA、3DHED??傮w而言,mDA的藍(lán)藻生物量模擬精度最高,但少部分站點存在mDA模擬結(jié)果的RMSE高于DA模擬結(jié)果的現(xiàn)象。
(a) IOA值
表3為各個湖區(qū)3DHED模擬結(jié)果、DA模擬結(jié)果以及mDA模擬結(jié)果的IOA值和RMSE值的對比情況。從表3可以看出,DA模擬結(jié)果的IOA均高于3DHED模擬結(jié)果的IOA,而mDA模擬結(jié)果的IOA值在DA模擬結(jié)果的基礎(chǔ)上又得到了進(jìn)一步提升。對于3種模擬結(jié)果的RMSE,mDA模擬結(jié)果的RMSE值最低,模擬效果最好,整體上太湖各湖區(qū)RMSE值表現(xiàn)為西北部湖區(qū)大于東南部湖區(qū)。
在真實的環(huán)境下,與藍(lán)藻相關(guān)的一些物理參數(shù)(如藍(lán)藻沉降率和被捕食率等)是難以精確模擬和確定的,并且參數(shù)會隨著時間而變化,其過程遠(yuǎn)比模型模擬復(fù)雜得多[29]。本文采用3DHED模型模擬2014—2016年太湖全湖藍(lán)藻生物量的時空變化時,雖然能夠在一定程度上反映太湖藍(lán)藻的變化趨勢,但總體模擬效果欠佳,峰值模擬效果有待進(jìn)一步提高(圖3)。藍(lán)藻從生長到形成水華會經(jīng)歷下沉—休眠—復(fù)蘇—上浮4個階段[30],冬季沉于底泥中的藻類細(xì)胞在春季適宜條件下迅速生長,于夏季聚集上浮形成水華[31]。水動力條件也是決定水華暴發(fā)的關(guān)鍵因子[32],當(dāng)藍(lán)藻生物量聚集到一定程度后,風(fēng)浪的擾動使藍(lán)藻細(xì)胞通過碰撞形成大群體,風(fēng)浪作用一旦減弱,便上浮形成表面可見水華[33]。結(jié)合本文模擬結(jié)果,3DHED模擬過程中未能考慮冬季沉底部分的藍(lán)藻,同時對于風(fēng)力作用下藍(lán)藻的遷移過程描述不夠清晰,這可能是導(dǎo)致模型對于藍(lán)藻生物量峰值捕捉不夠理想的重要原因[7]。采用遙感數(shù)據(jù)對3DHED進(jìn)行EnKF數(shù)據(jù)同化后,由于各個觀測時刻的藍(lán)藻生物量得到及時更新,使得DA模式下的藍(lán)藻生物量模擬精度得到明顯提升(圖3),其IOA均值較3DHED模擬結(jié)果增加了48.8%,RMSE均值降低了10.4%。
表3 8個湖區(qū)3DHED、DA和mDA模擬結(jié)果的IOA值和RMSE值的對比
模擬誤差和觀測誤差是數(shù)據(jù)同化的關(guān)鍵因素[16],對同化性能有重要影響。設(shè)置較小的觀測誤差時,觀測數(shù)據(jù)精度更高,同化結(jié)果會更接近觀測值,反之,同化結(jié)果會更接近模擬值。一般情況下,觀測數(shù)據(jù)的誤差更小,更接近于真實值。李淵等[34-35]在進(jìn)行不同同化試驗時采用了較小的觀測誤差,取得了較為理想的試驗結(jié)果。但遙感數(shù)據(jù)受到云覆蓋等因素的影響,在某些時刻、某些區(qū)域的數(shù)據(jù)誤差較大,在進(jìn)行數(shù)據(jù)同化時,由于模型采用的仍是較小的觀測誤差,會導(dǎo)致遙感數(shù)據(jù)誤差被低估,同化結(jié)果趨近于遙感數(shù)據(jù),反而會更加偏離真實值。本文采用改進(jìn)的數(shù)據(jù)同化模式后,結(jié)果顯示mDA的藍(lán)藻生物量模擬效果較DA整體上有了一定的提升,對藍(lán)藻生物量峰值的捕捉頻次也有所增加(圖4),全湖IOA均值在DA基礎(chǔ)上增加10.9%,RMSE均值降低了8.6%,說明未改進(jìn)前遙感數(shù)據(jù)在某些時刻存在誤差被低估的現(xiàn)象,模型模擬結(jié)果趨向于誤差被低估的遙感數(shù)據(jù),從而偏離真實值。
太湖藍(lán)藻水華總體呈現(xiàn)東南低西北高的趨勢,這與入湖河流污染負(fù)荷輸入密切相關(guān)。西南部的天目山水系,城鎮(zhèn)較少,人口密度低,水質(zhì)較好。西北部的南溪水系水流多來自工農(nóng)業(yè)發(fā)達(dá)的平原和城鎮(zhèn)地區(qū),入湖污染負(fù)荷較大[36]。同時太湖夏季盛行東南風(fēng),受到太湖風(fēng)浪的影響,藍(lán)藻水華易在西北部聚集和堆積[37],因此,重度水華主要集中在太湖西北部沿岸(如竺山湖、梅梁灣等)[38]。本文采用mDA方法進(jìn)行太湖藍(lán)藻生物量的模擬時,除了在一定程度上減小遙感數(shù)據(jù)誤差對同化結(jié)果的影響外,還能較好地模擬藍(lán)藻生物量的空間分布。結(jié)合圖1和表3可以看出,RMSE值總體表現(xiàn)為西北部湖區(qū)大于東南部湖區(qū),這是由于藍(lán)藻生物量越大的區(qū)域,其RMSE值也越大。
湖泊藻類動態(tài)模型采用常微分方程描述湖泊生態(tài)系統(tǒng)的食物鏈動態(tài)和營養(yǎng)物質(zhì)循環(huán)導(dǎo)致的自身結(jié)構(gòu)不確定性[25],使得模擬誤差會隨著模擬時間的增加而不斷積累。數(shù)據(jù)同化技術(shù)通過實時加入觀測數(shù)據(jù),可及時更新初始場數(shù)據(jù)[39],將一個初始場的使用時間縮短到一個觀測周期內(nèi),有效降低了模擬誤差的積累,此時初始場數(shù)據(jù)的誤差對模型模擬精度起到?jīng)Q定性作用。遙感數(shù)據(jù)具有時間上較為連續(xù)、監(jiān)測范圍廣等特點[40],但若在觀測時刻受到云霧等因素影響,提供的初始場數(shù)據(jù)誤差可能大于模型模擬得到的初始場數(shù)據(jù)。本文以兩種模式下提供的初始場數(shù)據(jù)模擬到下一觀測時刻,比較得到的模擬結(jié)果與實測數(shù)據(jù)的RMSE,再篩選出與真實情況誤差較小的初始場數(shù)據(jù)進(jìn)行模型模擬,從而進(jìn)一步提高模擬精度。近年來,國內(nèi)學(xué)者針對太湖藍(lán)藻生物量模擬開展了一系列研究。張成成[41]利用三維水生態(tài)模型模擬了藍(lán)藻生物量的變化,驗證站點的IOA值介于0.23~0.50。Huang等[28]采用EnKF方法通過更新模型狀態(tài)變量和模型參數(shù)以提高太湖富營養(yǎng)化模型對浮游植物的模擬精度,其最佳模擬效果下IOA值達(dá)到了0.67。本研究mDA模式下的藍(lán)藻生物量模擬結(jié)果改善效果明顯(圖5),全湖平均IOA值為0.71,表明本文提出的mDA同化方法具有較高的模擬精度,尤其對于監(jiān)測站點稀疏的大型湖庫水華的精確模擬預(yù)測具有廣闊的應(yīng)用前景。值得注意的是,存在少部分站點mDA結(jié)果精度低于DA的現(xiàn)象(圖5中拖山、洑東等站點),這主要是由于本研究是通過計算整個湖區(qū)36個站點處同化結(jié)果與實測數(shù)據(jù)的RMSE值,來判斷是否加入遙感數(shù)據(jù)進(jìn)行同化,少部分站點遙感數(shù)據(jù)質(zhì)量較差,但在整個湖區(qū)范圍內(nèi)精度較高,使得部分站點模擬效果不佳。因此后續(xù)的研究可以通過劃分不同湖區(qū)來進(jìn)行遙感數(shù)據(jù)分區(qū)的篩選,從而進(jìn)一步提高數(shù)據(jù)同化精度。同時,太湖面積廣闊,不同湖區(qū)的藍(lán)藻水華嚴(yán)重程度亦有差別,進(jìn)行不同湖區(qū)模型參數(shù)的分區(qū)率定對模型精度提高具有一定的效果。
a.采用遙感數(shù)據(jù)進(jìn)行藍(lán)藻生物量EnKF數(shù)據(jù)同化后,同化結(jié)果的IOA均值較3DHED模擬結(jié)果的IOA均值提升了48.8%,RMSE均值降低了10.4%,DA模擬精度較3DHED模型模擬精度有顯著提高。
b.本文提出的mDA方法對藍(lán)藻生物量的模擬精度最高,總體精度由大到小為mDA、DA、3DHED,其中mDA的全湖IOA均值達(dá)到0.71,RMSE均值降低至1.16 mg/L,不僅能較好反映藍(lán)藻生物量時空變化趨勢,還顯著提高了對藍(lán)藻生物量的峰值捕捉能力。