楊鑫春 游 為 萬祥禹 宋夢芝
1 西南交通大學地球科學與環(huán)境工程學院,成都市犀安路999號,611756 2 西南科技大學環(huán)境與資源學院,四川省綿陽市青龍大道中段59號,621010
GRACE衛(wèi)星于2017-10退役,其提供的數據只更新至2017-06。但其繼任者GRACE-FO衛(wèi)星直到2018-05才發(fā)射升空,并于同年6月開始發(fā)布全球陸地水儲量變化(terrestrial water storage changes, TWSC)信息。兩代GRACE衛(wèi)星數據之間存在11個月的空缺期,打破了GRACE/GRACE-FO監(jiān)測TWSC的連續(xù)性,也會限制其進一步應用[1]。因此,填補11個月的數據空缺或重構連續(xù)的TWSC尤為重要。
部分學者采用機器學習方法來重構或預測連續(xù)的TWSC[1-2]。如Sun等[1]采用深度神經網絡(deep neural network, DNN)、多變量季節(jié)性自回歸整合移動平均模型(seasonal autoregressive integrated moving average with external variables, SARIMAX)和多元線性回歸(multiple linear regression, MLR)3種機器學習方法,重構多種全球TWSC數據產品。結果表明,DNN性能略優(yōu)于SARIMAX,明顯優(yōu)于MLR。Li等[2]聯合多種統計分解、時間序列分解和機器學習方法重構全球TWSC信號,與采用整體信號重構不同,其首先分別重構TWSC時變模態(tài)上的季節(jié)項、年際變化項和殘余項信號,然后將GRACE/GRACE-FO原有時變模態(tài)上的趨勢項信號加回到重構的非趨勢項信號,以生成重構的全頻段時變模態(tài)信號,最后將GRACE/GRACE-FO原有空間模態(tài)乘以重構時變模型得到總的TWSC信號。同時,Li等[2]認為在聯合使用統計分解方法時,相比于其他復雜的機器學習方法,雖然MLR方法在訓練階段表現并非最佳,但在測試階段表現較好,因此MLR模型是一種可靠和穩(wěn)健的重構方法。基于以上研究,本文將采用MLR方法,以降水、氣溫和水文模型模擬的陸地水儲量數據作為預測參數,重構中國九大流域(邊界數據由資源環(huán)境科學與數據中心(http:∥www.resdc.cn)提供)連續(xù)的TWSC;同時,對比分析整體信號重構、去趨勢項信號重構和去趨勢項去季節(jié)項信號重構等3種策略對重構數據質量的影響,以期提供最適合九大流域的重構策略。
GRACE/GRACE-FO觀測數據產品具有2種不同的形式,即傳統的球諧系數產品和最新的Mascon產品[1]。相較于傳統的球諧系數產品,Mascon產品主要具有以下優(yōu)勢[3]:1)減少從陸地到海洋的泄漏誤差,增加數據的信噪比;2)在處理過程中應用地球物理數據約束,幾乎無經驗后處理的平滑濾波要求,更方便非大地測量用戶的使用。本實驗采用CSR最新發(fā)布的RL06 v02 Mascon產品[4],下文簡稱CSR-M。CSR-M空間分辨率為0.25°×0.25°,所選擇的時間跨度為2002-04~2021-12,即共計183個月的GRACE數據、43個月的GRACE-FO數據以及11個月的數據空缺。需要指出的是,本文重點關注GRACE/GRACE-FO系統間11個月空缺數據的重構問題,因此對于因GRACE/GRACE-FO衛(wèi)星儀器問題、校準活動、電池管理等原因造成的系統1~2個月的數據空缺采用簡單線性插值方法進行補全[5]。
降水和氣溫是陸地水儲量變化的重要驅動因子[6],故常作為重構TWSC的主要預測參數[1-2]。此外,Sun等[1]指出雖然水文模型模擬的TWSC通常不包括地下水和表面水,但其與GRACE TWSC存在強相關性,增加該變量作為預測參數所重構的TWSC性能優(yōu)于只考慮降水和氣溫作為驅動參數的重構數據?;诖耍疚牟捎肊CMWF發(fā)布的月度氣候再分析數據集ERA5-Land中降水、氣溫和TWSC(包括土壤水和雪水)數據作為預測參數[7]??紤]到3個預測參數與GRACE/GRACE-FO TWSC存在相位差[6],選擇時間窗口前3~0個月內的所有變量作為預測參數,即每個預測參數在2002-01~2021-12范圍內將具有4個預測變量。同時,為了與CSR-M數據保持一致性,3個驅動參數的空間分辨率由0.1°×0.1°重新采樣為0.25°×0.25°,并刪除2004~2009年均值。
MLR模型是一種用于估計2個或多個自變量與1個因變量之間線性關系的統計方法。本文使用3個預測參數(降水、氣溫和水文模型模擬的TWSC)作為自變量,GRACE/GRACE-FO TWSC 作為因變量,其對應的MLR模型計算公式為:
yi=β0+β1xi1+β2xi2+β3xi3+ε
(1)
式中,yi為某個流域的GRACE/GRACE-FO TWSC 時間序列;xi1、xi2、xi3為對應流域內3個預測參數的時間序列;β0、β1、β2、β3為待估參數;ε為模型誤差。本文使用183個月的GRACE數據,采用最小二乘方法估算MLR模型的待估參數,并采用43個月的GRACE-FO數據測試所確定MLR模型的可靠性。根據所確定的MLR模型,通過預測參數來重構2002-04~2021-12連續(xù)的TWSC。
本文使用3種不同的重構策略。重構策略1為整體信號重構,是對GRACE/GRACE-FO TWSC整體信號使用式(1)直接重構生成連續(xù)的TWSC;重構策略2為去趨勢項信號重構,是在使用MLR模型重構GRACE/GRACE-FO TWSC去長趨勢項信號基礎上加回GRACE/GRACE-FO TWSC原有的長趨勢項信號以生成連續(xù)的TWSC;重構策略3為去趨勢項去季節(jié)項信號重構,是在采用MLR模型重構GRACE/GRACE-FO TWSC去長趨勢項去季節(jié)項信號后加回GRACE/GRACE-FO TWSC原有的長趨勢項和季節(jié)項信號以生成連續(xù)的TWSC。
為獲得信號的趨勢項和季節(jié)項,采用最小二乘分解方法對GRACE/GRACE-FO TWSC 和預測參數的時間序列進行分解[3,8]:
Stotal=Strend+Sseasonal+Sresidual
(2)
式中,Stotal為總的原有信號;Strend為信號的長期線性趨勢項;Sseasonal為信號的季節(jié)項;Sresidual為信號的余項,主要包含年際變化項、次季節(jié)項和噪聲。需要說明的是,雖然11個月數據空缺會導致GRACE/GRACE-FO TWSC趨勢項值存在一定偏差,但這種偏差對重構數據質量的影響可以忽略[2,8]。此外,GRACE/GRACE-FO TWSC季節(jié)項信號在重構時間范圍內可認為并未發(fā)生實質性變化[2],因此GRACE/GRACE-FO TWSC季節(jié)項信號計算也不受數據空缺的影響。
本文采用皮爾遜相關系數(Pearson correlation coefficient,CC)、歸一化均方根誤差(normalized root mean square error,NRMSE)和納什效率系數(Nash-Sutcliffe efficiency coefficient,NSE)等3種常用的精度指標來評定重構TWSC的性能,各指標詳細計算公式見文獻[1]。CC、NRMSE和NSE的取值范圍分別為[-1,1]、[0,+∞)和(-∞,1],CC和NSE數值越大、NRMSE數值越小,重構數據的性能越好。此外,采用重構的TWSC與GRACE/GRACE-FO TWSC位于測試階段(2018-06~2021-12)的RMSE值作為重構數據的不確定性值[2]。
圖1為中國九大流域的CSR-M TWSC以及基于3種不同策略重構的TWSC,其相應的性能指標和不確定性值如圖2和表1所示?;诓呗?重構的TWSC在松花江遼河、黃河、淮河、東南諸河和珠江五個流域表現出良好的性能(CC/NRMSE/NSE值分別優(yōu)于0.80/0.10/0.70),但在海灤河、長江、西南諸河和內陸河四個流域表現出較差的性能。這種性能差異主要是因為本文只采用與氣候變化有關的降水、氣溫和水文模型模擬的TWSC數據作為驅動參數,未考慮人類活動和冰川融化等其他影響因子。松花江遼河、黃河、淮河、東南諸河和珠江流域TWSC主要受氣候變化影響,而海灤河、長江、西南諸河和內陸河流域TWSC除考慮氣候變化影響外,還應考慮人類活動或冰川融化的影響[5]。此外,重構的TWSC在海灤河和西南諸河兩個流域存在異常的不確定性,其對應數值分別高達13.55 cm和8.67 cm。因此,基于整體信號重構策略重構的TWSC不宜作為九大流域的最后重構結果。
圖1 基于不同策略重構的中國九大流域TWSCFig.2 The reconstructed TWSC of nine major river basins in China based on different strategies
相較于策略1,策略2可顯著提高九大流域重構數據的性能,特別是在海灤河、長江、西南諸河以及內陸河流域。例如在海灤河流域,重構數據的性能指標CC/NRMSE/NSE分別提高0.25/0.09/0.48,不確定性值降低9.71 cm。這種性能的提高得益于人類活動和冰川融化等因素主要影響GRACE/GRACE-FO TWSC趨勢項信號的變化[2],而去趨勢項信號重構策略完全保留該部分信號。
相較于策略2,策略3進一步提升重構數據的質量,但提升幅度并不明顯。重構數據質量的進一步提升是因為策略3完全包含原有的GRACE/GRACE-FO TWSC 趨勢項和季節(jié)項信號,進而能最大限度地保留人類活動和冰川融化對TWSC的影響。此外還可以發(fā)現,基于策略3重構的TWSC在海灤河、淮河和東南諸河流域存在較大的不確定性,其值分別為3.82 cm、4.01 cm和3.66 cm,這主要受GRACE/GRACE-FO 空間分辨率(從低緯度約 200 000 km2到兩極附近約 90 000 km2范圍[5])限制,較小流域的TWSC可能會存在明顯的信號泄露[9]。
圖2 中國九大流域重構的TWSC性能指標對比Fig.2 Comparison of performance indexes of reconstructed TWSC of nine major river basins in China
表1 不同策略重構的中國九大流域TWSC的不確定性
根據以上分析,將基于策略3重構的TWSC作為九大流域最后的重構結果,表2為重構數據的性能指標。從表2可以看出,重構數據的性能在不同流域存在一定差異,這主要與各自流域的GRACE/GRACE-FO 數據信噪比以及預測參數與GRACE/GRACE-FO TWSC的相關性有關。例如在信噪比以及相關性高的西南諸河流域(圖1(h)和表3),重構數據的性能指標CC/NRMSE/NSE高達0.97/0.05/0.94,而在信噪比和相關性低的內陸河流域(圖1(i)和表3),重構數據的性能指標CC/NRMSE/NSE值僅有0.77/0.12/0.60。因此在對比不同流域的重構數據性能指標時,應綜合考慮各流域的GRACE/GRACE-FO 數據信噪比以及預測參數與GRACE/GRACE-FO TWSC的相關性。
表2 基于策略3重構的中國九大流域TWSC性能
表3 預測參數與GRACE TWSC在中國九大流域的最大相關系數(時間窗口為前3~0個月)
本文利用MLR模型,采用3種不同的重構策略,重構中國九大流域的TWSC,得到以下結論:
1)基于整體信號重構策略的重構結果僅在TWSC主要受氣候變化影響的流域(如松花江遼河、黃河、淮河、東南諸河和珠江流域)表現出良好的性能,而在人類活動或冰川融化(如海灤河、長江、西南諸河和內陸河流域)頻繁的流域表現較差。
2)去趨勢項信號重構策略的重構結果在九大流域均優(yōu)于整體信號重構策略,在人類活動和冰川融化劇烈的流域優(yōu)勢更為明顯。
3)去趨勢項去季節(jié)項信號重構策略的重構結果在九大流域均稍優(yōu)于去趨勢項信號重構策略。
4)不同流域重構結果的性能還與該流域的GRACE/GRACE-FO數據信噪比以及預測參數(降水、氣溫、模型模擬的TWSC)與GRACE/GRACE-FO TWSC的相關性有關,信噪比和相關性高的流域(如西南諸河流域)其重構結果的性能優(yōu)于信噪比和相關性低的流域(如內陸河流域)。