夏 正 兵,邱 鵬
(江蘇城市職業(yè)學院 建筑工程學院,江蘇 南通 226006)
作為模擬流域水文過程和揭示流域水資源豐枯狀態(tài)的重要工具,水文模型被廣泛應用于水文預報、水資源管理、氣候變化和土地利用變化等方面[1-3]。然而,水文模型多基于大量數(shù)學方程對復雜流域水文過程進行抽象性描述,而大部分參數(shù)不能直接從流域特征中獲取,必須采用人工或智能優(yōu)化算法予以確定,以使模擬的水文過程盡可能接近流域?qū)嶋H的水文特性[4-5]。過去通常是采用單一目標函數(shù)評價模型的模擬精度,但眾多水文模型參數(shù)率定結(jié)果表明:單一目標函數(shù)僅能反映流域水文特征的某一方面(洪量、洪峰等),并不能夠綜合刻畫水文過程中流域的全部水文特性[6-7]。比如,若選擇相對誤差(RE)作為目標函數(shù),那么模擬結(jié)果在總水量上具有很好的性能,但在流量過程線形狀和峰值流量上的性能會較差;若選擇納什效率系數(shù)(NSE)作為目標函數(shù),則模型對高水流量較敏感,但會忽視枯水流量。
近年來,國內(nèi)外學者針對多目標函數(shù)的水文模型參數(shù)率定過程進行了研究,并取得了較滿意的結(jié)果[8-10]。例如,歐陽碩等[11]采用多目標文化自適應仿電磁學算法(MOCSEM),對新安江模型進行了多目標參數(shù)的求解,結(jié)果表明,該方法可以同時權(quán)衡流域水文系統(tǒng)不同水文特性的參數(shù)組合方式。周建中等[7]采用多目標優(yōu)化算法(MOSCDE)對新安江模型參數(shù)進行率定,結(jié)果表明,改進的非劣解選擇方法能夠有效地從大規(guī)模非劣解集中篩選出最優(yōu)的非劣解。杜彥臻等[12]采用多目標混合復雜演化(MOSCEM-UA)方法來率定垂向混合產(chǎn)流模型參數(shù),結(jié)果表明,采用多目標最優(yōu)非劣解準則來選取最優(yōu)解,使篩選結(jié)果更具準確性和可靠性。黃曉敏等[13]對比評估了NSGA-Ⅱ和MOPSO多目標的優(yōu)化性能后發(fā)現(xiàn),前者的非支配解的空間分布較后者相對均勻,即NSGA-Ⅱ的優(yōu)化性能更優(yōu)。徐帆等[14]以海河流域為研究對象,通過引入集成學習理論,將多目標NSGA-Ⅱ算法和集成學習相結(jié)合,有效地提高了洪水預測的泛化能力和預測精度。
以往的研究結(jié)果表明:采用多目標函數(shù)獲得的模型模擬精度優(yōu)于單目標函數(shù),但在多目標函數(shù)的選擇上存在著較大差異。同時,受近期氣候變化和高強度人類活動的影響,流域或區(qū)域水資源在質(zhì)和量上均發(fā)生了明顯改變,目標函數(shù)選擇的不確定性可能會影響到流域不同時期水資源的評估水平。因此,探究不同目標函數(shù)及其組合的不確定性對不同時期流域水資源評估的影響具有重要意義。
綜上,本文以長江北岸的嘉陵江流域為例,利用流域內(nèi)部及周邊18個氣象站點2006~2011年的日氣象數(shù)據(jù)(降水、氣溫、風速等)和水文數(shù)據(jù),通過設定不同目標函數(shù)及其組合方案集,采用多目標優(yōu)化算法(NSGA-Ⅱ)來優(yōu)化各方案下HyMod模型最優(yōu)的參數(shù)組合,并將該優(yōu)化結(jié)果與適應于單目標的遺傳算法(GA)優(yōu)化結(jié)果進行對比分析。在此基礎上,量化評估了不同目標函數(shù)及其組合對不同量級流量和月尺度水資源評估的影響。
嘉陵江流域發(fā)源于秦嶺北麓的代王山,干流流經(jīng)三省一市(甘肅省、陜西省、四川省和重慶市),流域支流較多,重要支流有八渡河、西漢水、白龍江、渠江和涪江等,干流全長1 345 km[15-16]。嘉陵江流域是長江上游的重要支流,也是三峽水庫集水區(qū)域最大的一級支流,流域?qū)儆诘湫偷膩啛釒夂騾^(qū)。年內(nèi)水資源時程分布不均,年降水量主要集中在5~10月,略陽以上降水量較小,介于600~800 mm,中下游平原區(qū)約為1 000 mm。流域年潛在蒸發(fā)能力介于800~900 mm,多年平均徑流量約為700億m3。流域地理位置及其氣象水文站點空間分布情況如圖1所示。
圖1 流域地理位置及氣象水文站點位置空間分布示意Fig.1 Geographical location of the basin and spatial distribution of meteorological and hydrological stations
本文所采用的氣象和水文數(shù)據(jù)包括流域內(nèi)部及周邊18個國家基準站2006~2011年逐日降水、風速、相對濕度、日照時數(shù)、氣溫等氣象數(shù)據(jù),以及同期流域出口控制站北碚水文站逐日實測流量數(shù)據(jù),其中氣象資料獲取自國家氣象共享服務網(wǎng)基準數(shù)據(jù),水文數(shù)據(jù)獲取自長江流域水文年鑒。
HyMod模型是一種概念式水文模型,被廣泛應用于水資源模擬、水文預報等方面,其產(chǎn)匯流過程主要包括高速流水箱產(chǎn)流和低速流水箱產(chǎn)流,采用蓄滿產(chǎn)流機制[17-18]。HyMod模型滿足的基本假定為:流域由無窮多個互不相干的點集合組成,且空間上任意一點的初始土壤蓄水量為已知,而且僅當凈雨量P大于土壤有效持水能力(Cmax)時產(chǎn)流。同時,模型的蓄水能力曲線被假定為
(1)
式中:F為流域任意一點的累積蓄水能力;參數(shù)B為流域的蓄水能力變化系數(shù);C為流域中任意一點的土壤蓄水能力。HyMod模型的產(chǎn)匯流過程結(jié)構(gòu)如圖2所示。
圖2 HyMod模型的產(chǎn)匯流過程結(jié)構(gòu)示意Fig.2 Schematic diagram of the production and convergence process of the HyMod model
NSGA-Ⅱ是針對NSGA 在非支配集構(gòu)造、維持解集分布性策略中存在的不足所提出的改進算法[19]。該算法以聚集密度為目標,保證群體的多樣性水平,其中聚集距離表示當前個體與相鄰個體在每個子目標的距離和。非支配集的保存機制依據(jù)偏序關(guān)系,對于不同的子集選擇排序小的子集,對于相同的子集保留聚集密度小的個體進入下一代。
本文采用多目標距離函數(shù)法對Pareto集進行求解。該方法首先將不同目標函數(shù)值進行轉(zhuǎn)化,目的是轉(zhuǎn)化后的不同函數(shù)值到原點的距離相等[7]。具體為:以各個目標函數(shù)中最大的最小值減去其最小值,并修正目標函數(shù)到原點的距離。其計算公式為
Ai=max{Fj,min,j=1,2,…,n}-Fi,min
(2)
式中:Ai為目標函數(shù)i的轉(zhuǎn)化常數(shù);Fj,min為第j個目標函數(shù)的最小值;Fi,min為第i個目標函數(shù)的最小值;n為目標函數(shù)個數(shù)。
根據(jù)轉(zhuǎn)化常數(shù)可以將不同目標函數(shù)進行聚合,其計算公式為
(3)
式中:Fagg代表參數(shù)組合θ下的聚合值。
通過式(2)將NSGA-Ⅱ得到的Pareto集合進行轉(zhuǎn)化,就可以從參數(shù)空間中找到唯一一組最優(yōu)的參數(shù)組合,即把多目標求解轉(zhuǎn)化為單目標求解過程。
不同目標函數(shù)反映了水文過程的不同特征,但多目標之間往往存在沖突。本文目標函數(shù)選取的同時考慮了:
(1) 模擬過程與實測過程水量的平衡。
(2) 模擬過程和實測過程的流量過程線形狀一致。
(3) 洪峰流量、峰現(xiàn)時間吻合程度高,即均方根誤差、高水流量誤差系數(shù)和低水流量誤差系數(shù),3個目標函數(shù)的計算公式分別為
(4)
(5)
(6)
式中:Qobs,i為第i天的實測值,m3/s;Qsim,i為第i天的模擬值,m3/s;H為流量序列個數(shù);N為場次洪水數(shù);θ為模型參數(shù)組。
為了探究不同目標函數(shù)及其組合對不同量級流量和月徑流量評估的影響,本文設定的目標函數(shù)組合方案集如表1所列。其中,F(xiàn)1、F2和F3方案采用廣泛應用的遺傳算法(GA)進行單目標模型參數(shù)優(yōu)選,F(xiàn)1F2、F1F3、F2F3和F1F2F3組合方案則采用多目標NSGA-Ⅱ算法進行模型參數(shù)優(yōu)選。
(1) 目標函數(shù)F1、F2和F3為單目標,采用GA算法進行參數(shù)優(yōu)選,其參數(shù)設定為:種群大小為200、最大迭代次數(shù)設置為10 000、交叉概率和變異概率分別為0.70和0.30。
(2) 不同目標之間的組合則采用NSGA-Ⅱ多目標算法,其參數(shù)設定為:種群大小設定為100次、最大迭代次數(shù)設定為10 000、交叉概率和變異概率分別為0.80和0.05,算法得到最大迭代次數(shù)時終止。
(3) 率定和驗證的相關(guān)過程為:① 基于嘉陵江流域18個氣象站點逐日降水、氣溫等資料,采用Penman-Monteith公式計算各站點的日潛在蒸發(fā)量;基于ArcGIS平臺構(gòu)建泰森多邊形矩陣,計算流域面降水量和面潛在蒸發(fā)量。② 模型預熱期為2006年,率定期、驗證期分別為2007~2009年和2010~2011年。③ 將日面降水量和蒸發(fā)量數(shù)據(jù)分別輸入到單目標和多目標模型中,分別采用單目標GA算法和多目標NSGA-Ⅱ算法進行率定期參數(shù)優(yōu)選,將優(yōu)選出的最優(yōu)參數(shù)組合作為模型參數(shù),并將其與驗證期數(shù)據(jù)共同輸入模型,進行模型性能驗證。本文設定的目標函數(shù)組合方案集如表1所列。
為了評估模擬值與實測值之間的差異,即模型性能評價精度,本文選取了納什效率系數(shù)NSE、相對誤差RE以及相關(guān)系數(shù)R2對模型性能進行適應性評價,其詳細的計算公式參閱參考文獻[2-3]。而且僅當NSE>0.5、RE<20%和R2>0.5同時得到滿足時,才認為構(gòu)建的嘉陵江流域HyMod模型是成功的。
表2為不同目標函數(shù)組合下模型參數(shù)的取值結(jié)果。由表2可以看出:同一參數(shù)在不同目標函數(shù)及其組合下,其取值差異不同,比如參數(shù)Cmax在F1、F1F3和F1F2F3目標函數(shù)下的取值基本一樣,為18.63左右;但在其他目標函數(shù)組合下的取值差異較大,F(xiàn)2F3和F3下取值分別為5.31和28.71。這就意味著在不同目標函數(shù)下,模型參數(shù)參與水文過程的方式不同,參數(shù)值Cmax越大,流域產(chǎn)流方式更多是以蓄滿產(chǎn)流為主,其參數(shù)值Cmax越小,則越易發(fā)生超滲產(chǎn)流。同時,參數(shù)bexp值越大,意味著流域內(nèi)土壤含水量的空間變化性較大,即流量過程變化較快。總之,目標函數(shù)選擇的不確定性直接決定著流域的產(chǎn)匯流方式,進而也會影響到流域徑流模擬的精度。
表2 不同目標函數(shù)下HyMod模型參數(shù)取值結(jié)果Tab.2 Results of HyMod model parameter values under different objective functions
表3為不同目標函數(shù)下HyMod模型率定期和驗證期模型性能評價結(jié)果。由表3可知:不同目標函數(shù)組合下,模型在率定期的徑流模擬精度均優(yōu)于驗證期的徑流模擬精度。單目標函數(shù)下,率定期和驗證期考慮了實測水文過程和模擬過程吻合程度(F1)的目標函數(shù)獲得的模型模擬精度最優(yōu),率定期和驗證期NSE、RE和R2分別為0.70,0.10,0.85和0.69,0.12,0.83;而僅考慮洪峰流量擬合過程(F3)的目標函數(shù)得到的率定期和驗證期NSE均在0.50左右,但模擬值與實測值的偏差卻高達0.25。這就意味著單目標函數(shù)選擇的不確定性將會給流域水資源的評估帶來很大影響,應予以重視。
表3 不同目標函數(shù)下HyMod模型率定期和驗證期模型性能評價結(jié)果Tab.3 Performance evaluation results of HyMod model rate under different objective functions
由多目標優(yōu)化結(jié)果可以看出:不同目標函數(shù)組合下,若同時考慮實測水文過程與模擬水文過程的吻合程度(F1),則率定期和驗證期徑流模擬的精度均較優(yōu),比如,率定期F1F2、F1F3目標函數(shù)下得到的NSE值均為0.71,驗證期得到的NSE值則均為0.69。若未同時考慮F1目標函數(shù),則模型模擬的精度較差,比如F2F3。若同時考慮F1、F2和F3,率定期和驗證期得到的NSE值均會大于其他目標函數(shù)組合,且實測值與模擬值之間的偏差均小于其他目標函數(shù)組合。這就意味著采用多目標函數(shù)率定水文模型參數(shù)是十分重要的,也是必要的。
此外,多目標函數(shù)組合下(F1F2F3)得到的模型模擬精度均明顯優(yōu)于單目標模型的模擬精度,這一結(jié)果與周建中等[7]和杜彥臻等[12]研究得到的評價結(jié)果具有很好的一致性。
圖3為不同目標函數(shù)下HyMod模型率定期和驗證期的水文過程模擬結(jié)果。由圖3可以看出:不同目標函數(shù)下,實測水文過程線與模擬水文過程線擬合程度較好,但在不同時段存在著明顯差異。比如,單目標函數(shù)下:F2目標函數(shù)下得到的水文過程線在汛期對高流量的捕捉較差,洪峰流量明顯被高估;而F3目標函數(shù)下得到的水文過程線對小洪水峰值流量的捕捉較好,但對高流量的捕捉同樣較差。
圖3 率定期和驗證期HyMod模型在單目標和多目標下的水文模擬結(jié)果Fig.3 Results of calibration and verification period HyMod models under single and multiple objectives
由多目標函數(shù)下水文過程的擬合結(jié)果可以看出:F1F2F3目標函數(shù)下得到的水文模擬過程和實測水文過程基本一致,且對小洪水和大洪水的捕捉均較好;但在F2F3目標函數(shù)下得到模擬流量在非汛期(枯水期)明顯被低估,這就意味著在不同目標函數(shù)下,水文模擬流量在不同時期對水文過程的捕捉能力存在較大差異,比如相較于單目標,無論是汛期還是非汛期,模擬流量過程線均與實測流量過程線的起伏變化一致;而單目標下的F3目標函數(shù)忽略了水量平衡因素,導致汛期(6~10月)洪量較??;F2目標函數(shù)忽略了洪峰流量擬合,導致汛期對洪峰的抓捕不準確。此外,對比多目標擬合結(jié)果可以看出:引入目標函數(shù)F1的情況下,汛期F1F2F3的性能劣于F2F3,表明引入過多的優(yōu)化目標反而會降低優(yōu)化結(jié)果的性能。因此,在采用多目標優(yōu)化率定模型時,目標函數(shù)的合理選擇也是十分重要的。
由前文可知:在不同目標函數(shù)下,水文模型側(cè)重于捕捉水文過程的不同水文特征,這將會導致模型的模擬精度存在明顯差異(由模型適應性評價結(jié)果可知),但不易清晰看出目標函數(shù)組合的不確定性對不同量級流量的影響,因此,本節(jié)基于不同目標函數(shù)下的水文模擬結(jié)果,繪制出了其累積流量歷時曲線,如圖4所示。
圖4 不同目標函數(shù)下水文模擬累積流量歷時曲線Fig.4 Hydrological simulation cumulative flow duration curve under different objective functions
由圖4可以看出:單目標時,10%~50%頻率流量下,F(xiàn)1目標函數(shù)得到的模擬流量明顯被低估,而F3目標函數(shù)下得到的模擬流量則存在著微弱的高估現(xiàn)象。同時,F(xiàn)3目標函數(shù)下顯著低估了特大洪水量級,這從側(cè)面驗證了水文模擬過程對高流量的捕捉較差的結(jié)論。
由多目標的模擬結(jié)果可以看出:在F2F3目標函數(shù)下,水文模型得到的模擬流量在不同頻率流量下表現(xiàn)形式差異較大,即高估高水流量、低估低水流量,這也是其水文模擬精度較差的主要原因。在其他目標函數(shù)下,水文模擬值與實測值誤差較小。
基于不同目標函數(shù)下率定期和驗證期的徑流模擬結(jié)果,對比評估了目標函數(shù)組合的不確定性對月尺度水資源評估的影響,以期為流域水資源管理規(guī)劃提供科學的參考。
圖5為不同目標函數(shù)對月尺度模擬流量值的影響。由圖5可以看出:
圖5 不同目標函數(shù)對月尺度模擬流量值的影響Fig.5 Effects of different objective functions on simulated flow values on a monthly scale
(1) 不同目標函數(shù)下,月尺度模擬流量值與實測值之間差異的表現(xiàn)形式不同,但總體表現(xiàn)為,考慮多目標函數(shù)的模型模擬流量值與實測值之間的差異較小,而僅考慮單目標函數(shù)得到的流量值與實測值差異較大,尤其是在F3目標函數(shù)下,非汛期(10~12月份)明顯低估了流域水資源量。
(2) 在非汛期(1~4月),不同目標函數(shù)下得到的模擬流量誤差范圍明顯要大于實測值的取值區(qū)間(由箱體寬度可知),這可能歸因于嘉陵江流域?qū)儆诘湫偷膩啛釒夂騾^(qū),受降水的時程分配不均影響(主要集中于5~10月份)而導致的;在非汛期徑流量條件下,模型同時采用蓄滿產(chǎn)流機制產(chǎn)流,對枯水流量的捕捉較差。
(3) 5~6月份,F(xiàn)2F3目標函數(shù)下得到的模擬流量明顯被高估,尤其是6月份,其模擬值與實測值(中位數(shù))差值高達2 350.00 m3/s;同時,8~12月份,模擬值顯著被低估,尤其是10月份,其模擬值與實測值差值高達1 285.47 m3/s。
(4) 總的來說,采用不同的目標函數(shù),可能在模型模擬性能評價結(jié)果上的差異較小,比如F1F2和F1F3,其率定期和驗證期的NSE值相同,但不同時期在水資源評估方面卻存在著較大差異。
綜上所述,開展不同目標函數(shù)下不同量級和不同特征時期的流域徑流預報分析,可有效提高流域管理機構(gòu)的管理水平。
本文以典型的濕潤區(qū)嘉陵江流域為研究對象,通過設定不同的目標函數(shù)方案集,分別采用遺傳算法(GA)來優(yōu)化單目標模型參數(shù)和采用NSGA-Ⅱ算法來優(yōu)化多目標下的HyMod水文模型的參數(shù)。其次,對比分析了目標函數(shù)不確定性對模型模擬精度的性能評價結(jié)果,并探究了目標函數(shù)不確定性對不同量級的流量和月尺度水資源評估的影響。主要得到以下結(jié)論。
(1) 相較于單目標,同時考慮洪量和洪峰目標函數(shù),可以有效提高水文預報精度;而僅考慮單目標時,則模擬值和實測值之間的誤差較大。
(2) 不同目標函數(shù)在不同頻率流量下的表現(xiàn)形式不同,當頻率流量為10%~50%時,在F1目標函數(shù)下得到的模擬流量明顯被低估,而在F3目標函數(shù)下則存在模擬流量被高估的現(xiàn)象。
(3) 采用不同的目標函數(shù),可能在模型模擬性能評價結(jié)果上的差異較小,比如F1F2目標函數(shù)和F1F3目標函數(shù)率定期及驗證期的NSE值相同,但在不同時期的徑流預報方面,卻存在著較大的差異。