關(guān)鍵詞:徑流預(yù)測;孿生極限學(xué)習(xí)機(jī);合作搜索算法;面雨量因子
中圖法分類號:P338 文獻(xiàn)標(biāo)志碼:A DOI:10.15974/j. cnki. slsdkb.2025.05.002
文章編號:1006-0081(2025)05-0007-07
0 引言
徑流預(yù)測作為水文領(lǐng)域的關(guān)鍵課題,一直以來備受關(guān)注,通常采用基于物理過程驅(qū)動的模型研究水文循環(huán)物理過程以預(yù)測未來的徑流變化[1-2],但該類模型率定參數(shù)眾多,對數(shù)據(jù)量要求大,建模困難;基于數(shù)據(jù)驅(qū)動的機(jī)器學(xué)習(xí)模型以其更準(zhǔn)確可靠的性能優(yōu)勢逐漸取代基于物理機(jī)制的傳統(tǒng)模型[3-4]。在機(jī)器學(xué)習(xí)模型應(yīng)用的初期,由于各項(xiàng)技術(shù)的時代局限性,通常以歷史數(shù)據(jù)作為預(yù)測因子輸入,但近年來氣象因子對徑流的影響已經(jīng)越發(fā)顯著,隨著各項(xiàng)技術(shù)的發(fā)展,已逐漸考慮將降水、溫度、濕度等氣象因子作為輸入因子,為機(jī)器學(xué)習(xí)模型在徑流預(yù)測方面的應(yīng)用提供了新的可用信息[5-7]。例如,ARDALAN 等[8]以降雨、溫度、蒸散發(fā)等氣象因子作為模型輸入變量對比了GRU和LSTM模型在季節(jié)性河流和非季節(jié)性河流的徑流預(yù)測方面的準(zhǔn)確性,試驗(yàn)結(jié)果表明,基于深度學(xué)習(xí)模型的徑流預(yù)報(bào)僅需考慮氣象因子,且其預(yù)報(bào)過程與傳統(tǒng)水文模型相比不受流域物理特性的影響。
極限學(xué)習(xí)機(jī)(ExtremeLearningMachine,ELM)具有建模速度快、容易實(shí)現(xiàn)等優(yōu)點(diǎn)[9],但因參數(shù)隨機(jī)性強(qiáng),導(dǎo)致模型預(yù)測能力不穩(wěn)定、魯棒性較差。近年來,有學(xué)者提出了孿生極限學(xué)習(xí)機(jī)(TwinExtremeLearningMachine,TELM)[1o],通過優(yōu)化兩個分類平面來提高模型性能,已廣泛應(yīng)用于故障檢測等分類問題[11-12],但在徑流預(yù)測領(lǐng)域應(yīng)用較少。通過群體智能優(yōu)化算法選取合適的輸入?yún)?shù),可以有效提升預(yù)報(bào)結(jié)果準(zhǔn)確性和模型運(yùn)算效率,但率定模型參數(shù)時優(yōu)化方法存在的局部最優(yōu)和收斂速度緩慢等問題都將影響預(yù)測結(jié)果的準(zhǔn)確性[13]。為避免此類問題,F(xiàn)eng 等[14]提出了一種全新的智能優(yōu)化方法—合作搜索算法(CooperationSearchAlgorithm,CSA)。CSA具有結(jié)構(gòu)簡單、調(diào)節(jié)參數(shù)少等特點(diǎn),通過集成至神經(jīng)網(wǎng)絡(luò)、極限學(xué)習(xí)機(jī)等人工智能模型參數(shù),顯著提升了模型精度和效率[15-19]。然而,在處理復(fù)雜問題時,CSA在全局搜索方面存在不足。針對此問題,本文提出兼顧全局搜索能力和局部勘探能力的改進(jìn)合作搜索算法(ImprovedCooperation"SearchAlgorithm,ICSA),而后將其集成至孿生極限學(xué)習(xí)機(jī)TELM參數(shù)優(yōu)化領(lǐng)域,實(shí)現(xiàn)高精度徑流預(yù)測。
1 研究方法
1.1 改進(jìn)合作搜索算法
合作搜索算法(Cooperation Search Algorithm,CSA)[14]是近年來新提出的智能啟發(fā)算法,該算法把每個員工看作一個解決方案,從而將現(xiàn)代企業(yè)團(tuán)隊(duì)的合作發(fā)展行為表示為一個數(shù)學(xué)模型。其具有結(jié)構(gòu)簡單、調(diào)節(jié)參數(shù)少等特點(diǎn),但在處理問題時在全局搜索方面存在不足。針對此問題,本文提出改進(jìn)合作搜索算法(Improving Cooperation Search Algorithm,ICSA),旨在提高全局搜索能力的同時保證局部勘探能力,為構(gòu)建高精度的水文預(yù)報(bào)模型提供重要策略支撐。具體改進(jìn)公式如下:
M=1+max(floor(3?α?I?(1-t/(0.7?T)))
式中: xi,jk 是第 k 個迭代過程中第 χi 個成員的第 j 個位置; I 是當(dāng)前目標(biāo)函數(shù)解空間的維數(shù); K 為最大迭代次數(shù); J 為員工所取變量的最大個數(shù); φ(X,Y) 是生成在(2 [X,Y] 內(nèi)均勻分布的隨機(jī)數(shù)的函數(shù); ui,jk+1 為第 k+1 次迭代第 i 個員工群組更新后第 j 個變量取值; pBesti,jk 表示第 k 次迭代第 i 個員工歷史最優(yōu)決策的第 j 個變量取值; gBestind,jk 表示第 k 次迭代第ind個團(tuán)隊(duì)歷史最優(yōu)決策的第 j 個變量取值; M 表示團(tuán)隊(duì)歷史最優(yōu)決策的個數(shù); Ai,jk,Bi,jk Ci,jk 分別表示從領(lǐng)導(dǎo)者、決策者和監(jiān)督者得到的信息增益; α,β 表示調(diào)整參數(shù); ΨtΨt 和 T 分別為當(dāng)前迭代次數(shù)和全局迭代次數(shù);floor是向下取整函數(shù)。
改進(jìn)合作搜索算法具體包括以下算子:
(1)改進(jìn)的團(tuán)隊(duì)溝通算子:式(3)作為算法主要收斂公式,引入進(jìn)行聯(lián)合搜索,提高收斂速度;式(4)中的 M ,選取個數(shù)為動態(tài)選擇,在前期提高全局尋優(yōu)能力,避免早熟收斂。后期選取全局最優(yōu),提高局部搜索能力;式(5)不再采用種群個體進(jìn)行更新,而是采用種群均值,為種群尋優(yōu)提供整體優(yōu)化方向,提高收斂精度及收斂速度。
(2)改進(jìn)的反思學(xué)習(xí)算子:在反思學(xué)習(xí)階段,式(7)作為均衡全局和局部搜索的控制算子;式(8)在反思搜索的同時引人動態(tài)擾動,盡可能防止陷人局部最優(yōu),在前期提高搜索的多樣性,后期保持穩(wěn)定反思搜索;式(9)對種群個體和歷史最優(yōu)個體增加了動態(tài)擾動,提高局部搜索能力。
式中: vi,jk+1 為第 K+1 次迭代第 i 個員工反思決策后第 j 個變量取值;randn是正態(tài)分布隨機(jī)函數(shù); rand 是[0,1]隨機(jī)取值函數(shù); 分別表示第 j 個變量的最大值和最小值。
(3)內(nèi)部競爭算子:
式中: F(x) 用于評估員工的工作表現(xiàn),即待優(yōu)化問題的適應(yīng)度取值。
1.2 孿生極限學(xué)習(xí)機(jī)
孿生極限學(xué)習(xí)機(jī)(TwinExtremeLearningMachine,TELM)是極限學(xué)習(xí)機(jī)的一種改進(jìn)方法,其基本原理是生成一對非平行超平面并對其進(jìn)行求解,得到一對上下邊界函數(shù)[10]。TELM算法的核心是解決以下兩個二次規(guī)劃問題:
TELM 1 :
約束條件為 (204
TELM 2 :
約束條件為 式中: Y 為輸出項(xiàng);隱藏層的數(shù)量為 L , H= 號
為隱藏層的輸出,
為輸人項(xiàng)的非線性映射;
wi 為權(quán)重, bi 為偏差, G 為激活函數(shù); ξ,η 均為誤差向量; C1,C2 為大于零的權(quán)衡參數(shù); e 為單位向量; ε1,ε2 為尋優(yōu)參數(shù);
和
為待求的權(quán)重項(xiàng)。
以式(11)為例,引入拉格朗日乘子 (α,γ ,原始問題的拉格朗日函數(shù)定義如下:
根據(jù)最優(yōu)化理論和KKT條件求得:
C1e-α-γ=0
式中: x 為輸人項(xiàng)。
引入正則化項(xiàng) ,避免
中可能出現(xiàn)的不良條件反射,則:
f=Y-eε1
式中:δ為一個取值較小的正標(biāo)量, I 為單位矩陣。則對偶形式如下所示:
步驟5:計(jì)算個體適應(yīng)度值并更新全局最優(yōu)解。
步驟6:團(tuán)隊(duì)溝通階段。引入pBest進(jìn)行聯(lián)合搜索,動態(tài)選取個數(shù)M,采用種群均值,為種群尋優(yōu)提供整體優(yōu)化方向,提高收斂精度及收斂速度。
步驟7:計(jì)算反思學(xué)習(xí)階段的最優(yōu)解,得到團(tuán)隊(duì)內(nèi)部競爭階段的個體最優(yōu)解。引入搜索均衡算子以及動態(tài)擾動,提高前期搜索的多樣性,以及局部搜索能力。
步驟8:重復(fù)步驟5\~7直至滿足最大迭代次數(shù)。
步驟9:輸出全局最優(yōu)解,即模型最優(yōu)參數(shù)組合。從而建立TELM-ICSA模型對測試集進(jìn)行預(yù)測,得到最終徑流值點(diǎn)預(yù)測結(jié)果。
2 評價(jià)指標(biāo)
預(yù)測評價(jià)指標(biāo)體系包括:均方根誤差(RootMeanSquareError,RMSE)平均絕對百分比誤差(MeanAb-solutePercentageError,MAPE)、相關(guān)系數(shù)(CorrelationCoefficient,R)納什-效率系數(shù)(Nash-sutcliffeEffi-ciency,NSE)。RMSE和MAPE值越接近 0,R 和 NSE 值越接近1,代表模型的預(yù)測性能越好。
通過這兩個公式,可以得到TELM模型最終預(yù)測結(jié)果如下:
1.3 建模流程
步驟1:利用偏自相關(guān)分析法確定時間序列的滯時作為輸入因子;而后確定訓(xùn)練集和測試集樣本,并進(jìn)行歸一化處理,以減小數(shù)據(jù)量差異影響。
步驟2:利用訓(xùn)練樣本的擬合值與實(shí)測值建立納什效率系數(shù)函數(shù),將其作為ICSA算法優(yōu)化TELM模型參數(shù)的適應(yīng)度函數(shù)。
步驟3:初始化算法參數(shù),設(shè)置最大迭代次數(shù)、種群個數(shù)、尋優(yōu)參數(shù)范圍。
步驟4:團(tuán)隊(duì)建設(shè)階段,隨機(jī)生成團(tuán)隊(duì)成員。
式中: n 為樣本總數(shù); 分別表示第 χi 個實(shí)測值和預(yù)測值; yavg ,
分別表示實(shí)測和預(yù)測序列的平均值。
3 實(shí)例分析
3.1 數(shù)據(jù)預(yù)處理
池潭水庫位于福建省閩江水系的二級支流金溪的中上游,流域形狀近扇形,其壩址以上控制流域面積4766km2 ,地屬高山丘陵區(qū),亞熱帶氣候[20]。本文以池潭水庫2000年4月2日至2020年8月27日的徑流序列,以及日尺度面雨量時間序列作為數(shù)據(jù)資料,預(yù)見期為1d,具體數(shù)據(jù)信息如圖1和表1所示。以8:2的比例劃分訓(xùn)練集、測試集。理論上,流域出口斷面流量主要由流域滯時之前的降雨形成,反映了地形、地貌、降水強(qiáng)度等因素對降雨-徑流過程的影響。考慮降雨等信息有助于更好理解徑流形成演變機(jī)制,揭示不同區(qū)域之間徑流過程的聯(lián)系和差異,使得模型更加接近實(shí)際情況,為徑流預(yù)測提供科學(xué)依據(jù)。為確定滯時,本文采用偏自相關(guān)分析法識別徑流序列蘊(yùn)藏的依賴關(guān)系,計(jì)算時間序列觀測值與其過去某一滯后項(xiàng)之間的相關(guān)性。經(jīng)計(jì)算,徑流序列的最佳滯后輸入項(xiàng)為8個時段,以日徑流和面雨量時間序列作為輸入項(xiàng),預(yù)測下一時段的日徑流值。
表1池潭水庫面雨量和徑流量時間序列數(shù)據(jù)
3.2 結(jié)果分析
氣象因子等物理因素可以有效提高水文預(yù)報(bào)精度。為此,本文以面雨量時間序列為氣象因子,分別考慮前期面雨量與降雨預(yù)報(bào)信息。研究該因子在徑流預(yù)測精度上的貢獻(xiàn)度。為減小工作量,ICSA種群個數(shù)為10,最大迭代次數(shù)為25。同時,構(gòu)建多個對比模型,包括:耦合孿生極限學(xué)習(xí)機(jī)和合作搜索算法模型(TELM-CSA)、孿生極限學(xué)習(xí)機(jī)(TELM)、極限學(xué)習(xí)機(jī)(ELM)長短期記憶神經(jīng)網(wǎng)絡(luò)(LongShortTermMemo-ry,LSTM)最小二乘支持向量機(jī)(Least SquaresSup-portVectorRegression,LSSVR)。
3.2.1 算例1:考慮前期面雨量
由表2\~3中池潭水庫測試集各模型預(yù)測評價(jià)指標(biāo)結(jié)果及改善率可知,考慮前期面雨量可顯著提高模型的預(yù)測精度,各項(xiàng)指標(biāo)結(jié)果均有不同程度的改善,其中,平均改善率最大的為NSE,4項(xiàng)指標(biāo)的平均改善率為 23.71% 。與耦合原始CSA優(yōu)化方法的CSA-TELM模型相比,經(jīng)過改進(jìn)后的TELM-ICSA模型可以得到更好的預(yù)測結(jié)果。不考慮前期面雨量時,與TELM-CSA 模型相比,TELM-ICSA對 RMSE,MAPE ,R,NSE 評價(jià)指標(biāo)的改善率分別為 0.29% , 23.04% ,0.40% ? 0.38% ;考慮前期面雨量時,與TELM-CSA模型相比,TELM-ICSA對 RMSE,MAPE,R,NSE 評價(jià)指標(biāo)的改善率分別為5. 25% ,15. 78% , 1.12% ,2.53% 。與不考慮前期面雨量的情況相比,考慮前期面雨量的情況下,TELM-ICSA模型對 RMSE,MAPE ,R,NSE 四項(xiàng)評價(jià)指標(biāo)的平均改善率為 27.60% ??煽闯觯嬗炅恳蜃訉δP托Ч母倪M(jìn)程度具有一定的影響,可以提高方法預(yù)測精度。圖2\~4為各模型的預(yù)測過程以及散點(diǎn)圖??梢?,無論是否考慮前期面雨量,所提方法預(yù)測能力均好于對比模型,擬合度更高,預(yù)測誤差較小。不考慮前期面雨量時,各模型所得的預(yù)測結(jié)果誤差較大,散點(diǎn)圖過于分散,擬合程度較差。
3.2.2算例2:考慮降雨預(yù)報(bào)信息
考慮當(dāng)天降雨預(yù)報(bào)信息,對徑流序列進(jìn)行預(yù)測,得到預(yù)測結(jié)果如表4~5所示??梢姡?dāng)天降雨預(yù)報(bào)信息作為輸人項(xiàng)時,可顯著增加徑流預(yù)測結(jié)果。TELM-ICSA模型各項(xiàng)評價(jià)指標(biāo)的改善率分別為 14.33% ,10.34% . 3.11% . 6.09% 。其中,各模型的MAPE改善程度最大,平均 19.05% 。與不考慮當(dāng)天預(yù)報(bào)信息的情況相比,考慮當(dāng)天降雨預(yù)報(bào)信息的情況下,4項(xiàng)評價(jià)指標(biāo)的平均改善率為 8.47% 。分析各模型不同年份21個峰值預(yù)測流量并繪制柱狀圖如圖5所示??梢?,相較于其他對比模型,TELM-ICSA模型峰值預(yù)測能力更強(qiáng),所得峰值預(yù)測結(jié)果更接近實(shí)測峰值流量。
表5考慮降雨預(yù)報(bào)信息時各模型評價(jià)指標(biāo)改善率
注:不考慮當(dāng)天預(yù)報(bào)信息的情況和考慮前期降雨的情況是一樣的,因?yàn)槎叩慕涤贻斎腠?xiàng)相同。
注:表中數(shù)據(jù)為A對B的改善率。
綜上所述,本文對CSA進(jìn)行的改進(jìn)(如 M 的個數(shù)為動態(tài)選擇、采用種群均值更新監(jiān)督者得到的信息增益、在反思學(xué)習(xí)階段引入動態(tài)擾動等改進(jìn))可以提高模型的全局尋優(yōu)能力,盡可能防止陷入局部最優(yōu),避免早熟收斂,提高搜索的多樣性、模型的收斂精度及收斂速度、搜索能力,得到全局最優(yōu)解,從而提高模型的預(yù)測能力,使得TELM-ICSA具有更好的魯棒性和可靠性。
4結(jié)語
本文提出了耦合孿生極限學(xué)習(xí)機(jī)和改進(jìn)合作搜索算法的徑流預(yù)測模型,將孿生極限學(xué)習(xí)機(jī)應(yīng)用于水文預(yù)報(bào)領(lǐng)域,同時通過向合作搜索算法中增加動態(tài)擾動和搜索均衡算子等改進(jìn)方法提高優(yōu)化算法的全局尋優(yōu)能力,避免陷入局部最優(yōu)。池潭水庫的應(yīng)用結(jié)果表明,所提模型TELM-ICSA可得到更好的徑流預(yù)測結(jié)果,面雨量因子的引入可增強(qiáng)模型的物理機(jī)制,顯著提高水文預(yù)報(bào)精度。
參考文獻(xiàn):
[1]閆寶偉,唐儀偉,劉昱,等.基于等容瞬時單位線的水文模 型研究[J].人民長江,2024,55(6):92-97.
[2] 崔震,郭生練,王俊,等.基于GR4J-LSTM混合模型的洪 水預(yù)報(bào)研究[J].人民長江,2022,53(7):1-7.
[3] 胡樂怡,付曉雷,蔣曉蕾,等.基于LSTM、RF、SVR三種機(jī) 器學(xué)習(xí)方法的徑流預(yù)測研究[J].水文,2024,44(5):17 -24.
[4]張玥,姜中清,周伊,等.基于GRU-CNN 雙網(wǎng)絡(luò)輸出構(gòu) 建BP模型的徑流預(yù)測方法[J].水力發(fā)電,2024,50(6): 17 -22.
[5]周慶梓,何自立,吳磊,等.多源數(shù)據(jù)融合的深度學(xué)習(xí)徑流 預(yù)測模型[J].水力發(fā)電學(xué)報(bào),2023,42(5):43-52.
[6]李步,田富強(qiáng),李鈺坤,等.融合氣象要素時空特征的深度 學(xué)習(xí)水文模型[J].水科學(xué)進(jìn)展,2022,33(6):904-913.
[7]陳娟,徐琦,曹端祥,等.基于多因子多模式集成的中長期 徑流預(yù)測模型[J].水科學(xué)進(jìn)展,2024,35(3):408-419.
[8]ARDALAN I,NASTARAN Z,MOHAMMAD R N,et al. Exploring the potential of deep learning for streamflow forecasting:Acomparative study with hydrological models for seasonal and perennial rivers[J]. Expert Systems with Applications,2024,252:124139.
[9]洪敏,艾萍,岳兆新.基于FPA-ELM模型的中長期徑流 預(yù)測——以雅襲江流域?yàn)槔齕J].人民長江,2022,53 (6) :119 -125.
[10]WAN Y H,SONG S J,GAO H,et al. Twin extreme learning machines for pattern classfication[J].Neurocomputing, 2017,260:235 - 244.
[11]YUAN X,F(xiàn)AN Y,ZHOU C,et al. Research on twin extreme learning fault diagnosis method based on multi- scale weighted permutation entropy[J]. Entropy,2O22,24:1181.
[12]YANG Y,XUE Z X,MA J,et al. Robust projection twin extreme learning machines with capped L1- norm distance metric[J]. Neurocomputing,2023,517:229 - 242.
[13]毛建剛,王慶杰.群智能算法在月徑流預(yù)測支持向量機(jī) 建模中的適應(yīng)性研究[J].水電能源科學(xué),2024,42(5): 34-38.
[14]FENG Z K,NIU W J,LIU S. Cooperation search algorithm: A novel metaheuristic evolutionary intelligencealgorithm for numerical optimization and engineering optimization problems[J]. Applied Soft Computing,2021,98:106734.
[15]FENG Z K,NIU W J. Hybrid artificial neural network and cooperation search algorithm for nonlinear river flow time series forecasting in humid and semi - humid regions[J]. Knowledge-Based Systems,2021,2111:106580.
[16]FENG Z K,NIU WJ,TANG Z Y,et al.Evolutionary artificial intelligence model via cooperation search algorithm and extreme learning machine for multiple scales nonstationary hydrological time series prediction[J]. Journal of Hydrology,2021,595:126062.
[17]FENG ZK,SHI PF,YANG T,et al.Parallel cooperation search algorithm and artificial inteligence method for streamflow time series forecasting[J]. Journal of Hydrology, 2022,606:127434.
[18]馮仲愷,付新月,紀(jì)國良,等.基于混合孿生支持向量機(jī)的 徑流區(qū)間預(yù)測[J].人民長江,2024,55(4):95-102,117.
[19]王鏡淋,王敬,沈來銀,等.基于人工神經(jīng)網(wǎng)絡(luò)的長期徑流預(yù)報(bào)模型研究[J].水利水電快報(bào),2023,44(9):6-10,28.
Runoff prediction model based on coupling of Twin Extreme Learning Machine and improved Cooperation Search Algorithm
YANG Shengyi1 ,LIN Fei1,LIU Zhijia1,ZHANG Taiheng2 (1.CentralControlCenterChianHydroeletricowerPntofujaHuadianFuruEnegyDeveopmentCod.anmng, China;2.HydroelectricesearchCenter,uadianElectricowerResearchIstituteCo.Ltd.HanghouOina)
Abstract:Toenhancetheaccuracyofrunoffprediction,wedevelopedapredictionmodelincorporating thearealrainal factor based on Twin Extreme Learning Machine (TELM).The improved Cooperation Search Algorithm (ICSA) was optimizedthrough dynamic disturbance enhancementand searchequilibriumoperator implementation to strengthenits global optimization capability.Subsequently,acoupled runoff prediction model integrating Twin Extreme Learning Machine and improved Cooperation Search Algorithm(TELM-ICSA)was established.Using Tanchi Reservoir in Fujian Province as a case study,comparativevalidation was conducted between TELM-ICSAand alternative models including TELM, Extreme Learning Machine(ELM),Long Short- Term Memory neural network(LSTM),and Least Squares Support VectorMachine(LSSVR).The results showed that compared with models neglecting antecedent areal rainfall,the TELM -ICSA model achieved average improvement rates of 27.60% across RMSE,MAPE,R ,and NSE four evaluation metrics.When incorporating daily rainfall forecast information,the average improvement rate reached 8.47% for these four metrics.The inclusionof arealrainfallfactorsignificantlyenhancedmodelperformance.Overall,regardlessof whether areal rainfallfactors were considered,TELM-ICSA exhibited superior predictive capabilitycompared to benchmark models,characterized by higher fitting degree,smaller prediction errors,as wellas robust reliability.
Key Words: runoff prediction;Twin Extreme Learning Machine; Cooperation Search Algorithm;area rainfallfactor