摘要:降水受到多種氣象因素的影響,從而導致降水預測精度不高。針對這個問題,在考慮影響降水的多個氣象因素基礎上,通過 Attention機制賦予各種氣象因素不同的權(quán)重,結(jié)合雙向長短期記憶神經(jīng)網(wǎng)絡(BiLSTM),提出了改進的 Attention-BiLSTM混合模型去實現(xiàn)月尺度降水量的預測。以江西省南昌氣象站為例,將1989—2018年的逐月降水量與逐月氣象因素(氣溫、蒸發(fā)量、氣壓等)觀測資料作為模型輸入數(shù)據(jù),通過 Attention機制識別出各種氣象因素的權(quán)重,從而提高BiLSTM模型對降水量的預測性能。結(jié)果表明:Attention-BiLSTM混合模型可有效地提高降水量預測的精度;通過 Attention機制的修正,顯著地改善了原有的BiLSTM模型降水量預測值偏低的問題。
關(guān)鍵詞:月尺度降水;氣象因子;Attention機制;BiLSTM;預測性能
中圖分類號:TV213.9;P457.6文獻標識碼:A文章編號:1001-9235(2024)06-0073-09
Monthly Precipitation Prediction Based on Attention-BiLSTM Model
CHENG Yuxiang, XIAO Liying*, WANG Pinggen, LIU Xiangzhou, ZHANG Chenhui
(School of Hydraulic and Ecological Engineering, Nanchang Institute of Technology, Nanchang 330099, China)
Abstract: Precipitation is affected by various meteorological factors, leading to low prediction accuracy. To solve this problem, multiple meteorological factors affecting precipitation were considered, and the attention mechanism was used to assign different weights to various meteorological factors. Combined with the bidirectional long short-term memory neural network (BiLSTM), an improved attention-BiLSTM model was proposed to predict monthly precipitation. By taking the Nanchang Meteorological Station in Jiangxi Province as an example, the observation data of monthly precipitation and meteorological factors (temperature, evaporation, pressure, etc.) from 1989 to 2018 were used as input data for the model. The attention mechanism identified the weights of various meteorological factors to improve the prediction performance of the BiLSTM model for precipitation. The results show that the attention-BiLSTM model can effectively improve the accuracy of precipitation prediction. Through the correction of the attention mechanism, the low precipitation prediction values by the original BiLSTM model are significantly improved.
Keywords: monthly precipitation; meteorological factors; attention mechanism; BiLSTM; prediction performance
降水量預測是水文預報領域的一項必不可少的重要研究內(nèi)容。降水量發(fā)生異?,F(xiàn)象是誘發(fā)洪澇災害、旱災的直接因素之一。由于每個月的降水量能清晰地反映年內(nèi)降水的時間分布,因此,準確的降水預測對社會和經(jīng)濟部門至關(guān)重要。對降水進行準確的預測不僅在供水、洪水風險和干旱緩解方面發(fā)揮著重要作用,而且在指導農(nóng)業(yè)管理和水力發(fā)電廠的運行方面也發(fā)揮著重要作用。
降水預測通常是通過采用基于物理過程的模型而實現(xiàn)的。傳統(tǒng)的數(shù)值計算模型需要在短時間內(nèi)處理龐大的氣象數(shù)據(jù),而且求解物理方程的過程十分復雜。傳統(tǒng)的降水預測方法主要的不足之處如下。首先,精度和可靠性有限。由于降水的預測受到多種因素影響,如大氣環(huán)流、地形和下墊面因素等,降水預測精度和可靠性受到數(shù)據(jù)和模型的限制。其次,時效性欠佳。傳統(tǒng)預測方法需要收集和分析大量的觀測數(shù)據(jù)和模型參數(shù),同時需要一定的時間來進行預測,導致無法及時響應突發(fā)的氣象事件和水文災害[1]。由于降水量數(shù)據(jù)具有非平穩(wěn)、非線性的特征,若直接通過降水數(shù)據(jù)進行預測,往往達不到精確的預測效果。采用信號分解能夠使時間序列平穩(wěn)并且能夠提取時間序列的局部特征。例如,KIM 等[2]采用小波分解算法(Wavelet Decomposition,WD)對降水量數(shù)據(jù)進行分解,并與單一的預測模型做了對比。結(jié)果發(fā)現(xiàn),在相同的預測模型下,經(jīng)過小波分解后的時間序列預測模型準確度更高。
隨著人工智能理論和應用的迅速發(fā)展,LSTM (Long Short Term Memory,LSTM)模型已被廣泛應用于降水預測中[3]。LSTM 模型通過 Cell 門開關(guān)實現(xiàn)時間上的記憶功能,并防止梯度消失,可以學習長期依賴信息,讓信息長期保存。SHI 等[3]在早期提出了ConvLSTM模型。該模型通過將全鏈接的LSTM 模型擴展為輸入到輸出、狀態(tài)到狀態(tài)的卷積結(jié)構(gòu),能夠更好地學習數(shù)據(jù)的時空相關(guān)性。從此,它成功地將循環(huán)神經(jīng)網(wǎng)絡引入降水預測,為降水預測奠定了基礎。在深度學習理論出現(xiàn)之后,循環(huán)神經(jīng)網(wǎng)絡的表征學習能力得到了關(guān)注,并隨著數(shù)值計算設備的更新而得到發(fā)展。基于 LSTM算法的降水預測模型能更好的處理長時間序列數(shù)據(jù),通過不斷訓練可以抓住月尺度降水數(shù)據(jù)隨時間變化的規(guī)律,并顯著提高預測精度。例如,劉新等[4]利用 LSTM等5種預測模型對青藏高原的月尺度降水量預測結(jié)果進行對比。結(jié)果發(fā)現(xiàn),LSTM 模型的預測精度遠優(yōu)于其他幾個神經(jīng)網(wǎng)絡模型。1997年,隨著雙向長短期記憶神經(jīng)網(wǎng)絡(Bidirectional Long Short-Term Memory,BiLSTM)的提出,Alex Graves 等首次提出了使用BiLSTM網(wǎng)絡來改進語音識別任務。由于降水預測和語音識別都屬于序列預測問題,因此, Ivanov Sergey 等在2015年將BiLSTM網(wǎng)絡應用于降水預測,并取得一定的效果。凌銘等[5]對比了 LSTM 和 BiLSTM2個模型在鄱陽湖流域的日尺度降水預測的結(jié)果,發(fā)現(xiàn)BiLSTM模型的預測效果要明顯優(yōu)于 LSTM模型。綜上所述,在降水預測方面 LSTM模型的預測效果在各模型中尤為突出,而且,由 LSTM 變種而來的BiLSTM模型在降水預測方面的效果更佳。
降水的形成與不同氣象因素息息相關(guān)。如果將降水與其他氣象因素的原始時間序列直接用作模型輸入,則很難解釋每個輸入特征序列在預測中所起的作用。為了解決這一問題,有研究指出:根據(jù)輸入特征序列的重要性,為其分配最優(yōu)權(quán)重。近年來,Attention 機制與深度學習模型的結(jié)合已得到廣泛應用,并且反饋效果良好[6]。例如,吳香華等[7]將單一的 CNN(Convolutional Neural Network)與CNN-Attention-BP 混合模型的預測結(jié)果進行對比,發(fā)現(xiàn)引入 Attention機制后的組合模型相較于其他單一的模型具有更高的預測精度。王怡等[8]使用卷積神經(jīng)網(wǎng)絡提取氣溫數(shù)據(jù)的局部特征,挖掘氣溫數(shù)據(jù)在空間上的相關(guān)性,并融入 Attention 機制進行權(quán)重分析,最后運用BiLSTM進行降水預測。結(jié)果表明,組合模型的預測結(jié)果精度有了較大的提高。
因此,將 Attention 機制加入BiLSTM中,考慮各種氣象因子歷史時間序列的影響,可以捕捉與月降水量相關(guān)的最重要因子。通過對各氣象因子分配相應的權(quán)重,使得預測模型更加深度學習對降水預測影響較大的氣象因子序列,減少或忽略對降水預測影響較小的氣象因子序列的學習,從而提高預測準確率。
綜上所述,本文的創(chuàng)新之處在于在降水預測的常規(guī)數(shù)據(jù)驅(qū)動模型中,考慮各種氣象因子歷史時間序列對降水預測模型的影響,引入深度學習中的 Attention 機制,對氣溫、蒸發(fā)量、氣壓等各種氣象因子進行權(quán)重分析,捕捉到有意義的信息;然后,進一步構(gòu)建 Attention-BiLSTM混合模型,采用相關(guān)指標來評價該混合模型的預測性能,并與常規(guī)數(shù)據(jù)驅(qū)動模型的預測結(jié)果進行對比,以觀察月尺度降水量的預測精度是否得到有效提升。
1研究方法
1.1 BiLSTM神經(jīng)網(wǎng)絡
長短期神經(jīng)網(wǎng)絡 LSTM 是循環(huán)神經(jīng)網(wǎng)絡(Recurrent Neural Network,RNN)的一種改進[9]。 LSTM 在主體結(jié)構(gòu)上與 RNN 相似,但能解決 RNN 中梯度消失、爆炸等問題。LSTM 在隱藏層 h 中增加了3個門控結(jié)構(gòu)(Gating Mechanism),分別是遺忘門(Forget Gate)、輸入門(Input Gate)、輸出門(Output Gate),同時新增了一個隱藏狀態(tài)(Cell State)[10]。這樣有利于 LSTM 長時間存儲和訪問信息。首先,遺忘門用于確定是否應該從先前的狀態(tài)丟棄信息。相關(guān)的計算見式(1)—(4):
f (t )=σ(Wfht-1+UfXt + bf )
i (t )=σ(Wi ht-1+ Ui Xt + bi )
c (t )= tanh(Wcht-1+ Uc Xt +bc )
o (t )=σ(W h+ U X + b )
式中:Xt為 t 時刻的輸入;ht-1為 t-1時刻的隱藏層狀態(tài)值;Wf、Wi、Wo、Wc分別為遺忘門、輸入門、輸出門和特征提取過程中ht-1的權(quán)重系數(shù);Uf、Ui、Uo、Uc 分別為遺忘門、輸入門、輸出門和特征提取過程中Xt的權(quán)重系數(shù);bf、bi、bo、bc分別為遺忘門、輸入門、輸出門和特征提取過程中的偏置值;tanh 為雙曲正切函數(shù);σ為激活函數(shù) Sigmoid。
其次,是確定需要向單元狀態(tài)中添加多少新的信息。在這一步中,有2個部分:第一個部分,由輸入門層確定在當前時間步長中使用哪些信息來更新單元狀態(tài);第二個部分,由 tanh 層生成一個更新向量 C 。然后,將這兩部分組合起來創(chuàng)新更新的狀態(tài),見式(5)、(6):
tanh(x)=1(1) e(e)--2x(2x)(5)
σ(x)=(6)
遺忘門和輸入門計算的結(jié)果作用于ct-1,構(gòu)成 t 時刻的細胞狀態(tài)ct,見式(7):
ct =ct-1⊙f (t )+i (t )⊙c (t )( 7)
最后的一個門是輸出門,用于控制單元狀態(tài)ct的信息流入新的隱藏狀態(tài)。其中,t 時刻的隱藏層狀態(tài)ht由輸入門 o(t )和當前時刻的細胞狀態(tài)ct得出:
ht = o (t )⊙ tanh(ct)(8)式中:⊙為 Hadamard積。
雙向長短期記憶網(wǎng)絡(Bi-directional Long Short-Term Memory,BiLSTM)是長短期記憶神經(jīng)網(wǎng)絡的一個變種。BiLSTM神經(jīng)網(wǎng)絡結(jié)構(gòu)模型分為2個獨立的 LSTM,輸入序列分別以正序和逆序輸入至2個 LSTM神經(jīng)網(wǎng)絡進行特征提取,將2個輸出向量(即提取后的特征向量)進行拼接后形成的詞向量作為該詞的最終特征表達[11]。BiLSTM的模型設計理念是使 t 時刻所獲得特征數(shù)據(jù)同時擁有過去和將來之間的信息,這種神經(jīng)網(wǎng)絡結(jié)構(gòu)的參數(shù)特征提取效率和性能要優(yōu)于單個 LSTM 結(jié)構(gòu)模型[12]。另外,在BiLSTM模型中,2個 LSTM神經(jīng)網(wǎng)絡的參數(shù)相互獨立。BiLSTM神經(jīng)網(wǎng)絡的拓撲結(jié)構(gòu)見圖1。
1.2 Attention機制
各種氣象因子在降水預測中的重要性是不同的。在降水預測中,需要更多地關(guān)注更有意義的預測因子。Attention機制即注意力機制。這種機制可以通過掃描全局圖像,獲取需要重點關(guān)注的目標區(qū)域,而后對這一區(qū)域投入更多的注意力資源,獲取更多與目標有關(guān)的細節(jié)信息,同時忽視其他無關(guān)信息[13]。這種機制可以利用有限的注意力資源,從大量信息中快速篩選出高價值的信息。因此, Attention機制可以根據(jù)輸入特征序列的重要性程度賦予不同的權(quán)重,從而在時間序列預測中對輸入特征序列進行優(yōu)化。Attention 機制的計算分為三步:一是在所有輸入信息上計算注意力分布從而得到權(quán)重系數(shù);二是通過注意力打分函數(shù)的計算,來衡量一個輸入序列中每個元素與當前輸出元素之間的相似度得分,用于計算權(quán)重;三是根據(jù)注意力分布來計算輸入信息的加權(quán)平均。Attention機制的詳細計算步驟如下。
步驟一注意力分布αn 的計算,見式(9):α n = p (z = n|X,q )= soft max(s (xn,q ))=
exp(s (xn,q ))
exp(s (xj,q ))
式中:X 為輸入向量;q 為和任務相關(guān)的查詢向量; X、q 為已給定的參數(shù);在給定任務相關(guān)的查詢 q 時,α n 為第 n 個輸入向量受關(guān)注的程度;z 為選擇信息的索引位置,例如z = n 表示選擇了第 n 個輸入向量。
步驟二注意力打分函數(shù) s(x,q )的計算
s (x,q )=vT tanh(WX +Uq)(10)
式中:W 為輸入向量 X 的權(quán)重;U 為查詢向量 q 的權(quán)重;v 為用于得分計算的權(quán)重向量。
步驟三加權(quán)平均
att(X,q )=α n x n
式中:α n 為第 n 個輸入向量受關(guān)注的程度;xn為第 n 個輸入向量。
圖2是 Attention 機制加權(quán)平均的示例。圖中softmax的作用是將一組任意的實數(shù)值轉(zhuǎn)化為在[0,1]之間的概率值。
1.3 Attention-BiLSTM混合模型
本文引入深度學習中的 Attention 機制與BiLSTM神經(jīng)網(wǎng)絡融合,將 Attention 機制加入到BiLSTM的隱含層中,對氣溫、氣壓、風速等各氣象因子進行特征學習之后,再進行權(quán)重影響分析。最后,采用BiLSTM神經(jīng)網(wǎng)絡對降水進行預測,見圖3。
1.4評價指標
本文選取均方根誤差(Root Mean Square Error, RMSE)、平均絕對誤差(Mean Absolute Deviation, MAE)、皮爾遜相關(guān)系數(shù)(Pearson Correlation Coefficient,PCC)作為評價指標。其中,RMSE、MAE 反映預測的準確度,二者的值越小代表模型預測效果越好。PCC 則反映預測序列與觀測序列的相關(guān)性,PCC 的值越大代表模型預測準確度越高,其絕對值越接近1則表明預測序列與觀測序列越相關(guān)[14],見式(12)—(14)。
PCC =(13)
MAE =ht - h(~)t |(14)
式中:cov為2個變量的協(xié)方差;σ為變量的標準差;n 為樣本數(shù)量;ht、h t(~)分別為 t 時間的觀測降水量與預測降水量。
2實例分析
2.1數(shù)據(jù)來源與預處理
選取江西省南昌站1989年1月至2018年12月的月氣象(降水和其他氣象因子等)觀測數(shù)據(jù)作為研究對象。這些數(shù)據(jù)來源于國家氣象科學數(shù)據(jù)中心(http://data. cma. cn)的中國地面氣候資料數(shù)據(jù)集。由于不同氣象數(shù)據(jù)的單位不同,首先對數(shù)據(jù)進行歸一化處理,見式(15):
Xi = X(X) a(0)-- X(X)m(m)i(i)n(n)(15)
式中:Xi 為歸一化處理后的序列;X 0)為輸入的原始氣象序列,Xmin、Xmax為各個序列的最小值和最大值。經(jīng)過歸一化處理后的數(shù)據(jù)值都在[0,1]內(nèi)。然后,將歸一化處理后的氣象數(shù)據(jù)以8∶2比例劃分訓練集與測試集[15]。其中,對于降水數(shù)據(jù),1989年1月至2012年12月(共計288個月)為訓練集;2013年1月至2018年12月(共計72個月)為測試集。
在對流層內(nèi),與降水有關(guān)的氣象因素主要是氣溫、氣壓、風、濕度、云和蒸發(fā)等。對于暴雨,則主要與氣壓、氣溫、濕度、風等因素有關(guān)。本文是針對月尺度的降水量進行預測,而南昌屬于亞熱帶季風氣候,四季分明,春季氣溫較暖雨水較多,夏季炎熱濕潤時有暴雨,秋冬氣溫降低雨量較少,考慮到實際情況,本文經(jīng)過初期篩選后,選取氣溫、氣壓、風速、相對濕度、蒸發(fā)量這5個氣象因子作為影響南昌站月降水量的主要因素。另外,這些氣象因子的時間序列起止時間也是1989年1月—2018年12月(共計360個月)。
2.2模型步驟
步驟一將降水序列以及溫度、濕度、風速等氣象因子序列作為輸入數(shù)據(jù),對輸入數(shù)據(jù)進行預處理,并以8∶2比例劃分訓練集與測試集。
步驟二將訓練集的數(shù)據(jù)由輸入層傳入,經(jīng)過 Attention層的權(quán)重分析后由BiLSTM層輸出。
步驟三計算預測值和觀測值的均方根誤差(RMSE)、平均絕對誤差(MAE)、皮爾遜相關(guān)系數(shù)(PCC)。判斷 RMSE 和 MAE 是否為最小值、PCC 是否為最大值,若3個評價指標為最優(yōu)值,則由輸出層輸出結(jié)果;若不滿足最優(yōu)值條件,則調(diào)整輸入長度
進行循環(huán),直到得到滿足最值條件的輸入長度。步驟四經(jīng)過試湊法,調(diào)整 Attention-BiLSTM混合模型參數(shù)以確定最優(yōu)超參數(shù)。然后,根據(jù)由輸出層輸出的訓練結(jié)果對測試集的數(shù)據(jù)進行降水預測。
圖4為 Attention-BiLSTM混合模型的構(gòu)建流程。
2.3 Attention-BiLSTM混合模型權(quán)重分析
本文將歸一化后的數(shù)據(jù)經(jīng) Attention層進行權(quán)重分析,得出各因子對降水的平均權(quán)重見表1。其中,氣溫、氣壓、風速、相對濕度、蒸發(fā)量等5項為主要的氣象因子,這些氣象因子均影響降水的形成或降水量的大小。表1可知,在注意力機制的權(quán)重分配結(jié)果中,蒸發(fā)量的權(quán)重為最大(0.24),相對濕度權(quán)重次之(0.21),氣壓的權(quán)重為最?。?.17)。這說明,在南昌站,影響降水的主要因素為蒸發(fā)量、相對濕度與風速。
2.4 Attention-BiLSTM混合模型參數(shù)設置與優(yōu)化
在 Attention-BiLSTM混合模型的訓練過程中,本文采取自適應矩估計(Adaptive Moment Estimation,Adam)為優(yōu)化函數(shù),雙曲正切函數(shù)(Hyperbolic Tangent Function,tanh)為激活函數(shù),并采用隨機失活正則化(Dropout)方法。Adam算法能夠基于訓練數(shù)據(jù)迭代更新神經(jīng)網(wǎng)絡的權(quán)重,使損失函數(shù) RMSE 輸出值達到最優(yōu)[16]。tanh 收斂速度快,會使迭代次數(shù)大幅度降低,提高模型效率[17]。 Dropout方法會防止過擬合。此外,本文采用試湊法最終確定超參數(shù)。試湊法是指憑借經(jīng)驗確定參數(shù)的方法,即根據(jù)觀察結(jié)果調(diào)整 Attention-BiLSTM混合模型的參數(shù),最終得出最優(yōu)超參數(shù)[18]。Attention-BiLSTM混合模型超最優(yōu)超參數(shù)見表2。
2.5訓練階段結(jié)果分析
為了尋找 Attention-BiLSTM混合模型的最優(yōu)輸入長度,本文在訓練階段采用試湊法,根據(jù)不同輸入長度得出 Attention-BiLSTM混合模型預測值。同時,采用均方根誤差(RMSE)來評價 Attention- BiLSTM混合模型的預測效果。之后,計算了在不同輸入長度下 Attention-BiLSTM混合模型降水預測值與觀測值之間的均方根誤差 RMSE。由于訓練集的數(shù)據(jù)較大,圖5僅展示以南昌站1989年1月至1992年4月的氣象數(shù)據(jù)為原始數(shù)據(jù)(共計40個月)的Attention-BiLSTM混合模型預測均方根誤差的變化范圍及誤差變化過程。結(jié)果表明:①采用 Attention- BiLSTM混合模型預測,降水預測值與觀測值之間的均方根誤差 RMSE 隨著時間長度的增加而上下波動。在輸入長度為10個月后,波動幅度變小,變化絕對值低于0.3。②在輸入長度為9個月時, Attention-BiLSTM混合模型預測值與觀測值的RMSE 達到了最低值。因此,本文在 Attention- BiLSTM混合模型中,采取的模型最優(yōu)輸入序列長度為9個月。
為了對比 Attention-BiLSTM混合模型和BiLSTM的預測效果差異,本文采用均方根誤差(RMSE)、平均絕對誤差(MAE)評價預測的準確度;采用 Pearson 相關(guān)系數(shù)(PCC)評價預測序列與觀測
序列的相關(guān)性。表3給出了在不同輸入長度下,2種預測模型評價指標對比結(jié)果。其中,符號 B代表采用BiLSTM模型預測,符號 Aamp;B代表采用 Attention- BiLSTM混合模型預測。因訓練集數(shù)據(jù)較大,表3只列出了12個月的評價結(jié)果作示例。
結(jié)果表明:①在輸入長度為9個月時, Attention-BiLSTM混合模型的預測效果最優(yōu),RMSE 和 MAE 達到最小值,分別為2.16和1.73,此外, Attention-BiLSTM混合模型的降水預測序列與觀測序列之間相關(guān)系數(shù)最高,PCC 達到最大值0.82;②在不斷改變輸入長度的情況下,發(fā)現(xiàn)采用 Attention- BiLSTM混合模型預測的 RMSE、MAE 均比采用BiLSTM模型進行降水預測的 RMSE、MAE 低。此外,Attention-BiLSTM混合模型的 PCC 也比BiLSTM模型的 PCC 高。因此,在訓練階段,發(fā)現(xiàn) Attention-BiLSTM混合模型的預測效果比BiLSTM模型更好。
2.6測試階段結(jié)果分析
2.6.1不同模型預測結(jié)果對比
本文采用南昌站2013年1月至2018年12月(共72個月)逐月降水量與逐月氣象因素(氣溫、蒸發(fā)量、氣壓等)觀測資料作為模型測試集,在輸入長度為9個月的情況下,完成降水預測模型的測試。在圖6中,給出了BiLSTM模型和 Attention-BiSLTM混合模型測試集的逐月降水預測結(jié)果;同時,也列出該時期逐月降水量觀測值以便對照。
結(jié)果表明:在測試階段,BiLSTM模型的預測值與觀測值波動特征相似,但在有些極值點位置,預測效果并不是很理想;另一方面,Attention-BiLSTM混合模型的預測值與觀測值波動特征趨于一致,并且在極值點位置,預測效果相比于BiLSTM模型更好。總體上,Attention-BiLSTM混合模型的預測效果要遠優(yōu)于BiLSTM模型的預測效果。
為了解不同模型在測試階段的預測效果如何,本文將不同模型預測結(jié)果的評價指標進行對比(表4)。結(jié)果表明:①在測試階段,Attention-BiLSTM混合模型的 RMSE(2.21)和 MAE(1.82)均小于BiLSTM模型的 RMSE(2.67)和 MAE(2.01),這說明Attention-BiLSTM混合模型預測的準確度高于BiLSTM模型;②Attention-BiLSTM混合模型的 PCC (0.78)高于BiLSTM模型的 PCC(0.67)。這可得出Attention-BiLSTM混合模型預測序列與觀測序列的相關(guān)性高于BiLSTM模型。因此,從測試階段不同模型的評價指標上看,Attention-BiLSTM混合模型預測效果要優(yōu)于BiLSTM模型。
2.6.2降水峰值點預測結(jié)果對比
前文主要是針對測試階段整體預測效果的評價,但是,對于汛期或主汛期降水量的預測效果如何需要進一步分析,而這往往是降水模型預測較難的地方。為了深入對比不同模型的預測結(jié)果,本文選取測試階段中的21個降水峰值點作對比,計算不同模型預測值與觀測值的誤差(圖6、表5)。結(jié)果表明:①Attention-BiLSTM混合模型預測值與觀測值的最大誤差為115.36 mm,最小誤差為0.71 mm,平均誤差為22.25 mm,而BiLSTM模型預測值與觀測值的最大誤差為307.14 mm,最小誤差為1.44 mm,平均誤差為79.02 mm;②針對圖6中降水序列的峰值點展開進一步的預測對比分析,發(fā)現(xiàn) Attention- BiLSTM混合模型預測值與觀測值的誤差要小于BiLSTM模型的預測誤差。Attention-BiLSTM混合模型在峰值點處的預測誤差相比于BiLSTM模型平均降低了17.69%。因此,在峰值點處 Attention- BiLSTM混合模型要優(yōu)于BiLSTM模型。
進一步選取表5中序號為2、5、8、11、15的峰值點作為汛期代表點。這些代表點均發(fā)生于各年的6月,其月降水量也都超過汛期降水量平均值250.3 mm。計算這些代表點處降水預測值與觀測值的誤差,發(fā)現(xiàn):①在5個汛期代表點處,采用 Attention- BiLSTM混合模型,降水預測值與觀測值的誤差絕對值要遠小于BiLSTM模型的誤差絕對值;② Attention-BiLSTM混合模型在汛期代表點處的誤差相比于BiLSTM模型平均降低了32.12%。因此, Attention-BiLSTM混合模型在汛期代表點處的預測效果要遠優(yōu)于BiLSTM模型。
3結(jié)論
針對降水因受到多種氣象因素影響而導致降水極值預測不準確的問題,本文將 Attention 機制與BiLSTM神經(jīng)網(wǎng)絡融合,構(gòu)建出 Attention-BiLSTM混合模型,并以南昌站月降水量為例展開了預測分析。首先,采用 Attention 機制對各氣象因子進行了權(quán)重分配。其次,將月降水量與月氣象因素等觀測資料作為輸入數(shù)據(jù),通過試湊法確定 Attention-BiLSTM混合模型的最優(yōu)超參數(shù),然后完成對月降水量的預測。最后,對比了 Attention-BiLSTM混合模型與BiLSTM模型之間的預測效果,評價了這兩種模型在峰值點和汛期代表性點的預測效果差異。
結(jié)果表明:Attention 機制識別出主要影響南昌站降水的氣象因子為蒸發(fā)量、相對濕度與風速,并量化了各個氣象因子的權(quán)重值。在 Attention- BiLSTM混合模型的優(yōu)化方面,發(fā)現(xiàn)輸入長度為9個月是該模型的最優(yōu)時間步長。無論在測試階段與訓練階段,Attention-BiLSTM混合模型的降水預測結(jié)果與觀測結(jié)果基本一致;同時,Attention-BiLSTM混合模型的預測誤差均小于原始的BiLSTM模型。這說明,經(jīng)過 Attention 機制的調(diào)節(jié),原有的BiLSTM模型在月降水預測方面的穩(wěn)定性和準確性顯著提高。
通過降水峰值點的預測誤差分析,可知 Attention-BiLSTM混合模型可以較好地解決降水預測精度偏低的問題。但是,本研究也發(fā)現(xiàn),在某些降水量峰值點處,Attention-BiLSTM混合模型的預測精度還不夠高,預測值也出現(xiàn)了偏高的情況。因此,在下一步工作中還需要引入自適應噪聲的完全集合經(jīng)驗模態(tài)分解等方法[19],將數(shù)據(jù)預先進行分解去噪,以提高 Attention-BiLSTM混合模型預測的精度。此外,本文在模型的參數(shù)調(diào)優(yōu)訓練時所采用的試湊法,耗費了過多的時間和精力。未來可以引入先進的算法進行參數(shù)自動調(diào)優(yōu),進一步實現(xiàn)智能化,提高模型的工作效率。
參考文獻:
[1]劉鑫.傳統(tǒng)與現(xiàn)代水文方法相結(jié)合在水系規(guī)劃中的應用研究[J].城市道橋與防洪,2019(2):113-116,15.
[2] KIM S,KISI O,SEO Y,WANG H,et al. Assessment of rainfall aggregation and disaggregation using data-driven models and wavelet decomposition[J]. Hydrology Research,2017,48(1):99-116.
[3] SHI X J,ZHOU C R ,WANG H,et al.2015. Convolutional LSTM network: a machine learning approach for precipitationnowcasting[C]// Proceedings of the 28th International Conference on Neural Information Processing Systems,2015:802-810.
[4]劉新,趙寧,郭金運,等.基于 LSTM神經(jīng)網(wǎng)絡的青藏高原月降水量預測[J].地球信息科學學報,2020,22(8):1617-1629.
[5]凌銘,肖麗英,趙嘉,等.基于 SVM-CEEMDAN-BiLSTM模型的日降水量預測[J].人民珠江,2023,44(9):61-68.
[6] LI S Z,XIE G,REN J C,et al. Urban PM2.5 Concentration Prediction via Attention-Based CNN –LSTM[J]. Applied Sciences,2020,10(6). DOI:10.3390/app10061953.
[7]吳香華,華亞婕,官元紅,等.基于 CNN-Attention-BP 的降水發(fā)生預測研究[J].南京信息工程大學學報(自然科學版),2022,14(2):148-155.
[8]王怡,普運偉.基于 CNN-BiLSTM-Attention 融合神經(jīng)網(wǎng)絡的大氣溫度預測[J].中國水運(下半月),2023,23(1):25-27.
[9]韓瑩,管健,曹允重,等. LSTM-WBLS 模型在日降水量預測中的應用[J].南京信息工程大學學報(自然科學版),2023,15(2):180-186.
[10]沈皓俊,羅勇,趙宗慈,等.基于 LSTM 網(wǎng)絡的中國夏季降水預測研究[J].氣候變化研究進展,2020,16(3):263-275.
[11]翟月昊.基于BiLSTM和 GCN 的氣溫預測模型研究[D].南京:南京郵電大學,2022.
[12]萬齊斌,董方敏,孫水發(fā).基于BiLSTM-Attention-CNN 混合神經(jīng)網(wǎng)絡的文本分類方法[J].計算機應用與軟件,2020,37(9):94-98,201.
[13]劉媛媛.融合 CNN-LSTM 和注意力機制的空氣質(zhì)量指數(shù)預測[J].計算機時代,2022(1):58-60.
[14]程娟娟.高??蒲信c教學關(guān)系實證研究:基于皮爾遜相關(guān)系數(shù)的分析[J].中國高??萍迹?022(10):46-52.
[15]王宏樂,王興林,李文波,等.深度學習訓練數(shù)據(jù)分布對植物病害識別的影響研究[J].廣東農(nóng)業(yè)科學,2022,49(6):100-107.
[16]李梓毓,趙月愛.改進 Adam優(yōu)化算法的人臉檢測方法[J].太原師范學院學報(自然科學版),2022,21(4):58-63.
[17]王攀杰,郭紹忠,侯明,等.激活函數(shù)的對比測試與分析[J].信息工程大學學報,2021,22(5):551-557.
[18]WANG X L,YANG H,HAN D R,et al. Trial and error method for optimal tradable credit schemes:The network case[J]. Journal of Advanced Transportation,2014,48(6):685-700.
[19]劉選.基于 CEEMDAN-BiLSTM的月降水量預測模型[J].江西水利科技,2023,49(4):277-282.
(責任編輯:程茜)