亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于多周期趨勢(shì)分解和兩級(jí)融合策略的浪高預(yù)測(cè)方法

        2023-07-29 11:47:24鄭小羅李其超鄧小東
        海洋科學(xué)進(jìn)展 2023年3期
        關(guān)鍵詞:融合模型

        鄭小羅,李其超,姜 浩,宋 巍*,鄧小東

        (1. 上海海洋大學(xué) 信息學(xué)院,上海 201306;2. 國家海洋局 東海預(yù)報(bào)中心,上海 200081)

        浪高是全球大氣系統(tǒng)中的一個(gè)重要參數(shù),由于海洋環(huán)境極其復(fù)雜,預(yù)測(cè)浪高是一項(xiàng)非常具有挑戰(zhàn)性的任務(wù)[1]。一般地,浪高的預(yù)測(cè)方法大致可以分為3 類:數(shù)值波浪模型、經(jīng)典線性時(shí)間序列模型和機(jī)器學(xué)習(xí)模型。

        數(shù)值波浪模型基于能量平衡方程,例如第三代波浪模型WAM(Wave Model)、基于WAM 的近岸波浪模擬SWAN(Simulating Waves Nearshore)和WW3(WAVE WATCH Ⅲ)[2],其利用預(yù)報(bào)的風(fēng)場(chǎng)資料,將第三代生成波模式應(yīng)用于大尺度、長時(shí)間的浪高預(yù)測(cè)。然而,數(shù)值波浪模型是物理規(guī)律驅(qū)動(dòng)的數(shù)值逼近模型,具有輸入復(fù)雜度高、對(duì)風(fēng)場(chǎng)資料的要求高及計(jì)算過程耗時(shí)長等特點(diǎn),比較適用于大區(qū)域海浪的反演和預(yù)報(bào)。

        由數(shù)據(jù)驅(qū)動(dòng)的方法中,經(jīng)典線性時(shí)間序列模型包括自回歸模型(Autoregressive,AR)、自回歸移動(dòng)平均模型(Autoregressive Moving Average,ARMA)和差分整合移動(dòng)平均自回歸模型(Autoregressive Integrated Moving Average,ARIMA)等[3]。Soares 和Ferreira[4]將AR 用于浪高預(yù)測(cè);Ge 和Kerrigan[5]對(duì)比了AR 和ARMA 用于海浪預(yù)報(bào)的性能,在10 種不同的海浪數(shù)據(jù)測(cè)試下,ARMA 的誤差和效率均優(yōu)于AR。Agrawal 和Deo[6]采用ARMA 和ARIMA 在不同預(yù)測(cè)區(qū)間進(jìn)行在線浪高預(yù)測(cè),結(jié)果表明ARMA 和ARIMA 的性能非常相似。但是ARMA 模型對(duì)序列的平穩(wěn)性有要求,而ARIMA 能夠通過差分運(yùn)算將非平穩(wěn)數(shù)據(jù)轉(zhuǎn)換成平穩(wěn)數(shù)據(jù),解決平穩(wěn)性依賴問題,所以ARIMA 模型是應(yīng)用更為廣泛的經(jīng)典線性時(shí)間序列模型。

        近年來,以大數(shù)據(jù)為基礎(chǔ)的機(jī)器學(xué)習(xí)算法表現(xiàn)出強(qiáng)大的預(yù)測(cè)能力。Makarynskyy[7]和Cornegobueno 等[8]利用人工神經(jīng)網(wǎng)絡(luò)(Artificial Neural Networks,ANN)和極限學(xué)習(xí)機(jī)(Extreme Learning Machine,ELM)預(yù)測(cè)浪高,在準(zhǔn)確率和一致性方面都有較好的表現(xiàn)。由于支持向量機(jī)(Support Vector Machine,SVM)和支持向量回歸(Support Vector Regression,SVR)具有強(qiáng)大的泛化能力和完整的數(shù)學(xué)理論,在海浪預(yù)測(cè)方面也得到廣泛應(yīng)用[9-11]。Malekmohamadi 等[12]對(duì)SVM、ANN、貝葉斯網(wǎng)絡(luò)和自適應(yīng)神經(jīng)模糊推理系統(tǒng)(Adaptive neural fuzzy Inference System,ANFIS)的浪高預(yù)測(cè)效果進(jìn)行了深入研究,結(jié)果表明,ANN、ANFIS 和SVM 的預(yù)測(cè)結(jié)果都在可接受范圍,而貝葉斯網(wǎng)絡(luò)的預(yù)測(cè)結(jié)果相對(duì)不可靠。陸小敏等[13]通過集成棧式自編碼器和XGBoost(eXtreme Gradient Boosting)[14]算法,進(jìn)行有效波高預(yù)測(cè),但是并沒有考慮到數(shù)據(jù)分布的不平衡和數(shù)據(jù)集的規(guī)模大小。黃心裕等[15]基于Prophet 算法[16]對(duì)海南近海波高和周期進(jìn)行了分析和預(yù)測(cè)。Prophet 算法是基于時(shí)間序列分解(Seasonal、Trend 及Residual)和機(jī)器學(xué)習(xí)的擬合實(shí)現(xiàn)的,適用于具有強(qiáng)烈季節(jié)性影響的時(shí)間序列分析,對(duì)數(shù)據(jù)異常和趨勢(shì)變化具有穩(wěn)健性。深度學(xué)習(xí)作為機(jī)器學(xué)習(xí)的子領(lǐng)域,極大地促進(jìn)了計(jì)算機(jī)視覺和自然語言處理的發(fā)展。長短時(shí)記憶網(wǎng)絡(luò)(Long Short Term Memory,LSTM)是最流行的時(shí)間序列預(yù)測(cè)深度學(xué)習(xí)網(wǎng)絡(luò)之一,被廣泛地用于預(yù)測(cè)風(fēng)速、交通、太陽能和股票價(jià)格等[17]領(lǐng)域。莫旭濤和李自立[18]將卷積神經(jīng)網(wǎng)絡(luò)(Convolutional Neural Network,CNN)和LSTM 相結(jié)合,在中國南海北部灣的浪高預(yù)測(cè)取得較高的預(yù)測(cè)精度。顧興健等[19]基于LSTM 建立的海浪環(huán)境短期預(yù)報(bào)模型,在我國海域上的預(yù)測(cè)結(jié)果取得了較好的精度,但是隨著時(shí)間長度的推移,誤差會(huì)逐漸增大。此外,許多新的深度學(xué)習(xí)網(wǎng)絡(luò),例如DeepAR[20]也被廣泛應(yīng)用到時(shí)間序列預(yù)測(cè)相關(guān)領(lǐng)域,但是在浪高預(yù)測(cè)中應(yīng)用較少。

        上述方法嘗試從多個(gè)角度進(jìn)行浪高預(yù)測(cè),但未能充分考慮浪高序列的周期性、非平穩(wěn)性和非線性,一定程度地限制了浪高預(yù)測(cè)的精度。基于局部加權(quán)回歸(Locally Weighted Regression,Loess)的周期趨勢(shì)分解(Seasonal and Trend decomposition using Loess,STL)[21]能夠探索復(fù)雜的時(shí)序數(shù)據(jù)的規(guī)律,適用于時(shí)序預(yù)測(cè)任務(wù),且具有較強(qiáng)的魯棒性。為了實(shí)現(xiàn)對(duì)多站點(diǎn)未來12 h 的浪高預(yù)測(cè),本文針對(duì)多源浪高時(shí)序數(shù)據(jù)的多周期性、非平穩(wěn)性和非線性等特點(diǎn),提出了一種基于多周期STL 分解和兩級(jí)融合策略的浪高預(yù)測(cè)方法MSTL-WH。首先通過周期圖法估計(jì)多源浪高數(shù)據(jù)集中的主要周期,然后利用STL 將復(fù)雜的浪高序列分解為簡單的趨勢(shì)項(xiàng)、周期項(xiàng)和余項(xiàng),最后使用LSTM 結(jié)合兩級(jí)融合策略以融合長中短時(shí)序下的浪高特征并進(jìn)行浪高預(yù)測(cè)。應(yīng)用實(shí)測(cè)浪高數(shù)據(jù)開展實(shí)驗(yàn),并與經(jīng)典時(shí)間序列模型ARIMA、加性時(shí)間序列預(yù)測(cè)模型Prophet、集成學(xué)習(xí)模型XGBoost、長短時(shí)記憶網(wǎng)絡(luò)LSTM 和基于概率預(yù)測(cè)深度學(xué)習(xí)模型DeepAR。實(shí)驗(yàn)結(jié)果表明,MSTL-WH 能夠?qū)Σ煌军c(diǎn)未來12 h 的浪高進(jìn)行準(zhǔn)確預(yù)測(cè),綜合表現(xiàn)優(yōu)于ARIMA、Prophet、XGBoost、LSTM 和DeepAR 方法,各級(jí)浪高下MAE 均低于20%,符合業(yè)務(wù)化運(yùn)行標(biāo)準(zhǔn)。

        1 方 法

        MSTL-WH 的流程如圖1 所示。首先對(duì)浪高數(shù)據(jù)集進(jìn)行預(yù)處理,包括缺失值填充、異常值處理等。使用周期圖法提取浪高數(shù)據(jù)集中的4 個(gè)主要周期,以代表不同監(jiān)測(cè)站點(diǎn)的浪高周期,并根據(jù)這4 個(gè)主要周期對(duì)浪高序列進(jìn)行4 次STL 分解,將復(fù)雜的浪高序列分解為12 個(gè)簡單分量;然后采用結(jié)合兩級(jí)融合策略的LSTM 網(wǎng)絡(luò)進(jìn)行特征提取與融合,有效學(xué)習(xí)不同周期、不同時(shí)間海浪信息對(duì)未來浪高的影響;最后使用全連接層并結(jié)合注意力機(jī)制輸出浪高預(yù)測(cè)值,實(shí)現(xiàn)對(duì)多站點(diǎn)浪高的精確預(yù)測(cè)。

        圖1 方法流程圖Fig. 1 Flow chart of the proposed method

        1.1 基于STL 的多周期-趨勢(shì)分解

        近岸浪高受多重因素影響,使得浪高難以預(yù)測(cè),近岸浪高具有一定的周期性,可以使用STL 將浪高時(shí)間序列分解為3 個(gè)簡單分量:趨勢(shì)分量、周期分量和剩余分量。不同站點(diǎn)浪高時(shí)間序列一般具有不同的周期,因此本文利用從數(shù)據(jù)集中提取的4 個(gè)主要周期,對(duì)每一條浪高時(shí)間序列進(jìn)行4 次STL 分解,提取其不同周期下的分量,從而提高預(yù)測(cè)方法的泛化性能,實(shí)現(xiàn)對(duì)多源浪高時(shí)間序列的精準(zhǔn)預(yù)測(cè)。高序列X(n) ,對(duì)其進(jìn)行離散傅里葉變換為X(ejω),該序列的周期圖可以定義為:

        浪高數(shù)據(jù)主要周期提取的方法采用經(jīng)典的周期圖法,即信號(hào)功率譜密度估計(jì)方法。對(duì)于一個(gè)浪

        根據(jù)式(1)得到的功率譜估值,找出最大功率對(duì)應(yīng)的頻率,并取其倒數(shù)得到該序列的主要周期。

        STL 是由Cleveland 等[21]提出的一種經(jīng)典的時(shí)間序列分解方法,其優(yōu)點(diǎn)在于,對(duì)帶有異常值的時(shí)間序列分解出的分量有更強(qiáng)的魯棒性,本文中,STL 將浪高序列分解為3 個(gè)分量的分解表達(dá)如下:

        式中: Xi為 浪高序列; Ci為趨勢(shì)分量; Si為周期分量; Ri為剩余分量;N 為序列長度。STL 是一種迭代方法,其分解過程主要分為內(nèi)循環(huán)和外循環(huán),內(nèi)循環(huán)嵌套在外循環(huán)中。內(nèi)循環(huán)用于更新趨勢(shì)分量和周期分量,外循環(huán)用于計(jì)算穩(wěn)健的權(quán)值,通過在下一次內(nèi)循環(huán)中使用這些權(quán)值,以減少異常值對(duì)更新后續(xù)內(nèi)循環(huán)中趨勢(shì)分量和周期分量的影響。內(nèi)循環(huán)是STL 的主要部分,具體循環(huán)過程如下。

        第1 步:去趨勢(shì)性。在內(nèi)循環(huán)迭代 k+1次 ,使用在第 k 次 迭代時(shí)得到的趨勢(shì)分量對(duì)原始浪高序列進(jìn)行去趨勢(shì):。

        第2 步:平滑周期性。使用Loess 對(duì)去趨勢(shì)浪高序列 Xi′的 每個(gè)周期子序列進(jìn)行平滑,得到浪高序列的臨時(shí)周期分量。

        第4 步:臨時(shí)周期分量去趨勢(shì)性。將第2 步中得到的臨時(shí)周期分量減去防止低頻信號(hào)進(jìn)入周期分量,得到第 k+1次 循環(huán)的周期分量,表示為。

        第5 步:去周期性。原始浪高序列 Xi減 去周期分量得到去周期序列,表示為。

        第2、3、4 步是內(nèi)循環(huán)的周期平滑部分,第6 步是趨勢(shì)平滑部分。在外循環(huán)中,利用內(nèi)循環(huán)所得的浪高趨勢(shì)分量和浪高周期分量來計(jì)算浪高剩余分量。浪高序列 4 個(gè)主要周期經(jīng)過STL 分解,被分解為12 個(gè)簡單分量,接下來以這12 個(gè)分量作為神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)模型的輸入。

        1.2 兩級(jí)融合策略

        對(duì)于不同周期STL 分解的12 個(gè)分量,直接利用LSTM 進(jìn)行特征學(xué)習(xí)可能會(huì)破壞各周期的獨(dú)立性,造成多周期之間的干擾。為此,結(jié)合兩級(jí)融合的思想設(shè)計(jì)特征學(xué)習(xí)網(wǎng)絡(luò),網(wǎng)絡(luò)第一層使用4 個(gè)LSTM 網(wǎng)絡(luò)分別提取4 個(gè)不同周期輸入子序列的特征。

        LSTM 網(wǎng)絡(luò)是RNN 的一種改進(jìn)模型,相較于RNN 模型,它具有特殊的記憶和遺忘模式,每一個(gè)LSTM 網(wǎng)絡(luò)擁有一個(gè)記憶單元(cell),在 t 時(shí)刻的狀態(tài)記為 ct,其值通過輸入門、遺忘門和輸出門更新,它們一般使用sigmoid 或者tanh 函數(shù)進(jìn)行激活。記憶單元的工作流程為:在時(shí)刻t,記憶單元通過3 個(gè)門接收當(dāng)前狀態(tài) xt與 上一時(shí)刻記憶單元的隱藏狀態(tài) ht-1,除此之外,每一個(gè)門還接收記憶單元的狀態(tài) ct-1。接收到輸入信息之后,每一個(gè)門對(duì)不同來源的輸入進(jìn)行計(jì)算,并且由其激活函數(shù)決定其是否激活。輸入門的輸入經(jīng)非線性變換后,與經(jīng)過遺忘門處理過的記憶單元狀態(tài)進(jìn)行組合,產(chǎn)生新的記憶單元狀態(tài) ct。最后,記憶單元狀態(tài) ct通過非線性運(yùn)算和輸出門的控制產(chǎn)生記憶單元的輸出 ht。

        從浪高時(shí)間序列的長、中、短周期考慮,結(jié)合兩級(jí)融合的思想設(shè)計(jì)預(yù)測(cè)網(wǎng)絡(luò),網(wǎng)絡(luò)第一層使用4 個(gè)LSTM 網(wǎng)絡(luò)分別提取輸入序列中4 個(gè)子序列的特征,然后將輸出融合到一個(gè)LSTM 網(wǎng)絡(luò)中,之后再連接2 層LSTM 網(wǎng)絡(luò)進(jìn)一步提取特征(LSTM 網(wǎng)絡(luò)中的隱藏單元數(shù)量均為128)。

        1.3 自注意力機(jī)制

        對(duì)浪高特征進(jìn)行充分提取之后,每個(gè)特征已經(jīng)獲得了一定的權(quán)重,為進(jìn)一步強(qiáng)化特征,提升模型預(yù)測(cè)精度,使用自注意力模塊對(duì)權(quán)重進(jìn)一步分配。

        注意力機(jī)制本質(zhì)為一個(gè)查詢對(duì)應(yīng)多個(gè)鍵值對(duì)的映射。注意力機(jī)制的原理可分為3 個(gè)階段:第1階段計(jì)算每一個(gè)查詢Q 和各個(gè)鍵K 的相似度,獲得每個(gè)鍵對(duì)應(yīng)值V 的權(quán)重;第2 階段使用Softmax激活函數(shù)歸一化權(quán)重,從而獲得權(quán)重系數(shù);第3 階段對(duì)權(quán)重系數(shù)和對(duì)應(yīng)的鍵值V 進(jìn)行加權(quán)求和,獲得最終注意力權(quán)值,其計(jì)算式為:

        式中: Q ∈Rn×dk; K ∈Rn×dk; V ∈Rn×dk, n為 輸入序列長度, dk為輸入序列特征維度。

        自注意力機(jī)制也被稱作內(nèi)部注意力機(jī)制,是一種特殊的注意力機(jī)制。一般情況下,注意力機(jī)制中的輸入和輸出是不一樣的,比如在翻譯任務(wù)下,輸入序列是需要翻譯的英文語句,輸出序列則是翻譯后的中文語句,注意力機(jī)制發(fā)生在輸出的Q 和輸入的所有元素之間。對(duì)于自注意力機(jī)制則是發(fā)生在輸入序列或輸出序列的內(nèi)部元素之間,也就是式(3)中Q、K 和V 三個(gè)矩陣都來源于相同的輸入序列。自注意力機(jī)制可以減少對(duì)外部信息的依賴,將輸入序列不同位置的信息關(guān)聯(lián),擅長提取數(shù)據(jù)的內(nèi)部相關(guān)性。

        2 實(shí)驗(yàn)驗(yàn)證

        實(shí)驗(yàn)驗(yàn)證了MSTL-WH 在測(cè)試集和新數(shù)據(jù)集上的預(yù)測(cè)誤差,并通過與ARIMA、XGBoost、Prophet 和LSTM 這4 個(gè)具有代表性的預(yù)測(cè)方法對(duì)比,證明本文所提方法的優(yōu)越性。本文實(shí)驗(yàn)硬件環(huán)境如下:處理器為英特爾酷睿i9-10885H,CPU 頻率為2.4 GHz,內(nèi)存為16 GB;操作系統(tǒng)為Windows10(64 位);程序設(shè)計(jì)語言為Python3.6.9(64 位),集成開發(fā)環(huán)境為PyCharm Professional 2019.3.3;程序設(shè)計(jì)過程中的LSTM 網(wǎng)絡(luò)由Keras2.1.5 程序包實(shí)現(xiàn)。整個(gè)浪高預(yù)測(cè)實(shí)驗(yàn)主要分為4 部分:①數(shù)據(jù)集構(gòu)建;②消融實(shí)驗(yàn);③對(duì)比實(shí)驗(yàn);④泛化性能驗(yàn)證。

        2.1 評(píng)價(jià)指標(biāo)

        為驗(yàn)證MSTL-WH 的有效性,選擇平均絕對(duì)百分誤差(Mean Absolute Percentage Error,MAPE)和平均絕對(duì)誤差(Mean Absolute Error,MAE)作為評(píng)價(jià)指標(biāo),對(duì)比不同預(yù)測(cè)模型預(yù)測(cè)浪高的性能。MAPE 和MAE 的公式如下所示:

        式中: yi為 真實(shí)浪高;為預(yù)測(cè)浪高; Nt為預(yù)測(cè)長度。模型在預(yù)測(cè)浪高時(shí),MAPE 和MAE 的數(shù)值越小,代表預(yù)測(cè)結(jié)果越準(zhǔn)確。

        2.2 數(shù)據(jù)集構(gòu)建

        本文的浪高實(shí)測(cè)數(shù)據(jù)來自國家海洋科學(xué)數(shù)據(jù)中心[22]。由于浪高監(jiān)測(cè)設(shè)備異?;蚓W(wǎng)絡(luò)異常等原因,實(shí)測(cè)數(shù)據(jù)會(huì)包含異常值,因此需要對(duì)實(shí)測(cè)數(shù)據(jù)進(jìn)行異常值處理,具體處理方式為:對(duì)于異常值連續(xù)長度不超過3 的浪高序列,使用異常點(diǎn)前后的3 個(gè)有效值的均值進(jìn)行填充;對(duì)于異常值連續(xù)長度超過3 的浪高序列進(jìn)行截?cái)啾4?。?duì)所有站點(diǎn)的實(shí)測(cè)數(shù)據(jù)進(jìn)行上述處理后,得到94 條長度不一的浪高序列,這些序列用于后續(xù)數(shù)據(jù)集的制作。

        數(shù)據(jù)集中的觀測(cè)站點(diǎn)分布在24°~39°N,包含小長山(XCS)、小麥島(XMD)、連云港(LYG)、大陳(DCH)、老虎灘(LHT)、芝罘島(ZFD)、南麂(NJD)七個(gè)海洋站的實(shí)測(cè)數(shù)據(jù),每條浪高數(shù)據(jù)時(shí)間跨度為2017 年1 月至2020 年4 月,采樣頻率為1 次/h,共29 160 h。

        由于浪高實(shí)測(cè)數(shù)據(jù)跨越了不同海區(qū),其浪高數(shù)據(jù)的周期性變化也大不相同。為了確定對(duì)浪高數(shù)據(jù)進(jìn)行STL 分解的周期值,使用周期圖法對(duì)每一條浪高序列進(jìn)行功率譜密度估計(jì)。提取功率最大的頻率,取其倒數(shù)作為候選周期,共獲得94 個(gè)候選周期,各觀測(cè)站點(diǎn)浪高時(shí)序數(shù)據(jù)的主要周期如圖2 所示。結(jié)合候選周期的直方圖,最終確定140、221、314 和460 h 作為周期值。根據(jù)上述4 個(gè)周期,STL 將每一條復(fù)雜的浪高序列分解成12 個(gè)簡單分量,將每個(gè)分量歸一化至區(qū)間(0,1)后用于后續(xù)的數(shù)據(jù)集制作。為了捕捉不同站點(diǎn)的海浪周期,從而更加準(zhǔn)確地預(yù)測(cè)浪高,在制作數(shù)據(jù)集時(shí),滑動(dòng)窗口的長度應(yīng)大于海浪序列數(shù)據(jù)的周期。因此,在使用滑動(dòng)窗口切分浪高序列時(shí),窗口大小設(shè)置為500 h,步長為2 h,前488 個(gè)時(shí)間點(diǎn)的浪高值及其分量作為輸入,后12 個(gè)時(shí)間點(diǎn)的浪高值作為真值,對(duì)所有序列進(jìn)行滑動(dòng)窗口切分后,共得到69 836 個(gè)樣本。按照8∶2 劃分訓(xùn)練集和測(cè)試集,得到55 868 個(gè)樣本的訓(xùn)練集、13 967 個(gè)樣本的測(cè)試集,數(shù)據(jù)形狀分別為(55 868,488,12)和(13 967,12),訓(xùn)練集中各等級(jí)浪高樣本的數(shù)量如圖3 所示。

        圖3 訓(xùn)練集中各等級(jí)浪高的樣本數(shù)量Fig. 3 Number of samples at different levels of wave height in the training data set

        2.3 消融實(shí)驗(yàn)

        首先通過對(duì)比實(shí)驗(yàn),確定一個(gè)具有3 層LSTM 的預(yù)測(cè)網(wǎng)絡(luò),基于此網(wǎng)絡(luò)對(duì)比采用單周期STL 分解前后和多周期STL 分解的浪高預(yù)測(cè)誤差,驗(yàn)證多周期STL 分解的有效性,然后分別在是否采用多周期STL 分解的基礎(chǔ)上,對(duì)比采取兩級(jí)融合前后的浪高預(yù)測(cè)誤差,證明兩級(jí)融合的有效性,最后通過實(shí)驗(yàn)確定融合層后LSTM 的層數(shù)。

        為了驗(yàn)證多周期STL 分解的有效性,向一個(gè)3 層LSTM 預(yù)測(cè)網(wǎng)絡(luò)分別輸入原始浪高時(shí)間序列、單周期STL 分解后的浪高時(shí)間序列和多周期STL 分解后的浪高時(shí)間序列,對(duì)比浪高預(yù)測(cè)誤差,其中每層LSTM 的隱藏神經(jīng)元個(gè)數(shù)為128。未采用STL 分解時(shí),模型輸入數(shù)據(jù)為原始浪高序列,維度為(488,1);采用單周期STL 分解時(shí),使用周期圖法得到數(shù)據(jù)集中功率最大周期,并據(jù)此對(duì)輸入的浪高序列進(jìn)行STL 分解,模型的輸入數(shù)據(jù)維度為(488,3);采用多周期STL 分解時(shí),模型的輸入數(shù)據(jù)維度為(488,12)。模型的輸出均為未來12 h 的浪高值,結(jié)果如表1 所示。

        表1 多周期STL 分解對(duì)預(yù)測(cè)性能的影響Table 1 Impact of multi-period STL decomposition on prediction performance

        從表1 可以看到,使用單周期進(jìn)行STL 分解在一定程度上可以減小預(yù)測(cè)誤差,相比之下,多周期進(jìn)行STL 分解可以更進(jìn)一步減小預(yù)測(cè)誤差,使MAE 降至0.15 m,MAPE 降至30.97%,這表明多周期STL 分解對(duì)于減小預(yù)測(cè)誤差發(fā)揮了重要作用。

        接下來為了驗(yàn)證兩級(jí)融合的有效性并進(jìn)一步說明多周期STL 分解的有效性,我們分別對(duì)單周期STL 分解及多周期STL 分解下是否采用兩級(jí)融合對(duì)預(yù)測(cè)誤差的影響進(jìn)行了對(duì)比。在融合層之后連接1 層LSTM 網(wǎng)絡(luò)和1 層全連接層來輸出浪高預(yù)測(cè)值,其中每層LSTM 的隱藏神經(jīng)元個(gè)數(shù)為128。實(shí)驗(yàn)結(jié)果如表2 所示。

        表2 單/多周期STL 分解下兩級(jí)LSTM 特征融合對(duì)預(yù)測(cè)性能的影響Table 2 Impact of two-stage LSTM feature fusion on prediction performance under single/multi-period STL

        從表2 可以看出,無論在單周期STL 分解下還是在多周期STL 分解下,采用兩級(jí)融合均可明顯減小預(yù)測(cè)誤差。相對(duì)單周期STL 分解,采用多周期STL 分解具有更小的預(yù)測(cè)損失,結(jié)合兩級(jí)融合可將MAE 降低至0.11 m,MAPE 降低至20.56%。因此,多周期STL 分解及兩級(jí)融合對(duì)于多源浪高時(shí)間序列預(yù)測(cè)任務(wù)具有明顯提升效果。

        最后,在采用多周期STL 分解及兩級(jí)融合的基礎(chǔ)上,我們?cè)谔卣魅诤蠈雍筮B接不同層數(shù)的LSTM,然后使用自注意力層對(duì)權(quán)重再分配,最后連接1 個(gè)全連接層輸出浪高預(yù)測(cè)值,其中每層LSTM 的隱藏神經(jīng)元個(gè)數(shù)為128,結(jié)果如表3所示。

        表3 LSTM 層數(shù)對(duì)預(yù)測(cè)性能的影響Table 3 Impact of the number of layers of LSTM on prediction performance

        由表3 可以看出,隨著網(wǎng)絡(luò)中LSTM 層數(shù)的增加,網(wǎng)絡(luò)的預(yù)測(cè)性能也隨之提升,但當(dāng)LSTM層數(shù)增加至4 層時(shí),由于網(wǎng)絡(luò)參數(shù)量過多導(dǎo)致過擬合,網(wǎng)絡(luò)性能開始下降,當(dāng)LSTM 的添加層數(shù)為3 時(shí),模型的預(yù)測(cè)誤差最小,MAE 低至0.07 m,MAPE 低至11.87%,因此,在MSTL-WH 中,使用3 層LSTM 進(jìn)一步提取融合后的特征。

        2.4 對(duì)比實(shí)驗(yàn)

        基于時(shí)間序列的預(yù)測(cè)模型主要包括經(jīng)典線性時(shí)間序列模型、機(jī)器學(xué)習(xí)模型和深度學(xué)習(xí)模型,本文從中選取了ARIMA、Prophet、XGBoost、LSTM 和DeepAR 這5 個(gè)具有代表性的預(yù)測(cè)模型與MSTLWH 進(jìn)行對(duì)比。

        根據(jù)最新發(fā)布的海浪等級(jí)國家標(biāo)準(zhǔn)[23],將模型預(yù)測(cè)結(jié)果計(jì)算平均值后分為4 個(gè)等級(jí)區(qū)間,即2級(jí)對(duì)應(yīng)浪高0.10~0.50 m、3 級(jí)對(duì)應(yīng)浪高0.50~1.25 m、4 級(jí)對(duì)應(yīng)浪高1.25~2.50 m、5 級(jí)對(duì)應(yīng)浪高2.50~4.00 m,評(píng)價(jià)指標(biāo)結(jié)果如表4 所示。同時(shí),為直觀觀察各模型在不同等級(jí)浪高下的預(yù)測(cè)性能,在不同浪高等級(jí)范圍隨機(jī)選擇了4 個(gè)時(shí)間序列,使用各種對(duì)比模型進(jìn)行了24 h 預(yù)測(cè),預(yù)測(cè)結(jié)果如圖4 所示。

        表4 各模型在不同浪高等級(jí)下的評(píng)價(jià)指標(biāo)結(jié)果Table 4 Evaluation metrics of different models at different levels of wave height

        圖4 各模型不同等級(jí)浪高下的預(yù)測(cè)效果Fig. 4 Results of different models at different levels of wave height

        根據(jù)24 h 的浪高值預(yù)測(cè)結(jié)果對(duì)比(圖4),MSTL-WH(紅色)與實(shí)際浪高值(黑色)的擬合度較高。集成學(xué)習(xí)方法XGBoost(黃色)和經(jīng)典的ARIMA 模型(藍(lán)色)整體上比其他3 種方法性能更好。DeepAR 模型(粉色)整體性能與ARIMA 模型類似。Prophet 模型(綠色)對(duì)低等級(jí)的浪高預(yù)測(cè)值偏高,但是高等級(jí)的浪高預(yù)測(cè)值偏低,說明其對(duì)數(shù)據(jù)變化適應(yīng)性較差。同樣,LSTM 網(wǎng)絡(luò)(灰色)預(yù)測(cè)網(wǎng)絡(luò)效果也不佳,總體預(yù)測(cè)值偏低,這對(duì)海浪預(yù)警非常不利。最后,大部分模型在海況4 級(jí)的浪高范圍內(nèi)預(yù)測(cè)趨勢(shì)較好,這可能與這一等級(jí)的訓(xùn)練數(shù)據(jù)較充分有關(guān),但也存在波動(dòng)峰值滯后的情況,本文模型滯后性較小。

        表4 從誤差指標(biāo)上進(jìn)一步給出客觀評(píng)價(jià)。MSTL-WH 在各等級(jí)浪高下的預(yù)測(cè)指標(biāo)均優(yōu)于其他模型,尤其對(duì)于3、4 級(jí)浪高,即在0.50~1.25 m、1.25~2.50 m 區(qū)間的浪高序列,MSTL-WH 的平均絕對(duì)誤差僅為0.10 m 和0.17 m,在平均絕對(duì)誤差±0.20 m 的誤差范圍內(nèi),浪高等級(jí)不會(huì)發(fā)生變化。對(duì)于2 級(jí)浪高,MSTL-WH 的平均絕對(duì)誤差僅為0.03 m,幾乎可以忽略不計(jì)。因此,本文提出的MSTLWH 在各等級(jí)浪高下有著良好的預(yù)測(cè)性能,滿足浪高預(yù)報(bào)業(yè)務(wù)化的要求(MAPE≤20%)。

        2.5 泛化性能驗(yàn)證

        盡管MSTL-WH 在驗(yàn)證集上的準(zhǔn)確性和穩(wěn)定性表現(xiàn)良好,為了進(jìn)一步驗(yàn)證其泛化能力,本文在不同站點(diǎn)以及新數(shù)據(jù)集上分別進(jìn)行了實(shí)驗(yàn)。各模型針對(duì)不同站點(diǎn)(多源)的MAE 評(píng)價(jià)指標(biāo)結(jié)果如表5 所示。

        表5 各模型在不同站點(diǎn)(多源)的MAE 評(píng)價(jià)指標(biāo)結(jié)果(m)Table 5 MAE evaluation metrics of different models at different stations (m)

        由表5 可以看出,MSTL-WH 在7 個(gè)不同站點(diǎn)中有5 站MAE 評(píng)價(jià)指標(biāo)上優(yōu)于其他模型。在DCH站點(diǎn),MSTL-WH 和XGBoost 的預(yù)測(cè)指標(biāo)相同,均優(yōu)于其他模型。在XMD 站點(diǎn)中,DeepAR 的MAE 評(píng)價(jià)指標(biāo)更小,預(yù)測(cè)性能相對(duì)更好,但MSTL-WH 仍然是所有預(yù)測(cè)模型中排名第二的模型??傮w來看,MSTL-WH 在不同站點(diǎn)(多源)的預(yù)測(cè)誤差變化小,模型性能穩(wěn)定。

        對(duì)國家海洋科學(xué)數(shù)據(jù)中心與訓(xùn)練集一致的7個(gè)站點(diǎn)2020 年4 月至5 月的浪高實(shí)測(cè)數(shù)據(jù)進(jìn)行預(yù)處理(詳見2.2 節(jié)描述)后,共得到3 620 條浪高序列,覆蓋了2~5 級(jí)的浪高。MSTL-WH 在這一新數(shù)據(jù)集上的各項(xiàng)指標(biāo)如表6 所示。

        表6 MSTL-WH 在新數(shù)據(jù)集上的各項(xiàng)指標(biāo)Table 6 Results of MSTL-WH in new dataset

        由表6 可見,MSTL-WH 在新數(shù)據(jù)集上各等級(jí)浪高的平均相對(duì)誤差均小于20%,對(duì)比表4 中的性能指標(biāo),MSTL-WH 除了在2 級(jí)浪高預(yù)測(cè)有較大誤差外,其余等級(jí)浪高情況下最大增加了1.36%的平均絕對(duì)誤差。雖然2 級(jí)浪高預(yù)測(cè)的MAPE 為19.16%,但其平均絕對(duì)誤差僅為0.05 m,對(duì)實(shí)際預(yù)報(bào)業(yè)務(wù)幾乎沒有影響。由此可見,MSTL-WH 在不同等級(jí)浪高預(yù)測(cè)上具有良好的泛化性。

        3 結(jié) 語

        本文基于浪高實(shí)測(cè)數(shù)據(jù),針對(duì)多源浪高時(shí)序序列難以預(yù)測(cè)問題,提出了基于多周期STL 分解和兩級(jí)融合策略預(yù)測(cè)方法。首先使用周期圖法從多源浪高時(shí)序數(shù)據(jù)集中提取主要周期,并據(jù)此對(duì)浪高序列進(jìn)行STL 分解,然后使用LSTM 從短、中和長期不同的視野提取浪高特征,采用兩級(jí)融合策略進(jìn)行特征融合,最后使用全連接層輸出未來12 h 的浪高值。

        本文所提出的浪高預(yù)測(cè)方法MSTL-WH 對(duì)2、3、4 和5 級(jí)浪高序列預(yù)測(cè)的MAPE 均低于20%,滿足浪高預(yù)報(bào)業(yè)務(wù)化運(yùn)行的要求(MAPE≤20%)。相較于LSTM、ARIMA、Prophet、XGBoost 和DeepAR,MSTL-WH 能更好地預(yù)測(cè)具有不同周期的浪高序列,同時(shí)解決了對(duì)不同地區(qū)(多源)預(yù)測(cè)適應(yīng)性差的問題,降低了預(yù)測(cè)模型的滯后性,且在新的浪高數(shù)據(jù)集下,具有良好的泛化性。

        在充分分析時(shí)間序列數(shù)據(jù)特征的前提下,本文提出的方法不僅適用于浪高預(yù)測(cè),還可以用于其他領(lǐng)域的時(shí)間序列預(yù)測(cè)任務(wù),具有廣闊的應(yīng)用前景。

        猜你喜歡
        融合模型
        一半模型
        一次函數(shù)“四融合”
        村企黨建聯(lián)建融合共贏
        融合菜
        從創(chuàng)新出發(fā),與高考數(shù)列相遇、融合
        重要模型『一線三等角』
        寬窄融合便攜箱IPFS500
        《融合》
        重尾非線性自回歸模型自加權(quán)M-估計(jì)的漸近分布
        3D打印中的模型分割與打包
        国产不卡视频一区二区三区| 中文字幕精品亚洲二区| 在线亚洲免费精品视频| 在线观看国产白浆一区三区| 777精品出轨人妻国产| 无码a∨高潮抽搐流白浆| 亚洲自拍愉拍| 国产自产在线视频一区| 亚洲视频一区二区三区视频| 最新精品国偷自产在线| 亚洲中文字幕乱码| 久久久婷婷综合亚洲av| 日韩美女亚洲性一区二区| 人妻少妇乱子伦精品| y111111少妇影院无码| 国产精品玖玖资源站大全| 国产精品高湖呻呤久久av| 国产亚洲精品成人aa片新蒲金| 真实国产乱啪福利露脸| 99在线国产视频| 亚洲禁区一区二区三区天美| 日韩人妻无码一区二区三区久久 | 国产精品女同一区二区久| 蜜桃av人妻精品一区二区三区| 亚洲欧美日韩成人高清在线一区| 99热这里只有精品3| 国产精品99久久不卡二区| 日本国产亚洲一区二区| 国产一区二区精品久久| 婷婷色综合成人成人网小说| 性色国产成人久久久精品二区三区| 97一期涩涩97片久久久久久久| 国产自国产在线观看免费观看| 亚洲AV成人无码天堂| 日本免费一二三区在线| 亚洲综合色区另类av| 亚洲av美女在线播放啊| 日本在线综合一区二区| 欧美日韩一区二区三区在线观看视频 | 午夜精品一区二区三区的区别| 国产精品白浆视频免费观看|