黃冬梅 王唱 胡安鐸 孫錦中 孫園 宋巍
(1、上海電力大學(xué)電子與信息工程學(xué)院,上海 201306 2、上海電力大學(xué)數(shù)理學(xué)院,上海 201306 3、上海海洋大學(xué)信息學(xué)院,上海 201306)
潮汐能是一種重要的海洋可再生能源。利用潮汐能發(fā)電,加快潮汐能開發(fā),推動沿海地區(qū)能源清潔化轉(zhuǎn)型,有助于區(qū)域雙碳目標(biāo)的實現(xiàn)[1,2]。潮汐電站的日發(fā)電量與發(fā)電水頭密切相關(guān),在正、反向的發(fā)電過程中,水頭決定發(fā)電流量,進而決定發(fā)電量的多少。通過潮汐電站的潮位短期預(yù)測,可以提前考慮日發(fā)電量,制定合理的調(diào)度方案,合理地分配發(fā)電流量,提高潮汐能的功率轉(zhuǎn)換效率。
調(diào)和分析[3](Harmonic Analysis, HA)模型是預(yù)測潮位的經(jīng)典模型,十九世紀(jì)七十年代Thomson 首次將調(diào)和分析的方法用于潮汐的預(yù)測中,后由Darwin[4]完善并創(chuàng)立了平衡潮理論。二十世紀(jì)三十年代Doodson[5]用最小二乘法來確定調(diào)和常數(shù),利用調(diào)和常數(shù)來計算潮汐高度。調(diào)和分析的方法發(fā)展至今,仍然是潮汐預(yù)報的基礎(chǔ),但調(diào)和分析的預(yù)報需要大量的參數(shù)以及長期的潮汐測量數(shù)據(jù)。近年來,人工智能技術(shù)特別是深度學(xué)習(xí)的發(fā)展,給潮位預(yù)測帶來了新的方法。文獻[6]對17 個潮汐站21 年的潮汐資料分析,建立了LSTM 預(yù)測模型,有效地減少機器學(xué)習(xí)方法在連續(xù)預(yù)測中產(chǎn)生的重疊問題。文獻[7]利用前幾個小時的潮位數(shù)據(jù)建立了Bi-LSTM 模型,有效的提高預(yù)測精度。為了進一步提高潮汐預(yù)測的準(zhǔn)確性及泛化性,考慮到潮汐了成因,將調(diào)和分析的方法與智能算法結(jié)合,建立了一種模塊化的混合模型,調(diào)和分析方法作用于天文潮部分,智能算法作用于非天文潮部分。文獻[8] 采用Grey-GMDH 模型處理6000 組非天文潮數(shù)據(jù),文獻[9]建立了ARIMA-SVR 模塊化潮汐預(yù)測模型,非天文潮的非線性問題得到一定的解決。
針對潮位變化非線性非周期性影響預(yù)測精度的問題,本文提出一種基于HA-TCN 的模塊化潮位預(yù)測方法,在調(diào)和分析的基礎(chǔ)上,TCN 能夠很好的學(xué)習(xí)到非天文潮數(shù)據(jù)歷史過程,并挖掘出序列的局部特征和潛在關(guān)系,為潮位短期預(yù)測提供了一種可行性的方法,算例實驗結(jié)果表明了所提模型具有更高的預(yù)測精度和泛化性。
潮汐的起源是天體在空間中的引潮力,是地球與天體之間的離心力和引力的結(jié)合。研究潮汐潮位最廣泛使用的方法是調(diào)和分析法,它把復(fù)雜的潮汐分解成若干周期分量,而每一個周期分量都是由一個假設(shè)天體產(chǎn)生的。在t 時刻,對于某潮汐站的潮高h(t),可表示為:
時間卷積網(wǎng)絡(luò)(Temporal Convolutional Network, TCN)是卷積神經(jīng)網(wǎng)絡(luò)(CNN)結(jié)構(gòu)上的一種創(chuàng)新形式,由具有相同輸入和輸出長度的因果卷積層和膨脹卷積層組成,只有一維的卷積核,與ReLU 激活函數(shù)組成隱含層對時間序列的特征進行提取。在時間序列問題上,傳統(tǒng)的CNN 由于卷積核大小以及池化層的限制,不能夠處理好序列之間的依賴關(guān)系,并不適用大規(guī)模時間序列的建模,一般會建立循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)模型。序列的在訓(xùn)練中,TCN 可以避免RNN 模型的梯度消失或者梯度爆炸問題。與LSTM 相比,TCN 的并行思想在訓(xùn)練的過程中,當(dāng)處理精度不低LSTM 的狀態(tài)下時,處理速度遠快于LSTM。
其中,N 為卷積核大小。
在時間序列的處理中,為了更深層次的挖掘長期歷史信息,因果卷積則需要較大的卷積核或者較深的層數(shù)才能覆蓋待處理數(shù)據(jù)。卷積核的增大會使網(wǎng)絡(luò)權(quán)重參數(shù)增多,網(wǎng)絡(luò)層數(shù)的加深會使處理次數(shù)增加,從而會增大網(wǎng)絡(luò)模型的訓(xùn)練難度和時間。為了克服這種局限,使用膨脹卷積來學(xué)習(xí)更長時間的序列依賴關(guān)系,在不丟失底層卷積核信息的前提下能夠獲得更大的感受野。引入擴張因子d 可以大大減少網(wǎng)絡(luò)參數(shù)以及訓(xùn)練時間,同時獲得更長時間跨度的數(shù)據(jù)特征。引入膨脹卷積后,在xT出的因果卷積可表示為:
其中,d 為擴張因子。
根據(jù)潮汐產(chǎn)生的原因不同,把模塊化思想引入到潮汐預(yù)報領(lǐng)域,潮汐可認為是天文潮潮位和非天文潮潮位的疊加。天文潮是由天體引潮力的影響產(chǎn)生的周期性運動和變化,由不同周期的分潮疊加而成。非天文潮則是由風(fēng)速、風(fēng)向、氣壓、洋流等環(huán)境因素引起的,表現(xiàn)出很強的非線性和不確定性。由于潮汐影響因素的復(fù)雜性,僅使用調(diào)和分析方法或者單一的智能優(yōu)化算法,無法高度體現(xiàn)到潮汐規(guī)律,表現(xiàn)出較大的預(yù)測誤差。
基于此,本文建立了基于潮汐調(diào)和分析和時間卷積網(wǎng)絡(luò)模塊化的組合模型來預(yù)測潮位。該模型結(jié)構(gòu)如圖1 所示,首先利用調(diào)和分析模型對實測潮位數(shù)據(jù)進行處理,得到調(diào)和常數(shù),進而得到天文潮的預(yù)測值和變化規(guī)律;然后將實測數(shù)據(jù)與預(yù)測的天文潮數(shù)據(jù)進行做差,結(jié)果為殘差部分即非天文潮部分,利用TCN 對非天文潮部分進行預(yù)測;最后將調(diào)和分析預(yù)測的天文潮部分和TCN 預(yù)測的非天文潮部分線性相加,得到最終結(jié)果,實現(xiàn)精確預(yù)測。
圖1 HA-TCN 模塊化結(jié)構(gòu)框圖
模塊化預(yù)測模型的誤差由均方根誤差(RMSE)和相關(guān)系數(shù)(CC)來衡量,RMSE 和CC 的公式為
為了評估所提模塊化模型預(yù)測潮汐的精確性,從美國NOAA 網(wǎng)站獲取芝加哥港口(Port Chicago, CA)的實測數(shù)據(jù)進行潮位預(yù)測,實測數(shù)據(jù)的采樣間隔為1 小時。首先利用調(diào)和分析方法對所在地天文潮進行計算,得到2019 年12 月19 日GMT1200 到2019 年12 月31 日GMT2300 共300 小時的潮位預(yù)測值;然后以2019 年11 月20 日GMT0800 到2019年12 月31 日GMT2300 共1000 小時的非天文潮部分作為TCN 網(wǎng)絡(luò)模型的數(shù)據(jù)集進行訓(xùn)練和測試,其中2019 年11 月20 日GMT0800 到2019 年12 月19 日GMT1100 共700 小時非天文潮部分為訓(xùn)練集,2019 年12 月19 日GMT1200 到2019 年12 月31 日GMT2300 共300 小時非天文潮部分為測試集,得到300 小時的非天文潮預(yù)測值;最后將潮汐調(diào)和分析天文潮的預(yù)測值和TCN 網(wǎng)絡(luò)模型非天文潮的預(yù)測值等權(quán)疊加,得到最終的預(yù)測結(jié)果。
調(diào)和分析模型的預(yù)測結(jié)果如圖2 所示,預(yù)測值和實測值變化趨勢基本相同,但是也不難看出數(shù)據(jù)點之間的擬合誤差較大,特別是在高潮和低潮點,誤差相當(dāng)明顯。由此可以看出影響潮汐高度的因素復(fù)雜,不僅僅是在天體引潮力的作用下周期運動,環(huán)境中的其他不確定因素也會影響到潮汐的非線性變化。從調(diào)和分析模型誤差分布圖中,可以看出誤差在[-0.2,0.2]之間,誤差值比較大且關(guān)于誤差中心不對稱,通過計算,HA 模型預(yù)測值的RMSE 為0.0722m。
圖2 HA 模型預(yù)測結(jié)果及誤差分布
僅用時間卷積網(wǎng)絡(luò)模型對700 小時的數(shù)據(jù)進行訓(xùn)練,得到預(yù)測結(jié)果如圖3 所示,潮位的實測值與預(yù)測值的契合度明顯要優(yōu)于HA 模型。不難看出,部分潮高點的預(yù)測值與實測值之間任然存在較大偏差,根據(jù)誤差計算,TCN 模型預(yù)測值的RMSE 為0.0328m。誤差分布在集中在[-0.1,0.1],并在0 處相對對稱,但是誤差分布不均勻。
圖3 TCN 模型預(yù)測結(jié)果及誤差分布
圖4 為調(diào)和分析與時間卷積網(wǎng)絡(luò)模型的模塊化模型的預(yù)測結(jié)果,顯而易見,預(yù)測值與實測值兩者的擬合度要遠高于HA 模型和TCN 模型。通過計算,RMSE 為0.0128m,從HATCN 模塊化模型的誤差分布圖中可以看出誤差分布集中且均勻,分布區(qū)間在[-0.03,0.03]之間,誤差范圍很小且誤差關(guān)于分布中心相對對稱。HATCN 模型的預(yù)測誤差明顯降低是由于模塊化模型充分考慮了天文潮部分和非天文潮部分的雙重影響,使得預(yù)測精度有了明顯提高。
圖4 HA-TCN 模塊化模型預(yù)測結(jié)果及誤差分布
根據(jù)RMSE 指標(biāo),HA-TCN 模塊化模型的預(yù)測精度比HA 模型和TCN 模型分別提高了82.33%和61.18%。HA 模型、TCN 模型和HA-TCN模塊化模型的預(yù)測誤差結(jié)果如圖5 所示,HATCN 模塊化模型相比于HA 和TCN 模型的誤差在0 上下波動,波動幅值小且波動均勻。三個模型預(yù)測值與實測值之間的回歸比較如圖6 所示,其相關(guān)系數(shù)(CC)分別為0.9887、0.9975 和0.9997,可見HA-TCN 模塊化模型的相關(guān)性很強。綜上所述,HA-TCN 模塊化模型擁有更高的潮位預(yù)測精度。
圖5 三個模型的誤差比較
圖6 三個模型的回歸比較
為了進一步確定HA-TCN 模塊化模型對潮位預(yù)測是否具有通用性和實用能力,在相同的仿真條件下,另選取了莫勒港(Moller,AK)和圣地亞哥驗潮站(San Diego,CA)作為驗證樣本,預(yù)測結(jié)果如表1 所示。HA-TCN 模塊化模型的RMSE 和CC指標(biāo)均優(yōu)于HA 模型和TCN 模型。綜上所述,模塊化的HA-TCN 模型的預(yù)測結(jié)果更準(zhǔn)確,模型的通用性和實用性也得到驗證。
表1 不同港口潮汐預(yù)測結(jié)果對比
本文提出一種基于時間卷積網(wǎng)絡(luò)(TCN)模塊化模型預(yù)測潮位的方法。根據(jù)潮汐的形成原因,采用調(diào)和分析的方法求得調(diào)和常數(shù)對天文潮實現(xiàn)預(yù)測;采用時間卷積網(wǎng)絡(luò)處理非線性非天文潮序列,其靈活的感受野使得模型可以很好的控制記憶長短;最后將兩部分預(yù)測結(jié)果線性疊加得到最終的預(yù)測值。結(jié)合港口的實測數(shù)據(jù)證明了所提TCN 模塊化模型的有效性和可行性,與其他模型相比,擁有更好的擬合效果。
潮汐電站的優(yōu)化調(diào)度離不開潮位的精確預(yù)測。精確的預(yù)測可以預(yù)知潮汐電站庫水位的變化過程,進而關(guān)聯(lián)發(fā)電水頭的大小,將直接影響潮汐電站的能 量利用率指標(biāo),是制定合理電站調(diào)度方案的關(guān)鍵環(huán)節(jié)。HATCN 模塊化的預(yù)測模型能夠提供精確的潮位預(yù)測數(shù)據(jù),可以很好地模擬出潮位的動力學(xué)特征,預(yù)測精度能夠達到電站運行要求。