亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于數(shù)據(jù)修正的概率稀疏自注意短期風(fēng)電功率預(yù)測(cè)

        2023-11-10 12:56:26施進(jìn)煒原冬蕓
        智慧電力 2023年10期
        關(guān)鍵詞:檢測(cè)模型

        施進(jìn)煒,張 程,2,原冬蕓

        (1.福建理工大學(xué)電子電氣與物理學(xué)院,福建福州 350118;2.智能電網(wǎng)仿真分析與綜合控制福建省高校工程研究中心,福建福州 350118;3.閩江學(xué)院材料與化學(xué)工程學(xué)院,福建福州 350108)

        0 引言

        近十年來(lái),可再生能源風(fēng)能經(jīng)歷了階段式的跨越,截止到2022 年,全年風(fēng)光發(fā)電累計(jì)裝機(jī)容量達(dá)到7.6 億千瓦,同比增速達(dá)18.75%,風(fēng)電已經(jīng)逐步成為能源供應(yīng)的中堅(jiān)力量。但由于風(fēng)力發(fā)電受氣象和和地理?xiàng)l件的影響,風(fēng)電具有隨機(jī)性、波動(dòng)性和間歇性,使得大規(guī)模的風(fēng)電并網(wǎng)電力供需難以平衡[1-4]。提高風(fēng)電預(yù)測(cè)的精度,有助于優(yōu)化電網(wǎng)的整體規(guī)劃調(diào)度,找到風(fēng)機(jī)的最佳組合,保證電力系統(tǒng)安全穩(wěn)定運(yùn)行,從而進(jìn)一步提高風(fēng)電的經(jīng)濟(jì)效益[5-7]。因此風(fēng)電功率預(yù)測(cè)技術(shù)的精準(zhǔn)度是當(dāng)前探究的重要方向。

        目前為止,風(fēng)電功率的預(yù)測(cè)法分為統(tǒng)計(jì)法和物理法[8]。而物理法主要是用數(shù)值天氣預(yù)報(bào)(Numerical Weather Prediction,NWP)的預(yù)測(cè)結(jié)果得到氣象數(shù)據(jù),再利用風(fēng)機(jī)的功率曲線計(jì)算得出風(fēng)機(jī)的實(shí)際輸出功率。NWP 更新的頻率在1~3 h 內(nèi),不適用于短期風(fēng)電功率預(yù)測(cè)。而統(tǒng)計(jì)法則是基于歷史風(fēng)電功率數(shù)據(jù),結(jié)合輸入特征信息構(gòu)建功率預(yù)測(cè)的非線性模型,主要包括時(shí)間序列模型[9]、支持向量機(jī)模型[10]、深度神經(jīng)網(wǎng)絡(luò)模型[11]等。

        隨著深度學(xué)習(xí)的不斷發(fā)展,通過(guò)學(xué)習(xí)大量參數(shù),非線性的數(shù)據(jù)擬合能力得到不斷地提高。因此,使用深度神經(jīng)網(wǎng)絡(luò)來(lái)擬合風(fēng)電功率這種具有強(qiáng)隨機(jī)的時(shí)間序列具備合理性[12]。長(zhǎng)短期記憶網(wǎng)LSTM[13](Long Short Term Memory,LSTM)和門(mén)控循環(huán)單元[14](Gate Recurrent Unit,GRU)為主的神經(jīng)網(wǎng)絡(luò)在風(fēng)電功率預(yù)測(cè)中有大面積的應(yīng)用。文獻(xiàn)[15]中長(zhǎng)短期記憶模型構(gòu)建高頻校正模型,彌補(bǔ)低頻分量缺失的高頻分量,提高數(shù)據(jù)挖掘的準(zhǔn)確性。文獻(xiàn)[16]對(duì)天氣預(yù)報(bào)、實(shí)測(cè)功率數(shù)據(jù)進(jìn)行時(shí)空特征提取,結(jié)合注意力機(jī)制,對(duì)多個(gè)風(fēng)場(chǎng)之間相關(guān)性進(jìn)行學(xué)習(xí),剔除低權(quán)重冗余信息。獲取預(yù)測(cè)精度更高的風(fēng)電功率未來(lái)數(shù)據(jù)。文獻(xiàn)[17]采用動(dòng)態(tài)權(quán)重選擇、孤立森林算法以及鄰近節(jié)點(diǎn)算法篩選并處理數(shù)據(jù),構(gòu)建多元注意力框架,具有提高模型預(yù)測(cè)精度的作用。Transformer 模型完全拋棄常見(jiàn)的循環(huán)神經(jīng)網(wǎng)絡(luò)RNN(Recurrent Neural Network,RNN)、LSTM 結(jié)構(gòu),采用Encoder-Decoder 結(jié)構(gòu),最近許多學(xué)者將其運(yùn)用到序列數(shù)據(jù)預(yù)測(cè)領(lǐng)域均取得了不錯(cuò)的效果[18],但其計(jì)算復(fù)雜度高,多層網(wǎng)絡(luò)堆疊,占用內(nèi)存,訓(xùn)練速度較慢。

        采集過(guò)程中不可控因素的存在,使采集到的原始風(fēng)電數(shù)據(jù)中存在異常數(shù)據(jù)及缺失數(shù)據(jù)[19],無(wú)法進(jìn)行直接預(yù)測(cè)。文獻(xiàn)[20]將離群信息標(biāo)識(shí)為異常,但該方法流程較復(fù)雜,且檢測(cè)耗時(shí)過(guò)長(zhǎng)。文獻(xiàn)[18]雖然檢測(cè)精度高,但受參數(shù)選取的影響大,因此魯棒性較差。文獻(xiàn)[21]采用基于距離的異常檢測(cè),但需提前獲悉數(shù)據(jù)的先驗(yàn)知識(shí)且無(wú)法對(duì)數(shù)據(jù)的異常度進(jìn)行區(qū)分。

        本文提出一種數(shù)據(jù)修正的概率稀疏自注意力風(fēng)電功率預(yù)測(cè)方法。首先,采用一種新的集成異常檢測(cè)技術(shù),通過(guò)綜合K 近鄰、局部異常因子、孤立森林3 種方法進(jìn)行異常檢測(cè),并且利用輕梯度提升機(jī)(Light Gradient Boosting Machine,lightGBM)學(xué)習(xí)經(jīng)過(guò)清洗的風(fēng)速-功率數(shù)據(jù)集,對(duì)缺失值進(jìn)行補(bǔ)充。然后將修正后的數(shù)據(jù)集輸入Informer 模型進(jìn)行訓(xùn)練,該模型通過(guò)概率稀疏自注意(ProSparse selfattention)篩選出重要特征,在保證預(yù)測(cè)精度的基礎(chǔ)上,進(jìn)一步提高運(yùn)算速度。此方法能提高預(yù)測(cè)效率和精度,準(zhǔn)確的短期風(fēng)電功率預(yù)測(cè)有助于減少電力系統(tǒng)的調(diào)峰負(fù)荷,降低火電廠的啟停次數(shù),提高火電廠的運(yùn)行效率,降低運(yùn)行成本。而更高效率的預(yù)測(cè),可以更快地為電網(wǎng)調(diào)度提供可靠的信息,提高電力系統(tǒng)運(yùn)行的經(jīng)濟(jì)性和穩(wěn)定性。

        1 短期風(fēng)電功率預(yù)處理

        1.1 風(fēng)電數(shù)據(jù)集分析

        本文采用的風(fēng)電數(shù)據(jù)集來(lái)源于某風(fēng)電場(chǎng)。該數(shù)據(jù)集記錄了風(fēng)電場(chǎng)從2019 年3 月1 日00:00—2020 年2 月28 日24:00 的70 m 高度的風(fēng)速、風(fēng)向、環(huán)境溫度、實(shí)測(cè)風(fēng)電功率等數(shù)據(jù),采樣時(shí)間間隔為15 min。

        圖1 為該風(fēng)電場(chǎng)四季的風(fēng)力玫瑰圖,受季節(jié)影響,春夏盛行的東風(fēng),秋季從東風(fēng)向西南風(fēng)過(guò)渡,冬季盛行西南風(fēng)。

        圖1 四季風(fēng)力玫瑰圖Fig.1 Dynamic wind rose for four seasons

        1.2 異常檢測(cè)模型

        根據(jù)風(fēng)速-風(fēng)電功率的數(shù)據(jù)分布特征,正常的數(shù)據(jù)分布在風(fēng)速-風(fēng)電功率曲線附近,然而異常數(shù)據(jù)常表現(xiàn)為橫向數(shù)據(jù)帶聚集性分布且明顯偏離風(fēng)速-功率曲線。如圖2所示。

        圖2 異常數(shù)據(jù)類(lèi)型Fig.2 Abnormal data type

        異常類(lèi)型主要分為3 類(lèi):(1)類(lèi)型1:曲線上部分的堆積式異常數(shù)據(jù),一般由計(jì)量裝置的失靈所引起;(2)類(lèi)型2:曲線中部的堆積式異常數(shù)據(jù),一般是由限電或網(wǎng)絡(luò)故障引起;(3)類(lèi)型3:曲線周?chē)稚⑹疆惓?shù)據(jù),一般是由于氣象波動(dòng)、信號(hào)傳播噪聲等隨機(jī)情況造成。

        1.2.1K近鄰聚類(lèi)檢測(cè)

        K近鄰(K-Nearest Neighbor)是一種常用的監(jiān)督學(xué)習(xí)方法,其工作機(jī)制是隨機(jī)選定初始樣本作為起點(diǎn),計(jì)算各個(gè)樣本與所選起點(diǎn)的歐式距離來(lái)判斷相似程度,即相似分?jǐn)?shù)[22]。根據(jù)相似分?jǐn)?shù)去劃分類(lèi)別,隨后確定各類(lèi)別中心。重復(fù)上述步驟,直到起點(diǎn)不改變,劃分的樣本類(lèi)別就確定完畢。

        1.2.2 局部異常因子檢測(cè)

        局部異常因子檢測(cè)(Cluster-based Local Outlier Factor)首先通過(guò)k-means 聚類(lèi),區(qū)分出大簇和小簇[23]。然后將每簇按數(shù)據(jù)量從大到小排序之后,大簇通常占總量的90%左右,余下的就被認(rèn)為是小簇。最后計(jì)算異常點(diǎn)分?jǐn)?shù),當(dāng)數(shù)據(jù)點(diǎn)屬于大簇的時(shí)候,計(jì)算它與當(dāng)前簇的聚類(lèi)中心的距離,當(dāng)數(shù)據(jù)點(diǎn)屬于小簇時(shí),計(jì)算它與最近的大簇的聚類(lèi)中心的距離,得出異常分?jǐn)?shù),然后從大到小排序,篩選出異常值。

        1.2.3 孤立森林異常檢測(cè)

        孤立森林(Isolation Forest)算法是一種無(wú)監(jiān)督離群點(diǎn)檢測(cè)算法,該算法不使用距離或密度測(cè)度來(lái)檢測(cè)異常,而是根據(jù)所計(jì)算出樣本點(diǎn)的異常分?jǐn)?shù)來(lái)識(shí)別其中的異常點(diǎn)[24]。孤立樹(shù)林計(jì)算法首先計(jì)算每個(gè)數(shù)據(jù)的原始異常得分,然后根據(jù)孤立樹(shù)在樣本空間P中隨機(jī)選取m個(gè)特征,在所選取數(shù)據(jù)的最大值與最小值間隨機(jī)選取一個(gè)數(shù)值,以分割數(shù)據(jù)點(diǎn)。隨著觀測(cè)數(shù)據(jù)的劃分遞回的重復(fù),直至把所有的觀測(cè)值都孤立,然后再把各個(gè)樹(shù)組成孤立樹(shù)林。

        對(duì)于樣本點(diǎn)的異常值分?jǐn)?shù)S(x)定義如下:

        式中:h(x)為樣本點(diǎn)x在森林中的平均深度;c(n)為由n個(gè)點(diǎn)構(gòu)造的孤立樹(shù)的平均路徑長(zhǎng)度,計(jì)算方法如下:

        式中:H(g)為諧波函數(shù),H(g)=lng+0.58

        1.2.4 KCI集成異常檢測(cè)

        集成近鄰森林異常檢測(cè)算法(Nearest-Cluster-Isolation,KCI)是一種基于多種檢測(cè)算法的集成異常檢測(cè)。該算法利用近鄰算法、孤立森林、局部異常因子檢測(cè)分別檢測(cè)異常點(diǎn)。在理論功率曲線小波動(dòng)范圍內(nèi),篩選掉所檢測(cè)的異常點(diǎn),最后綜合3個(gè)算法檢測(cè)的結(jié)果合并為異常點(diǎn)集合,步驟為:

        1)標(biāo)記歷史風(fēng)速-功率數(shù)據(jù)集合所有樣本為初始未處理狀態(tài)。

        2)輸入3 種異常檢測(cè)算法種,分別判斷出每個(gè)樣本點(diǎn)是否為異常值,輸出3 個(gè)異常點(diǎn)集r1,r2,r3。

        3)3 個(gè)異常點(diǎn)集通過(guò)選擇門(mén)w,即計(jì)算異常點(diǎn)與理論功率曲線的橫向距離是否在理論功率的±5%內(nèi),若異常點(diǎn)被識(shí)別在該范圍內(nèi),則剔除此異常點(diǎn)。

        4)綜合篩選后的異常點(diǎn)集,輸出異常點(diǎn)集合。

        1.3 缺失值重構(gòu)

        異常值清洗之后,原始數(shù)據(jù)序列存在數(shù)據(jù)缺失,會(huì)破壞風(fēng)電數(shù)據(jù)集在時(shí)序上的連續(xù)和完整,進(jìn)而導(dǎo)致數(shù)據(jù)分析挖掘變得困難。因此需要對(duì)缺失值進(jìn)行重構(gòu),才能保證數(shù)據(jù)質(zhì)量。針對(duì)該問(wèn)題本文采用LightGBM[25],對(duì)清洗后的數(shù)據(jù)進(jìn)行深度學(xué)習(xí),生成的新的數(shù)據(jù)來(lái)重構(gòu)數(shù)據(jù)集,以此來(lái)對(duì)缺失的功率值進(jìn)行補(bǔ)充。

        LightGBM 是一種高效的梯度增強(qiáng)決策樹(shù),其本質(zhì)是多個(gè)弱回歸樹(shù)的加法模型,是梯度提升決策樹(shù)GBDT(Gradient Boosting Decision Tree)[26]的升級(jí)版本,可以有效地解決高維大量數(shù)據(jù)處理效率較低的問(wèn)題。采用互斥特征捆綁、單邊梯度采樣和高效并行新技術(shù),減少了特征數(shù)量,避免小樣本數(shù)據(jù)的影響,有效減少特征數(shù)量,提高效率和準(zhǔn)確度。

        圖3 為單棵回歸樹(shù)的結(jié)構(gòu)。LightGBM 采用leaf-wise 策略,每次對(duì)所有葉子分裂增益最大的子節(jié)點(diǎn)進(jìn)行分裂,其他葉子節(jié)點(diǎn)則不會(huì)分裂。為了避免出現(xiàn)過(guò)擬合,LightGBM 會(huì)限制葉子節(jié)點(diǎn)生長(zhǎng)過(guò)程中樹(shù)的深度,即調(diào)節(jié)max_depth 來(lái)限制樹(shù)的深度。

        圖3 單棵回歸樹(shù)結(jié)構(gòu)Fig.3 Structure of single regression tree

        2 短期風(fēng)電功率預(yù)測(cè)

        Informer 算法是一種高效的基于transformer[27]的時(shí)間序列預(yù)測(cè)模型。針對(duì)Transformer 模型的不足,Informer 采用概率稀疏自注意(ProbSparse Selfattention),能夠有效降低計(jì)算復(fù)雜度。編碼器和自注意蒸餾(Self-attention Distilling)結(jié)合,減少維度和網(wǎng)絡(luò)參數(shù)量。

        該算法的結(jié)構(gòu)框架如圖4 所示,其中Xen為編碼器的風(fēng)電歷史長(zhǎng)序列輸入,Xdn為解碼器序列輸入,Xsn為預(yù)測(cè)點(diǎn)之前的已知序列,X0為預(yù)測(cè)序列的占位符(將標(biāo)量設(shè)置為0)。左半部分編碼器接受大量風(fēng)電歷史長(zhǎng)序列輸入(紫色系列),采用概率稀疏自注意代替了常規(guī)自注意力,粉色梯形是自注意力蒸餾機(jī)制;右半部分解碼器接收長(zhǎng)序列輸入,將目標(biāo)元素置零,測(cè)量特征圖的加權(quán)注意力組成,并立即以生成方式預(yù)測(cè)輸出元素(黃色系列)。

        圖4 Informer模型框架Fig.4 Informer model framework

        2.1 概率稀疏自注意

        傳統(tǒng)的自注意力機(jī)制由Q,K,V(向量)構(gòu)成,表達(dá)式為:

        式中:Q為查詢向量(query);K為鍵向量(key);V為值向量(value);d為輸入維度。

        設(shè)qi,ki,vi分別代表Q,K,V中的第i行。第i個(gè)查詢的注意力被定義為概率形式的內(nèi)核平滑器:

        式中:k(qi,ki)為計(jì)算qi,ki的不對(duì)稱指數(shù)核;為第i個(gè)Q的條件下K的分布期望值;vj代表V中的第j行。

        傳統(tǒng)的自注意需要較大內(nèi)存和二次點(diǎn)積計(jì)算代價(jià),是其預(yù)測(cè)能力的主要缺點(diǎn)。為了保證不遺漏重要注意力且較小的計(jì)算量,通過(guò)相對(duì)熵(relative entropy)定義第i個(gè)概率稀疏度量M(qi,K)為:

        第一項(xiàng)是所有鍵向量上qi的對(duì)數(shù)求和指數(shù)函數(shù)(log-sum-exp,LSE);第二項(xiàng)則是他們的算數(shù)平均。其中,LK為鍵向量K中的鍵數(shù),Kj為K中的第j個(gè)鍵向量。然而這樣計(jì)算LSE 存在潛在的數(shù)值穩(wěn)定性問(wèn)題,通過(guò)近似qi的方式設(shè)定M值的上限:

        基于式(6)的理論,提出概率稀疏自注意機(jī)制,其表達(dá)示為:

        式中:和Q為具有大小相同的稀疏矩陣,且僅包含在稀疏度量下的qi中。

        算法復(fù)雜度用O(L)表示,L為輸入數(shù)據(jù)的量,L的規(guī)模越大,算法的執(zhí)行效率越低。該方法使得計(jì)算復(fù)雜度從O(L2)降到O(LlnL)。

        2.2 自注意蒸餾機(jī)制

        為了更高效地使用內(nèi)存和提高運(yùn)行效率,通過(guò)自注意力蒸餾機(jī)制逐次將序列長(zhǎng)度減半,第j層到第j+1層的蒸餾操作的表達(dá)式為:

        2.3 短期風(fēng)電功率預(yù)測(cè)方法流程圖

        基于數(shù)據(jù)修正的概率稀疏自注意短期風(fēng)電功率預(yù)模型流程如圖5 所示。

        圖5 基于數(shù)據(jù)修正的概率稀疏自注意短期風(fēng)電功率預(yù)測(cè)流程圖Fig.5 Flowchart of short-term wind power prediction based on data correction with probabilistic sparse selfattention

        3 實(shí)例分析

        3.1 模型參數(shù)選擇及調(diào)優(yōu)

        本文采用自動(dòng)超參數(shù)優(yōu)化Optuna 對(duì)LightGBM進(jìn)行參數(shù)調(diào)節(jié),以得到較好的缺失值重構(gòu)效果,部分關(guān)鍵參數(shù)見(jiàn)表1,其中最大深度、正則化系數(shù)α、正則化系數(shù)β無(wú)量綱。

        表1 Optuna算法參數(shù)調(diào)節(jié)結(jié)果Table 1 Parameter tuning results with Optuna algorithm

        Informer 參數(shù)設(shè)置如表2 所示。其中n_heads為多頭注意力機(jī)制中的頭數(shù),無(wú)量綱;seq_len 為控制模型輸入序列長(zhǎng)度;e_layers 為encoder 的層數(shù);d_layers 為decoder 的層數(shù);loss 為損失函數(shù)的類(lèi)型選擇;moving_avg 為移動(dòng)平均的窗口大小,無(wú)量綱。該參數(shù)用于控制模型的平滑程度,即在預(yù)測(cè)時(shí)對(duì)歷史數(shù)據(jù)進(jìn)行平滑處理,以減少噪聲和異常值的影響。

        表2 Informer參數(shù)設(shè)置Table 2 Parameter settings for Informer model

        3.2 異常檢測(cè)模型對(duì)比

        為了對(duì)風(fēng)電數(shù)據(jù)集進(jìn)行有效充分的修復(fù),采用二階段的修正策略。在第一階段,將風(fēng)電場(chǎng)數(shù)據(jù)集采用KCI 集成檢測(cè)進(jìn)行異常值識(shí)別,并與KNN 近鄰、局部異常因子檢測(cè)、孤立森林進(jìn)行實(shí)驗(yàn)比對(duì)。在進(jìn)行無(wú)監(jiān)督異常檢測(cè)前,將上述4 種方法的污染比例設(shè)置為0.05,該參數(shù)用來(lái)將連續(xù)的異常分值轉(zhuǎn)化為0(正常點(diǎn))和1(異常點(diǎn))的。

        由圖6(a)可以看出,KNN 近鄰聚類(lèi)方法在進(jìn)行風(fēng)速-功率異常檢測(cè)時(shí),類(lèi)型2 并未得到有效識(shí)別,散點(diǎn)圖中部有密集的異常點(diǎn)堆積。圖6(b)顯示在異常檢測(cè)時(shí),該方法僅將類(lèi)型2 進(jìn)行正常識(shí)別,但類(lèi)型1 和類(lèi)型3 并未得到有效的識(shí)別。如圖6(c)顯示孤立森林異常檢測(cè)能夠?qū)︻?lèi)型1 和類(lèi)型3 進(jìn)行充分識(shí)別,但是類(lèi)型2 仍識(shí)別不夠充分。圖6(d)顯示與其他算法相比,KCI 能夠較為充分地識(shí)別3 類(lèi)異常值。

        圖6 4種異常檢測(cè)算法結(jié)果對(duì)比Fig.6 Comparison of results among four anomaly detection algorithms

        為保證數(shù)據(jù)集的完整性,第二階段對(duì)異常值進(jìn)行清洗后,用LightGBM 對(duì)缺失值進(jìn)行補(bǔ)充,防止后續(xù)的數(shù)據(jù)挖掘出現(xiàn)問(wèn)題。圖7 為經(jīng)過(guò)清洗和重構(gòu)兩步預(yù)處理之后的風(fēng)速-功率曲線,該曲線保留原有的樣本趨勢(shì)下,更加貼近理論風(fēng)速-功率曲線。

        圖7 清洗重構(gòu)后的風(fēng)速-功率曲線Fig.7 Wind speed-power curve after data cleaning and reconstruction

        3.3 自原始數(shù)據(jù)輸入各模型性能對(duì)比

        本文提到的概率稀疏注意對(duì)Transformer 進(jìn)行了改進(jìn),使其訓(xùn)練時(shí)長(zhǎng)和精度都得到了有效提升,將編碼器最終輸出的特征圖進(jìn)行可視化處理如圖8所示。顏色越接近黃色稀疏程度低,接近藍(lán)色稀疏度高,Informer 的稀疏化的特征圖相比Transformer,僅對(duì)少部分位置賦予更高權(quán)重,剩余的部分權(quán)重分布平均。

        圖8 編碼器最終特征圖輸出可視化Fig.8 Visualization of final feature map output of encoder

        采用2019 年3 月至2020 年2 月的國(guó)內(nèi)某風(fēng)電場(chǎng)氣象數(shù)據(jù)和實(shí)測(cè)數(shù)據(jù)分別對(duì)四季的情況進(jìn)行實(shí)驗(yàn)分析,數(shù)據(jù)集按照1:4 劃分測(cè)試集和訓(xùn)練集。將過(guò)去1.5 h 的風(fēng)速、風(fēng)向、環(huán)境溫度等共12 個(gè)變量作為輸入,輸出變量為15 min 的風(fēng)電功率。該算例基于Python 實(shí)現(xiàn)。硬件采用CPU: AMD R-5800H,3.20 GHz,GPU: RTX 3070,8 GB,內(nèi)存:16 GB 的計(jì)算機(jī)平臺(tái)。

        基于該數(shù)據(jù)集將本文提出的Informer 模型與自注意力模型Transformer、深度分解自回歸模型Autoformer、重參數(shù)化自注意力模型Reformer 進(jìn)行實(shí)驗(yàn)比對(duì),使用擬合系數(shù)(R2),均方根誤差(Root Mean Square Error,RMSE),EMA和平均訓(xùn)練時(shí)間t對(duì)各個(gè)模型的預(yù)測(cè)精度和時(shí)間進(jìn)行評(píng)價(jià)。RMSE 的值用ERMS表示。ERMS用于衡量模型的絕對(duì)誤差,值越小,絕對(duì)誤差越小。R2表示預(yù)測(cè)功率和實(shí)際功率曲線擬合度,取值范圍為(0,1),R2的值越接近1,說(shuō)明擬合程度高,預(yù)測(cè)效果好。ERMS和R2的計(jì)算公式為:

        式中:N為預(yù)測(cè)點(diǎn)數(shù)量;i為預(yù)測(cè)點(diǎn)序號(hào);為預(yù)測(cè)值;yi為實(shí)測(cè)值;為平均值。

        原始數(shù)據(jù)輸入預(yù)測(cè)模型中,Informer 模型采用使用圖形處理器GPU 來(lái)加速深度學(xué)習(xí)模型的訓(xùn)練。將尚未清洗重構(gòu)的原始風(fēng)電數(shù)據(jù)集,歸一化后輸入各個(gè)模型中。

        從圖9 可以看出,未經(jīng)過(guò)數(shù)據(jù)修正的原始功率曲線具有顯著的間歇性,在功率值接近0 的時(shí)間段內(nèi)Autoformer,Reformer 的預(yù)測(cè)結(jié)果與實(shí)際功率曲線有著顯著的差異,而本文的Informer 模型在各個(gè)時(shí)間段均的擬合結(jié)果表現(xiàn)最佳。

        圖9 原始數(shù)據(jù)輸入各個(gè)模型性能對(duì)比(春季)Fig.9 Performance comparison of various models for raw data input(spring)

        3.4 修正后的數(shù)據(jù)集輸入各模型性能對(duì)比

        將原始風(fēng)電數(shù)據(jù)通過(guò)KCI 數(shù)據(jù)清洗和LightGBM 數(shù)據(jù)重構(gòu)來(lái)給數(shù)據(jù)降低噪聲,歸一化處理后載入到各個(gè)模型中,實(shí)驗(yàn)結(jié)果如圖10 所示,經(jīng)過(guò)數(shù)據(jù)修正之后的功率曲線,降低了氣象波動(dòng)、設(shè)備異常等誤差的影響,風(fēng)電功率得到了一定的提升,各個(gè)模型的擬合程度均有所提升。

        圖10 修正數(shù)據(jù)輸入各個(gè)模型性能對(duì)比(春季)Fig.10 Performance comparison of various models for corrected data input(spring)

        表3 為四季實(shí)驗(yàn)結(jié)果。

        表3 四季實(shí)驗(yàn)結(jié)果Table 3 Experimental results from four seasons

        由表3 所示四季數(shù)據(jù)修正前后預(yù)測(cè)模型的實(shí)驗(yàn)結(jié)構(gòu)或表明,與原始數(shù)據(jù)輸入相比,該數(shù)據(jù)修正技術(shù)減低了預(yù)測(cè)誤差,Informer 的ERMS,R2在數(shù)據(jù)修正前后都表現(xiàn)最佳。Autoformer 在數(shù)據(jù)修正后,ERMS,R2得到了明顯的提升,說(shuō)明Autoformer,Transformer 對(duì)數(shù)據(jù)噪聲較為敏感。Reformer 具有一定的抗干擾能力,但是預(yù)測(cè)模型的性能表現(xiàn)不如Informer。

        兼顧精度和更快的訓(xùn)練速度有助于電網(wǎng)調(diào)度決策,對(duì)于針對(duì)15 min 的風(fēng)電功率短期預(yù)測(cè),訓(xùn)練速度很重要。從表3 中可知,Autoformer 的訓(xùn)練時(shí)長(zhǎng)最長(zhǎng),Informer 的訓(xùn)練時(shí)長(zhǎng)最短。Informer 通過(guò)改進(jìn)Transformer 概率稀疏自注意機(jī)制、蒸餾機(jī)制使得模型訓(xùn)練更高效,訓(xùn)練時(shí)長(zhǎng)相比Transformer 有所下降。

        綜合上述,本文提出的數(shù)據(jù)修正的概率稀疏自注意短期預(yù)測(cè)相比傳統(tǒng)的預(yù)測(cè)方法有一定的優(yōu)勢(shì)。

        4 結(jié)論

        本文提出了一種數(shù)據(jù)修正的概率稀疏自注意短期風(fēng)電功率預(yù)測(cè)方法,采用集成異常檢測(cè)KCI 方法對(duì)異常值進(jìn)行檢測(cè),并利用LightGBM 對(duì)清洗后的數(shù)據(jù)進(jìn)行學(xué)習(xí),保留數(shù)據(jù)特征的同時(shí)對(duì)缺失數(shù)據(jù)集進(jìn)行修復(fù)。本文提出的概率稀疏自注意在傳統(tǒng)自注意力的基礎(chǔ)上,用概率稀疏評(píng)估篩選出重要特征,相比于其他及基準(zhǔn)算法,魯棒性更強(qiáng),具有良好精度的同時(shí),提高了預(yù)測(cè)速度。本文采用西北某風(fēng)電場(chǎng)實(shí)測(cè)數(shù)據(jù)進(jìn)行方法有效性的驗(yàn)證,結(jié)論如下:

        1)采用集成異常檢測(cè)和LightGBM 缺失值修復(fù),對(duì)比數(shù)據(jù)修正前后,4 個(gè)模型的精度都得到了提高。

        2)從擬合系數(shù)、均方根誤差、絕對(duì)誤差、訓(xùn)練時(shí)長(zhǎng)4 個(gè)方面來(lái)看,Informer 的模型效果最好,擬合系數(shù)可以達(dá)到94.5%,誤差低于其他模型。

        需要指出的是,該算法的執(zhí)行復(fù)雜度取決于數(shù)據(jù)的長(zhǎng)度和模型超參數(shù),需要根據(jù)具體情況對(duì)超參數(shù)和輸入數(shù)據(jù)長(zhǎng)度進(jìn)行調(diào)整。在實(shí)際工程中,受到各個(gè)不同風(fēng)場(chǎng)具體的地理環(huán)境影響,實(shí)際分析會(huì)存在差異性;應(yīng)注意使用合適的評(píng)價(jià)指標(biāo)(如MAE、RMSE 等)來(lái)評(píng)估模型的預(yù)測(cè)效果,并根據(jù)實(shí)際需求對(duì)模型進(jìn)行優(yōu)化;需要考慮計(jì)算資源的限制??梢酝ㄟ^(guò)降低模型的復(fù)雜度、使用知識(shí)蒸餾等方法來(lái)降低計(jì)算復(fù)雜度,以滿足實(shí)際應(yīng)用的需求。

        猜你喜歡
        檢測(cè)模型
        一半模型
        “不等式”檢測(cè)題
        “一元一次不等式”檢測(cè)題
        “一元一次不等式組”檢測(cè)題
        “幾何圖形”檢測(cè)題
        “角”檢測(cè)題
        重要模型『一線三等角』
        重尾非線性自回歸模型自加權(quán)M-估計(jì)的漸近分布
        3D打印中的模型分割與打包
        小波變換在PCB缺陷檢測(cè)中的應(yīng)用
        一区二区亚洲精美视频| 精品人妻人人做人人爽夜夜爽| 极品粉嫩嫩模大尺度无码| 国产91在线|亚洲| 激情五月开心五月av| 99re6在线视频精品免费| 久久露脸国产精品| 国产爆乳乱码女大生Av| 国产黄色一区二区福利| 日本高清一道本一区二区| 中文字幕无码毛片免费看| 成人伊人亚洲人综合网站222| 国产熟女自拍视频网站| 国产精品日韩av一区二区| 777米奇色狠狠俺去啦| 日韩一线无码av毛片免费| 国产情侣一区二区| 少妇饥渴偷公乱a级无码| 亚洲精品黄网在线观看| 国产啪啪视频在线观看| 亚洲国产精品美女久久| 老子影院午夜精品无码| 久久亚洲成a人片| 中文文精品字幕一区二区| 一区二区三区视频| 亚洲欧美国产日韩天堂在线视| 久久久国产精品粉嫩av| 久久精品人搡人妻人少妇 | 人禽伦免费交视频播放| 男人阁久久| 人妻精品久久一区二区三区| aⅴ精品无码无卡在线观看| 久青草国产视频| 一区二区三区精品婷婷| 国产女人18毛片水真多18精品| 欧美人与动牲交a欧美精品| 级毛片无码av| 国内揄拍国内精品人妻久久| 精品深夜av无码一区二区| 国产又黄又爽又无遮挡的视频| 亚洲精品大全中文字幕|