摘 要:針對光伏發(fā)電功率存在的較大隨機性和不確定性問題,提出一種基于改進長短期記憶神經網絡的光伏發(fā)電功率預測方法,以此提高光伏發(fā)電功率預測的準確性。首先,分析與光伏發(fā)電出力相關性較強的氣象特征,并利用t分布近鄰嵌入降維技術將被選取的特征數據降至二維,以減小數據復雜度。然后,通過密度峰值聚類將降維后的數據自動聚成3類,幫助訓練長短期記憶神經網絡預測模型。與傳統(tǒng)循環(huán)神經網絡和長短期記憶神經網絡模型相比,所提模型在光伏發(fā)電功率預測方面表現出較高的預測精度,MSE減少49.00%和31.77%,RMSE減少28.59%和17.41%,MAE減少62.35%和53.52%。研究結果表明,該模型在光伏發(fā)電功率預測方面具有較好的適用性。
關鍵詞:光伏出力;預測;神經網絡;聚類分析;[t]分布近鄰嵌入
中圖分類號:TM615" " " " " " " " " " " " " " " "文獻標志碼:A
0 引 言
光伏發(fā)電相對于傳統(tǒng)化石能源發(fā)電形式,更具環(huán)保性,可有效解決環(huán)境污染對生態(tài)的影響,對推進可持續(xù)發(fā)展具有重要的戰(zhàn)略意義[1-2]。隨著光伏發(fā)電裝機容量占比的不斷提升,光伏發(fā)電所帶來的問題也不容忽視。由于高比例的光伏和風電的接入,電網所承擔的安全風險也在增加[3]。光伏發(fā)電在供電時,因受當地天氣條件、氣候特征等外部環(huán)境的影響,發(fā)電功率不穩(wěn)定,功率難以準確預測,不可避免地會產生較大預測誤差。因此,分析影響光伏發(fā)電的特征因素,可實現較為準確的出力預測,減小預測誤差,從而實現經濟效益最大化。例如,太陽能隨季節(jié)、天氣、晝夜的變化,光伏發(fā)電出力不連續(xù)且波動較大[4],對后續(xù)未配置儲能系統(tǒng)并入電網進行調度帶來較大的困難[5]。因此,進行光伏發(fā)電功率預測對于電網的安全穩(wěn)定運行具有重要的意義。
短期的光伏發(fā)電功率預測是如今可再生能源領域的熱點之一,深度學習方法已廣泛應用于發(fā)電預測領域[6-8]。文獻[9]將長短期記憶神經網絡(long short-term memory, LSTM)和卷積神經網絡(convolutional neural network,CNN)相結合,構建了一個混合深度學習模型預測光伏出力;文獻[10]結合經驗模態(tài)分解方法和權值共享門控循環(huán)單元對風電場的功率進行了預測,實驗證明了經驗模態(tài)分解可有效提高預測精度;文獻[11]提出一種針對光伏出力改進時間卷積神經網絡的概率預測方法,采用變分模態(tài)分解方法分解光伏出力序列,最后用核密度估計了光伏出力概率密度曲線。文獻[12]采用[t]分布近鄰嵌入([t]-distributed stochastic neighbor embedding, [t]-SNE)降維方法對原始的負荷數據降維,有效解決了臺區(qū)的的特征維度過高帶來的計算的復雜問題;文獻[13]將密度峰值聚類和長短期記憶神經網絡結合對風電場的風速進行預測,首先聚類成不同類別,然后對同類的風速進行了預測;文獻[14]針對負荷的不確定性提出一種自適應的密度峰值聚類方法,有效解決了密度峰值的聚類弊端,針對不同類型的負荷數據,其適應能力更強、魯棒性更佳;文獻[15]采用密度峰值聚類對光伏發(fā)電功率進行聚類,然后采用廣義回歸神經網絡對不同的光伏功率聚類類別進行預測,但其對于高維的光伏特征聚類效果不佳,適用范圍較??;文獻[16]將模糊[C]均值聚類-隨機森林算法和長短期記憶神經網絡相結合對分布式光伏電站進行了功率預測,所得結果預測的誤差波動性小。
現有的功率預測方法在數據處理方面還存在不足,本文基于長短期記憶神經網絡進行改進,選取相關性強的特征數據,采用非線性降維方法([t]分布近鄰嵌入法)對特征數據進行降維,相對于只能處理線性相關的數據傳統(tǒng)線性降維方法主成分分析法,[t]分布近鄰嵌入法能保留非線性的數據關系,能更好地展現出復雜數據的特征和結構,更有利于提取新能源特征數據的隱藏信息。然后采用密度峰值聚類對降維后的數據進行聚類,與傳統(tǒng)聚類方法需人為確定聚類中心和聚類數量的區(qū)別是,密度峰值聚類能自動確定聚類中心和聚類數量,聚類速度快、魯棒性強。最后,將聚類后的每一類構建長短期記憶神經網絡模型,得到光伏發(fā)電功率預測結果。
1 理論基礎
光伏發(fā)電數據特征多樣且存在較大不確定性,每個特征的數值單位存在差異,為更好地訓練模型,采用最大最小歸一化處理原始特征數據。
1.1 最大最小歸一化
對數據進行歸一化處理可避免神經元過于飽和,歸一化處理后可將不同特征值的取值限定在0~1區(qū)間內,最大最小歸一化的公式為:
[zi=yi-yminymax-ymin] (1)
式中:[zi]——最大最小歸一化處理后的數據;[yi]——原始數據;[ymin]——原始數據特征的最小值;[ymax]——原始數據特征的最大值。
1.2 t分布近鄰嵌入法
[t]分布近鄰嵌入法是一種無監(jiān)督的能對特征進行降維的隨機算法[12]。[t]-SNE降維作為一種非線性降維方法,可挖掘高維數據的深層信息,最大程度地保留原始數據的結構和特征。對于特征數據集進行降維的步驟為:
1)構建高斯概率分布矩陣[P]?;诟咚垢怕史植己瘮祵祿c[xi]和[xj]之間的歐氏距離轉化為概率相似度,從而構建高斯概率分布矩陣[P]。具體為:
[pij=pij+pji2N] (2)
[pji=exp-X′i-X′j22σ2ik≠iexp-X′i-X′j22σ2i] (3)
[Pi=Pi1,Pi2,…,PiN] (4)
[P=P1,P2,…,PN] (5)
式中:[pij]——[xi]和[xj]之間的概率相似度;[σi]——高斯模型的標準差;[Pi]——相似度矩陣。
2)求低維數據中的[t]分布概率矩陣[Q]。在低維空間采用[t]分布函數將數據點之間的歐式距離轉化為概率相似度[qij]:
[qij=1+Yi-Yj2-1k≠l1+Yi-Yl2-1] (6)
[Qi=qi1,qi2,…,qiN] (7)
[Q=Q1,Q2,…,QN] (8)
式中:[Yi]——低維度下特征集;[Qi]——相似性度量矩陣。
3)使用KL散度迭代求[Y]?;贙ullback-Leible散度的梯度下降從而找到最小化[pij]和[qij]不匹配的低維數據。
[iKPiQi=ijpjilgpjiqji] (9)
如果[pij]大,則需一個較大的[qij]值來表示具有更高相似性的局部點;如果[pij]小,則需一個較小的[qij]值來表示相距較遠的局部點。
1.3 密度峰值聚類
密度峰值聚類(density peak clustering, DPC)能彌補傳統(tǒng)聚類算法不能自動確定聚類中心和聚類數量的不足,還能快速找到數據點中的密度峰值[15],同時還具有識別任意簇型、所需參數少的優(yōu)點。對于數據集[X=x1,x2,…,xn],其對應的下標集為[IX=1,2,…,N]。運用DPC進行聚類的步驟如下:
1)計算數據點兩兩之間的距離[dij]。引入歐式距離來表示不同樣本在空間距離上的數值差異,其表達式為:
[dij=k=1nxik-xjk212] (10)
2)找到密度計算的截斷距離[dc]。要求平均每個點周圍距離小于[dc]點的數量占總數的1%~2%。
3)計算每個點的局部密度[ρi]。局部密度采用高斯核函數,其表達式為:
[ρi=j=Ixe-dijdc2] (11)
4)找到距離其最近點的距離[δi],即如果數據點[xi]的局部密度取值最大時,則該樣本點的距離長度為在所有數據中與數據點[xi]之間距離最遠的數據點到數據點[xi]的距離;否則,該樣本點的距離表示該樣本點與其距離最近,且密度高于自身的樣本距離。
[δi=minj: ρjgt;ρidijδi=maxj∈cdij] (12
5)選擇數據聚類中心。
6)對除聚類中心的點進行聚類。
1.4 長短期記憶神經網絡
長短期記憶神經網絡能有效處理過去的信息,適用于時間序列的數據預測。LSTM作為RNN的一種,能有效解決RNN的梯度消失和梯度爆炸的問題,長短期記憶神經網絡的基本結構有輸入門、輸出門和遺忘門,能保留原始數據的有效信息,從而達到記憶的功能。對于原始數據序列[x=(x1, x2, …, xn)],循環(huán)神經網絡的計算公式為:
[ht=faWxhxt+Whhht-1+bh] (13)
[yt=Whyht+by] (14)
式中:[fa]——激活函數;[W]——權重系數矩陣;[b]——偏置向量;下標[t]——時刻。
LSTM的結構如圖2所示,計算過程如式(15)~式(19)所示。
[it=σWxixt+Whiht-1+WciCt-1+bi] (15)
[ft=σWxfxt+Whfht-1+WcfCt-1+bf] (16)
[Ct=ftCt-1+ittanhWxcxt+Whcht-1+bc] (17)
[ot=σWxoxt+Whoht-1+WcoCt+bo] (18)
[ht=ottanhCt] (19)
式中:i——輸入門;f——遺忘門;[C]——細胞狀態(tài);[o]——輸出門;[σ]——sigmoid激活函數;tanh——雙曲正切激活函數。
2 構建光伏發(fā)電功率預測模型
基于以上理論,本文構建一種t-SNE-DPC-LSTM的光伏發(fā)電功率預測模型。首先分析影響光伏發(fā)電功率的氣象因素,選取相關性大的特征數據進行降維,然后將降維后的數據進行聚類,最后將聚類后的數據分別輸入到長短期記憶神經網絡中進行預測。
2.1 光伏發(fā)電功率影響因素
光伏發(fā)電功率的輸出很大程度上取決于氣象參數的變化。影響光伏發(fā)電功率大小的因素有氣溫、相對濕度、地面氣壓、太陽輻照度、風速、風向等。通過計算氣象特征數據和光伏發(fā)電功率的Person相關系數,所得結果如表1所示。
根據表1,選用氣溫、云層不透明度、太陽輻照度、相對濕度以及歷史光伏發(fā)電數據作為原始特征輸入數據。氣溫、云層不透明度和太陽輻照度與實際功率呈正相關,相對濕度與實際功率呈負相關。分析其原因,不同的天氣類型氣溫會有所不同,晴天、雨天和多云等不同天氣類型帶來的太陽輻射量也會有所變化,從而造成光伏發(fā)電功率的變化[17]。大氣云層會相應地遮擋照射到地表的太陽輻射,造成光伏發(fā)電的隨機性與波動性。太陽輻照度和實際功率表現出強相關性,輻照度越高太陽輻射量越多,光伏發(fā)電功率也越大。相對濕度最主要的是會干擾光輻射在空氣中的穿透能力以及光伏組件的吸熱性能從而影響光伏發(fā)電功率的大?。?8]。
2.2 光伏發(fā)電功率預測步驟
光伏發(fā)電功率預測的流程如圖3所示。
1)輸入原始光伏特征數據,將原始特征數據進行歸一化處理,選取[N]個相關性強的特征數據;
2)采用t-SNE方法對[N]維特征數據進行降維,將[N]維數據降至二維;
3)降維后的數據進行密度峰值聚類,得[M]個類別的聚類數據;
4)采用長短期記憶網絡分別對[M]類的光伏發(fā)電功率數據進行功率預測。
3 算例分析
為驗證本文所提方法的有效性及可行性,采用華東某地區(qū)2020年1月1日—4月30日共11616個點的光伏發(fā)電數據和氣象數據作為本文的數據集,采樣間隔為15 min。將訓練集和驗證集按4∶1的比例進行劃分,同時為對比分析本文模型的性能,將RNN模型和LSTM模型與本文模型進行對比。
3.1 實驗配置及參數設置
該算例在具有Intel? Xeon? Gold 5217 CPU@3.00 GHz,32 GB內存的計算機上執(zhí)行。模型開發(fā)代碼基于Matlab編寫。本文在進行實驗驗證時采用網格搜索方法調整3種模型的參數,經網格搜索后,3個方法模型預測精度較高時參數不完全一致,RNN模型在初始學習率0.005、學習下降因子為0.5時預測精度較高,LSTM模型在初始學習率0.005、學習下降因子為0.2時預測精度較高。本文模型實驗參數設置如表2所示。
3.2 模型評價指標
本文采用均方誤差(mean squared error, MSE)、均方根誤差(root mean squared error, RMSE)、平均絕對誤差(mean absolute error, MAE)、這3個評價指標來評價本文所設計模型的預測效果。其計算公式為:
[εMSE=1ni=1n(Zi-Z′i)2] (20)
[εRMSE=1ni=1n(Zi-Z′i)2] (21)
[εMAE=1ni=1nZi-Z'i] (22)
式中:[Zi]——真實值;[Z'i]——預測值。
3.3 特征數據t-SNE降維
根據表1氣象因素與光伏發(fā)電功率相關系數大小,本文選用氣溫、云層不透明度,太陽輻照度、相對濕度、歷史光伏數據作為原始特征輸入數據。輸入特征維度為五維,因氣象因素存在較大不確定性,相關特征數值差異較大,因此采用非線性降維方法t-SNE降維來減小特征數據的維度,本文將特征數據經t-SNE降維至二維。特征數據經t-SNE降維后的結果如圖4所示,橫、縱坐標數值分別表示輸入五維特征降維后映射的兩個維度數據。降維后數據的復雜度減小,模型的計算量降低,有利于提高模型計算速度。
3.4 DPC聚類
選定的特征數據經過降維后,數據復雜度大大降低,為提高預測的精確性,本文采用密度峰值聚類對降維后的特征數據進行聚類,密度峰值聚類相較于傳統(tǒng)的聚類方法具有簡單高效的優(yōu)勢,也無需提前劃分類簇,適用性更強。圖5為經密度峰值聚類后的結果,橫、縱坐標數值分別表示輸入五維特征降維后映射的兩個維度數據。將降維后的數據聚成3類,分別為類簇1、類簇2、類簇3。各類簇訓練集和測試集的劃分如表3所示。
3.5 預測模型結果分析
將聚類后的3類數據分別輸入到LSTM模型里進行預測,類簇1~3所得預測結果如圖6所示。從圖6a可知,類簇1的發(fā)電功率數據差異性較大,光伏發(fā)電功率數值的峰值落差相對較大。從圖6b可知,類簇2發(fā)電功率數據的峰值存在一定差異,光伏發(fā)電功率數值的峰值落差相對于類簇1稍小,
但類簇2的發(fā)電功率數據的波動性相較于類簇1稍大,發(fā)電功率不穩(wěn)定。從圖6c可知,類簇3的發(fā)電功率數據差異性和峰值落差比類簇1和類簇2相對較小,發(fā)電功率更為穩(wěn)定,可能是由于天氣的因素導致類簇1和類簇2發(fā)電功率出現了波動。
3.6 對比實驗結果分析
為驗證本文模型選取t-SNE降維方法和密度峰值聚類方法對原始特征數據進行處理的有效性,將本文模型的預測結果和未經改進的長短期記憶神經網絡預測模型進行對比,同時還將循環(huán)神經網絡模型RNN與本文模型進行對比。圖7所示為3個模型的預測結果圖。表4所示各模型的預測誤差指數。
分析圖7和表4可知,LSTM模型相較于RNN模型均方誤差MSE減少25.24%,均方根誤差RMSE降低13.54%,平均絕對誤差MAE減少18.99%,所有指標均有所降低。本文對原有LSTM模型進行改進,選取與光伏發(fā)電功率相關較強的有關特征數據,采用降維和聚類對數據進行預處理。從表4可知,本文模型相對于LSTM模型,在均方誤差MSE減少31.77%,均方根誤差RMSE降了17.41%,平均絕對誤差MAE減少53.52%。
LSTM模型結構相較于RNN模型增加了遺忘門,更加利于特征數據的流通和篩選,在一定程度上減少了數據的冗余。本文方法在原有LSTM模型的基礎上增加了降維和聚類,對于數據的處理更為細致,也能有效提高計算精度,所以在實驗驗證時與RNN模型和原有LSTM模型進行對比,可驗證本文方法可處理高維數據的有效性,以及提高預測精度的適用性。綜上,本文模型的綜合預測效果最佳,適用性較強。
4 結 論
本文針對光伏發(fā)電功率存在較大的隨機性和不確定性,提出一種基于改進LSTM的光伏發(fā)電功率預測方法。具體來說,本文分析了與光伏發(fā)電功率相關性較強的天氣特征,包括有氣溫、云層不透明度、太陽輻照度、相對濕度。經過多次實驗對比,本文模型主要存在以下幾點優(yōu)勢:
1)選用與光伏發(fā)電功率相關系數強的特征數據和歷史光伏發(fā)電數據作為本文所采用的t-SNE降維的輸入數據,將特征數據降至二維有效數據,在保留有效特征數據的同時還能降低數據復雜度,減小模型計算量。
2)降維后的數據采用密度峰值聚類將數據聚成3類,將有相同特性的數據聚成一類,能更好地幫助新能源功率預測模型訓練模型,從而提高預測精度。
3)將本文模型與RNN模型和原有LSTM模型的預測結果進行比較,MSE分別減少49.00%、31.77%,RMSE分別降低28.59%、17.41%,MAE分別減少62.35%、53.52%。
[參考文獻]
[1] 賈凌云, 云斯寧, 趙澤妮, 等. 神經網絡短期光伏發(fā)電預測的應用研究進展[J]. 太陽能學報, 2022, 43(12): 88-97.
JIA L Y, YUN S N, ZHAO Z N, et al. Recent progress of short-term forecasting of photovoltaic generation based on artificial neural networks[J]. Acta energiae solaris sinica, 2022, 43(12): 88-97.
[2] DUDA J, KUSA R, PIETRUSZKO S, et al. Development of roadmap for photovoltaic solar technologies and market in Poland[J]. Energies, 2021, 15(1): 174.
[3] 宋文峰, 王倩, 李亞楠, 等. 基于雙饋風電場低電壓穿越的高溫超導故障限流器建模及其參數優(yōu)化[J]. 電力系統(tǒng)保護與控制, 2019, 47(18): 99-107.
SONG W F, WANG Q, LI Y N, et al. Modeling and parameter optimization of HTS-FCL based on low voltage ride-through of doubly-fed wind farm[J]. Power system protection and control, 2019, 47(18): 99-107.
[4] ZHANG F, WANG X H, WU M Y, et al. Optimization design of uncertain parameters for improving the stability of photovoltaic system[J]. Journal of power sources, 2022, 521: 230959.
[5] SENS L, NEULING U, KALTSCHMITT M. Capital expenditure and levelized cost of electricity of photovoltaic plants and wind turbines: development by 2050[J]. Renewable energy, 2022, 185: 525-537.
[6] 李燚航, 翟衛(wèi)欣, 顏寒祺, 等. 基于U-net神經網絡模型的PM2.5逐小時濃度值預測模型[J]. 北京大學學報(自然科學版), 2020, 56(5): 796-804.
LI Y H, ZHAI W X, YAN H Q, et al. Prediction of PM2.5 hour concentration based on U-net neural network[J]. Acta scientiarum naturalium universitatis pekinensis, 2020, 56(5): 796-804.
[7] 宋飛揚, 鐵治欣, 黃澤華, 等. 基于KNN-LSTM的PM2.5濃度預測模型[J]. 計算機系統(tǒng)應用, 2020, 29(7): 193-198.
SONG F Y, TIE Z X, HUANG Z H, et al. PM2.5 concentration prediction model based on KNN-LSTM[J]. Computer systems amp; applications, 2020, 29(7): 193-198.
[8] 肖云鵬, 王錫凡, 王秀麗, 等. 面向高比例可再生能源的電力市場研究綜述[J]. 中國電機工程學報, 2018, 38(3): 663-674.
XIAO Y P, WANG X F, WANG X L, et al. Review on electricity market towards high proportion of renewable energy[J]. Proceedings of the CSEE, 2018, 38(3): 663-674.
[9] WANG K J, QI X X, LIU H D. Photovoltaic power forecasting based LSTM-convolutional network[J]. Energy, 2019, 189: 116225.
[10] 盛四清, 金航, 劉長榮. 基于VMD-WSGRU的風電場發(fā)電功率中短期及短期預測[J]. 電網技術, 2022, 46(3): 897-904.
SHENG S Q, JIN H, LIU C R. Short-term and mid-short-term wind power forecasting based on VMD-WSGRU[J]. Power system technology, 2022, 46(3): 897-904.
[11] 邢晨, 張照貝. 基于改進時間卷積網絡的短期光伏出力概率預測方法[J]. 太陽能學報, 2023, 44(2): 373-380.
XING C, ZHANG Z B. Short-term probabilistic forecasting method of photovoltaic output power based on improved temporal convolutional network[J]. Acta energiae solaris sinica, 2023, 44(2): 373-380.
[12] 連子寬, 姚力, 劉晟源, 等. 基于t-SNE降維和BIRCH聚類的單相用戶相位及表箱辨識[J]. 電力系統(tǒng)自動化, 2020, 44(8): 176-184.
LIAN Z K, YAO L, LIU S Y, et al. Phase and meter box identification for single-phase users based on t-SNE dimension reduction and BIRCH clustering[J]. Automation of electric power systems, 2020, 44(8): 176-184.
[13] 王東風, 李嘉宇, 黃宇, 等. 風電場風速預測的密度峰值聚類方法研究[J]. 太陽能學報, 2021, 42(12): 110-118.
WANG D F, LI J Y, HUANG Y, et al. Research on density peaks clustering method for wind speed prediction of wind farms[J]. Acta energiae solaris sinica, 2021, 42(12): 110-118.
[14] 姚黃金, 雷霞, 付鑫權, 等. 基于改進自適應密度峰值算法的日負荷曲線聚類分析[J]. 電力系統(tǒng)保護與控制, 2022, 50(3): 121-130.
YAO H J, LEI X, FU X Q, et al. Cluster analysis of daily load curves based on an improved self-adaptive density peak clustering algorithm[J]. Power system protection and control, 2022, 50(3): 121-130.
[15] 姚宏民, 杜欣慧, 秦文萍. 基于密度峰值聚類及GRNN神經網絡的光伏發(fā)電功率預測方法[J]. 太陽能學報, 2020, 41(9): 184-190.
YAO H M, DU X H, QIN W P. PV power forecasting approach based on density peaks clustering and general regression neural network[J]. Acta energiae solaris sinica, 2020, 41(9): 184-190.
[16] 方鵬, 高亞棟, 潘國兵, 等. 基于LSTM神經網絡的中長期光伏電站發(fā)電量預測方法研究[J]. 可再生能源, 2022, 40(1): 48-54.
FANG P, GAO Y D, PAN G B, et al. Research on forecasting method of mid-and long-term photovoltaic power" "generation" "based" "on" LSTM" neural" network[J]. Renewable energy resources, 2022, 40(1): 48-54.
[17] 李瑞青. 計及氣象因素的超短期光伏電站出力預測研究[D]. 吉林: 東北電力大學, 2019.
LI R Q. Study on output prediction of ultra-short-term photovoltaic power station considering meteorological factors[D]. Jilin: Northeast Dianli University, 2019.
[18] GANDOMAN F H, ABDEL ALEEM S H E, OMAR N, et al. Short-term solar power forecasting considering cloud coverage" "and" ambient" temperature" variation" effects[J]. Renewable energy, 2018, 123: 793-805.
RESEARCH ON PHOTOVOITAIC POWER PREDICTION
METHOD BASED ON IMPROVED LSTM
Peng Shurong,Chen Huixia ,Sun Wantong,Guo Lijuan,Li Bin
(School of Electrical and Information Engineering, Changsha University of Science and Technology, Changsha 410004, China)
Abstract:In response to the significant randomness and uncertainty issues in photovoltaic power, this paper proposes an improved LSTM based photovoltaic power prediction method to improve the accuracy of photovoltaic power prediction. Firstly, meteorological features with strong correlation with photovoltaic output were analyzed, and the t-distribution nearest neighbor embedding dimensionality reduction technique was used to reduce the selected feature data to 2D to reduce data complexity. Then, the reduced dimensionality data is automatically clustered into three categories through density peak clustering to help train the LSTM prediction model. Compared with the traditional Recurrent neural network and Long short-term memory neural network models, the model proposed in this paper shows higher prediction accuracy in photovoltaic power prediction. MSE decreases by 49.00% and 31.77%, RMSE decreases by 28.59% and 17.41%, and MAE decreases by 62.35% and 53.52%. The research results indicate that the model has good applicability in photovoltaic power prediction, providing valuable reference for the optimization and scheduling of integrated energy systems.
Keywords:photovoltaic output; prediction; neural network; cluster analysis; t-distribution nearest neighbor embedding