毛錦偉,梁 甲,張修文
(1.防災(zāi)減災(zāi)湖北省重點實驗室(三峽大學(xué)),湖北 宜昌 443002;2.三峽大學(xué) 土木與建筑學(xué)院,湖北 宜昌 443002)
隨著我國經(jīng)濟(jì)的高速發(fā)展,電力建設(shè)需求也日益提升,“十三五”期間,經(jīng)濟(jì)發(fā)展步入新常態(tài),經(jīng)濟(jì)增長的結(jié)構(gòu)、動力等發(fā)生深刻變化,這對電力市場發(fā)展產(chǎn)生深遠(yuǎn)影響。電力發(fā)展是衡量一個國家經(jīng)濟(jì)水平的重要因素之一,對用電量的精準(zhǔn)預(yù)測有利于電力企業(yè)合理安排經(jīng)營計劃,提高經(jīng)濟(jì)效益[1]。在電力發(fā)展改革中,對新興智能技術(shù)的要求也不斷提升,智能電網(wǎng)是電力工業(yè)發(fā)展的方向和趨勢[2]。用電量預(yù)測是保證電力規(guī)劃實施運行的基礎(chǔ),只有合理采用有效預(yù)測模型才能得到精確的結(jié)果,從而保證電力規(guī)劃的經(jīng)濟(jì)性、合理性及適用性[3]。因此,如何保證用電量精準(zhǔn)預(yù)測,有效建立合理化模型成為重中之重。
目前對于用電量模型的預(yù)測方法通常為傳統(tǒng)的單耗法、彈性系數(shù)法、趨勢外推法、主成分回歸分析預(yù)測法、最小二乘回歸預(yù)測法、灰色預(yù)測法、各類神經(jīng)網(wǎng)絡(luò)預(yù)測法和時間序列分析預(yù)測法等[4]。在傳統(tǒng)神經(jīng)網(wǎng)絡(luò)分析方法中,BP神經(jīng)網(wǎng)絡(luò)是人工神經(jīng)網(wǎng)絡(luò)中的一個重要分支,已經(jīng)在用電量預(yù)測研究中取得了廣泛應(yīng)用。然而,BP神經(jīng)網(wǎng)絡(luò)屬于全局逼近網(wǎng)絡(luò),每給定網(wǎng)絡(luò)一個輸入,各個權(quán)值都需要調(diào)整,這將影響每個輸出,從而導(dǎo)致其學(xué)習(xí)的速度是一個較慢的過程。BP網(wǎng)絡(luò)是否達(dá)到收斂是與訓(xùn)練樣本的容量大小、算法、網(wǎng)絡(luò)結(jié)構(gòu)、期望誤差和訓(xùn)練步數(shù)等諸多方面都有很大的關(guān)系。
傳統(tǒng)BP神經(jīng)網(wǎng)絡(luò)在用電量預(yù)測應(yīng)用中出現(xiàn)的樣本數(shù)量缺乏和網(wǎng)絡(luò)結(jié)構(gòu)確定的問題,難以準(zhǔn)確預(yù)測,為了更好提升預(yù)測模型的精度,針對上述問題,引入SOM神經(jīng)網(wǎng)絡(luò)(Self-Orga-nizing Feature Map,SOM)[5,6]。先對整體樣本進(jìn)行自動聚類,再根據(jù)相似聚類結(jié)果分別建立RBF預(yù)測模型。RBF神經(jīng)網(wǎng)絡(luò)與BP神經(jīng)網(wǎng)絡(luò)相比,具有預(yù)算速度更快,而且不易陷入局部最小點優(yōu)點,所以選用RBF神經(jīng)網(wǎng)絡(luò)對樣本進(jìn)行建模和預(yù)測。
為了避免由于訓(xùn)練樣本點分散所導(dǎo)致的預(yù)測精度降低,采用先聚類、再分類建模和預(yù)測的方法。本文利用Matlab平臺建立SOM-RBF混合算法,構(gòu)成組合人工神經(jīng)網(wǎng)絡(luò),在評測樣本有限且訓(xùn)練樣本點分布不均勻的情況下,得到更高的預(yù)測精度,實現(xiàn)對湖北省年用電量的精準(zhǔn)預(yù)測。
1.1.1 SOM神經(jīng)網(wǎng)絡(luò)
SOM自組織特征映射網(wǎng)絡(luò)(Self-organizing Feature Map,SOM),也稱Kohonen網(wǎng)絡(luò),由荷蘭學(xué)者Teuvo Kohonen在1981年提出。SOM 網(wǎng)絡(luò)的神經(jīng)元是全連接的,該網(wǎng)絡(luò)不僅能夠?qū)W習(xí)輸入量的分布特點,還能夠?qū)W習(xí)輸入量的拓?fù)浣Y(jié)構(gòu)。通過訓(xùn)練,可以建立起這樣一種布局,它使得每個權(quán)值向量都位于輸入向量聚類的中心。樣本的密度分布或者蘊含在輸入空間樣本背后的其它特征被簡單壓縮到一個含有有限個節(jié)點的競爭平面上,使某些樣本在輸出空間中相對集中地聚在一起,由此便形成了聚類。
典型SOM網(wǎng)絡(luò)結(jié)構(gòu)如圖1所示,由輸入層和競爭層組成。輸入層神經(jīng)個數(shù)為m,競爭層由a×b個神經(jīng)元組成的二維平面陣列,輸入層與競爭層各神經(jīng)元之間實現(xiàn)全連接。
圖1 SOM網(wǎng)絡(luò)結(jié)構(gòu)圖
SOM網(wǎng)絡(luò)的一個典型特征就是可以在一維或者二維的處理單元陣列上,形成輸入信號的特征拓?fù)浞植迹虼薙OM網(wǎng)絡(luò)具有抽取輸入信號模式特征的能力。SOM網(wǎng)絡(luò)一般只包含有一維陣列和二維陣列,但也可以推廣到多維處理單元陣列中去。其算法主要包括以下四個過程[7]:
(1)評估過程
對于每一種輸入模式,在對網(wǎng)絡(luò)中所有競爭節(jié)點進(jìn)行初始化權(quán)重之后,計算它們相對于判別函數(shù)各自的函數(shù)值,其判別函數(shù)表達(dá)式如式(1)所示:
(1)
式(1)中,xi和wk分別表示輸入向量和及其對應(yīng)神經(jīng)元的權(quán)值。
(2)競爭模式
按照公式(1)所示,對在競爭層擁有最大判別函數(shù)值的神經(jīng)元,可以認(rèn)定其為本輪競爭的優(yōu)勝者。其中,可以用歐式距離最小來表示這種特定的輸入模式,其函數(shù)表達(dá)式用公式(2)表示:
(2)
(3)自學(xué)習(xí)過程
這里使用高斯鄰域函數(shù):
(3)
(4)
在批量學(xué)習(xí)方式下,以優(yōu)勝神經(jīng)元為核心的拓?fù)溧徲蛏窠?jīng)元可表示為:
(5)
(4)自組織過程
在自組織過程中,網(wǎng)絡(luò)中各個神經(jīng)元的權(quán)值按下面的等式更新。其中,在在線學(xué)習(xí)方式下,其更新等式為:
(6)
式(6)中為學(xué)習(xí)效率,在批量學(xué)習(xí)方式下,其更新等式為:
(7)
1.1.2 RBF神經(jīng)網(wǎng)絡(luò)
1988年Brookhead和Lowe將徑向基函數(shù)(Radical Basis Function,RBF)引入神經(jīng)網(wǎng)絡(luò),RBF神經(jīng)網(wǎng)絡(luò)是一種采用局部響應(yīng)的人工神經(jīng)網(wǎng)絡(luò)。其基本理念是通過隱含層對輸入層的變換,將低維的輸入數(shù)據(jù)變換到高維模式,將非線性問題轉(zhuǎn)化為線性問題。RBF神經(jīng)網(wǎng)絡(luò)屬于前向網(wǎng)絡(luò),包括輸入層、隱含層和輸出層,網(wǎng)絡(luò)結(jié)構(gòu)如圖2所示。
圖2 RBF徑向基神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)
建立一個RBF神經(jīng)網(wǎng)絡(luò)的步驟:
(1)建立神經(jīng)網(wǎng)絡(luò),添加所需的訓(xùn)練輸入矢量,輸入對應(yīng)的目標(biāo)矢量以及擴展參數(shù)。
(2)按照參數(shù)確定的算法進(jìn)行網(wǎng)絡(luò)訓(xùn)練,當(dāng)達(dá)到給定誤差要求時,確定最終網(wǎng)絡(luò)各層的權(quán)值和閾值,進(jìn)而確定網(wǎng)絡(luò)結(jié)構(gòu)用以完成訓(xùn)練。
用電量預(yù)測是一個高度非線性問題,大多數(shù)預(yù)測方法是通過對觀察某些特征因子來挖掘背后的信息。然而,這些預(yù)測因子的信息之間可能存在著非常復(fù)雜的相互作用,因此,在訓(xùn)練時,傳統(tǒng)人工神經(jīng)網(wǎng)絡(luò)容易出現(xiàn)過擬合現(xiàn)象,這樣預(yù)測可能會不夠準(zhǔn)確,但是在這種有特征因子的樣本數(shù)據(jù)中,會有相似的規(guī)律可尋,根據(jù)輸入樣本點較相似、密度大時,有領(lǐng)域預(yù)測精度更高的網(wǎng)絡(luò)特性。
實際預(yù)測中,組合人工神經(jīng)網(wǎng)絡(luò)是一種提高預(yù)測精度的有效方法,混合算法是通過對輸入樣本先聚類,組合成為相似樣本,對該樣本建立RBF神經(jīng)網(wǎng)絡(luò)預(yù)測模型,通過對樣本分類建模,將原來分布不均勻的各樣本點集中到各自相鄰的領(lǐng)域,從而預(yù)測精度將會大大提高[8]。
圖3 SOM-RBF神經(jīng)網(wǎng)絡(luò)預(yù)測系統(tǒng)工作流程
如圖3所示,組合人工神經(jīng)網(wǎng)絡(luò)預(yù)測的實現(xiàn)步驟如下:
(1)對給定的樣本進(jìn)行歸一化處理,其自變量區(qū)域為[0,1],其公式為:
xk=(xk-xmin)/(xmax-xmin)
(8)
公式(8)中,xmin為原始數(shù)據(jù)的最小值;xmax為原始數(shù)據(jù)的最大值;
(2)對于歸一化后的數(shù)據(jù)進(jìn)行SOM聚類分析,調(diào)用Matlab中的SOM 神經(jīng)網(wǎng)絡(luò)工具箱的函數(shù)命令:net=newsom(minmax(p),[x]);
(3)在SOM神經(jīng)網(wǎng)絡(luò)分出的每一種樣本類內(nèi)各自構(gòu)建一個RBF神經(jīng)網(wǎng)絡(luò),并分別用各種樣本類內(nèi)的訓(xùn)練樣本來訓(xùn)練該類的RBF神經(jīng)網(wǎng)絡(luò);
(4)對預(yù)測完后的值反歸一化處理,得到用電量具體值,通過與實際用電量誤差分析,判斷該組合神經(jīng)網(wǎng)絡(luò)的預(yù)測效果。
本文利用文獻(xiàn)[9]給出的從1997年到2016年10個影響因素和湖北省年用電量統(tǒng)計數(shù)據(jù)(見表1)可以看出,影響用電量的因素有很多種,這說明對用電量的預(yù)測是一個高度非線性問題,對10個主要影響因素和湖北省用電量均經(jīng)歸一化處理,作為輸入和目標(biāo)向量。其中,本文采取按數(shù)量隨機抽取訓(xùn)練樣本和測試樣本的選取策略,從20個樣本選取6、11、15、19、20進(jìn)行預(yù)測解決前組作為網(wǎng)絡(luò)的訓(xùn)練樣本,其余15組數(shù)據(jù)作為訓(xùn)練樣本。由于樣本數(shù)據(jù)向量中各個指標(biāo)有所不同,為了防止部分神經(jīng)元達(dá)到過飽和狀態(tài)以及方便計算,先對樣本的輸入數(shù)據(jù)進(jìn)行預(yù)處理。
表1 湖北省用電量與影響因素統(tǒng)計表
(1)本文調(diào)用Matlab[10]神經(jīng)網(wǎng)絡(luò)工具箱中的函數(shù)命令對樣本進(jìn)行分類:
net=newsom(minmax(P),[1,a]);net.trainParam.epochs=b;
其中,a為分類數(shù)目,b為訓(xùn)練次數(shù)。由訓(xùn)練結(jié)果可知,當(dāng)訓(xùn)練次數(shù)大于200次的時候,訓(xùn)練結(jié)果和100次相同,所以,訓(xùn)練次數(shù)的增加就沒有太大意義。所以選擇訓(xùn)練200次。分別取a=3,4,5,如表2所示:
表2 SOM聚類分成三類結(jié)果
如表2所示。由實際情況分析和上面三個表格的分類比較可以看出,將20組數(shù)據(jù)自適應(yīng)分成4類比較合適。其中預(yù)測樣本編號6為Ⅰ類,11為Ⅱ類,15為Ⅲ類,19、20為Ⅳ類。
(2)分別針對已經(jīng)分好的每一類樣本采用RBF神經(jīng)網(wǎng)絡(luò)進(jìn)行建模。根據(jù)影響用電量的影響因素、實際數(shù)據(jù)和其網(wǎng)絡(luò)自身的特點,確定RBF神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)參數(shù),調(diào)用RBF網(wǎng)絡(luò)工具箱如下:
net=newrbe(P,T,SPREAD)
其中 P代表訓(xùn)練樣本輸入,T代表訓(xùn)練樣本的輸出,即目標(biāo)向量,SPREAD為徑向基函數(shù)的分布密度,取不同的spread值,分別對神經(jīng)網(wǎng)絡(luò)進(jìn)行多次嘗試性訓(xùn)練后,Ⅰ類、Ⅱ類、Ⅳ類選取最佳值30,Ⅲ類選取最佳值為0.5。
(3)樣本訓(xùn)練過程就是RBF神經(jīng)網(wǎng)絡(luò)的建立過程。訓(xùn)練完之后,即可用于對測試樣本的預(yù)測。
根據(jù)上述預(yù)測步驟,通過Matlab結(jié)合表1數(shù)據(jù)建立年用電量預(yù)測模型進(jìn)行仿真試驗,樣本編號6、11、15、19、20作為測試樣本,輸入到SOM-RBF神經(jīng)網(wǎng)絡(luò)預(yù)測模型,可以得到該組訓(xùn)練樣本下實際值和預(yù)測值的對比,如圖4所示。
由圖4可知,該預(yù)測模型在5個樣本的預(yù)測上有著較好的擬合結(jié)果,對相關(guān)10個影響因素的變化有著良好的跟蹤能力,預(yù)測效果較好,并且對年用電量擬合精度較高,有著較為不錯的預(yù)測表現(xiàn)。
如圖5所示,本文分別建立單一的BP神經(jīng)網(wǎng)絡(luò)和RBF神經(jīng)網(wǎng)絡(luò),對比SOM-RBF神經(jīng)網(wǎng)絡(luò),可以看出在預(yù)測效果上更接近實際值,混合算法比傳統(tǒng)神經(jīng)網(wǎng)絡(luò)的預(yù)測優(yōu)勢更加明顯,BP、RBF在19和20樣本數(shù)據(jù)表現(xiàn)出較大的誤差,離散程度更大。
圖4 年用電量真實值與預(yù)測值對比圖
圖5 三種神經(jīng)網(wǎng)絡(luò)對比圖
將本文采用的 SOM-RBF 組合網(wǎng)絡(luò)預(yù)測的結(jié)果,與直接應(yīng)用BP神經(jīng)網(wǎng)絡(luò)模型和RBF神經(jīng)網(wǎng)絡(luò)模型的預(yù)測結(jié)果進(jìn)行對比,結(jié)果見表3??梢钥闯?,BP網(wǎng)絡(luò)的預(yù)測結(jié)果,其相對誤差最大達(dá)到了16.19%,最小也為2.24%;RBF相對誤差最大為9.09%,而混合SOM-RBF 網(wǎng)絡(luò)組合模型的預(yù)測結(jié)果,除19號樣本外,相對誤差都在3%以下。這是因為神經(jīng)網(wǎng)絡(luò)預(yù)測的準(zhǔn)確性和訓(xùn)練樣本數(shù)據(jù)的多少有較大的關(guān)系,特別是對BP神經(jīng)網(wǎng)絡(luò)來說,如果缺乏足夠多的訓(xùn)練數(shù)據(jù),網(wǎng)絡(luò)預(yù)測值可能存在較大的誤差。而精確網(wǎng)絡(luò)適合樣本數(shù)據(jù)較少的情況,能夠更有效提高誤差精度。
表3 三種預(yù)測模型預(yù)測效果對比分析
通過本文對湖北省近20年用電量數(shù)據(jù)樣本進(jìn)行分析,可以看出用電量是一種非線性數(shù)據(jù),傳統(tǒng)神經(jīng)網(wǎng)絡(luò)在面對非線性問題上有很好的處理能力,這往往需要大量樣本進(jìn)行網(wǎng)絡(luò)訓(xùn)練,對于預(yù)測精度問題仍是研究的重點和難點。在面對用電量數(shù)據(jù)監(jiān)測和采集不足的情況下,利用某些影響因素之間的關(guān)聯(lián)性,結(jié)合SOM和RBF各自的特點,聚類后再分別建模預(yù)測,從而提升預(yù)測模型的精度。試驗結(jié)果表明:較傳統(tǒng)BP神經(jīng)網(wǎng)絡(luò)和RBF神經(jīng)網(wǎng)絡(luò)模型,該方法有更高的擬合精度和泛化能力,預(yù)測的相對誤差較小,能更加有效地應(yīng)用到用電量預(yù)測中。