馮虎宗 張宗濤 李翔 陳江 張昆榮
(甘肅電器科學(xué)研究院 甘肅省天水市 741000)
隨著我國(guó)電網(wǎng)不斷壯大,使得電力電纜鋪設(shè)的范圍和密度也同步擴(kuò)大。電力電纜在長(zhǎng)時(shí)間內(nèi)以高壓方式供電的過(guò)程中會(huì)直接引起電纜的發(fā)熱,進(jìn)而可能導(dǎo)致電網(wǎng)局部的溫度超標(biāo),破壞絕緣介質(zhì),最終影響電網(wǎng)的安全可靠地運(yùn)行和導(dǎo)致電網(wǎng)火災(zāi);同樣,若傳統(tǒng)電纜導(dǎo)體正常運(yùn)行時(shí)的溫度太低,會(huì)大大降低對(duì)電纜資源的利用率。因此電纜溫度預(yù)測(cè)具有重要的現(xiàn)實(shí)意義。
本文提出了一種基于LSTM神經(jīng)網(wǎng)絡(luò)的電纜溫度預(yù)測(cè)方法,首先用SOM神經(jīng)網(wǎng)絡(luò)將電纜溫度序列進(jìn)行分類并構(gòu)建各類數(shù)據(jù)集,其次將各類數(shù)據(jù)集使用LSTM對(duì)其進(jìn)行訓(xùn)練,最后使用測(cè)試數(shù)據(jù)對(duì)訓(xùn)練好的網(wǎng)絡(luò)進(jìn)行驗(yàn)證,并將結(jié)果與常見(jiàn)方法對(duì)比,證明本文方法的有效性和準(zhǔn)確性。
包含三個(gè)循環(huán)結(jié)構(gòu)的LSTM如圖1所示,每個(gè)循環(huán)結(jié)構(gòu)有兩個(gè)輸出,其中一個(gè)即為單元狀態(tài),LSTM系統(tǒng)由輸入門、遺忘門、輸出門和單元狀態(tài)組成。輸入門決定當(dāng)前時(shí)刻網(wǎng)絡(luò)的輸入數(shù)據(jù)有多少需要保存到單元狀態(tài)。遺忘門決定上一時(shí)刻的單元狀態(tài)有多少需要保留到當(dāng)前時(shí)刻。輸出門控制當(dāng)前單元狀態(tài)有多少需要輸出到當(dāng)前的輸出值。各環(huán)節(jié)用公式相互連接,從數(shù)學(xué)角度實(shí)現(xiàn)物理抽象概念。
圖1:LSTM內(nèi)部結(jié)構(gòu)圖
公式(1)決定丟棄何種信息,公式(2)、(3)決定更新何種信息,公式(4)示意細(xì)胞狀態(tài)的變化,公式(5)、(6)決定信息的輸出。其中σ一般選擇sigmoid函數(shù),將輸出控制在0和1之間,0代表“全部不允許通過(guò)”,1表示“允許全部通過(guò)”。W=[Wf, Wi, WC, Wo]表示待訓(xùn)練的權(quán)重矩陣,B=[bf, bi, bC, bo]表示偏置量,表示不同時(shí)間的細(xì)胞狀態(tài)。
Som自組織神經(jīng)網(wǎng)絡(luò)通過(guò)學(xué)習(xí)輸入空間中的數(shù)據(jù),從一種降維的角度對(duì)數(shù)據(jù)進(jìn)行無(wú)監(jiān)督學(xué)習(xí)。不同于一般的神經(jīng)網(wǎng)絡(luò)使用反向傳遞算法進(jìn)行訓(xùn)練,SOM利用競(jìng)爭(zhēng)學(xué)習(xí)策略,讓神經(jīng)元之間自發(fā)互相競(jìng)爭(zhēng)并逐步優(yōu)化網(wǎng)絡(luò)。并且使用近鄰關(guān)系函數(shù)來(lái)維持輸入空間的拓?fù)浣Y(jié)構(gòu),使輸入空間中相鄰或相似的樣本會(huì)被映射到靠近的神經(jīng)元中,從而不需要人工介入的同時(shí)也可以對(duì)數(shù)據(jù)進(jìn)行聚類,且不同于k-means等聚類算法,并不預(yù)先估計(jì)聚類結(jié)果,可以最大化的挖掘出數(shù)據(jù)關(guān)系。SOM網(wǎng)絡(luò)由輸入層和輸出層構(gòu)成。輸出層又叫競(jìng)爭(zhēng)層,一般設(shè)置為由神經(jīng)元構(gòu)成的二維平面;輸入層與普通BP網(wǎng)絡(luò)輸入層類似,其大小由樣本數(shù)據(jù)的特征向量大小決定。
訓(xùn)練過(guò)程如下:
第一步:初始化權(quán)值矩陣,假設(shè)一條輸入數(shù)據(jù)有D個(gè)維度,為映射到二維神經(jīng)元上,競(jìng)爭(zhēng)層有n×m個(gè)神經(jīng)元。故有n×m個(gè)D維矩陣。
第二步:選取一個(gè)樣本X=(x1, x2, x3…xD),遍歷競(jìng)爭(zhēng)層的每一個(gè)神經(jīng)元,計(jì)算X與神經(jīng)元之間的相似度,經(jīng)過(guò)多種實(shí)驗(yàn)處理,本文最終采用歐氏距離表示X與神經(jīng)元之間的相似度。選取最小距離的神經(jīng)元作為優(yōu)勝神經(jīng)元,又叫BMU(best matching unit),根據(jù)鄰域半徑確定優(yōu)勝鄰域包括的點(diǎn),即與BMU距離較近的所有神經(jīng)元。
第三步:更新優(yōu)勝鄰域內(nèi)的節(jié)點(diǎn)權(quán)值矩陣,越靠近BMU的神經(jīng)元更新幅度越大,越遠(yuǎn)離BMU的神經(jīng)元更新幅度越小。
1.2.1 黨參總皂苷納米乳處方篩選。室溫下,將黨參總皂苷分別溶于表面活性劑(Cremophor EL40、Tween-80、Span-80)、助表面活性劑(PEG400、1,2-丙二醇)、油(辛酸癸酸甘油三酯、橄欖油)中,渦旋振蕩,直至不再溶解,測(cè)定藥物在各溶劑中的溶解情況。
θ(i,j)是一種對(duì)更新幅度的約束,與更新神經(jīng)元和BMU之間的距離有關(guān),本文用可以近似估計(jì)為高斯函數(shù)的bubble函數(shù)來(lái)表示。
第四步:迭代次數(shù)+1,返回第二步,直到滿足設(shè)定的迭代次數(shù)。
本文提出基于LSTM的電纜負(fù)荷溫度預(yù)測(cè)方法,具體步驟如下:
(1)數(shù)據(jù)預(yù)處理:將不同電纜溫度樣本數(shù)據(jù)進(jìn)行歸一化處理,消除量綱之間的影響的同時(shí)也使數(shù)據(jù)更適應(yīng)神經(jīng)網(wǎng)絡(luò),并按一定比例劃分為訓(xùn)練數(shù)據(jù)集和測(cè)試數(shù)據(jù)集。
(2)SOM聚類:提取各條數(shù)據(jù)之間的差異性,將歸一化的數(shù)據(jù)輸入SOM神經(jīng)網(wǎng)絡(luò),把相同聚類結(jié)果的數(shù)據(jù)歸為一類,為下一步的LSTM神經(jīng)網(wǎng)絡(luò)提供不同類別的數(shù)據(jù)集以提高預(yù)測(cè)精度。
(3)LSTM模型選擇:選取多種LSTM網(wǎng)絡(luò)結(jié)構(gòu),分別輸入訓(xùn)練數(shù)據(jù)并計(jì)算誤差,選擇誤差最小的網(wǎng)絡(luò)結(jié)構(gòu)作為本文選取的LSTM網(wǎng)絡(luò)模型。并分別使用SOM聚類后的數(shù)據(jù)集訓(xùn)練LSTM網(wǎng)絡(luò)參數(shù)。
(4)預(yù)測(cè)輸出并驗(yàn)證:先由SOM神經(jīng)網(wǎng)絡(luò)對(duì)測(cè)試數(shù)據(jù)集進(jìn)行聚類,然后將測(cè)試數(shù)據(jù)輸入到訓(xùn)練好的該類別LSTM網(wǎng)絡(luò)中得到本文預(yù)測(cè)值,并與真實(shí)值、BP神經(jīng)網(wǎng)絡(luò)和ARMA方法進(jìn)行對(duì)比。
一般來(lái)說(shuō),LSTM網(wǎng)絡(luò)中參數(shù)的多少與網(wǎng)絡(luò)的學(xué)習(xí)能力呈正相關(guān),與訓(xùn)練時(shí)間和效率呈負(fù)相關(guān)。不同的Time_step和cell_size同樣會(huì)對(duì)預(yù)測(cè)結(jié)果產(chǎn)生不同的影響。
表1:不同LSTM網(wǎng)絡(luò)結(jié)構(gòu)參數(shù)
為驗(yàn)證本文提出的基于LSTM的電纜負(fù)荷溫度預(yù)測(cè)方法,實(shí)驗(yàn)數(shù)據(jù)選取來(lái)自某市1個(gè)月的193條電纜負(fù)荷溫度,預(yù)測(cè)時(shí)間分辨率為一小時(shí)。實(shí)驗(yàn)的軟件框架是TensorFlow,運(yùn)行Windows10,64位操作系統(tǒng)。硬件方面,服務(wù)器是acer,AN515-52-73QL,CPU是i5-8300H,2.30GHz,內(nèi)存是8GB。
相同的數(shù)據(jù)維度之間,最大值與最小值之間可能存在較大差距。在構(gòu)建數(shù)據(jù)集時(shí)需要盡可能的消除一切影響,為了消除指標(biāo)之間的量綱影響,本文采用現(xiàn)有神經(jīng)網(wǎng)絡(luò)體系下比較簡(jiǎn)單且實(shí)用的最大-最小標(biāo)準(zhǔn)化處理方法,將電纜負(fù)荷溫度序列的所有數(shù)據(jù)分別歸一化至[0,1]區(qū)間內(nèi),如公式8所示,該方法可以加快神經(jīng)網(wǎng)絡(luò)的訓(xùn)練速度。
式中,xmax表示序列中最大值,xmin表示序列中最小值,xold是樣本數(shù)據(jù)歸一化前的值,xnew是數(shù)據(jù)歸一化后的值。將歸一化的數(shù)據(jù)經(jīng)過(guò)SOM自組織網(wǎng)絡(luò)。
為保證實(shí)驗(yàn)的科學(xué)性,隨機(jī)從每種樣本中選取40個(gè)作為訓(xùn)練樣本,10個(gè)作為測(cè)試樣本,并使用在預(yù)測(cè)領(lǐng)域常用的評(píng)價(jià)指標(biāo)均方誤差(MSE)、均方根誤差(RMSE)、平均絕對(duì)誤差(MAE)來(lái)衡量平均實(shí)驗(yàn)結(jié)果。
使用2.2章節(jié)選取的LSTM神經(jīng)網(wǎng)絡(luò)模型對(duì)各類樣本數(shù)據(jù)進(jìn)行仿真,訓(xùn)練的Batch_size設(shè)置為5,學(xué)習(xí)速率為0.004,采用Dropout方式優(yōu)化全連接層,Dropout參數(shù)設(shè)置為0.5。流程如2.1章所示,具體先將SOM網(wǎng)絡(luò)分類的數(shù)據(jù)格式調(diào)整為L(zhǎng)STM的輸入形式;然后分別對(duì)每種數(shù)據(jù)進(jìn)行訓(xùn)練和預(yù)測(cè);最后為最大化消除實(shí)驗(yàn)帶來(lái)的偶然性,將每種網(wǎng)絡(luò)對(duì)每種數(shù)據(jù)進(jìn)行多次實(shí)驗(yàn),取結(jié)果平均值作為最終預(yù)測(cè)結(jié)果進(jìn)行對(duì)比。
本文算法在MSE、RMSE、MAE三項(xiàng)指標(biāo)都有較好表現(xiàn)。從宏觀上看,比如在類別1中,本文算法MSE比第二名的BP神經(jīng)網(wǎng)絡(luò)算法低了0.9055,RMSE比第二名的BP神經(jīng)網(wǎng)絡(luò)算法低了0.4836,MAE比第二名的BP算法低了0.4912,其它類別也同樣表現(xiàn)最好。微觀上盡管在某寫固定時(shí)間不如其它方法接近真實(shí)值,但整體上與真實(shí)結(jié)果更加擬合。實(shí)驗(yàn)結(jié)果證明本文提出的算法學(xué)習(xí)能力更強(qiáng),更能發(fā)掘和領(lǐng)悟到電纜負(fù)荷溫度變化趨勢(shì),能夠?yàn)楹罄m(xù)研究提供依據(jù)。
表2:不同LSTM網(wǎng)絡(luò)訓(xùn)練誤差
針對(duì)電力電纜負(fù)荷溫度不易直接測(cè)量的問(wèn)題,本文通過(guò)SOM與LSTM神經(jīng)網(wǎng)絡(luò)相結(jié)合的方式對(duì)電纜負(fù)荷溫度進(jìn)行預(yù)測(cè),首先利用SOM神經(jīng)網(wǎng)絡(luò)對(duì)不同電纜進(jìn)行聚類并構(gòu)建不同類別的數(shù)據(jù)集,其次從不同結(jié)構(gòu)的LSTM模型中選擇出適應(yīng)該數(shù)據(jù)集的網(wǎng)絡(luò)結(jié)構(gòu),以時(shí)間序列作為輸入變量,建立了電纜溫度預(yù)測(cè)模型。結(jié)果表明,通過(guò)SOM與LSTM網(wǎng)絡(luò)相結(jié)合的方式,可以更為精確的對(duì)電纜負(fù)荷溫度作出預(yù)測(cè),能夠?yàn)楝F(xiàn)有的電纜溫度不易直接測(cè)量、目前預(yù)測(cè)精確度不高等問(wèn)題提出新的解決方案與參考價(jià)值。