◆王璐 程曉榮
基于大數(shù)據(jù)的信息融合技術(shù)在電力系統(tǒng)中的應(yīng)用
◆王璐 程曉榮
(華北電力大學(xué)(保定) 控制與計(jì)算機(jī)工程學(xué)院 河北 071000)
伴隨著電力行業(yè)中系統(tǒng)和設(shè)備的不斷升級(jí),出現(xiàn)了大量需要處理的數(shù)據(jù)集,電力行業(yè)進(jìn)入大數(shù)據(jù)時(shí)期。這使得傳統(tǒng)的電力系統(tǒng)無(wú)法滿(mǎn)足新的需求,所以引進(jìn)新的算法和框架。本文首先分析了傳統(tǒng)數(shù)據(jù)融合算法的缺點(diǎn),然后分析了新的Hermite正交基前神經(jīng)網(wǎng)絡(luò)的算法,并且電力系統(tǒng)要處理大規(guī)模的數(shù)據(jù)集,因此加入MapReduce框架,將其與該算法相結(jié)合。通過(guò)對(duì)上述算法實(shí)驗(yàn)的結(jié)果進(jìn)行分析,證實(shí)了該算法對(duì)于電力行業(yè)的大數(shù)據(jù)處理非常高效。
電力行業(yè);大數(shù)據(jù);神經(jīng)網(wǎng)絡(luò)
當(dāng)前的社會(huì)中,大數(shù)據(jù)技術(shù)發(fā)展很快速,并且對(duì)于大數(shù)據(jù)的技術(shù)應(yīng)用也非常的廣泛。在電力行業(yè)中,幾乎所有設(shè)備都趨于智能化,所以對(duì)于電力行業(yè)的系統(tǒng)和設(shè)備可能利用大數(shù)據(jù)技術(shù)的支持來(lái)進(jìn)行發(fā)展和升級(jí)。
因?yàn)殡娏ο到y(tǒng)是定時(shí)收集數(shù)據(jù),并且隨著設(shè)備種類(lèi)越來(lái)越多,所以數(shù)據(jù)的種類(lèi)和數(shù)量也越來(lái)越多。在大數(shù)據(jù)技術(shù)的基礎(chǔ)上進(jìn)行數(shù)據(jù)的分析和處理就很有必要,也就是數(shù)據(jù)融合[1]。數(shù)據(jù)融合在研究電力大數(shù)據(jù)中起著重要作用,它可以整合許多方面的數(shù)據(jù)信息,讓數(shù)據(jù)的特點(diǎn)一目了然。
電力系統(tǒng)中的數(shù)據(jù)有兩種:結(jié)構(gòu)化的數(shù)據(jù)和非結(jié)構(gòu)化的數(shù)據(jù)。結(jié)構(gòu)化數(shù)據(jù)可以通過(guò)數(shù)據(jù)庫(kù)進(jìn)行存儲(chǔ)和處理,但是使用數(shù)據(jù)庫(kù)去處理非結(jié)構(gòu)化的數(shù)據(jù)會(huì)比較難[2]。
數(shù)據(jù)融合的本質(zhì)是轉(zhuǎn)換和合并X的n塊信息,其中 X 是具有未知含義的實(shí)體。根據(jù)融合程度,它分為數(shù)據(jù)層、特征層、決策層。數(shù)據(jù)層的功能是從所有的監(jiān)測(cè)對(duì)象的數(shù)據(jù)集中提取出研究需要的特征狀態(tài)量。對(duì)于特征層,它的工作是對(duì)于數(shù)據(jù)層所提取的特征狀態(tài)量進(jìn)行分析,并且對(duì)于相同特征的狀態(tài)量進(jìn)行融合,就可以得到具有決定性的對(duì)于狀態(tài)的判斷和模式具有識(shí)別作用的特征向量。最后一部分,也就是決策層的作用是通過(guò)前兩部分所得到的決策向量與規(guī)定的算法結(jié)合,然后做出決策[3]。
傳統(tǒng)的數(shù)據(jù)融合算法主要利用反向傳播(Back Propagation, BP)網(wǎng)絡(luò)。它的網(wǎng)絡(luò)模型主要分為三個(gè)部分,如圖1的網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu)所示,分別是輸入層、隱含層和輸出層。
圖1 BP網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu)
根據(jù)圖1的BP網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu),可以觀(guān)察到一個(gè)簡(jiǎn)單的模型。通過(guò)觀(guān)察模型,隱含層的每個(gè)神經(jīng)元都會(huì)收到輸入層中所有神經(jīng)元的輸入信號(hào),并且這些輸入信號(hào)會(huì)經(jīng)過(guò)處理后通過(guò)連接傳遞到隱含層,這些連接都帶有權(quán)重。神經(jīng)元將接收到的總輸入值與設(shè)置的閾值進(jìn)行比較,只有大于閾值,才能通過(guò)“激活函數(shù)”來(lái)產(chǎn)生輸出,也是輸出層的輸入[4]。
這里使用的激活函數(shù)為如下公式:
第層第i個(gè)神經(jīng)元的輸入值為:
利用激活函數(shù)計(jì)算第層第個(gè)神經(jīng)元的輸出:
第層第個(gè)神經(jīng)元輸出的導(dǎo)數(shù):
在誤差逆向回傳時(shí),設(shè)預(yù)期輸出是d,第層第個(gè)神經(jīng)元所得誤差為,其中∈[1,]。誤差為:
接下來(lái)就可以計(jì)算整個(gè)BP網(wǎng)絡(luò)的均方誤差:
由此可以得到權(quán)值調(diào)整式:
如果輸出值與預(yù)期輸出值不相符時(shí),根據(jù)計(jì)算誤差,通過(guò)網(wǎng)絡(luò)的各層次將所得到的誤差值進(jìn)行反向傳遞[5]。經(jīng)過(guò)多次的調(diào)整,使得輸出值接近實(shí)際值(預(yù)期輸出值)。大部分情況下,對(duì)數(shù)據(jù)集進(jìn)行融合歸納都使用這種學(xué)習(xí)和訓(xùn)練的方法。
利用以下節(jié)點(diǎn)對(duì)BP算法進(jìn)行簡(jiǎn)單的介紹,i1和i2為輸入節(jié)點(diǎn),h1和h2為隱藏節(jié)點(diǎn),o1和o2為輸出節(jié)點(diǎn)。引入初始權(quán)值,以及節(jié)點(diǎn)的數(shù)值,如圖2所示。
圖2 引入初始權(quán)值,以及節(jié)點(diǎn)的數(shù)值
如圖2所示,下面求解迭代過(guò)程,當(dāng)輸入樣本為0.05和0.10時(shí)(一個(gè)2維樣本數(shù)據(jù)),神經(jīng)網(wǎng)絡(luò)的期望輸出是與0.01和0.99接近。
首先來(lái)計(jì)算節(jié)點(diǎn)h1的輸入值,激活函數(shù)就是之前的Sigmoid函數(shù)。
Inh1=0.15*0.05+0.10*0.20+0.35*1=0.3775
根據(jù)上式得到h1的輸入值后,通過(guò)激活函數(shù)得到h1的輸出值:
Outh1=f(0.3775)=0.593269992
按照上述方法,計(jì)算h2的輸出值:
Outh2=0.596884378
可以通過(guò)上述計(jì)算方法,計(jì)算輸出層節(jié)點(diǎn)o1的輸出值:
Ino1=W5*Outh1+W6*Outh2+b2*1=1.105905967
Outo1=f(1.105905967)=0.75136507
同樣的方法計(jì)算o2的輸出值:
Outo2=0.772928465
得到輸出值后,計(jì)算輸出節(jié)點(diǎn)的誤差:
Eo1=(0.01-0.75136507)2/2=0.274811083
Eo2=(0.99-0.772928465)2/2=0.023560026
所以這個(gè)神經(jīng)網(wǎng)絡(luò)的總誤差為:
E=Eo1+Eo2=0.274811083+0.023560026=0.298371109
這就是前向傳播的整個(gè)過(guò)程,接下來(lái)就是后向傳播。后向傳播過(guò)程就是替換迭代網(wǎng)絡(luò)的權(quán)值,利用傳播所計(jì)算的誤差得到新的權(quán)值,再一次進(jìn)行前向傳播時(shí),通過(guò)新的權(quán)值進(jìn)行計(jì)算,得到的誤差將會(huì)縮小,直到誤差接受范圍內(nèi)。
Hermite正交基前向神經(jīng)網(wǎng)絡(luò)算法,它的特殊之處為激勵(lì)函數(shù)是正交多項(xiàng)式,可以通過(guò)一步就計(jì)算出神經(jīng)網(wǎng)絡(luò)的最優(yōu)的權(quán)值[6]。
該神經(jīng)網(wǎng)絡(luò)模型如圖3所示。
圖3 Hermite 正交基前向神經(jīng)網(wǎng)絡(luò)模型
通過(guò)偽逆矩陣就可以一步得出其權(quán)值w(= 0,1,2,...,-1)。網(wǎng)絡(luò)的最優(yōu)權(quán)值計(jì)算公式如下:
MapReduce(分布式處理框架)由兩部分組成,一個(gè)是“Map”,它的作用是映射,一個(gè)是“Reduce”,它的作用是歸納[7]。主要是通過(guò)所有節(jié)點(diǎn)并行處理數(shù)據(jù),結(jié)點(diǎn)獨(dú)立執(zhí)行所分配的任務(wù)并且實(shí)時(shí)反饋其狀態(tài)。
圖4 結(jié)合 MapReduce模型的 Hermite 正交基前向神經(jīng)網(wǎng)絡(luò)算法的并行化處理流程圖
MapReduce框架可以將算法并行處理,而Hermite算法中的數(shù)據(jù)塊可以單獨(dú)處理并且執(zhí)行其工作。所以可以將兩者結(jié)合。
(1)離散數(shù)據(jù)。首先收集大量的相關(guān)數(shù)據(jù)。如果收集的數(shù)據(jù)為連續(xù)數(shù)據(jù),則先將數(shù)據(jù)離散化;如果收集的數(shù)據(jù)為離散數(shù)據(jù),則不用做處理。
利用多個(gè)設(shè)備在一定時(shí)間內(nèi)的收集的數(shù)據(jù)為矩陣:
(3)根據(jù)MapReduce與 Hermite 正交基前向神經(jīng)網(wǎng)絡(luò)算法相結(jié)合的網(wǎng)絡(luò)并行化算法進(jìn)行訓(xùn)練預(yù)測(cè)。
這個(gè)實(shí)驗(yàn)就是基于對(duì)比上述MapReduce 與 Hermite相結(jié)合算法和BP算法神經(jīng)網(wǎng)絡(luò)算法產(chǎn)生的結(jié)果,通過(guò)對(duì)功率預(yù)測(cè)的準(zhǔn)確度比較的仿真實(shí)驗(yàn),利用MapReduce 與 Hermite相結(jié)合算法預(yù)測(cè)結(jié)果的曲線(xiàn)與BP算法的預(yù)測(cè)結(jié)果曲線(xiàn)及實(shí)際功率的曲線(xiàn)進(jìn)行對(duì)比。
圖5 不同算法下風(fēng)電場(chǎng)功率預(yù)測(cè)對(duì)比
從上面的三條曲線(xiàn)可以看出,MapReduce和Hermite相結(jié)合的算法所預(yù)測(cè)的結(jié)果與實(shí)際結(jié)果更接近,這是因?yàn)镠ermite算法隱含層神經(jīng)元的激勵(lì)函數(shù)是正交多項(xiàng)式,一步就可以計(jì)算出神經(jīng)網(wǎng)絡(luò)連接最優(yōu)的權(quán)值,這保留了初始數(shù)據(jù)的信息特征,使算法預(yù)測(cè)得結(jié)果更接近實(shí)際值。
還可以通過(guò)計(jì)算誤差,對(duì)兩種算法進(jìn)行比較,表1為兩種算法的誤差。
表1 兩種算法標(biāo)準(zhǔn)誤差對(duì)比
結(jié)合本文,可以得出新融合算法的優(yōu)勢(shì):
(1)新融合算法在步驟上進(jìn)行了簡(jiǎn)化,提高了算法的工作效率,并且將誤差縮小,更易于在硬件上實(shí)現(xiàn)。
(2)根據(jù) MapReduce 模型,將算法并行,改進(jìn)后的算法比傳統(tǒng)方法更易于處理大數(shù)據(jù)[8]。
本文介紹了一種處理電力系統(tǒng)大數(shù)據(jù)的平臺(tái)結(jié)構(gòu),總結(jié)了其功能和必要的技術(shù)支持,并監(jiān)控?cái)?shù)據(jù),可以為各種需求提供服務(wù)。
[1]劉青松,錢(qián)蘇翔,嚴(yán)拱標(biāo).基于多傳感器的信息數(shù)據(jù)融合技術(shù)在電力系統(tǒng)中的應(yīng)用[J].微計(jì)算機(jī)信息,2006(31):191-193.
[2]朱付保,徐顯景,霍曉齊,等.多源數(shù)據(jù)融合技術(shù)在后備干部管理系統(tǒng)中的應(yīng)用[J].微型電腦應(yīng)用,2014,30(01):10-12.
[3]肖慧靈.基于信息融合的港機(jī)健康診斷研究[J].中國(guó)設(shè)備工程,2021(10):162-163.
[4]李翀,劉林青,陶鵬,等.基于多源數(shù)據(jù)融合技術(shù)的輸電線(xiàn)路故障定位方法[J].水電能源科學(xué),2021,39(01):168-170+210.
[5]萬(wàn)磊,陳洪勝,王曉婷,等.面向電力大數(shù)據(jù)的多源異構(gòu)數(shù)據(jù)融合技術(shù)研究[J].電子技術(shù)與軟件工程,2021(02):172-173.
[6]江友華,易罡,黃榮昌,等.基于多源信息融合的變壓器檢測(cè)與評(píng)估技術(shù)[J].上海電力大學(xué)學(xué)報(bào),2020,36(05):481-485.
[7]林瑀,陳日成,金濤.面向復(fù)雜信息系統(tǒng)的多源異構(gòu)數(shù)據(jù)融合技術(shù)[J].中國(guó)測(cè)試,2020,46(07):1-7+23.
[8]Jitendra R. Raol Data Fusion Mathematics:Theory and Practice[B].CRC Press,2015.
網(wǎng)絡(luò)安全技術(shù)與應(yīng)用2021年12期