程鵬
(國網(wǎng)廊坊供電公司,河北 廊坊 065000)
大數(shù)據(jù)挖掘技術(shù)目前已經(jīng)在電網(wǎng)企業(yè)及電力系統(tǒng)的運(yùn)行管理中廣泛應(yīng)用。但是如何利用大數(shù)據(jù)技術(shù)來深度挖掘這些數(shù)據(jù)的內(nèi)在規(guī)律以及通過可視化技術(shù)來實(shí)現(xiàn)更好的電力系統(tǒng)管理是當(dāng)前要解決的具有挑戰(zhàn)性的問題。將可視化技術(shù)應(yīng)用到電力大數(shù)據(jù)挖掘之中,能夠突破傳統(tǒng)二維圖表在可視化及直觀性上的局限性,解決傳統(tǒng)可視化方法出現(xiàn)的重疊及密集區(qū)域[1-3]。為了能夠更好展現(xiàn)電力設(shè)備的地理空間特性及設(shè)備的運(yùn)行狀態(tài),應(yīng)當(dāng)考慮引入數(shù)據(jù)挖掘智能算法,實(shí)現(xiàn)電力大數(shù)據(jù)的全景狀態(tài)數(shù)據(jù)展現(xiàn),深度挖掘不同空間位置數(shù)據(jù)之間的相互關(guān)系。
為了能夠獲得更快的刷新速度以及更快的場景繪制速度,需要利用場景漫游以及快速人際交互等多種技術(shù)[4]。在電力設(shè)備的三維模型構(gòu)建中,由于這些電力設(shè)備大部分都具有多線圈結(jié)構(gòu)且表面局部曲率很大,因而不能夠過度簡化,否則無法實(shí)現(xiàn)對場景重繪的目的效果[5-6]。在此情況下,考慮引入LOD(levels of detail)方法進(jìn)行模型構(gòu)建過程的簡化,提高場景繪制的速度。首先分析模型結(jié)構(gòu),采用三角網(wǎng)格(mesh)開展數(shù)學(xué)描述,即M=(K,V)。對模型的簡化,并非是進(jìn)行E的簡化,而是要逐漸過渡到E,需要對E進(jìn)行量化分析,從而確定其重要程度??梢岳媚芰亢瘮?shù)思想進(jìn)行模型簡化的逼近程度,并不斷修正頂點(diǎn)數(shù)量變化權(quán)重。利用能量函數(shù)進(jìn)行模型構(gòu)建的時候,難以有理想減面效果,算法復(fù)雜,執(zhí)行率低,因而并不適用于場景復(fù)雜的變電站中。
E(K,V)=Edist(K,V)+Erep(K,V)+Fspring(K,V)
(1)
式中:E為三角網(wǎng)格的連接頂點(diǎn)基本元素,實(shí)際模型中替換為M=(E,V),表示三角網(wǎng)格模型;K,V分別為三個連接頂點(diǎn)基本元素和頂點(diǎn);Edist為距離能量;Espring為彈性能量;Erep為代表性能量。因而提出LOD算法融入能量函數(shù)思想,結(jié)合統(tǒng)計(jì)方法加權(quán)進(jìn)行K值重要性量化,對于邊E影響因子A有:
(2)
式中:W為邊E的影響因子權(quán)重函數(shù);n為影響因子數(shù)量;Fi為所有特征邊標(biāo)識;Ai為i種不同的影響因子;wi為影響因子對應(yīng)的權(quán)重 。在進(jìn)行電力大數(shù)據(jù)可視化過程中,最主要是進(jìn)行電力設(shè)備的構(gòu)建,因而不能夠過度簡化[7]。綜合考慮之下,E選取影響因子A1、A2、A3、A4,分別對應(yīng)的是邊長L、特征邊標(biāo)識F、兩側(cè)三角形面積S和曲率C。
設(shè)邊E(V1,V2)兩側(cè)三角形如圖1中所示,四個點(diǎn)的坐標(biāo)分別為V1(x1,y1,z1)、V2(x2,y2,z2)、V3(x3,y3,z2)、V4(x4,y4,z4),則有:

圖1 周圍相關(guān)頂點(diǎn)及法向量示意圖
(3)
(4)
(5)
C=cos-1n1·n2=
(6)
式中:F、L、S、C分別為特征邊標(biāo)識、邊長、兩側(cè)三角形面積和曲率(后同);n1、n2為圖1中的兩個方向法向量。利用權(quán)重函數(shù)E=f(E)對影響因子加權(quán)計(jì)算,進(jìn)一步設(shè)計(jì)基本權(quán)重函數(shù)。
W0=w1·L+w2·F+w3·S+w4·|C|
(7)
式中:w1、w2、w3、w4為L、F、S和|C|對應(yīng)的權(quán)重系數(shù),其中C的值域區(qū)間為[0,π]。L、S值域是難以確定的,如果單純直接使用L、S原始值進(jìn)行計(jì)算,可能會導(dǎo)致最終產(chǎn)生較大的誤差,因而需要對影響因子進(jìn)行均衡化處理,使其能夠處于同一尺度空間中。將L、F、S值域線性映射至[0,π]區(qū)間中,設(shè):
(8)
EFj=π·Fj
(9)
(10)
由此能夠得到均衡值域的權(quán)重函數(shù)計(jì)算公式:
W=w1·EL+w2·EF+w3·ES+w4·|C|
(11)
式中:C為曲率,值域?yàn)閇0,π]。為了進(jìn)行模型簡化,令w1=σEL,w3=σES,w4=σC,w2=α。對于給定任意邊E,可以得到權(quán)重函數(shù)方程為:
W=σEL·EL+α·EF+σES·ES+σC·|C|
(12)
由此可以保證影響因子貢獻(xiàn)比例的均衡,完善邊E的貢獻(xiàn)值。將其應(yīng)用到電力可視化模型構(gòu)建時,可以對權(quán)重系數(shù)按照線性縮放的原則進(jìn)行調(diào)整。
利用式(10)可以計(jì)算出模型中每個E貢獻(xiàn)值,然而還需要進(jìn)一步完成LOD計(jì)算方法的過程完善,還需要進(jìn)一步定義模型構(gòu)建過程中模型頂點(diǎn)列表的變換確認(rèn)簡化比例,完成不同比例參數(shù)的分配等。在對E進(jìn)行約減時,為了填補(bǔ)刪除后可能留下的縫隙,操作需要遍歷三角網(wǎng)格模型,因而消耗大量的計(jì)算時間。在此采用收縮方式代替刪除方式,對E進(jìn)行收縮變換。
E(V1,V2)→E(V1,V3)
(13)

將簡化仿真算法應(yīng)用于某個變電站數(shù)據(jù)分析系統(tǒng)之中,開展變電站的場景優(yōu)化,對其測試算法效率和效果進(jìn)行分析。經(jīng)過初步的仿真模擬,對于不同簡化比例參數(shù)θ為0、70%、85%,對應(yīng)的場景優(yōu)化效果效率曲線如圖2及表1所示。從圖2及表1可以看出,當(dāng)處于初始化狀態(tài)時為0,對應(yīng)的FPS(frames per second)=3.8幀/s;當(dāng)簡化比例為70%時,F(xiàn)PS上升為15.4幀/s,對應(yīng)的細(xì)節(jié)基本上沒有損失,能夠保持案例設(shè)備的完整性,實(shí)現(xiàn)最好的優(yōu)化效果;當(dāng)簡化比例為85%時,損失了較多細(xì)節(jié),即便仍能夠保持有大致的設(shè)備外形,但是精度上有著顯著的降低,此時的FPS為18.1幀/s,對應(yīng)的連續(xù)幀率閾值為24 FPS,能夠滿足人機(jī)交互及變電站的場景漫游需要。

圖2 場景優(yōu)化效率曲線圖

表1 場景繪制效率表
整體分析可以看出,當(dāng)簡化比例參數(shù)在85%以上時,模型陷入扁平化,可能導(dǎo)致三體塌陷成為二維面,最終產(chǎn)生體積信息的損失,因而需要進(jìn)一步提升扁平化閾值。
利用Amdahl定律,采用并行方式加快算法,運(yùn)行速度存在極限,不能實(shí)現(xiàn)無限提高。具體計(jì)算公式為:
(14)
式中:S、a、n分別為加速比、串行比例和并行節(jié)點(diǎn)數(shù)。當(dāng)a無限趨近于0時,才能夠?qū)崿F(xiàn)n加速比。結(jié)合CUDA(computer unified device architecture)三層編程模型,可以將BP神經(jīng)網(wǎng)絡(luò)算法劃分為三個層次:第一層次是每個Grid對應(yīng)的單個神經(jīng)網(wǎng)絡(luò)計(jì)算任務(wù);第二層次是Block對上層節(jié)點(diǎn)的計(jì)算任務(wù);第三層次是Thread對應(yīng)的節(jié)點(diǎn)計(jì)算任務(wù)。對應(yīng)的并行層次計(jì)算模式如圖3中所示。

圖3 BP神經(jīng)網(wǎng)絡(luò)的并行層次計(jì)算模式
為了進(jìn)行基于BP神經(jīng)網(wǎng)絡(luò)改進(jìn)后的并行算法的效果分析,此次選取95臺主變壓器的相關(guān)監(jiān)測數(shù)據(jù)來進(jìn)行具體的仿真分析。在這個仿真體系中,每一臺變壓器就相當(dāng)于一個神經(jīng)網(wǎng)絡(luò),由此分別進(jìn)行BP及BP Grid算法效率的對比分析,結(jié)果如表2所示。

表2 BP Grid算法的加速比
從表2可以看出,對于不融入并行算法大數(shù)據(jù)技術(shù)時,整個算法的效率非常低,單臺變壓器所需要消耗的時間要達(dá)到58.14 s,消耗的時間過多,難以達(dá)到實(shí)用要求。而融入了BP神經(jīng)網(wǎng)絡(luò)算法后,BP Grid算法單臺變壓器的消耗時間為7.14 s,與單純的神經(jīng)網(wǎng)絡(luò)訓(xùn)練時間相比加速比為8.14。進(jìn)一步分析可以看出,神經(jīng)網(wǎng)絡(luò)數(shù)量為1、2、4、8時,對應(yīng)的加速比分別為8.14、7.69、7.32、7.51。
利用此次提出的可視化方法對三維場景的結(jié)果進(jìn)行可視化展示。為了更好實(shí)現(xiàn)可視化的展現(xiàn),設(shè)計(jì)出一種三維平行坐標(biāo)圖,用以展開時間序列數(shù)據(jù)對應(yīng)的時間維度,能夠?qū)⒍鄠€時間點(diǎn)數(shù)據(jù)同時排列其中。為了緩解空間可能出現(xiàn)的緊促感,需要將曲線排列在三維空間之中。在三維空間之中,可以利用視點(diǎn)位置的改變以及場景漫游等解決二維平行坐標(biāo)圖中可能出現(xiàn)的遮擋問題。根據(jù)此次可測試數(shù)據(jù)得到的結(jié)果集進(jìn)行可視化展現(xiàn),具體如圖4~圖7所示。

圖4 三維平行坐標(biāo)圖(1)

圖5 三維平行坐標(biāo)圖(2)

圖6 三維平行坐標(biāo)圖(3)

圖7 三維平行坐標(biāo)圖(4)
數(shù)據(jù)集分析的結(jié)果可視化展現(xiàn)在圖8中,圖中的“★”為存在異常數(shù)據(jù),黑色點(diǎn)為最近數(shù)據(jù)采集結(jié)果的維度數(shù)值。將三維場景的實(shí)現(xiàn)和數(shù)據(jù)結(jié)合起來,能夠增強(qiáng)人機(jī)交互效率,讓人們更好了解到數(shù)據(jù)背后隱藏的規(guī)律。

圖8 變電站可視化三維虛擬現(xiàn)實(shí)場景
綜合分析可以看出,并行化BP神經(jīng)網(wǎng)絡(luò)的BP Grid算法能夠?qū)斎氲臅r間序列數(shù)據(jù)實(shí)現(xiàn)高效快速的神經(jīng)網(wǎng)絡(luò)訓(xùn)練。通過和傳統(tǒng)可視化的對比分析可以看出,BP神經(jīng)網(wǎng)絡(luò)輸出結(jié)果可以讓用戶在地理空間上實(shí)現(xiàn)快速的定位,便于其更好地理解數(shù)據(jù)。通過可視化分析方式,用戶能夠快速定位數(shù)據(jù)源,基于三維場景輔助可視化方式進(jìn)行異常數(shù)據(jù)點(diǎn)的查找,有利于提高人機(jī)交互效率。
本文整合了大數(shù)據(jù)技術(shù)和可視化分析模型,通過數(shù)據(jù)挖掘并行優(yōu)化算法,實(shí)現(xiàn)漸進(jìn)、動態(tài)和無損的模型簡化重建。通過仿真試驗(yàn)數(shù)據(jù)的快速可視化分析模型構(gòu)建可以看出,此次的分析模型能夠滿足電力企業(yè)的大數(shù)據(jù)業(yè)務(wù)需求,便于用戶對數(shù)據(jù)的人機(jī)交互需求和理解,極大提升了人機(jī)交互效率。當(dāng)采用多分辨率快速渲染方法的時候,可以在不改變電力設(shè)備外觀的情況下快速實(shí)現(xiàn)異常設(shè)備點(diǎn)的定位,有助于電力系統(tǒng)的日常運(yùn)維管理。