陳 明,張文靜,趙 杰
(國(guó)網(wǎng)河北省電力有限公司,河北石家莊 050021)
隨著信息技術(shù)的不斷發(fā)展,利用數(shù)據(jù)處理與識(shí) 別技術(shù)實(shí)現(xiàn)對(duì)電力工程數(shù)據(jù)的智能化信息感知能力是當(dāng)前學(xué)術(shù)界的共識(shí)。因此,提升數(shù)據(jù)采集的效率和準(zhǔn)確率成為了當(dāng)下研究熱點(diǎn)[1-3]。國(guó)家電網(wǎng)公司出臺(tái)相關(guān)政策,鼓勵(lì)結(jié)合電力工程業(yè)務(wù)需求、挖掘基建過(guò)程價(jià)值,實(shí)現(xiàn)基建業(yè)務(wù)數(shù)字化、智能化,以提高電力工程基建管理水平。在電力工程實(shí)施過(guò)程中,對(duì)產(chǎn)生的數(shù)據(jù)進(jìn)行多源感知,形成以電力測(cè)量為代表的時(shí)序參量以及以圖像為代表的圖像參量,進(jìn)而構(gòu)成電力工程多源感知參量[4-6]。將二者進(jìn)行融合,使其互補(bǔ)增強(qiáng),提升電力數(shù)據(jù)感知準(zhǔn)確性。從多源感知數(shù)據(jù)融合角度看,融合參量包括三個(gè)層級(jí),各個(gè)層級(jí)在適用范圍上依次遞增。由于各個(gè)參量的表示形式不同,數(shù)據(jù)融合的難度較大,目前雖然已經(jīng)具備了一定的技術(shù)基礎(chǔ),但其在進(jìn)行跨類融合與分析處理能力上仍有不足,且異構(gòu)數(shù)據(jù)之間的電力工程數(shù)據(jù)融合問(wèn)題仍亟需進(jìn)一步地深入研究[7-9]。
該文研究了基于多源感知的電力工程數(shù)據(jù)信息處理與識(shí)別技術(shù),通過(guò)構(gòu)建多參量數(shù)據(jù)融合模型,對(duì)樣本數(shù)據(jù)進(jìn)行綜合處理。算例分析結(jié)果表明,該文提出的技術(shù)方案能夠有效提高數(shù)據(jù)感知結(jié)果的精確度,同時(shí)具有良好的容錯(cuò)性能,從而助力電力工程基建的信息化建設(shè)。
電力工程的數(shù)據(jù)處理影響整個(gè)工程進(jìn)度,數(shù)據(jù)的分析與處理是整個(gè)工程的重要工作,關(guān)系整個(gè)電力工程的安全性。數(shù)據(jù)預(yù)處理是多源感知的前提,數(shù)據(jù)的處理精度決定著多源感知數(shù)據(jù)融合的決策成敗[10-11]。針對(duì)電力工程產(chǎn)生的多源數(shù)據(jù),首先進(jìn)行數(shù)據(jù)相關(guān)性分析,將其結(jié)果作為數(shù)據(jù)融合的輸入。由于采集到的數(shù)據(jù)信息種類多樣,為防止數(shù)據(jù)采集結(jié)果產(chǎn)生誤差,對(duì)選取信息進(jìn)行降噪處理,剔除異常數(shù)據(jù)并提高采集信息的真實(shí)度。同時(shí)為進(jìn)行數(shù)據(jù)感知,處理后得到的數(shù)據(jù)必須具有連續(xù)性、有效性、一致性,其通過(guò)以下三個(gè)步驟進(jìn)行處理:
1)采用遍歷算法篩選異常數(shù)據(jù),消除隨機(jī)誤差,并對(duì)異常數(shù)據(jù)進(jìn)行補(bǔ)償;
2)對(duì)所有數(shù)據(jù)信息進(jìn)行特征提取,同時(shí)提取出采樣時(shí)間與補(bǔ)充的數(shù)據(jù),從而確保數(shù)據(jù)連續(xù)性;
3)為確保數(shù)據(jù)的一致性,對(duì)一維數(shù)據(jù)進(jìn)行擴(kuò)展化處理,擴(kuò)展化算法的原理如下:
假設(shè)樣本總數(shù)為M,有三個(gè)子樣本集:G1,G2,…,GM;K1,K2,…,KM;L1,L2,…,LM,則樣本j可用下式表示:
綜合式(1)-(3),可得Yj為:
電力工程多源參量融合模式如圖1 所示,其按照數(shù)據(jù)級(jí)、特征級(jí)、決策級(jí)三個(gè)層次劃分,各個(gè)層次均包含數(shù)據(jù)關(guān)聯(lián)、特征融合、目標(biāo)感知等內(nèi)容[12-14]。
圖1 多源參量融合模式
數(shù)據(jù)級(jí)是最基本的融合層級(jí),對(duì)各類參數(shù)進(jìn)行融合與特征提取,構(gòu)建多源感知數(shù)據(jù)參量;特征級(jí)為中間融合層級(jí),需要對(duì)數(shù)據(jù)特征進(jìn)行分析,并解釋各個(gè)參數(shù);決策層作為最高層級(jí)的融合,需對(duì)數(shù)據(jù)進(jìn)行獨(dú)立感知,根據(jù)預(yù)設(shè)的準(zhǔn)則進(jìn)行融合,也是最主要的融合方法[15-16]。
以數(shù)據(jù)信息輸入為參量,從實(shí)際需求出發(fā)分類回歸輸出。基于特征融合特點(diǎn)確定各個(gè)參數(shù)的特征信息,并進(jìn)行數(shù)據(jù)融合。最終進(jìn)行目標(biāo)信息數(shù)據(jù)感知,建立的多源感知數(shù)據(jù)融合框架,如圖2所示。
圖2 多源感知數(shù)據(jù)融合框架
針對(duì)時(shí)序電量,將所有數(shù)據(jù)排列為m行n列的矩陣,并轉(zhuǎn)換為非線性混沌系統(tǒng)圖,用特征形式表示。然后,基于卷積神經(jīng)網(wǎng)絡(luò)進(jìn)行特征提取,對(duì)于工程圖像數(shù)據(jù),采用更加成熟的網(wǎng)絡(luò)進(jìn)行特征提取,基于改進(jìn)Faster R-CNN 將全連接層的所有數(shù)據(jù)信息輸出到網(wǎng)絡(luò)參數(shù)中。
電力工程多源感知融合模型訓(xùn)練過(guò)程如下:
1)輸入時(shí)序參量,訓(xùn)練所有感知網(wǎng)絡(luò)數(shù)據(jù)參數(shù),輸出形式為數(shù)據(jù)回歸;
2)輸入與圖像相關(guān)的各類參數(shù),利用訓(xùn)練集數(shù)據(jù)對(duì)網(wǎng)絡(luò)進(jìn)行訓(xùn)練,通過(guò)改進(jìn)的Faster R-CNN 算法模型完成數(shù)據(jù)感知后輸出結(jié)果;
3)對(duì)所有的數(shù)據(jù)目標(biāo)感知網(wǎng)絡(luò)進(jìn)行綜合分類,基于分類結(jié)果,再對(duì)各個(gè)層次和部分的數(shù)據(jù)進(jìn)行融合,綜合構(gòu)建出網(wǎng)絡(luò)融合模型;
4)固定特征參數(shù),輸入序列參數(shù),輸出回歸結(jié)果。
對(duì)于電力工程的分類數(shù)據(jù),通過(guò)Softmax 輸入數(shù)據(jù)源頭的信息類別,以最小損失進(jìn)行電力工程數(shù)據(jù)的訓(xùn)練。其誤差滿足預(yù)期目標(biāo)即可,如下式所示:
式中,L(θ) 為當(dāng)輸入變量為θ時(shí)對(duì)應(yīng)的概率,θ=[θ1,θ2,…,θm]為電力工程采集到的數(shù)據(jù)序列,其值隨著訓(xùn)練網(wǎng)絡(luò)模型的變化而變化。
此外,損失函數(shù)Y可表示為:
式中,M為數(shù)據(jù)樣本總數(shù),αi表示樣本數(shù)據(jù)的預(yù)測(cè)值,表示數(shù)據(jù)樣本的真實(shí)值。
當(dāng)誤差滿足預(yù)定值時(shí),可停止迭代,并輸出數(shù)據(jù)。因此,所采用的方均誤差函數(shù)可表示為:
式中,θi表示電力工程數(shù)據(jù)輸入值,f(θi)表示預(yù)測(cè)函數(shù)對(duì)應(yīng)的函數(shù)值,αi表示電力工程數(shù)據(jù)的真實(shí)值。
由于采集到的電力工程數(shù)據(jù)信息為遞歸圖,其具有典型的非線性特征,時(shí)間與圖像數(shù)據(jù)為多源信息,需要進(jìn)行特征同化。因此,采用多參量遞歸方法對(duì)電力工程數(shù)據(jù)信息進(jìn)行特征提取。具體流程如下:
1)假設(shè)采集到的電力工程數(shù)據(jù)時(shí)序量為xi(tj),為了使得所有信息具有相同的時(shí)序性,令采集時(shí)刻相同的數(shù)據(jù)信息排列成相同的序列。
2)對(duì)所有數(shù)據(jù)信息進(jìn)行歸一化處理,歸一化公式如下:
式中,為歸一化之后的形式,θi為i類時(shí)序參量,maxθi、minθi分別為時(shí)序參量對(duì)應(yīng)的最大值和最小值。
3)計(jì)算遞歸矩陣,構(gòu)建空間向量并確定遞歸元素。假設(shè)遞歸矩陣為Mn×n,則其中的元素為:
4)將所有的數(shù)據(jù)信息匯總,并以其為輸入值,繪制出電力工程數(shù)據(jù)多參量遞歸圖。
得到遞歸圖后,假設(shè)相關(guān)的參數(shù):令s為步長(zhǎng)、p為填充層數(shù)、非線性函數(shù)用ReLU 表示。建立卷積神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)如圖3 所示。
圖3 多源感知數(shù)據(jù)卷積神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)
數(shù)據(jù)融合以服務(wù)電力工程技經(jīng)現(xiàn)場(chǎng)業(yè)務(wù)管控為重點(diǎn),采用物聯(lián)網(wǎng)、移動(dòng)互聯(lián)網(wǎng)等技術(shù)為不同層級(jí)、崗位的基建管理人員提供專屬定制化的業(yè)務(wù)系統(tǒng)與移動(dòng)應(yīng)用。對(duì)技經(jīng)專業(yè)現(xiàn)場(chǎng)管理流程、應(yīng)用進(jìn)行標(biāo)準(zhǔn)化、精細(xì)化地設(shè)計(jì)及實(shí)現(xiàn),將服務(wù)對(duì)象重心從傳統(tǒng)的建設(shè)管理單位轉(zhuǎn)移到參建單位和工程現(xiàn)場(chǎng),從而推動(dòng)基建技經(jīng)業(yè)務(wù)從管理型向服務(wù)型的轉(zhuǎn)變,實(shí)現(xiàn)業(yè)務(wù)數(shù)據(jù)化管理。利用信息化、數(shù)據(jù)化手段,創(chuàng)建造價(jià)管理的線上數(shù)據(jù)上報(bào)、審批、歸集及數(shù)據(jù)分析展示等功能。以線上訂單管理模式設(shè)計(jì)費(fèi)用上報(bào)、審核場(chǎng)景,實(shí)現(xiàn)平臺(tái)的資料數(shù)字化歸檔,最大程度降低人為因素造成的數(shù)據(jù)不準(zhǔn)確情況?,F(xiàn)場(chǎng)造價(jià)人員組織落實(shí)現(xiàn)場(chǎng)造價(jià)管理要求,承擔(dān)所轄電力工程現(xiàn)場(chǎng)造價(jià)管理工作。在計(jì)算機(jī)終端提交相關(guān)會(huì)議紀(jì)要、管理過(guò)程資料、現(xiàn)場(chǎng)影像資料等,平臺(tái)自動(dòng)推送建設(shè)管理單位。該單位可采取計(jì)算機(jī)終端審批,當(dāng)審批完成后各參建單位可查看并進(jìn)行保存。
該算例模擬電力工程基建現(xiàn)場(chǎng),以實(shí)際工程數(shù)據(jù)為數(shù)據(jù)樣本。采用主從結(jié)構(gòu),以NameNode 作為主服務(wù)器來(lái)管理文件命名和數(shù)據(jù)訪問(wèn)系統(tǒng)。分別對(duì)時(shí)序和圖像融合的感知模型進(jìn)行訓(xùn)練與測(cè)試,通過(guò)對(duì)感知模型綜合性能參數(shù)的對(duì)比分析,驗(yàn)證其容錯(cuò)性。
對(duì)電力工程現(xiàn)場(chǎng)情況預(yù)警并對(duì)現(xiàn)場(chǎng)圖像進(jìn)行感知,使用準(zhǔn)確率與平均召回率作為評(píng)價(jià)指標(biāo)。以某次工程基建為數(shù)據(jù)基礎(chǔ),根據(jù)工程現(xiàn)場(chǎng)設(shè)施情況,并對(duì)每個(gè)類別進(jìn)行感知。采集的信息包括溫度、濕度、風(fēng)速、圖像參量等,每隔20 min 采集一次。為使采集到的信息得到補(bǔ)充和增強(qiáng),以時(shí)序參量與圖像參量作為輸入,對(duì)感知模型進(jìn)行仿真。從精確性和容錯(cuò)性的角度進(jìn)行對(duì)比分析,得到三種感知模型的精確性測(cè)試結(jié)果,如表1 所示。從表中可以看出,多源融合模型由于單獨(dú)輸入?yún)⒘浚淦骄鶞?zhǔn)確率(AP)達(dá)到83.76%,而平均召回率(AR)則達(dá)到了90.14%。
表1 精確性對(duì)比分析
為進(jìn)一步驗(yàn)證所述方法的準(zhǔn)確率,對(duì)選取的時(shí)序參量與圖像參量進(jìn)行異常處理,以不同程度的數(shù)據(jù)丟失作為時(shí)序參量的異常變化;以遮擋或模糊處理作為圖像參量的異常變化。將上述參數(shù)作為數(shù)據(jù)輸入,得到的容錯(cuò)性驗(yàn)證結(jié)果如表2 所示。從表中可以看出,將數(shù)據(jù)輸入?yún)⒘窟M(jìn)行異常處理之后,融合參量對(duì)應(yīng)的平均準(zhǔn)確率較圖像參量高10.86%,平均召回率提升8.46%。
表2 容錯(cuò)性驗(yàn)證結(jié)果
采用三種算法對(duì)電力工程數(shù)據(jù)進(jìn)行處理,并對(duì)比分析三種方法與所提方法的標(biāo)準(zhǔn)誤差(R)與絕對(duì)誤差(M),其結(jié)果如表3 所示。從表中可看出,采用該文方法進(jìn)行數(shù)據(jù)處理的標(biāo)準(zhǔn)誤差與絕對(duì)誤差均有所降低,其更能反映原始數(shù)據(jù)的真實(shí)性。
表3 幾種算法的誤差對(duì)比
在電力工程的實(shí)施過(guò)程中會(huì)產(chǎn)生大量的異構(gòu)多參量數(shù)據(jù),然而由于缺乏深度融合手段,導(dǎo)致了數(shù)據(jù)信息處理與分析不足、數(shù)據(jù)利用率低等問(wèn)題的出現(xiàn)。該文基于多源感知技術(shù)提出了一套電力工程數(shù)據(jù)信息處理與識(shí)別方法,采用融合時(shí)序參量與圖像參量的多參量框架,從數(shù)據(jù)角度分析數(shù)據(jù)融合模式的優(yōu)缺點(diǎn),利用卷積神經(jīng)網(wǎng)絡(luò)對(duì)圖像信息進(jìn)行特征提取。通過(guò)模型優(yōu)化設(shè)計(jì)和數(shù)據(jù)融合,實(shí)現(xiàn)目標(biāo)信息的數(shù)據(jù)感知,以增強(qiáng)不同參量之間的互補(bǔ)性,從而有效提高電力工程數(shù)據(jù)感知與處理的精確性及容錯(cuò)率。