李佳凝
(國網(wǎng)山東省電力公司青島市黃島區(qū)供電公司)
電能是我國最重要的基礎能源之一,與國計民生、經濟發(fā)展有著密切關聯(lián),采用深度學習模式,將其用于實體經濟的分析,能夠進一步推動電力行業(yè)的經濟運轉。在我國經濟發(fā)展水平日益向好、國民生活質量日益改善的背景下,我國電力用戶的數(shù)量也在持續(xù)增加,與此同時用電量也出現(xiàn)明顯提升,在電力系統(tǒng)中電力業(yè)務所具有的重要意義和作用也逐漸突出,因此針對電力營銷管理工作中所涉及到的電量管理工作的要求也愈發(fā)嚴格[1]。對電量管理工作而言,電費以及電價的統(tǒng)計分析工作極為關鍵,在進行電量管理工作時經常會遇到電量異常等問題,借助優(yōu)化后的改進深度學習方法,對于電力營銷工作中所涉及到的異常數(shù)據(jù)加以識別判斷,可改善電力營銷數(shù)據(jù)的準確性和可靠度。
深度學習模式的原理,即找到學習資料數(shù)據(jù)中的表層含義與深層含義之間的關聯(lián)規(guī)律,學習環(huán)節(jié)中獲取的全部文字、音頻及圖像信息內容,具有深層次的應用價值。深度學習模式算法的主要目的,是和AI具有人類一樣的領悟分析能力,能夠精準識別文字、音頻及圖像信息,并且能夠找到各類信息之間的必要關聯(lián),再加以處理。
簡而言之,深度學習模式是一種相對繁雜的信息化學習算法,對于數(shù)據(jù)識別方面具有較為廣闊的應用前景,遠超數(shù)據(jù)挖掘、機器翻譯等其他類型的信息處理技術[2]。
深度學習在異常檢測方面展現(xiàn)出良好的性能,遞歸神經網(wǎng)絡(RecurrentNeuralNetwork,RNN)常用于分析序列信息, 長短期記憶 (LongShort-TermMemory,LSTM)作為RNN 的分支網(wǎng)絡,能夠深度處理語音信息,并做好信息分類。
卷積神經網(wǎng)絡(ConvolutionalNeuralNetwork,CNN)為當前應用較多的深度學習理論中的研究模型之一,主要架構涵蓋:信息輸出模塊、信息連接模塊、信息輸入模塊及信息交換模塊、池化模塊等。為進一步優(yōu)化電力事業(yè)發(fā)展,提升電網(wǎng)運行可靠性與安全性,相關研究人員已經開始采用深度學習模式用于電力行業(yè)中[3]。
自動編碼器(AutoEncoder,AE)在創(chuàng)建之初實際上是用于壓縮數(shù)據(jù),主要具有下述特點:(1)與數(shù)據(jù)間具有密切聯(lián)系,即代表自動編碼器,僅能夠對和訓練數(shù)據(jù)較為類似的數(shù)據(jù)進行壓縮處理;(2)通過該方法對數(shù)據(jù)進行壓縮處理以后,會在一定程度上對數(shù)據(jù)產生損傷,這主要是由于在進行降維處理時必然會丟失部分信息。
通過自動編碼器能夠對輸入原始數(shù)據(jù)所具有的一些隱蔽性特征進行學習,也就是編碼(Coding)。在對新特征進行學習后,即可重新獲得原始輸入信息,這一過程也被稱之為解碼(Decoding)[4]。對自動編碼器的工作情況進行分析,其實際上和主成分分析(PrincipalComponentAnalysis,PCA)具有相似之處,但是性能卻得到顯著優(yōu)化,這主要是由于神經網(wǎng)絡能夠自動的對一些新的數(shù)據(jù)和能力進行學習,因此能夠使得企業(yè)數(shù)據(jù)處理效率和質量均得到顯著提高。在對自動編碼器的工作原理和整體情況進行深入分析后,能夠發(fā)現(xiàn)其實際上屬于無監(jiān)督式的深度學習模型,通過其能夠獲得多種多樣的訓練樣本的新數(shù)據(jù)信息,所以從這一層面而言,其實際上也可以被劃分到生成算法模型的范疇中[5]。
對于RNN結構進行分析,該算法能夠對此前所輸入的各項信息加以記憶,并在現(xiàn)有輸出信息中進行應用,所以對于數(shù)據(jù)序列類型的數(shù)據(jù)信息進行計算時極為適用,而且將CNN 算法和RNN 算法聯(lián)合應用可以很好地解決數(shù)據(jù)間的相關性問題。
采用改進深度學習模式的電力營銷異常信息量的識別技術,主要涵蓋Caffe網(wǎng)絡架構、電力營銷信息流清洗、異常識別標簽注解這三個步驟,詳細方法如下[6]。
1.2.1 Caffe網(wǎng)絡學習框架
Caffe網(wǎng)絡學習架構的主要功能,是作為電力系統(tǒng)中硬件設備運行的基礎,主要包括網(wǎng)絡學習中心、檢測主機、深度學習節(jié)點、異常信息流采集等模塊。
網(wǎng)絡學習中心能夠為電力系統(tǒng)的正常運行提供需要的電量數(shù)據(jù),同時,可用信息傳輸通道將電子量數(shù)據(jù)傳遞至下級模塊中。檢測主機的作用是連接上級與下級的模塊,能夠在電量信息傳輸?shù)倪^程中,把識別出來的異常信息均分到每個深度學習節(jié)點,這樣可以讓電信息捕獲更為精準。異常信息流采集模塊在Caffe網(wǎng)絡學習架構的最底層,主要功能是梳理每個深度學習節(jié)點內的異常信息流,把信息流資料轉化成固定格式的系統(tǒng)日志,并存儲。Caffe網(wǎng)絡學習架構參考圖1。
圖1 Caffe網(wǎng)絡學習架構
1.2.2 電力營銷信息流清洗
信息流的清洗,即為處理電力營銷數(shù)據(jù)中的異常信息,同時可輔助異常信息識別工作,將遺漏的異常信息再次捕捉并處理,將其所涉及到的不足之處進行解決應對的過程,通過傳統(tǒng)的人工數(shù)據(jù)處理方法僅能夠對少量的數(shù)據(jù)信息進行處理,而且還存在費時費力、效率較低等問題,同時對專業(yè)水平要求高,本身還會出錯,不能滿足海量調度管理類及實時類數(shù)據(jù)清洗要求[7]?;诖?,開發(fā)出一種便捷高效快速的數(shù)據(jù)清理轉換方法,并且借助一定的設備或者儀器實現(xiàn)自動化或者半自動化的數(shù)據(jù)清洗工作具有重要意義,對于控制數(shù)據(jù)質量也具有顯著積極影響。
通常狀況下,Caffe網(wǎng)絡學習架構內,電力營銷信息流清洗與流程化識別指標X密切關聯(lián),如果不考慮其余因素對于捕捉結果的影響,流程化識別指標X的參數(shù)越大,信息流清洗的效果就會越強,信息流清洗流程如圖2所示。
圖2 信息流清洗流程
1.2.3 異常識別標簽注解
異常檢測主要分為以下兩類。
(1)數(shù)據(jù)有標簽。對于這樣的數(shù)據(jù),期望訓練一個分類器,這個分類器除了要能告知正常數(shù)據(jù)的類別外,還要對于異常數(shù)據(jù)輸出其屬于“unknown”類,這個任務叫做Open-setRecognition[8]。
(2)數(shù)據(jù)無標簽。這類數(shù)據(jù)分為兩種,一種是數(shù)據(jù)是干凈的(clean),也就是說數(shù)據(jù)集中不包含異常數(shù)據(jù);另一種是數(shù)據(jù)是受污染的(polluted),數(shù)據(jù)集中包含少量的異常數(shù)據(jù)。其中,受污染的數(shù)據(jù)是更常見的情況。
一般狀況下,營銷異常信息內都會包含很多有著固定類別與特點的信息量,因此,能夠自動對這種信息量的特點進行標注。然而還是會有個別識別節(jié)點,需要執(zhí)行上級系統(tǒng)的判定指令,這也就是異常識別標簽注解的目的。異常識別標簽注解可以采集的系統(tǒng)信息量一定是有固定規(guī)律的,同時,信息量的輸出必須是不間斷的狀態(tài)[9]。
采用自動化協(xié)議,能夠解決電力營銷異常數(shù)據(jù)的智能化識別、提取。系統(tǒng)應用模塊、數(shù)據(jù)傳輸模塊、網(wǎng)絡架構模塊以及各鏈路布設于電力系統(tǒng)以太網(wǎng)絡的外層,可以輔助Caffe網(wǎng)絡學習架構系統(tǒng)的運行,為其提供更好的信息捕捉條件。
不但可以防止異常信息流對電力系統(tǒng)的攻擊、惡意干擾,還能夠把異常信息流梳理整合為一整體,進一步簡化了Caffe網(wǎng)絡學習架構系統(tǒng)的信息儲存。異常信息流的復制會消耗大量的系統(tǒng)儲存空間,在自動化協(xié)議多層模塊的協(xié)助處理下,能夠大幅度縮短異常信息流的識別獲取時間,減輕50%的儲存空間。異常信息流的傳輸速度普遍為l0Mb/s,識別標簽注解功能可以將原有識別獲取的速度提升數(shù)倍。
一般情況下,電力系統(tǒng)的內部訪問權限不會對對深度學習模式開放,同時,在系統(tǒng)運行過程中,也會被信息捕捉節(jié)點的布置所干擾。所以,需要將電力營銷異常信息的初始捕捉節(jié)點當做捕獲映射網(wǎng)的搭建條件,對智能化捕獲節(jié)點的范圍加以限定。這樣能夠為電力系統(tǒng)應用深度學習模式捕捉異常信息提供更加有利的搭建環(huán)境。
異常信息流的審核環(huán)節(jié)中,核算人員需要根據(jù)電力系統(tǒng)內,電量營銷、電費數(shù)據(jù)等條件,篩選異常用戶,對其進行審核。審核條件是電量、電費審核過程中的重要參考,條件的制定與執(zhí)行,對于審核工作來說十分關鍵。改進深度學習模型需要進行實際的訓練,通過大量數(shù)據(jù)來提高它的準確性和智能性。深度學習實際上就是借助建立涉及到多個隱藏層的機器學習模型,通過大量的訓練數(shù)據(jù)進行反復的學習,從中提取到數(shù)據(jù)的有用特征,進而使得預測或者分類工作準確性得到有效提升的一種方法。深度模型實際上是一種方式、一種手段,而特征學習才是其目的。在深度學習算法中,對于模型結構的深度極為重視,同時對于特征學習所具有的重要意義進行了著重表現(xiàn),借助逐層的特征變化使得樣本在原本空間中所具有的特征進行處理,以一個新的空間特征加以表示,進而降低預測或者分類工作的難度[10]。相較于人工規(guī)則構造特征算法而言,借助大數(shù)據(jù)進行課程學習,可以對數(shù)據(jù)所蘊含的大量內在信息進行更加準確可靠的體現(xiàn)。
在僅能夠提供有限的數(shù)據(jù)的情況下,深度學習算法無法實現(xiàn)對數(shù)據(jù)中所包含規(guī)律的無偏差估計,所以為顯著提高算法的精度,必須給予充足的數(shù)據(jù)支持。因為深度學習中圖模型的復雜化,所以使得算法的時間和復雜程度大大提高,想要切實保證算法的實時性,還需要進一步優(yōu)化改善硬件設備和編程技能。
基于改進深度學習模式下,電力系統(tǒng)營銷的異常信息智能識別方法可采用Caffe網(wǎng)絡學習架構,在清洗電力信息流的同時,能夠對異常識別標簽進行注解處理,并且因為自動化協(xié)議多模塊架構系統(tǒng)的協(xié)助,待復制的異常信息可以與最終信息識別結果建立一一對應的捕獲映射網(wǎng),不但可以使電網(wǎng)運行環(huán)境更加穩(wěn)定,還能夠實現(xiàn)對異常傳輸信息流的精準處理,具備較強的應用可行性。