鄒賢求
(國網(wǎng)湖南省電力有限公司婁底供電分公司)
利用用電信息采集系統(tǒng)可以通過遠(yuǎn)程方式對(duì)相關(guān)計(jì)量點(diǎn)的數(shù)據(jù)信息進(jìn)行采集[1],截至目前已經(jīng)在我國幾億只電能計(jì)量器上得到應(yīng)用。對(duì)于采集得到的電壓、功率、電流等數(shù)據(jù)信息可以上傳至系統(tǒng)站中,利用大數(shù)據(jù)分析技術(shù)進(jìn)行處理,以便及時(shí)掌握電表的運(yùn)行狀態(tài),發(fā)現(xiàn)存在的問題[2]。由于大量的電表在應(yīng)用過程中,受到各類環(huán)境因素影響,難免出現(xiàn)故障問題,通過數(shù)據(jù)分析可以及時(shí)發(fā)現(xiàn)計(jì)量異?,F(xiàn)象,不需要利用傳統(tǒng)的人工方式進(jìn)行排查,能顯著提升工作質(zhì)量和效率,為電力企業(yè)的經(jīng)濟(jì)效益提供堅(jiān)實(shí)的保障[3]。本研究利用長(zhǎng)短期記憶網(wǎng)絡(luò)(LSTM)模型,對(duì)用電信息系統(tǒng)采集的數(shù)據(jù)信息進(jìn)行深度挖掘分析,可以及時(shí)發(fā)現(xiàn)計(jì)量異?,F(xiàn)象。通過實(shí)踐測(cè)試發(fā)現(xiàn)其具有良好的效果,值得進(jìn)一步推廣應(yīng)用。
我國當(dāng)前使用的電表通常為智能電表,電表采集得到的電壓、電流、功率,包括有功功率和無功功率,及其隨時(shí)間的演變情況等信息,能夠很好地反映出智能電表的實(shí)際工作狀態(tài)[4]。利用用電信息采集系統(tǒng)對(duì)智能電表的上述信息進(jìn)行采集,基于先進(jìn)的數(shù)據(jù)分析技術(shù)進(jìn)行處理,可以及時(shí)發(fā)現(xiàn)電表計(jì)量過程中存在的異常問題。一般情況下表計(jì)異常點(diǎn)比較隱蔽,且會(huì)持續(xù)比較長(zhǎng)的時(shí)間,實(shí)踐過程中發(fā)現(xiàn)表計(jì)異常點(diǎn)主要表現(xiàn)為三種形式,分別為數(shù)據(jù)偏大、數(shù)據(jù)偏小、數(shù)據(jù)持續(xù)缺失。如果存在數(shù)據(jù)缺失問題,在數(shù)據(jù)預(yù)處理階段就可以發(fā)現(xiàn)。針對(duì)其他問題則需要進(jìn)行深入的數(shù)據(jù)挖掘分析,不同用戶的用電行為特征與大小存在很大差異,所以需要基于系統(tǒng)采集的數(shù)據(jù)信息進(jìn)行深度的數(shù)據(jù)挖掘與甄別,才能發(fā)現(xiàn)用戶的用電行為異?,F(xiàn)象。
如果表計(jì)數(shù)據(jù)信息出現(xiàn)持續(xù)性的數(shù)據(jù)偏小或者偏大,而沒有按照正常的規(guī)律變化,那么可以根據(jù)數(shù)據(jù)庫中存儲(chǔ)的此類異常點(diǎn)之前的數(shù)據(jù)信息進(jìn)行數(shù)據(jù)分析,很快就可以確定異常點(diǎn)的開始時(shí)間[5]。如果數(shù)據(jù)庫中沒有存儲(chǔ)足夠的數(shù)據(jù)信息,那么將很難查找到異常點(diǎn)開始時(shí)間,此時(shí)就需要利用電力模型確定異常點(diǎn)開始時(shí)間,比如對(duì)線損率進(jìn)行排查計(jì)算,但這類方法需要依賴很多的數(shù)據(jù)信息,計(jì)算量和工作量很大,工作質(zhì)量和效率不高。本文基于長(zhǎng)短期記憶網(wǎng)絡(luò)(LSTM)模型進(jìn)行數(shù)據(jù)挖掘分析,能夠快速的確定表計(jì)數(shù)據(jù)的異常情況,效率較高。
本研究利用深度學(xué)習(xí)算法對(duì)用電信息采集系統(tǒng)收集得到的數(shù)據(jù)信息進(jìn)行挖掘分析,判斷存在的電表計(jì)量異常問題,具體為長(zhǎng)短期記憶網(wǎng)絡(luò)(LSTM)模型。利用深度學(xué)習(xí)算法時(shí)需要利用已有的數(shù)據(jù)信息對(duì)模型進(jìn)行訓(xùn)練與驗(yàn)證,然后可以利用該模型對(duì)電力用戶未來的電流、電壓以及功率等數(shù)據(jù)進(jìn)行準(zhǔn)確預(yù)測(cè),基于預(yù)測(cè)結(jié)果設(shè)置一個(gè)置信區(qū)間。如果實(shí)際結(jié)果正好處在置信區(qū)間范圍以內(nèi),則認(rèn)為不存在異常問題。相反的,如果實(shí)際結(jié)果不處在置信區(qū)間范圍以內(nèi),則認(rèn)為實(shí)際結(jié)果與預(yù)測(cè)結(jié)果之間存在明顯的偏差,可以認(rèn)定對(duì)應(yīng)的采集點(diǎn)存在數(shù)據(jù)計(jì)量異常問題。下文將對(duì)LSTM模型進(jìn)行深入介紹,基于該模型可以對(duì)電壓、電流、功率等常見的電參數(shù)的異常點(diǎn)進(jìn)行有效甄別。模型需要輸入的是電流、電壓或者功率的歷史數(shù)據(jù)信息,模型輸出的是下一個(gè)采集點(diǎn)的置信區(qū)間,并將實(shí)際結(jié)果與置信區(qū)間進(jìn)行對(duì)比,判斷是否存在異常問題。
整個(gè)LSTM模型可以劃分成為不同的結(jié)構(gòu),每個(gè)結(jié)構(gòu)均具有對(duì)應(yīng)的功能,所有功能結(jié)合起來就可以實(shí)現(xiàn)電流、電壓、功率結(jié)果的預(yù)測(cè)與分析。具體包括遺忘門結(jié)構(gòu)、輸入門結(jié)構(gòu)、當(dāng)前輸入單元狀態(tài)、當(dāng)前時(shí)刻單元狀態(tài)、輸出門的計(jì)算結(jié)構(gòu)等。以下對(duì)各結(jié)構(gòu)或狀態(tài)的情況進(jìn)行簡(jiǎn)要介紹。
對(duì)于遺忘門結(jié)構(gòu)的計(jì)算過程可以利用式(1)表示:
式中,Wf為遺忘門結(jié)構(gòu)的權(quán)重矩陣;bf為遺忘門結(jié)構(gòu)的偏置矩陣;[ht-1,xt]表示將括號(hào)內(nèi)的兩個(gè)量進(jìn)行拼接,ht-1、xt分別表示LSTM模型前一時(shí)刻的輸出以及當(dāng)前時(shí)刻的輸入情況;σf表示遺忘門激活函數(shù)。
對(duì)于輸入門結(jié)構(gòu)的計(jì)算過程可以利用式(2)表示:
式中,σi表示輸入門的激活函數(shù);Wi為輸入門結(jié)構(gòu)的權(quán)重矩陣;bi為輸入門結(jié)構(gòu)的偏置矩陣。
利用c′表示當(dāng)前時(shí)刻輸入的單元狀態(tài),具體操作時(shí)可以利用式(3)進(jìn)行計(jì)算:
式中,Wc為該單元的權(quán)重矩陣;bc為該單元的偏置矩陣。
利用ct表示當(dāng)前時(shí)刻的單元狀態(tài),該狀態(tài)主要由兩部分構(gòu)成:第一是基于前一時(shí)刻的單元狀態(tài)ct-1獲得,具體是ct-1與遺忘門ft相乘;第二是基于當(dāng)前輸入單元的狀態(tài)獲得,具體是c′t與輸入門it相乘。具體計(jì)算過程可按式(4)進(jìn)行:
式中,符號(hào)“?”表示根據(jù)元素進(jìn)行相乘。根據(jù)以上公式,LSTM模型可以把當(dāng)前記憶c′t和長(zhǎng)期記憶ct-1進(jìn)行有效結(jié)合,最終構(gòu)建出新單元狀態(tài)ct。
輸出門的計(jì)算過程可以按式(5)進(jìn)行處理:
式中,σo表示輸出門的激活函數(shù);Wo表示輸出門的權(quán)重矩陣;bo表示輸出門的偏執(zhí)矩陣。
利用LSTM模型對(duì)功率大小實(shí)施預(yù)測(cè),可以得到待測(cè)時(shí)間點(diǎn)功率大小的概率預(yù)測(cè)置信區(qū)間范圍。主要的網(wǎng)絡(luò)模型結(jié)構(gòu)參數(shù)如下:循環(huán)神經(jīng)網(wǎng)絡(luò)為4層,包括輸入層、LSTM層、普通隱含層、輸出層,其中輸入層為96×1序列輸入,LSTM層和隱含層分別設(shè)置有8個(gè)節(jié)點(diǎn)和4個(gè)節(jié)點(diǎn),輸出層的節(jié)點(diǎn)數(shù)量只有1個(gè)。系統(tǒng)每間隔15min采集一次數(shù)據(jù)信息,利用該模型可以利用96個(gè)點(diǎn)的歷史數(shù)據(jù)信息對(duì)未來一個(gè)時(shí)刻的數(shù)據(jù)進(jìn)行預(yù)測(cè)。使用模型之前需要利用歷史數(shù)據(jù)信息對(duì)LSTM模型進(jìn)行訓(xùn)練,本案例中準(zhǔn)備的訓(xùn)練樣本信息為5856個(gè),共完成了400次迭代訓(xùn)練,訓(xùn)練批數(shù)為512次,每次迭代運(yùn)算需要使用4~5批數(shù)據(jù)信息。其中訓(xùn)練的數(shù)據(jù)可以分為兩種類型,分別為訓(xùn)練集和驗(yàn)證集,其中驗(yàn)證集占所有數(shù)據(jù)信息比例的5%。利用歷史數(shù)據(jù)信息對(duì)模型進(jìn)行訓(xùn)練和驗(yàn)證以后,發(fā)現(xiàn)利用模型得到的數(shù)據(jù)信息基本在100%置信區(qū)間范圍以內(nèi),并且整個(gè)置信區(qū)間的范圍非常窄,意味著LSTM模型對(duì)功率進(jìn)行預(yù)測(cè)的置信區(qū)間具有很好的效果,且區(qū)間范圍對(duì)于異常數(shù)據(jù)信息的分析識(shí)別具有非常好的參考意義。如果實(shí)際的參數(shù)信息超過了模型預(yù)測(cè)的置信區(qū)間范圍,那么說明實(shí)際參數(shù)信息與歷史數(shù)據(jù)樣本信息的時(shí)序規(guī)律不相符,屬于異常數(shù)據(jù)點(diǎn)。
對(duì)于本研究所述的異常數(shù)據(jù)信息分析模型,可以采用兩個(gè)重要的指標(biāo)進(jìn)行評(píng)價(jià),分別為檢出率和誤檢率,以上兩個(gè)指標(biāo)分別用kacc、kerr符號(hào)表示,其計(jì)算公式如下:
式中,Nb表示實(shí)際所有的異常點(diǎn)數(shù)目;Nt表示利用模型正確檢測(cè)出來的異常點(diǎn)數(shù)目;Nf表示錯(cuò)誤檢測(cè)的異常點(diǎn)數(shù)目。
使用不同大小的噪聲方差對(duì)不同類型的參數(shù)信息進(jìn)行預(yù)測(cè),對(duì)兩個(gè)關(guān)鍵指標(biāo)進(jìn)行了統(tǒng)計(jì)計(jì)算。對(duì)于電壓參數(shù)信息,當(dāng)噪聲方差為0.5V2時(shí),kacc和kerr分別為79.66%和16.94%;當(dāng)噪聲方差為0.7V2時(shí),kacc和kerr分別為83.05%和13.55%。對(duì)于電流參數(shù)信息,當(dāng)噪聲方差為0.01A2時(shí),kacc和kerr分別為72.88%和25.42%;當(dāng)噪聲方差為0.05A2時(shí),kacc和kerr分別為77.97%和18.64%。對(duì)于功率參數(shù)信息,當(dāng)噪聲方差為7kW2時(shí),kacc和kerr分別為67.8%和15.25%,當(dāng)噪聲方差為13kW2時(shí),kacc和kerr分別為76.27%和13.55%。上述所有參數(shù)中,kacc和kerr的平均數(shù)分別為76.27%和17.23%。
為了驗(yàn)證LSTM模型在用電信息系統(tǒng)數(shù)據(jù)計(jì)量異常分析中的應(yīng)用效果,結(jié)合實(shí)際情況選取了三只存在異常數(shù)據(jù)的智能電表為對(duì)象進(jìn)行分析,電表分別用Ⅰ、Ⅱ、Ⅲ序號(hào)表示。選取的是2023年3月6日~5月7日的數(shù)據(jù)信息,每間隔15min采集一次數(shù)據(jù)信息,在兩個(gè)月時(shí)間里共測(cè)量得到了5952個(gè)點(diǎn)的數(shù)據(jù)信息,主要是功率值、電壓值和電流值等,利用上文提出的LSTM模型對(duì)計(jì)量異常數(shù)據(jù)信息進(jìn)行識(shí)別,以達(dá)到檢驗(yàn)LSTM模型的目的。下面對(duì)具體的測(cè)試過程以及結(jié)果進(jìn)行分析。
在普通電力用戶一天的用電過程中,其電流值通常不會(huì)出現(xiàn)明顯的變化,如果通過分析發(fā)現(xiàn)用戶的電流存在明顯突變現(xiàn)象,大概率是存在計(jì)量異常問題。如圖1所示為電表Ⅰ的電流大小以及電流變化情況,圖中顯示的是電表Ⅰ在3月6日的電流數(shù)據(jù)及其變化情況,從圖中可以看出,第37個(gè)采集點(diǎn)的電流及其電流變化值存在異?,F(xiàn)象,利用LSTM模型判定為異常點(diǎn)數(shù)據(jù),異常的根據(jù)是電流變化率過大,與實(shí)際數(shù)據(jù)進(jìn)行對(duì)比分析,發(fā)現(xiàn)異常點(diǎn)的甄別判斷是有效的。
圖1 電表Ⅰ的電流大小以及電流變化情況
普通電力用戶的用電功率不會(huì)出現(xiàn)明顯的變化,如果用電功率存在突變問題,則很可能是存在計(jì)量異常問題。如圖2所示為電表Ⅱ的功率大小以及功率變化情況,圖中顯示的主要是4月25日電表Ⅱ的數(shù)據(jù)信息。
圖2 電表Ⅱ的功率大小以及功率變化情況
從圖中可以看出,在第57個(gè)采集點(diǎn)的功率以及功率變化值出現(xiàn)了顯著的變化現(xiàn)象。利用LSTM模型進(jìn)行分析判斷后,認(rèn)為第57個(gè)采集點(diǎn)屬于異常點(diǎn)數(shù)據(jù)信息,判斷的根據(jù)是該采集點(diǎn)的功率存在突變現(xiàn)象。通過與實(shí)際情況進(jìn)行對(duì)比,認(rèn)定該異常點(diǎn)的甄別是有效的。
根據(jù)相關(guān)的理論可知,對(duì)電力用戶而言,其用電功率與電流的平方是成正比的,意味著電力用戶的電流越大,對(duì)應(yīng)的功率也越大。如果通過用電信息采集系統(tǒng)采集得到的電流和功率數(shù)據(jù)信息之間不匹配,則大概率是存在計(jì)量異常問題。如圖3所示為電表Ⅲ的電流大小以及功率變化情況,圖中顯示的是5月7日電表Ⅲ的數(shù)據(jù)信息。利用LSTM模型對(duì)相關(guān)的數(shù)據(jù)進(jìn)行深入挖掘分析以后,認(rèn)為第75個(gè)采集點(diǎn)的數(shù)據(jù)信息存在異?,F(xiàn)象,主要的根據(jù)是第75個(gè)采集點(diǎn)的電流值相對(duì)較小,但是功率值卻相比較大。這與基本的電力常識(shí)相沖突,因?yàn)樵陔妷罕3植蛔兊那闆r下,功率應(yīng)該與電流的平方成正比。通過與實(shí)際情況進(jìn)行對(duì)比,發(fā)現(xiàn)該采集點(diǎn)確實(shí)存在數(shù)據(jù)異常現(xiàn)象,驗(yàn)證了LSTM模型甄別判斷過程的有效性。
圖3 電表Ⅲ的電流大小以及功率變化情況
利用LSTM模型對(duì)智能電表的異常數(shù)據(jù)進(jìn)行分析時(shí),可以結(jié)合實(shí)際情況決定是否將相關(guān)結(jié)果反饋給有關(guān)部門。如果某一個(gè)智能電表在一段時(shí)間內(nèi)只是出現(xiàn)個(gè)別異常數(shù)據(jù)信息,則需要對(duì)該異常點(diǎn)的前后數(shù)據(jù)信息進(jìn)行更加細(xì)致地排查,確定是否出現(xiàn)了數(shù)值偏小或者數(shù)值偏大的更加隱蔽的數(shù)據(jù)計(jì)量異常問題,如果不存在上述問題,可以認(rèn)定為是偶然現(xiàn)象,無需向有關(guān)部門進(jìn)行反饋;如果某一個(gè)智能電表在很短的時(shí)間內(nèi)出現(xiàn)了很多次異常數(shù)據(jù)點(diǎn),可以認(rèn)定該電表存在計(jì)量異?,F(xiàn)象,需要及時(shí)將結(jié)果反饋給有關(guān)部門。
綜上所述,針對(duì)用電信息采集系統(tǒng)收集得到的數(shù)據(jù)信息,利用LSTM模型進(jìn)行深入地挖掘分析,可以及時(shí)發(fā)現(xiàn)智能電表計(jì)量過程中存在的問題,該模型是可行有效的。通過與實(shí)際的數(shù)據(jù)信息對(duì)比,發(fā)現(xiàn)平均檢出率和平均誤檢率分別為76.27%和17.23%。能夠大幅縮小故障問題的排查范圍,為電力企業(yè)提供很好的現(xiàn)實(shí)參考價(jià)值。
在人工智能的發(fā)展歷程中,LSTM模型以其卓越的數(shù)據(jù)建模和推理能力,得到了全球?qū)W術(shù)界和業(yè)界的廣泛關(guān)注和推崇。針對(duì)用電信息采集系統(tǒng)采集的電壓、電流、功率等大量數(shù)據(jù)信息,通過運(yùn)用LSTM模型進(jìn)行深度挖掘和分析,能夠快速準(zhǔn)確地發(fā)現(xiàn)電表計(jì)量過程中存在的異常問題。通過實(shí)踐測(cè)驗(yàn)發(fā)現(xiàn)LSTM模型的平均檢出率和平均誤檢率分別為76.27%和17.23%。這些測(cè)試結(jié)果有力地證明了LSTM模型的實(shí)用性和有效性,這對(duì)于進(jìn)一步推廣LSTM模型在用電信息采集系統(tǒng)數(shù)據(jù)計(jì)量異常分析中的應(yīng)用具有重要的現(xiàn)實(shí)意義。