王毓琦,高 嵩,萬校宏,李元元,楊子江
(1.國網(wǎng)山東省電力公司電力科學(xué)研究院,山東 濟(jì)南 250003;2.山東中實(shí)易通集團(tuán)有限公司,山東 濟(jì)南 250003;3.山東科技大學(xué)電氣與自動化工程學(xué)院,山東 青島 266590)
當(dāng)今隨著電力技術(shù)不斷進(jìn)步與發(fā)展,智能家居與智慧生活的概念相繼提出,企業(yè)更加注重用戶的日常生活用電體驗(yàn)。其中,對用戶用電行為進(jìn)行準(zhǔn)確分析,是實(shí)現(xiàn)負(fù)荷精準(zhǔn)預(yù)測和負(fù)荷調(diào)控的關(guān)鍵手段之一。而非侵入式電荷辨識算法以現(xiàn)有住宅電路為基礎(chǔ),借助現(xiàn)有電能表等電氣設(shè)備,實(shí)現(xiàn)了對用戶家庭用電行為的分析。
近年來,非侵入式負(fù)荷辨識技術(shù)已經(jīng)廣泛應(yīng)用于建筑節(jié)能、智慧城市、智慧電網(wǎng)等領(lǐng)域。隨著人工智能的不斷發(fā)展與大數(shù)據(jù)分析技術(shù)的不斷成熟,非侵入式負(fù)荷辨識技術(shù)通過電能監(jiān)控設(shè)備即可實(shí)現(xiàn)對用電行為的監(jiān)測,在一定程度上保護(hù)了用戶的隱私。對于用戶,通過負(fù)荷監(jiān)測獲取設(shè)備用電詳情可以及時(shí)得到反饋,有助于引導(dǎo)用戶合理用電。對于電力公司,非侵入式負(fù)荷監(jiān)測在不明顯提高投入的前提下,可實(shí)現(xiàn)負(fù)荷各組成成分的細(xì)粒度感知,提升電力負(fù)荷辨識預(yù)測準(zhǔn)確度,提高電網(wǎng)的安全性和經(jīng)濟(jì)性,有助于更精準(zhǔn)地對用戶行為進(jìn)行建模,實(shí)現(xiàn)對用戶的差異化和精細(xì)化服務(wù)。但目前市場已有的非侵入式負(fù)荷監(jiān)測產(chǎn)品因計(jì)算能力、功耗和成本限制,產(chǎn)品化設(shè)備算法單一固定,導(dǎo)致分類參數(shù)或匹配庫更新較慢,各型號電器識別率提高有限。
在現(xiàn)有非侵入式負(fù)荷辨識算法研究的基礎(chǔ)上,充分利用用戶評價(jià)數(shù)據(jù)信息,結(jié)合深度學(xué)算法對評價(jià)文本進(jìn)行分類和情感分析,建立分類評價(jià)反饋模型,根據(jù)分析結(jié)果實(shí)現(xiàn)對電網(wǎng)負(fù)荷辨識進(jìn)行反饋調(diào)整。
非侵入式負(fù)荷辨識是通過監(jiān)測識別用電設(shè)備的電壓、功率、啟動電流等典型用電特征實(shí)現(xiàn)在總負(fù)荷中分解并識別每一個(gè)電器。
與傳統(tǒng)的監(jiān)測方法相比,非侵入式負(fù)荷監(jiān)測可以在不監(jiān)測用戶電氣設(shè)備的情況下獲取所有電氣設(shè)備的運(yùn)行狀態(tài),解決了現(xiàn)有線路的改造、維護(hù)和設(shè)施購置問題,是一種方便、低成本的監(jiān)測方法。目前,設(shè)備事件的檢測方法可分為三類:啟發(fā)式、匹配濾波和概率模型[1]。文獻(xiàn)[2]基于簡單的規(guī)則判斷進(jìn)行時(shí)間監(jiān)控,首先根據(jù)規(guī)則對歸一化功率進(jìn)行分割,然后根據(jù)設(shè)置的閾值檢測事件。文獻(xiàn)[3]使用匹配濾波方法將輸入功率信號與已知信號模板進(jìn)行匹配,以檢測目標(biāo)事件。在文獻(xiàn)[4]中,負(fù)載通過時(shí)域變換得到家用設(shè)備的曲線,綜合運(yùn)用概率模型對各參數(shù)調(diào)整的負(fù)荷進(jìn)行分解。
但電氣設(shè)備類型的增加,分類匹配參數(shù)也需要不斷更新,而現(xiàn)有模型不能根據(jù)設(shè)備要求及時(shí)調(diào)整,導(dǎo)致了負(fù)荷識別的錯(cuò)誤率增加、用電量行為分析不完全等問題。
近年來,隨著計(jì)算機(jī)計(jì)算能力的提升,機(jī)器學(xué)習(xí)和深度學(xué)習(xí)技術(shù)得到的快速發(fā)展。K?近鄰算法、貝葉斯、支持向量機(jī)、循環(huán)神經(jīng)網(wǎng)絡(luò)(Recurrent Neural Network,RNN)算法逐漸被應(yīng)用到分類評估中[5?9]。
例如,在參考文獻(xiàn)[10]中提出了一種基于長期和短期記憶(Long?Short Term Memory,LSTM)神經(jīng)網(wǎng)絡(luò)和標(biāo)簽嵌入的文本分類模型。該模型融合了重要信息和后續(xù)信息的文本表示,在聯(lián)合空間中學(xué)習(xí)標(biāo)簽和單詞,最后利用標(biāo)簽和單詞之間的兼容性得分來加權(quán)標(biāo)簽和句子,有效地提高了文本分類的效果。參考文獻(xiàn)[11]提出了一種循環(huán)卷積注意模型。該模型將主題信息添加到注意層,提高了多標(biāo)記情感傾向的提取準(zhǔn)確率。該方法在多標(biāo)記情感分類任務(wù)中具有較高的穩(wěn)定性和較強(qiáng)的通用性。文獻(xiàn)[12]在原始的LSTM神經(jīng)網(wǎng)絡(luò)中加入文本向量,從而得到句子和段落之間的關(guān)系,實(shí)現(xiàn)了電子政務(wù)文本相似度的評價(jià)。LSTM 雖然在文本處理方面有很好的效果,但在文本分類和情感分析方面缺乏在電力領(lǐng)域的應(yīng)用,存在領(lǐng)域限制和專業(yè)障礙。
分類評價(jià)反饋算法包括語料庫處理、分類評價(jià)分析和評價(jià)反饋機(jī)制三個(gè)部分。算法整體架構(gòu)設(shè)計(jì)如圖1所示。
圖1 算法設(shè)計(jì)架構(gòu)
語料庫預(yù)處理部分對用戶評價(jià)數(shù)據(jù)中的整體評價(jià)數(shù)據(jù)進(jìn)行預(yù)處理。該部分主要實(shí)現(xiàn)了刪除特殊符號、過濾常用詞、句子分句等步驟。將全文處理成單句形式的簡短的負(fù)荷評估文本,并去除了文中的冗余文本,降低了模型操作的噪聲。最后,將預(yù)處理后的數(shù)據(jù)發(fā)送到分類評價(jià)分析部分,進(jìn)行文本分類分析。
分類評價(jià)分析部分是對語料庫數(shù)據(jù)進(jìn)行建模和分析。首先,根據(jù)評價(jià)文本的句子長度特征,建立分類評價(jià)模型。然后對現(xiàn)有數(shù)據(jù)集進(jìn)行劃分,手工標(biāo)注一部分?jǐn)?shù)據(jù)用于模型的訓(xùn)練,其余部分作為待分類測試的文本。對模型進(jìn)行訓(xùn)練和測試,直到模型達(dá)到較高的分類效果。最后對負(fù)荷評價(jià)文本輸入模型進(jìn)行分類,得到類型反饋結(jié)果,并發(fā)送給評價(jià)反饋機(jī)構(gòu)部分進(jìn)行處理。
根據(jù)語料庫分類反饋結(jié)果進(jìn)行處理和分析。根據(jù)反饋機(jī)制算法,判斷得到的裝備類別向量屬于新的裝備類別,提出現(xiàn)有的非侵入式負(fù)荷識別算法,對現(xiàn)有的非侵入式負(fù)荷識別算法進(jìn)行調(diào)整,或者更新裝備庫和訓(xùn)練參數(shù)。
分類評價(jià)反饋模型通過對預(yù)處理后的語料庫建立算法模型,實(shí)現(xiàn)負(fù)荷裝備評價(jià)文本的分類,并構(gòu)建評價(jià)反饋機(jī)制,實(shí)現(xiàn)按分類進(jìn)行負(fù)荷識別調(diào)整。
對用戶的總體評價(jià)數(shù)據(jù)進(jìn)行處理的步驟如圖2所示。
圖2 語料庫預(yù)處理步驟
由于用戶評價(jià)數(shù)據(jù)多為段落式句子,結(jié)構(gòu)復(fù)雜,首先采用子句處理,拆分用戶的全部文本Xn為短文本(x1,x2,…,xn)。其次,根據(jù)常用詞字典刪除常用語氣詞和特殊符號等字符,以減少模型的計(jì)算負(fù)擔(dān)。同時(shí),為了不影響模型的測試和訓(xùn)練,對無效數(shù)據(jù)進(jìn)行篩選和剔除,以保證數(shù)據(jù)的有效性。
3.2.1 LSTM神經(jīng)網(wǎng)絡(luò)
LSTM 神經(jīng)網(wǎng)絡(luò)是一種特殊的時(shí)間循環(huán)神經(jīng)網(wǎng)絡(luò),具有典型的復(fù)雜神經(jīng)網(wǎng)絡(luò)模塊的鏈?zhǔn)叫问?,用來解決RNN 存在的長期依賴問題[13?16]。單向LSTM 能更好地捕獲句子中的上下文信息,因此經(jīng)常用于文本分類等方向[17?18]。
用戶評價(jià)文本經(jīng)過語料庫處理生成文本序列后,由于文本較短且分類結(jié)果高度依賴上下文,采用LSTM 神經(jīng)網(wǎng)絡(luò)算法處理時(shí)間向量和長期依賴問題,以避免傳統(tǒng)RNN 在處理長期依賴上下文問題時(shí)信息丟失的弊端,可有效提高文本分類的準(zhǔn)確率[19]。LSTM神經(jīng)元的結(jié)構(gòu)如圖3所示。
圖3 LSTM神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)
長期狀態(tài)c存儲了長期記憶的信息,特征向量作為長期狀態(tài)進(jìn)行保存和傳輸。同時(shí),遺忘門層決定輸入信息x和前一個(gè)單元輸出信息ht?1是否通過ft傳送到ct。其中,W為權(quán)重,b為偏置,其計(jì)算公式為
式中:ft為遺忘門輸出;Wf為遺忘門權(quán)重;bf為遺忘門 偏置;ht?1為前一個(gè)單元輸出信息;σ為激活函數(shù)。
更新層通過輸入門層的σ決定ht?1和xt的更新信息,并通過tanh激活函數(shù)計(jì)算新的候選狀態(tài)其中,激活函數(shù)公式為
式中:it為輸入門輸出;Wi為輸入門權(quán)重;bi為輸入門偏置。
然后更新長期狀態(tài),即更新ct?1為ct。ft決定丟棄的信息內(nèi)容,ct?1和ft相乘后添加新的狀態(tài),完成狀態(tài)長期狀態(tài)更新為
式中:ct為細(xì)胞狀態(tài)輸出;ct?1為前一時(shí)刻細(xì)胞狀態(tài)。
最后,通過輸出層處理,輸出最終確定的類別結(jié)果向量為
式中:ot為輸出門輸出;Wo為輸出門權(quán)重;bo為輸出門偏置。
式中:ht為本單元輸出信息。
3.2.2 評價(jià)分類算法
評價(jià)分類算法流程如圖4 所示。首先,從序列文本xn中選擇部分?jǐn)?shù)據(jù)集。根據(jù)評價(jià)文本的設(shè)備類別標(biāo)記為dtrain最后得到模型訓(xùn)練集(xtrain,xtes)t和測試集(ytrain,ytes)t。然后對訓(xùn)練集和測試集的序列文本xn進(jìn)行分割,得到詞向量x(s1,s2,…,sn),并作為模型訓(xùn)練和測試的輸入。
圖4 評價(jià)分類算法流程
模型訓(xùn)練完成后,對用戶數(shù)據(jù)的其余部分按照同樣的步驟進(jìn)行分割,然后輸入到模型中,得到相應(yīng)的用戶文本類別向量Y(y1,y2,…,yn),并作為評價(jià)反饋機(jī)制的輸入。
評價(jià)分類算法偽代碼為:
3.2.3 評價(jià)反饋機(jī)制
首先,根據(jù)用戶評價(jià)文本分類結(jié)果構(gòu)建評價(jià)反饋機(jī)制。然后采用分類分析評價(jià)算法對輸出結(jié)果進(jìn)行分析,確定是否有新設(shè)備,及時(shí)調(diào)整負(fù)荷識別算法,更新設(shè)備類型或參數(shù)數(shù)據(jù)庫。具體算法的實(shí)現(xiàn)過程為:
1)遍歷用戶的評估類別信息,以確定用戶Xi的文本類別yi是否滿足[20]
2)如果超過該值,則認(rèn)為用戶設(shè)備已經(jīng)更新,應(yīng)及時(shí)調(diào)整用戶負(fù)荷識別模型,做出類別反饋響應(yīng)。
根據(jù)上述算法設(shè)計(jì)步驟,本文在python3.7 的環(huán)境下,利用Pycharm 軟件在TensorFlow2.0 框架構(gòu)建LSTM 神經(jīng)網(wǎng)絡(luò),并實(shí)現(xiàn)了分類評價(jià)反饋機(jī)制。本實(shí)驗(yàn)共使用120 組用戶文本數(shù)據(jù)。通過子句拆分處理,總共得到800 套設(shè)備樣本,訓(xùn)練集設(shè)置為70%,即560組。
利用LSTM 神經(jīng)網(wǎng)絡(luò)對6 種設(shè)備的評價(jià)文本進(jìn)行分類,分類效果如表1 所示表1 中,用于反映模型的穩(wěn)健度。每種設(shè)備的平均分類準(zhǔn)確率δ為0.87,召回率r為0.86,F(xiàn)1為0.87。訓(xùn)練過程如圖5 所示,整體訓(xùn)練效果相對穩(wěn)定。實(shí)驗(yàn)結(jié)果表明,該模型能有效地實(shí)現(xiàn)負(fù)荷識別與評價(jià)的文本分類。
圖5 文本分類訓(xùn)練過程效果
表1 評價(jià)分級效果分析表
用電負(fù)荷分類評價(jià)與反饋的效果分析如表2 所示。實(shí)際負(fù)荷識別如圖6 所示。實(shí)驗(yàn)對擴(kuò)展數(shù)據(jù)集中隨機(jī)選取的包括新設(shè)備在內(nèi)的6 種設(shè)備的實(shí)際運(yùn)行結(jié)果進(jìn)行了文本測試。實(shí)驗(yàn)結(jié)果表明,通過對文本分類效果的判斷,評價(jià)反饋機(jī)制可對異常值進(jìn)行有效反饋,從而對負(fù)載識別算法進(jìn)行評價(jià)。
表2 評價(jià)與反饋實(shí)驗(yàn)分析表
圖6 負(fù)荷識別效果
結(jié)合深度學(xué)習(xí)算法,建立了電網(wǎng)負(fù)荷的分類評價(jià)反饋模型,根據(jù)用戶評價(jià)文本和電氣設(shè)備類型進(jìn)行分類,通過模型分析反饋負(fù)荷識別結(jié)果。實(shí)驗(yàn)結(jié)果表明,該模型能夠準(zhǔn)確地對評價(jià)文本進(jìn)行分類,對非侵入式負(fù)荷識別算法的研究起到輔助反饋?zhàn)饔?,?shí)現(xiàn)了信息的實(shí)時(shí)交換,達(dá)到了非侵入式負(fù)荷識別的校正效果。但仍存在一些未考慮的問題,如人工標(biāo)注的數(shù)據(jù)量少于總數(shù)據(jù)量、模型的分類效果不夠準(zhǔn)確等。該模型主要根據(jù)文本內(nèi)容進(jìn)行分析,但不可能識別出惡意評論或遺漏信息,反饋中仍存在漏洞。綜上所述,該算法模型能夠及時(shí)實(shí)現(xiàn)負(fù)荷識別和調(diào)整,減少人工參與評估過程,提高問題發(fā)現(xiàn)效率,實(shí)現(xiàn)與用戶的實(shí)時(shí)溝通,對非侵入式負(fù)荷載識別算法的研究的應(yīng)用具有積極推進(jìn)作用。