尹 利,于 波,馬 飛,朱生榮,金溢杭,袁志昌,熊春暉
(1.內(nèi)蒙古電力(集團(tuán))有限責(zé)任公司烏蘭察布電業(yè)局,內(nèi)蒙古 烏蘭察布 100176; 2.清華大學(xué)電機(jī)工程與應(yīng)用電子技術(shù)系,北京 100084; 3.北京智中能源互聯(lián)網(wǎng)研究院有限公司,北京 100048)
近年來,我國不斷推進(jìn)智能電網(wǎng)的建設(shè),電力公司部署了大量的智能電表及用電信息采集系統(tǒng)[1]。在各種用電成分中,工業(yè)用電是其中重要的負(fù)荷成分之一。根據(jù)國家能源局發(fā)布的統(tǒng)計(jì)數(shù)據(jù),2021年1~2月全國工業(yè)用電量達(dá)到7 843億kW·h,占全社會(huì)用電量的62.3%。對(duì)于工業(yè)用電負(fù)荷進(jìn)行感知、分析和管理是推進(jìn)智能電網(wǎng)建設(shè)的重要一步。
負(fù)荷分解(load disaggregation)是感知并識(shí)別對(duì)象負(fù)荷成分及其狀態(tài)的重要技術(shù),也稱為非侵入式負(fù)荷檢測(Non-Intrusive Load Monitoring, NILM)。侵入式負(fù)荷檢測需要針對(duì)用戶每一臺(tái)用電設(shè)備安裝傳感器,所需成本巨大且對(duì)用戶隱私安全造成隱患。NILM則只需要根據(jù)用戶總體用電特征對(duì)用戶負(fù)荷進(jìn)行識(shí)別分解,具有簡單、經(jīng)濟(jì)、可靠和易于擴(kuò)展的優(yōu)點(diǎn)[2],同時(shí)非侵入式的分解方法也提高了電力用戶的隱私安全。工業(yè)設(shè)備用電總量大,其負(fù)荷特征相對(duì)較為穩(wěn)定,對(duì)工業(yè)用戶進(jìn)行負(fù)荷分解能夠幫助電網(wǎng)系統(tǒng)快速準(zhǔn)確地掌握工業(yè)用戶設(shè)備狀態(tài)、制定相關(guān)用電政策和完善需求響應(yīng)機(jī)制;同時(shí)對(duì)于工業(yè)用戶負(fù)荷分解能夠協(xié)助其降低能源成本、改善企業(yè)生態(tài)狀況和反饋調(diào)度[3]。
目前針對(duì)負(fù)荷分解國內(nèi)外已經(jīng)有大量的研究。不同于對(duì)用戶負(fù)荷的短期預(yù)測[4,5],負(fù)荷分解需要根據(jù)已知多種負(fù)荷的總體特征來推斷各個(gè)分負(fù)荷的狀態(tài)。文獻(xiàn)[6-8]綜述了非侵入式負(fù)荷分解問題的方法和技術(shù)。如圖1所示,負(fù)荷分解問題主要由數(shù)據(jù)采集、負(fù)荷特征提取(若有必要?jiǎng)t進(jìn)一步構(gòu)建負(fù)荷特征庫)和負(fù)荷分解方法三個(gè)部分組成,最終實(shí)現(xiàn)從總負(fù)荷特征中解析出各設(shè)備負(fù)荷。
圖1 工業(yè)負(fù)荷分解示意圖Fig.1 Illustration of industrial load disaggregation
負(fù)荷特征提取方法主要基于設(shè)備的穩(wěn)態(tài)特征和暫態(tài)特征。暫態(tài)特征通過提取設(shè)備負(fù)荷瞬態(tài)的形狀、大小、持續(xù)時(shí)間和諧波等特征,能夠獨(dú)特地定義設(shè)備負(fù)荷狀態(tài)轉(zhuǎn)換[9]。文獻(xiàn)[10,11]分別通過暫態(tài)功率頻譜分析和基于滑動(dòng)窗的雙邊累積及暫態(tài)事件自動(dòng)檢測算法捕捉暫態(tài)事件特征,從而實(shí)現(xiàn)對(duì)負(fù)荷狀態(tài)的辨識(shí)。文獻(xiàn)[12]提出了一種基于均值變點(diǎn)模型的識(shí)別算法,利用最小二乘法計(jì)算目標(biāo)函數(shù)以確定變點(diǎn)個(gè)數(shù)。穩(wěn)態(tài)特征則是指設(shè)備狀態(tài)改變時(shí)更加持續(xù)的變化特征,包括有功功率、無功功率、電流等[7-11,13]。文獻(xiàn)[14,15]通過對(duì)設(shè)備穩(wěn)態(tài)負(fù)荷電流進(jìn)行建模,通過優(yōu)化方法估計(jì)設(shè)備電流。也有相關(guān)文獻(xiàn)將穩(wěn)態(tài)特征與暫態(tài)特征相結(jié)合,共同用于負(fù)荷特征建模[16,17]。目前進(jìn)行負(fù)荷特征提取的技術(shù)主要包括傅里葉分解、小波分析、回歸分析[6,7]。
負(fù)荷分解方法主要包括優(yōu)化方法和學(xué)習(xí)算法。優(yōu)化方法主要通過數(shù)學(xué)規(guī)劃方法或啟發(fā)式算法求解得到當(dāng)前用電設(shè)備的狀態(tài),如粒子群算法[18]、遺傳算法[15]等,文獻(xiàn)[19]則利用模擬退火算法輔助求解其基于圖信號(hào)的分解模型。學(xué)習(xí)算法則通過學(xué)習(xí)各個(gè)設(shè)備的負(fù)荷特征對(duì)總體特征進(jìn)行分解,主要包括支持向量機(jī)[6,7,20]、K近鄰算法[6,7]、基于隱馬爾可夫模型(Hidden Markov Model,HMM)的算法[21,22]、基于神經(jīng)網(wǎng)絡(luò)的算法[23-25]等。
已有研究主要存在幾方面問題,首先,目前負(fù)荷分解的對(duì)象只關(guān)注居民和商業(yè)用戶,大多為家電負(fù)荷,針對(duì)工業(yè)用戶的負(fù)荷分解幾乎仍為空白。另外,當(dāng)前負(fù)荷特征建模方法難以對(duì)工業(yè)設(shè)備負(fù)荷進(jìn)行有效建模。工業(yè)負(fù)荷相對(duì)于居民電器負(fù)荷特征差別很大,居民電器負(fù)荷通常具有獨(dú)特的狀態(tài)變化和穩(wěn)定運(yùn)行時(shí)的有功功率、電流等特征。而對(duì)于工業(yè)負(fù)荷,其設(shè)備種類多、數(shù)量大,負(fù)荷的時(shí)序特征取決于生產(chǎn)模式。對(duì)于大工業(yè)用戶的生產(chǎn)設(shè)備,通常一條總線下連接1~5臺(tái)設(shè)備,設(shè)備性質(zhì)較相似。很多大功率工業(yè)設(shè)備狀態(tài)變化和穩(wěn)定運(yùn)行時(shí)的特征主要表現(xiàn)在功率和電流量級(jí)上。這為工業(yè)用戶負(fù)荷建模帶來兩個(gè)問題:一是能夠定義負(fù)荷狀態(tài)的特征較少,并且常用的有功功率、電流、電壓等特征之間還具有較高的相關(guān)性;二是即使處于同一狀態(tài)的負(fù)荷也可能根據(jù)實(shí)際生產(chǎn)情況的不同而具有不同的運(yùn)行特征,這使得難以對(duì)負(fù)荷狀態(tài)及其變化進(jìn)行定義和區(qū)別。另外,除了工業(yè)負(fù)荷本身的運(yùn)行特征,對(duì)于工業(yè)負(fù)荷的數(shù)據(jù)采集也相對(duì)更加困難,當(dāng)前工業(yè)用戶的數(shù)字化水平仍亟待提高,大中小型工業(yè)用戶尚不能在完成高頻工業(yè)負(fù)荷采集同時(shí)保證數(shù)據(jù)采集質(zhì)量。
綜上所述,本文針對(duì)大工業(yè)用戶的生產(chǎn)設(shè)備提出一種基于對(duì)工業(yè)設(shè)備差分負(fù)荷頻譜曲線聚類的方法,對(duì)工業(yè)設(shè)備負(fù)荷進(jìn)行建模,得到其負(fù)荷印記,通過對(duì)負(fù)荷差分進(jìn)行建模能夠避免同一運(yùn)行狀態(tài)可能具有多種特征量級(jí)的問題,快速傅里葉分解將工業(yè)負(fù)荷時(shí)域信號(hào)轉(zhuǎn)化為頻域特征,實(shí)現(xiàn)對(duì)負(fù)荷狀態(tài)以及狀態(tài)變化的捕捉。通過聚類的無監(jiān)督學(xué)習(xí)能夠快速地得到設(shè)備的典型工作狀態(tài)。然后使用雙向長短期記憶神經(jīng)網(wǎng)絡(luò)(Bi-directional Long Short-Term Memory, Bi-LSTM)對(duì)工廠總體有功功率下設(shè)備狀態(tài)進(jìn)行學(xué)習(xí)。最后通過工廠設(shè)備真實(shí)數(shù)據(jù)對(duì)本文所提方法進(jìn)行驗(yàn)證,結(jié)果表明基于差分聚類的方法能夠有效地對(duì)工業(yè)負(fù)荷進(jìn)行建模,同時(shí)基于神經(jīng)網(wǎng)絡(luò)的負(fù)荷分解方法能夠有效地分解識(shí)別工廠設(shè)備狀態(tài)。工業(yè)負(fù)荷特征建模與分解方法總體流程如圖2所示。
圖2 非侵入式工業(yè)負(fù)荷特征建模與分解方法流程Fig.2 Architecture of proposed method for non-intrusive industrial load modeling and monitoring
由于受制于對(duì)工業(yè)設(shè)備負(fù)荷的采樣頻率,負(fù)荷分解難以捕捉到工業(yè)負(fù)荷的高頻波動(dòng)。但工業(yè)設(shè)備也因?yàn)槠渖a(chǎn)流程的周期性而具有獨(dú)特的周期特征,設(shè)備生產(chǎn)流程中的特定工序會(huì)對(duì)應(yīng)不同的負(fù)荷特征。工業(yè)用戶的總體負(fù)荷特征更加容易獲得,感知工業(yè)用戶設(shè)備具體的用電負(fù)荷值在有序用電策略制定等場景中意義有限,更關(guān)鍵的是要識(shí)別出當(dāng)前設(shè)備負(fù)荷的生產(chǎn)狀態(tài)。本文首先對(duì)設(shè)備負(fù)荷狀態(tài)進(jìn)行建模,不同于傳統(tǒng)的只基于人工輔助記錄設(shè)備負(fù)荷特征或通過算法自動(dòng)分類,本文提出一種基于負(fù)荷差分聚類方法對(duì)設(shè)備負(fù)荷狀態(tài)進(jìn)行建模。
本文暫不考慮負(fù)荷分解中的數(shù)據(jù)采集問題,由于工業(yè)設(shè)備的不同負(fù)荷特征之間具有較強(qiáng)的相關(guān)性,這里主要考慮但不限于針對(duì)工業(yè)用戶總有功功率特征進(jìn)行建模。假設(shè)能夠采集到工廠的總體有功功率和各個(gè)設(shè)備的短期有功功率樣本數(shù)據(jù)。設(shè)工業(yè)用戶一條總線上包含N臺(tái)設(shè)備,在時(shí)刻t其總體有功功率為Pt,第i臺(tái)設(shè)備的功率為Pi,t,滿足:
(1)
一般情況下只能觀測到總體有功功率,而無法觀測到各設(shè)備功率值Pi,t。由于引言提到工業(yè)設(shè)備負(fù)荷的穩(wěn)定狀態(tài)和狀態(tài)變化相對(duì)不具有穩(wěn)定的有功功率量級(jí),難以對(duì)其有功功率值直接進(jìn)行有效建模。因此這里對(duì)設(shè)備有功功率進(jìn)行差分處理來捕捉設(shè)備的有功變化。得到其有功功率差分值di,t,定義為:
di,t=Pi,t-Pi,t-1i=1,2,…,N
(2)
(3)
式中,w為角頻率,取值為基頻w0的整數(shù)倍;Fi,t(e-jw)為i設(shè)備t時(shí)刻功率差分曲線vi,t在頻率點(diǎn)w的頻譜分解結(jié)果,是w的復(fù)函數(shù)。
快速傅里葉分解取傅里葉分解中固定頻率上的頻域值,這里取固定頻率上的幅值得到其幅值序列為:
Ai,t=[ai,0,ai,1,…,ai,l-1]
(4)
振幅曲線由固定長度的連續(xù)值組成,因此這里選擇K-means++聚類算法對(duì)其進(jìn)行聚類分析。K-means++聚類算法是基于K-means聚類的改進(jìn)算法[26],其相對(duì)于傳統(tǒng)的K-means聚類算法優(yōu)化了初始聚類中心的選擇。初始聚類中心的選擇對(duì)K-means算法的聚類結(jié)果有較大影響,隨機(jī)地選擇初始聚類中心有時(shí)不能得到很好的聚類結(jié)果,利用改進(jìn)的K-means++算法進(jìn)行聚類分析可以避免該問題。K-means++聚類算法的流程有如下6個(gè)步驟:
(1)設(shè)定聚類簇?cái)?shù)為K,每個(gè)簇的聚類中心為ck,包含的樣本點(diǎn)集合為Ck,k=1,2,…,K。從振幅序列集合中隨機(jī)選取一個(gè)樣本作為初始聚類中心c1。
(2)計(jì)算每個(gè)樣本Ai,t與當(dāng)前已有聚類中心的最短距離:
D(Ai,t)=min(Ai,t-ck)2
(3)計(jì)算每個(gè)樣本被選為下一個(gè)聚類中心的概率:
然后,按照轉(zhuǎn)盤法選出下一個(gè)聚類中心。
(4)重復(fù)步驟(2)、步驟(3)直到選出K個(gè)聚類中心。
(5)對(duì)每個(gè)樣本Ai,t,計(jì)算它到K個(gè)聚類中心的距離并將其歸到距離最小的聚類中心對(duì)應(yīng)的簇集合Ck中。
(7)重復(fù)步驟(5)、步驟(6)直到聚類中心變化小于設(shè)定閾值。
上述K-means++聚類算法是以最小化樣本與質(zhì)點(diǎn)平方誤差作為目標(biāo)函數(shù)。將聚類得到的每個(gè)簇質(zhì)點(diǎn)與簇內(nèi)樣本點(diǎn)的平方距離誤差和定義為畸變程度。對(duì)于第i臺(tái)設(shè)備的每個(gè)樣本點(diǎn)Ai,t∈Rl,記其所屬簇的類別為C(Ai,t)∈{1,2,…,K},C(·)為輸出樣本點(diǎn)類別的函數(shù),聚類中心為cC(Ai,t)∈Rl,則畸變程度為:
(5)
一般地,畸變程度會(huì)隨聚類類別數(shù)量K增大而減小。工程上通常使用“肘部法則”選取聚類數(shù)目K。該法則是指在畸變程度隨著K的增加而降低的過程中,通常會(huì)達(dá)到某個(gè)臨界點(diǎn)使畸變程度得到較大改善,之后緩慢下降,這個(gè)曲線下降的臨界點(diǎn)就可以考慮為聚類性能較好的點(diǎn)。
目前基于優(yōu)化方法的負(fù)荷分解在本質(zhì)上是多項(xiàng)式復(fù)雜程度的非確定性問題,當(dāng)設(shè)備過多或設(shè)備狀態(tài)較多時(shí)存在求解效率問題[7]。在本問題中,由于聚類對(duì)象為差分曲線分解得到的振幅序列,考慮到相角因素,使用優(yōu)化方法對(duì)其進(jìn)行分解時(shí)會(huì)造成較低的求解效率或較大的計(jì)算誤差,且優(yōu)化方法難以捕捉到負(fù)荷狀態(tài)的時(shí)序特征。這里考慮使用雙向長短期記憶神經(jīng)網(wǎng)絡(luò)進(jìn)行負(fù)荷分解。
循環(huán)神經(jīng)網(wǎng)絡(luò)(Recurrent Neural Network, RNN)是一類以連續(xù)序列數(shù)據(jù)為輸入,在序列的時(shí)間遞增方向進(jìn)行連續(xù)計(jì)算并傳遞隱藏狀態(tài)的神經(jīng)網(wǎng)絡(luò)模型。并且,在一個(gè)樣本序列段內(nèi)模型參數(shù)不會(huì)更新,共享一套參數(shù)進(jìn)行推理計(jì)算。RNN網(wǎng)絡(luò)更多詳細(xì)介紹見文獻(xiàn)[27],其模型結(jié)構(gòu)如圖3所示。
圖3 RNN結(jié)構(gòu)示意圖Fig.3 Structure of RNN
以o分類(o為分類數(shù)量,即輸出向量的維度)循環(huán)神經(jīng)網(wǎng)絡(luò)為例,模型的一個(gè)完整樣本輸入:連續(xù)T時(shí)刻序列數(shù)據(jù){Xt∈Rb×q,t=1,2,…,T}。其中,Xt為處于序列中第t時(shí)刻的數(shù)據(jù),批量大小(batch size)為b,輸入特征為q維。記Ht∈Rb×h為隱藏變量,h為隱藏層單元數(shù)。每個(gè)時(shí)刻的隱藏變量都會(huì)被保存,用于后續(xù)計(jì)算。在計(jì)算t時(shí)刻的模型輸出時(shí),與無隱藏狀態(tài)的神經(jīng)網(wǎng)絡(luò)不同,模型輸入不僅包括Xt(以學(xué)習(xí)對(duì)應(yīng)于該輸入的權(quán)重參數(shù)Wxh∈Rq×h,x為指代輸入層的符號(hào),h為指代隱藏層的符號(hào)),還將引入隱藏狀態(tài)張量Ht-1,以額外學(xué)習(xí)一個(gè)權(quán)重參數(shù)Whh∈Rh×h。t時(shí)刻,模型一個(gè)批量輸入對(duì)應(yīng)的輸出記為Ot∈Rb×o。φ為計(jì)算隱藏狀態(tài)用到的激活函數(shù),f為計(jì)算輸出時(shí)使用的激活函數(shù)。bh∈Rh、bo∈Ro(正體o為指代輸出層的符號(hào),斜體o為輸出向量的維度)為待學(xué)習(xí)的偏置量。則模型計(jì)算公式為:
Ht=φ(XtWxh+Ht-1Whh+bh)
(6)
Ot=f(HtWho+bo)
(7)
因此,在T長度的序列樣本中,每一個(gè)時(shí)刻的隱藏變量一定程度保留了初始時(shí)刻至當(dāng)前時(shí)刻的信息,實(shí)現(xiàn)了捕捉時(shí)序信息的功能。隱藏狀態(tài)的使用以及待學(xué)習(xí)的權(quán)重、偏置參數(shù)在T時(shí)段的每個(gè)時(shí)刻內(nèi)相同,因此稱計(jì)算過程是循環(huán)的。
基本的RNN網(wǎng)絡(luò)結(jié)構(gòu)對(duì)短期信息有一定的記憶功能,但難以解決長時(shí)間的序列學(xué)習(xí)問題。對(duì)長時(shí)間序列處理容易出現(xiàn)梯度消失或梯度爆炸的問題[28]。而長短期記憶網(wǎng)絡(luò)(Long Short-Term Memory,LSTM)除了傳遞隱藏狀態(tài),還引入了存儲(chǔ)單元,用于記錄附加信息,可有效解決長時(shí)間記憶依賴問題。由于需要同時(shí)維護(hù)和傳遞隱藏狀態(tài)與存儲(chǔ)單元,還引入了遺忘門、輸入門、輸出門學(xué)習(xí)序列信息,進(jìn)而控制存儲(chǔ)單元和隱藏狀態(tài)的信息流動(dòng)。每個(gè)“門”實(shí)質(zhì)上是“全連接層+激活函數(shù)”模塊。遺忘門用來控制存儲(chǔ)單元的信息留存;輸入門決定了當(dāng)前時(shí)刻備選存儲(chǔ)單元狀態(tài)有多少信息留存到存儲(chǔ)單元;輸出門控制有多少存儲(chǔ)單元狀態(tài)輸出到LSTM 的當(dāng)前輸出值。LSTM網(wǎng)絡(luò)的結(jié)構(gòu)示意如圖4所示,其詳細(xì)介紹可參考文獻(xiàn)[27]。
圖4 LSTM網(wǎng)絡(luò)結(jié)構(gòu)示意圖Fig.4 Structure of LSTM network
LSTM相應(yīng)的模型計(jì)算公式如式(8)~式(13)所示。
Ft=Sigmoid(XtWxf+Ht-1Whf+bf)
(8)
It=Sigmoid(XtWxi+Ht-1Whi+bi)
(9)
Ot=Sigmoid(XtWxo+Ht-1Who+bo)
(10)
At=tanh(XtWxa+Ht-1Wha+ba)
(11)
Ct=Ct-1⊙Ft+It⊙At
(12)
Ht=Ot⊙tanh(Ct)
(13)
式中,Xt∈Rb×h為LSTM模型t時(shí)刻的輸入數(shù)據(jù);令e∈{f,i,o,a},f,i,o,a分別為指代遺忘門、輸入門、輸出層和備選計(jì)算層的標(biāo)記符號(hào),則Wxe∈Rq×h、Whe∈Rh×h為待學(xué)習(xí)權(quán)重矩陣,be∈Rh為待學(xué)習(xí)偏置參數(shù);Ft∈Rb×h、It∈Rb×h、Ot∈Rb×h分別為遺忘門、輸入門、輸出門計(jì)算得到的門控狀態(tài)數(shù)據(jù);At∈Rb×h為備選存儲(chǔ)單元狀態(tài);Ct∈Rb×h、Ht∈Rb×h為t時(shí)刻計(jì)算得到的存儲(chǔ)單元狀態(tài)數(shù)據(jù)和狀態(tài)變量數(shù)據(jù)。最后LSTM單元的輸出Ht經(jīng)過全連接層與激活函數(shù)Softmax處理即可得到t時(shí)刻最終輸出Outt。
為了充分地利用一段時(shí)長為T的序列的信息分解出分設(shè)備的狀態(tài),本文采用雙向循環(huán)神經(jīng)網(wǎng)絡(luò)模型。雙向LSTM由正向和反向LSTM組成。本文中搭建的網(wǎng)絡(luò)模型結(jié)構(gòu)如圖5所示,正向和反向分別按照模型式(8)~式(13)計(jì)算得到相應(yīng)的隱藏狀態(tài)并進(jìn)行組合進(jìn)入輸出層。其中反向LSTM指該部分模型接收的樣本數(shù)據(jù)按時(shí)間遞減方向輸入{Xt∈Rb×q,t=T,T-1,…,1}。
圖5 雙向LSTM結(jié)構(gòu)Fig.5 Structure of Bi-directional LSTM network
(14)
本文將以內(nèi)蒙古自治區(qū)烏蘭察布地區(qū)某工廠為案例,使用負(fù)荷差分聚類算法對(duì)其設(shè)備負(fù)荷特征進(jìn)行建模,然后使用基于雙向長短期記憶神經(jīng)網(wǎng)絡(luò)的負(fù)荷分解算法對(duì)總有功功率進(jìn)行分解。數(shù)值試驗(yàn)中使用的數(shù)據(jù)為該工廠2021年2月份的總有功功率和各個(gè)設(shè)備的有功功率。由于數(shù)據(jù)采樣頻率較低且時(shí)間跨度較短,本文對(duì)工廠原始數(shù)據(jù)進(jìn)行了采樣再重復(fù)的擴(kuò)展(采樣間隔1 h),構(gòu)造仿真數(shù)據(jù),使得學(xué)習(xí)算法能更有效地抓取特征,以更客觀地測試模型性能。本文選取前85%、后15%的數(shù)據(jù)分別作為訓(xùn)練和測試數(shù)據(jù)集。采用整段測試數(shù)據(jù)進(jìn)行序列到序列的總負(fù)荷分解測試,并使用準(zhǔn)確率、加權(quán)召回率、加權(quán)精確率作為指標(biāo)做定量評(píng)價(jià)。算例中使用開源的Pytorch深度學(xué)習(xí)框架搭建LSTM模型。將準(zhǔn)備好的訓(xùn)練數(shù)據(jù)連續(xù)抽樣為小批量數(shù)據(jù),在雙向LSTM模型上進(jìn)行訓(xùn)練,并保存訓(xùn)練好的模型,用于負(fù)荷識(shí)別預(yù)測。
本文使用準(zhǔn)確率、加權(quán)召回率、加權(quán)精確率作為指標(biāo)做定量評(píng)價(jià)。準(zhǔn)確率為預(yù)測正確的序列點(diǎn)占樣本序列總點(diǎn)數(shù)的比例;精確率為預(yù)測為某類實(shí)例樣本中預(yù)測正確的比例;召回率為某類真實(shí)實(shí)例被正確識(shí)別的比例。精確率和召回率通常難以同時(shí)滿足,某類查找較全時(shí)往往較難達(dá)到高準(zhǔn)確率預(yù)測;某類預(yù)測正確率高時(shí)往往較難完全識(shí)別。進(jìn)一步使用綜合評(píng)價(jià)指標(biāo)F1_score評(píng)判兩方面的性能。
第i臺(tái)設(shè)備的測試準(zhǔn)確率為:
(15)
式中,Zi為第i臺(tái)設(shè)備預(yù)測正確的狀態(tài)數(shù);Ti為第i臺(tái)設(shè)備的樣本長度。
第i臺(tái)設(shè)備加權(quán)精確率(precision,記為p)為:
(16)
式中,Si為第i臺(tái)設(shè)備的狀態(tài)數(shù)量;pij為第i臺(tái)設(shè)備j狀態(tài)的精確率,pij=Tpij/(Tpij+Fpij);Tpij為第i臺(tái)設(shè)備第j狀態(tài)被預(yù)測正確的標(biāo)簽數(shù)量;Fpij為第i臺(tái)設(shè)備第j狀態(tài)被錯(cuò)誤預(yù)測為其他狀態(tài)的數(shù)量;FNij為第i臺(tái)設(shè)備非第j狀態(tài)預(yù)測為第j狀態(tài)的數(shù)量;TNij為第i臺(tái)設(shè)備非第j狀態(tài)未被預(yù)測為第j狀態(tài)的數(shù)量。
第i臺(tái)設(shè)備加權(quán)召回率(recall,記為r)為:
(17)
式中,rij為第i臺(tái)設(shè)備j狀態(tài)的召回率,rij=Tpij/(Tpij+FNij)。
第i臺(tái)設(shè)備的F1_score可以表示為:
(18)
將多個(gè)設(shè)備的準(zhǔn)確率、精確率、召回率和F1_score分別求平均即可得到平均準(zhǔn)確率、平均精確率、平均召回率和平均F1_score。
4.3.1 設(shè)備負(fù)荷特征建模
首先對(duì)工廠內(nèi)設(shè)備負(fù)荷特征進(jìn)行建模。圖6為工廠總線上有功功率與各個(gè)設(shè)備有功功率變化曲線。從圖6中可以看出,工廠內(nèi)4臺(tái)設(shè)備有著相似的生產(chǎn)周期輪廓,但每臺(tái)設(shè)備間都有一些差別,如生產(chǎn)周期長度、功率峰值、各個(gè)工序的時(shí)長等。首先對(duì)各個(gè)設(shè)備有功功率曲線進(jìn)行差分處理,如圖7所示為設(shè)備1的有功功率曲線及其差分曲線示意圖。
圖6 工廠內(nèi)總有功功率與各個(gè)設(shè)備有功功率曲線Fig.6 Active power curve of each equipment and total load curve
圖7 設(shè)備1的有功功率及其差分曲線示意圖Fig.7 Primal and differential active power of 1st set of equipment
然后,按照第2節(jié)中的基于差分快速傅里葉分解的方法,先對(duì)每一臺(tái)設(shè)備的有功功率分段進(jìn)行快速傅里葉分解得到其振幅序列,這里選擇16個(gè)點(diǎn)作為快速傅里葉分解的樣本曲線長度。
再對(duì)所得的振幅序列進(jìn)行K-means++聚類,按照“肘部法則”選取聚類數(shù)目。以設(shè)備1為例,觀察K=2~9范圍內(nèi)的聚類畸變程度,可得“肘部”為K=4。設(shè)備1畸變程度隨聚類數(shù)量變化示意圖如圖8所示。其他設(shè)備分析類似,均選擇聚類為4個(gè)狀態(tài)。圖9所示為設(shè)備1聚類得到的狀態(tài)與其有功功率的對(duì)應(yīng)關(guān)系。從中可以看出,聚類得到的狀態(tài)能夠清晰地反映設(shè)備的有功功率變化,聚類得到的狀態(tài)與設(shè)備各個(gè)工序能夠分別對(duì)應(yīng),識(shí)別出設(shè)備狀態(tài)后,即可通過狀態(tài)或狀態(tài)序列組合反推出設(shè)備的負(fù)荷狀態(tài)。
圖8 設(shè)備1畸變程度隨聚類數(shù)量變化示意圖Fig.8 Curve of distortions with number of clusters
圖9 設(shè)備1聚類后的負(fù)荷狀態(tài)與有功功率的對(duì)應(yīng)關(guān)系Fig.9 Corresponding relationship between load state from clustering and active power of 1st set of equipment
4.3.2 負(fù)荷分解訓(xùn)練與測試結(jié)果
為了完成各生產(chǎn)線下設(shè)備狀態(tài)的多分類任務(wù),將雙向LSTM模型的輸出設(shè)置為四組概率分布。具體地,批量序列數(shù)據(jù)分別輸入正、反向LSTM計(jì)算模塊,再由正、反向拼接的隱藏狀態(tài)平行引出四個(gè)全連接層給四個(gè)設(shè)備做分類。
該模型將使用適應(yīng)性矩估計(jì)(ADAptive Moment estimation,ADAM)優(yōu)化算法[29],該算法主要優(yōu)點(diǎn)是使用了動(dòng)量和自適應(yīng)學(xué)習(xí)率來加快收斂速度。激活函數(shù)φi(i=1,2,3,4)采用帶溫度(溫度參數(shù)取0.5)的Softmax函數(shù), 損失函數(shù)為多分類交叉熵?fù)p失函數(shù)。
(1)模型訓(xùn)練
圖10~圖12分別為損失與訓(xùn)練輪次的變化曲線圖、訓(xùn)練集的準(zhǔn)確率與訓(xùn)練輪次變化曲線圖、測試集的準(zhǔn)確率與訓(xùn)練輪次變化曲線圖??梢钥闯觯?80輪左右時(shí)訓(xùn)練集準(zhǔn)確率在逐步提高,但測試集準(zhǔn)確率不升反而緩慢下降,可以判斷此時(shí)模型性能較優(yōu),再繼續(xù)訓(xùn)練會(huì)出現(xiàn)過擬合的風(fēng)險(xiǎn)。因此這里選擇第379輪得到的模型作為當(dāng)前最優(yōu)模型。
圖10 訓(xùn)練損失隨訓(xùn)練輪次變化曲線Fig.10 Illustration of loss value with training turns
圖11 訓(xùn)練集的準(zhǔn)確率與訓(xùn)練輪次變化曲線Fig.11 Curve of accuracy with turns in training set
圖12 測試集的準(zhǔn)確率與訓(xùn)練輪次變化曲線Fig.12 Curve of accuracy with turns in test set
(2)負(fù)荷分解測試
四臺(tái)設(shè)備的狀態(tài)分解結(jié)果曲線如圖13所示??梢钥闯鍪褂帽疚奶岢龅墓I(yè)負(fù)荷建模方法,并使用雙向LSTM網(wǎng)絡(luò)訓(xùn)練后預(yù)測的效果較好,每臺(tái)設(shè)備的狀態(tài)趨勢(shì)基本都得到正確的分解。
圖13 各設(shè)備狀態(tài)分解結(jié)果示意圖Fig.13 Illustration of load decomposition test of each equipment
模型在測試集上準(zhǔn)確率、加權(quán)召回率、加權(quán)精確率和F1_score的表現(xiàn)見表1。以四條設(shè)備線的平均水平為總體分解水平,該負(fù)荷分解任務(wù)在上述四個(gè)指標(biāo)下都表現(xiàn)良好,準(zhǔn)確率達(dá)到90%以上,說明本文提出方法能有效地解決該工業(yè)負(fù)荷分解任務(wù)。同時(shí),四種指標(biāo)非常接近并達(dá)到較高水平,尤其是F1_score在90%以上,進(jìn)一步說明在工業(yè)負(fù)荷分解下,該方法既能較為完整地分解出各類狀態(tài),還能以較高準(zhǔn)確度完成子設(shè)備狀態(tài)識(shí)別。設(shè)備4出現(xiàn)了較為明顯的樣本不均衡的情況,0狀態(tài)占比超過50%,但是模型也能以較高準(zhǔn)確率87%完成狀態(tài)分類,達(dá)到較高的工作穩(wěn)定性。
針對(duì)當(dāng)前負(fù)荷分解主要關(guān)注家用和商業(yè)用電而工業(yè)負(fù)荷分解存在困難的情況,本文首先提出了一種基于差分快速傅里葉分解的聚類方法獲取工業(yè)負(fù)荷的狀態(tài)劃分,將工業(yè)負(fù)荷的有功功率曲線作為信號(hào)處理得到負(fù)荷的典型特征,能夠快速自動(dòng)地對(duì)工業(yè)負(fù)荷進(jìn)行建模;然后采用雙向長短期記憶神經(jīng)網(wǎng)絡(luò)對(duì)已知總有功功率下各個(gè)設(shè)備的狀態(tài)進(jìn)行學(xué)習(xí),為了充分地利用序列的信息分解出設(shè)備的狀態(tài),本文采用雙向LSTM循環(huán)神經(jīng)網(wǎng)絡(luò)模型。本文基于烏蘭察布地區(qū)一家工廠的生產(chǎn)數(shù)據(jù)進(jìn)行了數(shù)值試驗(yàn),結(jié)果表明本文提出的基于差分快速傅里葉分解聚類的方法能夠很好地對(duì)工廠設(shè)備狀態(tài)進(jìn)行建模,基于LSTM的神經(jīng)網(wǎng)絡(luò)算法能夠很好地分解工業(yè)負(fù)荷,對(duì)于四臺(tái)設(shè)備的分解準(zhǔn)確率達(dá)到90%以上,填補(bǔ)了工業(yè)負(fù)荷建模與分解的空白。
但是針對(duì)工業(yè)負(fù)荷分解仍然存在很多待解決的研究問題。首先,當(dāng)前針對(duì)工業(yè)負(fù)荷的數(shù)據(jù)采集質(zhì)量還不高,采樣頻率較低,數(shù)據(jù)特征不多,這對(duì)于開展工業(yè)負(fù)荷分解和需求側(cè)管理形成了巨大的阻礙;另外,工業(yè)負(fù)荷種類較多,本文僅針對(duì)其中的典型設(shè)備進(jìn)行建模,尚不能對(duì)所有工業(yè)設(shè)備負(fù)荷分解達(dá)到較好的效果,因此,建立更加普適和高效的負(fù)荷建模與分解方法仍然是重要的研究目標(biāo)。