張照鑫,朱允剛,虞玉峰,趙山博,張勝男,陶紫涵
(吉林大學(xué) 計算機學(xué)院,吉林 長春 130023)
電能表是每家每戶都會使用的電子測量儀器,而智能電表已經(jīng)和傳統(tǒng)電表有了很大的不同,它的功能有本地數(shù)據(jù)處理、遠程數(shù)據(jù)通信以及電網(wǎng)運行參數(shù)采集等。同時智能電表質(zhì)量以及運行狀態(tài)直接影響到采集系統(tǒng)的穩(wěn)定性和安全性,而現(xiàn)有針對智能電表狀態(tài)評價方法的研究較少,大量的質(zhì)量數(shù)據(jù)和監(jiān)測數(shù)據(jù)并沒有得到充分的價值挖掘和合理利用,國內(nèi)的智能電表狀態(tài)監(jiān)測技術(shù)仍處于起步狀態(tài),因此,尋找一個合理化、高效化的智能電表評價方法就成為了重要的探索方向。
貝葉斯網(wǎng)是一種概率網(wǎng)絡(luò)模型,它以貝葉斯公式為基礎(chǔ),基于概率推理,廣泛應(yīng)用于人工智能領(lǐng)域,被認為是推理領(lǐng)域和不確定知識表達領(lǐng)域最有效的理論模型之一[1-3]。通過對智能電表運行過程中與運行狀態(tài)相關(guān)的多種數(shù)據(jù)的選取,根據(jù)貝葉斯網(wǎng)絡(luò)知識訓(xùn)練有效模型,并利用集成學(xué)習(xí)方法融合構(gòu)建最優(yōu)網(wǎng)絡(luò),作為評價智能電表運行狀態(tài)的高效模型[4],同時利用Visual Studio 2019實現(xiàn)評價算法,通過輸入其他相關(guān)方面運行數(shù)據(jù)推算智能電表各狀態(tài)概率,得出最符合實際的狀態(tài)評價,以此作為評價智能電表運行狀態(tài)的合理方法。
利用貝葉斯網(wǎng)絡(luò)進行智能電表的狀態(tài)評價就需要選擇準(zhǔn)確的數(shù)據(jù)離散化方法以及高效合理的貝葉斯網(wǎng)訓(xùn)練方法。而電能表狀態(tài)評價是典型的有序命題類問題,為此該文提出適用于智能電能表狀態(tài)融合的凸函數(shù)證據(jù)理論方法,結(jié)合選擇性集成學(xué)習(xí)方法進一步提高了狀態(tài)評價的準(zhǔn)確性和科學(xué)性,最終實現(xiàn)對電能表狀態(tài)的高準(zhǔn)確判定。
為了有效地進行智能電表狀態(tài)評價,根據(jù)生活經(jīng)驗選取了基本誤差、有功準(zhǔn)確度等級、運行誤差、運行時間、運行故障率、全檢退貨率、監(jiān)測異常、安裝環(huán)境、用戶信譽、家族缺陷、狀態(tài)評分等相關(guān)因素[5](148),并結(jié)合智能電能表性能退化數(shù)據(jù)的典型時間點對應(yīng)的可靠性值、實際驗證的運行狀態(tài)等數(shù)據(jù)組成電能表狀態(tài)評價數(shù)據(jù)集,并同時進行數(shù)據(jù)離散化。同時,為了提高準(zhǔn)確度,運用集成學(xué)習(xí)思想,對訓(xùn)練集進行R次采集m個樣本的隨機采樣,形成R組均包含m個樣本的數(shù)據(jù)集,分別對每組進行貝葉斯網(wǎng)絡(luò)數(shù)據(jù)訓(xùn)練,同時根據(jù)數(shù)據(jù)訓(xùn)練結(jié)果不斷修改貝葉斯網(wǎng)絡(luò)的結(jié)構(gòu),尋找最優(yōu)的貝葉斯網(wǎng)絡(luò)模型[6]。然后利用聚類算法,對這R個貝葉斯網(wǎng)進行聚類,從中挑選出M個精度高,符合實際情況的貝葉斯網(wǎng)絡(luò)集合F,利用網(wǎng)絡(luò)集合F中的所有貝葉斯網(wǎng)作為融合模型,分別計算出智能電能表處于各評分狀態(tài)的概率值。基于凸函數(shù)的理論,對貝葉斯網(wǎng)絡(luò)進行有效融合,以此得到較為準(zhǔn)確的最終狀態(tài)評價結(jié)果。設(shè)計的模型框架如圖1所示。
圖1 基于貝葉斯網(wǎng)絡(luò)的智能電能表狀態(tài)評價模型框架
為了數(shù)據(jù)表示和處理方便,將上述的基本誤差、有功準(zhǔn)確度等級、運行誤差、運行時間、運行故障率、全檢退貨率、監(jiān)測異常、安裝環(huán)境、用戶信譽、家族缺陷、狀態(tài)評分等相關(guān)因素表示為變量X1,X2,…,X11。
由于采集的智能電能表數(shù)據(jù)有一部分是一系列連續(xù)值,而貝葉斯網(wǎng)絡(luò)只能處理離散數(shù)值,所以首先要將數(shù)據(jù)進行離散化,離散方法[4](148)如下:
對于以上所有區(qū)間,設(shè)計處理算法,將任意兩個區(qū)間合并后成k-1個區(qū)間,計算出每個區(qū)間出現(xiàn)的概率,根據(jù)每個區(qū)間出現(xiàn)的概率值計算合并后的指標(biāo)X的信息熵H(k-1),然后計算H(k)-H(k-1);計算任意合并情況下前后的信息熵之差,尋找出差值最小的合并策略作為本次合并策略[7-8]。若同時出現(xiàn)兩種或兩種以上差值最小的合并策略,則隨機選擇一種策略進行合并。根據(jù)合并后的信息熵H(k-1)計算Sj=(k0-1)×H(k-1)-(k-2)×H(k0),其中j的初始值為1;若Sj≤Sj-1,此時每個區(qū)間對應(yīng)指標(biāo)X的一個離散值。否則令k=k-1,j=j+1,重復(fù)上述操作[9]。利用Visual Studio 2019實現(xiàn)上述算法處理所得數(shù)據(jù),部分連續(xù)數(shù)據(jù)離散化后結(jié)果見表1(表中數(shù)字代表數(shù)據(jù)所處離散后的區(qū)間)。
表1 部分連續(xù)變量離散表
將離散化后確定的指標(biāo)屬性集合表示為變量集合X={X1,…,Xi,…,Xn}(n=11),基于預(yù)先采集的電能表運行狀態(tài)歷史評價數(shù)據(jù),通過遺傳算法進行學(xué)習(xí)、訓(xùn)練,結(jié)合集成學(xué)習(xí)思想,生成表示電能表數(shù)據(jù)和電能表狀態(tài)之間關(guān)系的貝葉斯網(wǎng)。
采用Bagging算法[10]從數(shù)據(jù)中訓(xùn)練生成R個貝葉斯網(wǎng)的集合F,方法[4](148)如下:
步驟1:對訓(xùn)練集進行第R次隨機采樣,共采集m次,得到包含m個樣本的采樣集Dr={C1,C2,…,Cm},其中m為數(shù)據(jù)量,Ci為第i組數(shù)據(jù),每組數(shù)據(jù)是一個長度為n+1的向量X={X1,…,Xi,…,Xn,Xn+1}(n=11),其中r的初始值是1,1≤r≤R。
步驟2:用采樣集Dr訓(xùn)練第r個貝葉斯網(wǎng),貝葉斯網(wǎng)包含n+1個變量,其中X1…Xn表示如前所述的電能表狀態(tài)屬性數(shù)據(jù),Xn+1表示電能表狀態(tài)評分,有d種可能取值,如d=3(穩(wěn)定、關(guān)注、預(yù)警),訓(xùn)練貝葉斯網(wǎng)方法如下:
基于訓(xùn)練數(shù)據(jù)集Dr={C1,C2,…,Cm}隨機生成若干個貝葉斯網(wǎng),作為通過遺傳算法迭代確定最優(yōu)貝葉斯網(wǎng)的初始種群Popr,其中r的初始值是0,設(shè)置的遺傳算法迭代數(shù)為r0,每個貝葉斯網(wǎng)作為所述初始種群Qr中的一個個體[11]。
(2)
步驟3:將步驟2生成的最優(yōu)貝葉斯網(wǎng)加入到貝葉斯網(wǎng)絡(luò)集合F中。
從產(chǎn)生的R個貝葉斯網(wǎng)中選擇K個精度高的貝葉斯網(wǎng)組成新的集合?。方法如下:
(3)
式中,m表示貝葉斯網(wǎng)Bi和Bj的采樣集采樣的樣本數(shù)量。
步驟5:當(dāng)連續(xù)兩次迭代中,所述K個簇均不發(fā)生變化或達到最大迭代次數(shù)L時,轉(zhuǎn)至步驟6,否則轉(zhuǎn)至步驟3繼續(xù)執(zhí)行。
步驟6:從K個簇中的每一個簇里選擇精度最高的貝葉斯網(wǎng),以得到新的貝葉斯網(wǎng)集合?={?1,?2,…,?k}。
采用凸函數(shù)證據(jù)理論方法[14],對?中的貝葉斯網(wǎng)進行集成,進而得到狀態(tài)評價結(jié)果(見圖2)。假定x1,x2,…,xn表示當(dāng)前觀測到的已知的指標(biāo)屬性值,Y表示電能表狀態(tài)。方法如下:
圖2 使用?中的貝葉斯網(wǎng)進行狀態(tài)評價
步驟1:對于集合?中的貝葉斯網(wǎng)?1,當(dāng)x1,x2,…,xn表示實際觀測到的評價智能電能表運行狀態(tài)的n個指標(biāo)的數(shù)值,Yl表示智能電能表的運行狀態(tài)d種可能取值中的第l種,則計算智能電能表的運行狀態(tài)Yl的概率λ1(sl)的公式為:
λ1(sl)=P(Yl|x1,x2,…,xn)=P(Yl|πY)·
(4)
式中,1≤l≤d,1≤i≤n+1,Xi∈Children(Y)表示電能表的屬性指標(biāo)Xi是運行狀態(tài)Y的子節(jié)點,πY是運行狀態(tài)Y的父節(jié)點。
步驟2:對于集合?中的貝葉斯網(wǎng)?j,當(dāng)x1,x2,…,xn表示實際觀測到的評價智能電能表運行狀態(tài)的n個指標(biāo)的數(shù)值,Yl表示智能電能表的運行狀態(tài)d種可能取值中的第l種,則計算智能電能表的運行狀態(tài)Yl的概率λj(sl)的公式為:
λj(sl)=P(Yl|x1,x2,…,xn)=P(Yl|πY)·
(5)
式中,2≤j≤K,j的初始值是2,Xi∈Children(Y)表示電能表的屬性指標(biāo)Xi是運行狀態(tài)Y的子節(jié)點,πY是運行狀態(tài)Y的父節(jié)點。
步驟3:用下式將λ1(sl)和λj(sl)進行融合,并將結(jié)果賦給λ1(sl)。
(6)
步驟4:當(dāng)j 步驟5:λ1(sl)即為每種可能的智能電能表運行狀態(tài)的概率值。 關(guān)于上式的推導(dǎo)有:設(shè)πY是節(jié)點Y的父節(jié)點,Children(Y)是節(jié)點Y的子節(jié)點。由貝葉斯網(wǎng)馬爾可夫覆蓋的特性,可知: P(Y|x1,x2,…,xn)=P(Y|MB(Y))= (7) 由于分母P(x1,x2,…,xn)并不包含Y,即無論Y取何值,P(x1,x2,…,xn)的值都相同,因此可以將分母看成常數(shù)。而且分子是聯(lián)合概率分布,那么可以把它表示成各節(jié)點的局部條件概率分布的乘積。因此,上式可以表示為: (8) 其中,c是常數(shù)。上式將各節(jié)點的局部條件概率分布分成3部分:Y的局部條件概率分布、Y的子節(jié)點的局部條件概率分布和其他節(jié)點的局部條件概率分布。由于第三部分∏Xj≠Y∩Xj?Children(Y)P(Xj|πXj)并不包含變量Y,所以這部分也可以歸到常數(shù)里,因此上式可以表示為: c·P(Y|πY)·∏Xi∈Children(Y)P(Xi|πY)·∏Xj≠Y∩Xj?Children(Y)P(Xj|πXj)=c'·P(Y|πY)·∏Xi∈Children(Y)P(Xi|πXi) (9) 從上式可以看到,P(Y|MB(Y))與P(Y|πY)·∏Xi∈Children(Y)P(Xi|πXi)成正比。 選用從江蘇、福建省分公司獲取的電能表運行狀態(tài)歷史數(shù)據(jù)集D。此數(shù)據(jù)集包含基本誤差、有功準(zhǔn)確度等級、運行誤差、運行時間、運行故障率、監(jiān)測異常、安裝環(huán)境、用戶信譽、家族缺陷、狀態(tài)評分等數(shù)據(jù),表示為變量X1,X2,…,Xn(n=11)。基于2.2中算法,結(jié)合集成學(xué)習(xí)思想,對電能表運行狀態(tài)歷史集D進行R次隨機采樣(R=10),形成R組數(shù)據(jù)集D1,D2,…,DR。運用機器學(xué)習(xí)的方法訓(xùn)練出R個貝葉斯網(wǎng)模型B1,B2,…,BR;訓(xùn)練出的每個貝葉斯網(wǎng)包含變量X1,X2,…,Xn,表示電能表運行指標(biāo)數(shù)據(jù)與運行狀態(tài)的不確定性因果關(guān)系。 貝葉斯網(wǎng)的基本訓(xùn)練原理是通過設(shè)計評分函數(shù)f(B,D)=P(D|B)來衡量貝葉斯網(wǎng)與數(shù)據(jù)集的擬合程度,然后運用啟發(fā)式搜索算法搜索貝葉斯網(wǎng)結(jié)構(gòu)分值最高的一種,同時運用極大似然法來學(xué)習(xí)貝葉斯網(wǎng)中的參數(shù),其過程如圖3所示。 圖3 貝葉斯網(wǎng)集成學(xué)習(xí) 基于2.3中算法,設(shè)計相似度函數(shù)估算任意兩個貝葉斯網(wǎng)在狀態(tài)評價上的相似度,基于K均值聚類對生成的R個貝葉斯網(wǎng)進行聚類,將其劃分為K(K 圖4 基于聚類的貝葉斯網(wǎng)選擇性集成 從每個簇中選擇精度最高的貝葉斯網(wǎng),進而可以得到K=4個精度高、多樣性強的貝葉斯網(wǎng)B2、B4、B9、B10。 基于2.4中算法,使用上步選出的K個貝葉斯網(wǎng)作為融合模型,分別推理計算出電能表各狀態(tài)的概率值?;谕购瘮?shù)證據(jù)理論融合各貝葉斯網(wǎng)的決策結(jié)果,獲得最終的狀態(tài)評價結(jié)果,其過程如圖5所示。 圖5 結(jié)合貝葉斯網(wǎng)和凸函數(shù)證據(jù)理論得出的最終評價結(jié)果 為了對智能電表的狀態(tài)進行高效而又準(zhǔn)確的評價,課題組采取了智能電能表狀態(tài)評價數(shù)據(jù)集,利用此數(shù)據(jù)集分組進行智能電能表狀態(tài)評價貝葉斯網(wǎng)絡(luò)的構(gòu)建,并利用集成學(xué)習(xí)思想提高其準(zhǔn)確度,再通過凸函數(shù)理論進行最優(yōu)貝葉斯網(wǎng)的融合,最終得出高效準(zhǔn)確的貝葉斯網(wǎng)絡(luò)結(jié)構(gòu)。利用貝葉斯網(wǎng)絡(luò)對智能電表的狀態(tài)評價方法相比傳統(tǒng)智能電表檢測方法節(jié)省了大量的人力和物力,降低了檢測成本,同時充分利用了采集的數(shù)據(jù),使檢測結(jié)果更具科學(xué)性和準(zhǔn)確性。實際研究表明,貝葉斯網(wǎng)絡(luò)對于智能電能表的狀態(tài)評價具有可行性,準(zhǔn)確性也非常貼近實際檢測結(jié)果。但此模型仍存在以下不足:數(shù)據(jù)離散化不一導(dǎo)致的精確度問題。貝葉斯網(wǎng)路只能處理離散數(shù)據(jù),因此在進行預(yù)測時要先將數(shù)據(jù)進行離散化,而數(shù)據(jù)離散化有多種方法,精確度不一,該文采用的為基于信息熵的數(shù)據(jù)離散化方法。因此以后要對如何進行數(shù)據(jù)離散化進行更加深入的探究。3 應(yīng)用驗證
4 結(jié)束語