何永強(qiáng) 秦 勤
(河南工程學(xué)院計(jì)算機(jī)學(xué)院, 鄭州 451191)
?
基于貝葉斯置信區(qū)間的傳感器網(wǎng)絡(luò)故障診斷方法研究
何永強(qiáng) 秦 勤
(河南工程學(xué)院計(jì)算機(jī)學(xué)院, 鄭州 451191)
通過(guò)構(gòu)建貝葉斯網(wǎng)絡(luò)故障診斷模型,提出了結(jié)合故障診斷準(zhǔn)確性和置信區(qū)間對(duì)傳感器網(wǎng)絡(luò)進(jìn)行故障診斷的方法。采用二項(xiàng)分布參數(shù)估計(jì)方法,結(jié)合β分布和F分布對(duì)置信區(qū)間進(jìn)行算法改進(jìn),降低了對(duì)測(cè)試數(shù)據(jù)規(guī)模的要求,減小了準(zhǔn)確度的誤差。通過(guò)仿真分析,驗(yàn)證了改進(jìn)算法的準(zhǔn)確性和可靠性。
貝葉斯; 置信區(qū)間; 故障診斷; 傳感器網(wǎng)絡(luò); 準(zhǔn)確度
傳感器網(wǎng)絡(luò)是由部署在檢測(cè)區(qū)域內(nèi)的、具有計(jì)算和通信能力的微小傳感器節(jié)點(diǎn)組成,通過(guò)自組織形式,采用多跳的通信方式進(jìn)行通信,能根據(jù)環(huán)境自主完成指定任務(wù)的分布式智能化網(wǎng)絡(luò)系統(tǒng)[1-2]。傳感器網(wǎng)絡(luò)故障一般是由傳感器節(jié)點(diǎn)故障引起的。由于節(jié)點(diǎn)廉價(jià)、自身能量有限、所處環(huán)境等因素的影響,導(dǎo)致節(jié)點(diǎn)采集到的數(shù)據(jù)不正確或者錯(cuò)誤,甚至導(dǎo)致節(jié)點(diǎn)失效[3-5]。
尹曉偉等人提出了采用貝葉斯網(wǎng)絡(luò)的推理能力進(jìn)行系統(tǒng)可靠性評(píng)估的方法[6];姜維等人提出了基于熵增益建立證據(jù)不確定的可信度貝葉斯網(wǎng)絡(luò)推理模型[7];趙俊等人針對(duì)貝葉斯置信網(wǎng)絡(luò)的結(jié)構(gòu)學(xué)習(xí)問(wèn)題,提出了一種遵循典型ACO算法框架(ACO-TSP)的貝葉斯網(wǎng)絡(luò)結(jié)構(gòu)學(xué)習(xí)算法(ACO-BN),并拓展為包括 EAS-BN、ACS-BN和 MMAS-BN在內(nèi)的一類(lèi)算法[8];李娜等人提出了基于貝葉斯置信框架的最小二乘支持向量機(jī)模型參數(shù)選擇方法的推理模型[9];賈松浩等人將節(jié)點(diǎn)順序置信指導(dǎo)的方法融入到增量學(xué)習(xí)過(guò)程中,提出了NOCLBN算法[10]。本次研究在總結(jié)已有故障預(yù)測(cè)的基礎(chǔ)上,針對(duì)貝葉斯診斷模型中數(shù)據(jù)對(duì)模型推理能力的影響以及訓(xùn)練樣本的數(shù)據(jù)規(guī)模對(duì)置信區(qū)間的影響等問(wèn)題,充分考慮傳感器網(wǎng)絡(luò)故障診斷結(jié)果分布情況,提出采用二項(xiàng)分布參數(shù)估計(jì)方法計(jì)算診斷準(zhǔn)確度的置信區(qū)間,運(yùn)用診斷準(zhǔn)確度期望值和置信區(qū)間來(lái)提高傳感器網(wǎng)絡(luò)的故障診斷能力。
貝葉斯網(wǎng)絡(luò)是通過(guò)變量參數(shù)和圖形化結(jié)構(gòu)的信息來(lái)獲取其他概率信息的推理數(shù)學(xué)模型,其通過(guò)網(wǎng)絡(luò)上已知的部分故障節(jié)點(diǎn)概率推理出網(wǎng)絡(luò)中其他節(jié)點(diǎn)或者整個(gè)網(wǎng)絡(luò)的故障概率[11]。構(gòu)建的診斷模型不準(zhǔn)確或者相關(guān)參數(shù)關(guān)系存在誤差都會(huì)影響故障診斷結(jié)果。故障診斷結(jié)果應(yīng)符合真實(shí)工作狀態(tài),但由于測(cè)試數(shù)據(jù)不可避免地存在數(shù)據(jù)噪聲、數(shù)據(jù)有限等不確定因素的影響,導(dǎo)致了故障診斷結(jié)果與實(shí)際值存在一定的偏差。本次研究通過(guò)引入期望與方差的概率論思想,對(duì)偏差值設(shè)置一個(gè)置信區(qū)間來(lái)解決偏差帶來(lái)的問(wèn)題。置信區(qū)間是對(duì)診斷模型結(jié)果范圍的預(yù)測(cè),若存在一個(gè)區(qū)間[θ1,θ2],對(duì)于給定的0<α<1,滿足P{θ1≤θ≤θ2}=1-α,則[θ1,θ2]是置信度1-α的置信區(qū)間[12]。運(yùn)用故障診斷的準(zhǔn)確度來(lái)求解置信區(qū)間時(shí),每次故障診斷的準(zhǔn)確度概率都應(yīng)處在置信區(qū)間內(nèi),因此運(yùn)用準(zhǔn)確度和置信區(qū)間來(lái)提高故障診斷能力。
1.1 準(zhǔn)確度分析
貝葉斯網(wǎng)絡(luò)故障診斷模型是根據(jù)已知經(jīng)驗(yàn)對(duì)測(cè)試訓(xùn)練樣本進(jìn)行診斷學(xué)習(xí),進(jìn)而確定合適的貝葉斯網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu)和網(wǎng)絡(luò)內(nèi)各節(jié)點(diǎn)的條件概率密度。貝葉斯網(wǎng)絡(luò)診斷系統(tǒng)準(zhǔn)確度計(jì)算公式為[13-14]:
(Si,Fi)∈Dh, i∈[1,h]
(1)
式中: Ah—— 診斷準(zhǔn)確度,是診斷正確次數(shù)與總測(cè)試次數(shù)的比值;
h —— 測(cè)試數(shù)據(jù)的規(guī)模;
δ(R(Dt,Si),Fi) —— 通過(guò)對(duì)征兆節(jié)點(diǎn)進(jìn)行推理,得出的故障節(jié)點(diǎn)診斷結(jié)果的正確程度,當(dāng)i=j時(shí)內(nèi)克羅克函數(shù)δ(i,j)的值為1,否則為0;
R —— 根據(jù)訓(xùn)練數(shù)據(jù)建立的貝葉斯網(wǎng)絡(luò)推理模型;
Dt—— 訓(xùn)練數(shù)據(jù)集合;
Si—— 故障征兆節(jié)點(diǎn)構(gòu)成的向量;
Fi—— 故障節(jié)點(diǎn)構(gòu)成的向量;
Dh—— 測(cè)試數(shù)據(jù)集合。
由式(1)可知,貝葉斯網(wǎng)絡(luò)故障診斷模型的準(zhǔn)確度不但與訓(xùn)練數(shù)據(jù)有關(guān),而且與測(cè)試數(shù)據(jù)也密切相關(guān)。診斷準(zhǔn)確度是對(duì)節(jié)點(diǎn)故障可能性的度量,通常情況下需要與預(yù)先設(shè)定的故障概率閾值進(jìn)行比較來(lái)進(jìn)一步判斷是否為真實(shí)故障[15],因此閾值的設(shè)定也會(huì)影響到診斷的準(zhǔn)確度。由于貝葉斯網(wǎng)絡(luò)故障診斷是通過(guò)推理進(jìn)行診斷的,過(guò)多的故障節(jié)點(diǎn)必然造成推理的復(fù)雜性,進(jìn)一步影響到推理結(jié)果的準(zhǔn)確性,因此合理構(gòu)建貝葉斯網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu)能有效提高貝葉斯網(wǎng)絡(luò)故障診斷能力。
1.2 置信區(qū)間分析
對(duì)于貝葉斯網(wǎng)絡(luò)故障診斷而言,準(zhǔn)確度越高越好,因此通過(guò)設(shè)定置信區(qū)間來(lái)提高故障診斷準(zhǔn)確度。對(duì)于診斷結(jié)果來(lái)說(shuō)只有2種情況:診斷正確或診斷錯(cuò)誤。因此,診斷結(jié)果符合0 — 1分布,則二項(xiàng)分布的期望和方差為[12]:
(2)
如測(cè)試樣本數(shù)據(jù)足夠大時(shí),則可以根據(jù)中心極限定理進(jìn)行估計(jì),故障診斷結(jié)果近似符合正態(tài)分布:
(3)
根據(jù)文獻(xiàn)[16]和標(biāo)準(zhǔn)正態(tài)分布概率表[12]可知,故障診斷結(jié)果的置信區(qū)間為:
(4)
當(dāng)測(cè)試樣本數(shù)據(jù)具有足夠大規(guī)模的時(shí)候,診斷結(jié)果符合近似正態(tài)概率分布。但在實(shí)際情況中,一方面,已知的歷史數(shù)據(jù)有限;另一方面,不斷增加的訓(xùn)練樣本數(shù)據(jù)將會(huì)導(dǎo)致貝葉斯網(wǎng)絡(luò)空間復(fù)雜度增加和訓(xùn)練時(shí)間加長(zhǎng),影響診斷準(zhǔn)確度,而準(zhǔn)確度的誤差會(huì)直接或間接地影響置信區(qū)間。本次研究提出采用二項(xiàng)分布參數(shù)估計(jì)方法,結(jié)合β分布和F分布計(jì)算置信區(qū)間。
設(shè)故障診斷結(jié)果概率值為p的置信區(qū)間為[pL,pH],置信度為1-α,測(cè)試樣本規(guī)模大小為h,診斷結(jié)果正確的樣本數(shù)為m,診斷結(jié)果概率分布函數(shù)為P[p|h,m]。
將P[p|h,m]在置信區(qū)間[pL,pH]上積分[12,16]:
(5)
根據(jù)伽瑪函數(shù)Γ(n+1)=n!,則參數(shù)p的二項(xiàng)分布轉(zhuǎn)化為β分布:
(6)
令n1=m+1,n2=h-m,則對(duì)β分布變形得到F分布為[12,17]:
(7)
由式(6)和式(7),可得:
(8)
根據(jù)改進(jìn)算法,選取一個(gè)包含11個(gè)節(jié)點(diǎn)的傳感器網(wǎng)絡(luò)構(gòu)建故障診斷模型(見(jiàn)圖1),其中節(jié)點(diǎn)Z1 — Z8為故障節(jié)點(diǎn),節(jié)點(diǎn)Z9 — Z11為測(cè)試節(jié)點(diǎn)。
圖1 傳感器網(wǎng)路故障診斷模型
選取測(cè)試樣本數(shù)為1 000,設(shè)定置信水平為0.95,采用原算法和改進(jìn)算法計(jì)算準(zhǔn)確度介于 1%~99%的置信區(qū)間,選取關(guān)鍵數(shù)據(jù)(見(jiàn)表1)的置信區(qū)間進(jìn)行對(duì)比,在相同準(zhǔn)確度下改進(jìn)算法比原算法得到的置信區(qū)間范圍更小,說(shuō)明改進(jìn)算法下的故障診斷性能更強(qiáng)、可靠性更高、診斷能力更好。
故障診斷中的誤差來(lái)源于數(shù)據(jù)的不完整。將圖1中的測(cè)試節(jié)點(diǎn)數(shù)據(jù)作為已知數(shù)據(jù),對(duì)完整數(shù)據(jù)和不同程度缺失的數(shù)據(jù)進(jìn)行仿真,診斷故障節(jié)點(diǎn)的故障概率。選定診斷準(zhǔn)確度為80%,置信區(qū)間為[76.07%,83.93%],選取不同規(guī)模的測(cè)試數(shù)據(jù),診斷準(zhǔn)確度結(jié)果與置信區(qū)間的關(guān)系(見(jiàn)圖2),結(jié)果顯示隨著測(cè)試數(shù)據(jù)規(guī)模的增加,準(zhǔn)確度更加趨向于預(yù)期值,表明故障診斷更加準(zhǔn)確。
圖2 準(zhǔn)確度與置信區(qū)間驗(yàn)證
通過(guò)構(gòu)建貝葉斯網(wǎng)絡(luò)故障診斷模型,在數(shù)據(jù)缺失的情況下采用診斷準(zhǔn)確度和置信區(qū)間相結(jié)合的方法進(jìn)行故障診斷。通過(guò)采用二項(xiàng)分布參數(shù)估計(jì)方法,結(jié)合β分布和F分布計(jì)算來(lái)改進(jìn)對(duì)置信區(qū)間的算法,降低了對(duì)測(cè)試數(shù)據(jù)規(guī)模的要求,減小了準(zhǔn)確度誤差。通過(guò)仿真分析,驗(yàn)證了改進(jìn)算法的準(zhǔn)確性和可靠性,驗(yàn)證了采用準(zhǔn)確度和置信區(qū)間相結(jié)合的方法進(jìn)行貝葉斯網(wǎng)絡(luò)故障診斷的可靠性和精確性,為傳感器網(wǎng)絡(luò)故障診斷提供了新的思路和方法。
[1] 崔遜學(xué),左從菊.無(wú)線傳感器網(wǎng)絡(luò)簡(jiǎn)明教程[M].北京:清華大學(xué)出版社,2009:1-2.
[2] 何永強(qiáng),張文欣,李可.基于貝葉斯理論的傳感器網(wǎng)絡(luò)節(jié)點(diǎn)故障檢測(cè)方法[J].河南工程學(xué)院學(xué)報(bào)(自然科學(xué)版),2014,26(4):65-68.
[3] ABOELAZE M,ALOUL F.Courrent and Future Trends in Sensor Networks: A Survey[J].Wireless and Optiocal Communications Networks,2005,68(3):551-555.
[4] KOUSHANFAR F,POTKONJAK M,SANGIOVANNI V.A Fault Tolerance Techniques for Wireless and Hoc Sensor Networks[J].Proceedings of IEEE on Sensors,2002(2):1491-1496.
[5] 何永強(qiáng),宮玉榮,朱予聰.基于貝葉斯和層次模型的傳感器網(wǎng)絡(luò)節(jié)點(diǎn)故障預(yù)測(cè)研究[J].河南工程學(xué)院學(xué)報(bào)(自然科學(xué)版),2015,27(4):63-68.
[6] 尹曉偉,錢(qián)文學(xué),謝里陽(yáng).貝葉斯網(wǎng)絡(luò)在機(jī)械系統(tǒng)可靠性評(píng)估中的應(yīng)用[J].東北大學(xué)學(xué)報(bào)(自然科學(xué)版),2008,29(4):557-560.
[7] 姜維,李一軍.基于貝葉斯網(wǎng)絡(luò)推理的導(dǎo)彈目標(biāo)類(lèi)型識(shí)別[J].計(jì)算機(jī)集成制造系統(tǒng),2011,17(6):1264-1270.
[8] 趙俊,顏晨陽(yáng),熊偉清.一類(lèi)基于蟻群優(yōu)化的貝葉斯置信網(wǎng)結(jié)構(gòu)學(xué)習(xí)策略及性能分析[J].計(jì)算機(jī)應(yīng)用研究,2009,26(11):4069-4072.
[9] 李娜,劉明光,楊恒,等.基于貝葉斯置信框架的最小二乘支持向量機(jī)模型參數(shù)選擇方法及SS7型電力機(jī)車(chē)牽引電機(jī)建模[J].中國(guó)鐵道科學(xué),2009,30(6):61-66.
[10] 賈松浩,楊彩,張海玉.利用節(jié)點(diǎn)順序置信指導(dǎo)增量學(xué)習(xí)貝葉斯網(wǎng)絡(luò)的研究與應(yīng)用[J].計(jì)算機(jī)工程與科學(xué),2013,35(6):96-100.
[11] CHOI A, DARWICHE A, ZHANG L, et al. Machine Learning and Knowledge Discovery for Engineering Systems Health Management[M].Boca Raton:Chapman and HallCRC Press, 2011:38-65.
[12] 盛驟,謝式千,潘承毅.概率論與數(shù)理統(tǒng)計(jì)[M].第4版.北京:高等教育出版社,2008:41-76.
[13] 肖秦琨,高嵩,高曉光.動(dòng)態(tài)貝葉斯網(wǎng)絡(luò)推理學(xué)習(xí)理論及應(yīng)用[M].北京:國(guó)防工業(yè)出版社,2007:61-78.
[14] KOHAVI R. A Study of Cross-Validation and Bootstrap for Accuracy Estimation and Model Selection[C]∥IJCAI.Proceedings of the 14thInternational Joint Conference in Artificial Intelligence.San Francisco:Morgan Kaufmann Publishers Inc.,1995:1137-1143.
[15] 李儉川,胡蔦慶,秦國(guó)軍,等.貝葉斯網(wǎng)絡(luò)理論及其在設(shè)備故障診斷中的應(yīng)用[J].中國(guó)機(jī)械工程,2003,14(10):896-900.
[16] 李鴻.二項(xiàng)分布的參數(shù)估計(jì)問(wèn)題研究[J].應(yīng)用數(shù)學(xué)學(xué)報(bào),2010,33(3):385-394.
[17] 孟昭為.二項(xiàng)分布參數(shù)的置信區(qū)間[J].工科數(shù)學(xué),1995,11(4):169-171.
Study of Fault Diagnosis for Sensor Network Based on Confidence Intervals of Bayesian
HEYongqiangQINQin
(College of Computers, Henan University of Engineering, Zhengzhou 451191, China)
This paper constructs fault diagnosis model of Bayesian network and presents the method from sensor network fault diagnosis accuracy and confidence intervals to carry on fault diagnosis of sensor networks. Algorithms for confidence intervals are improved based on Binomial distribution combined with -distribution and -distribution to reduce requirement for scale of the test data and decrease error of accuracy. Through simulation analysis, the accuracy and reliability of the improved algorithm is verified.
Bayesian; confidence intervals; fault diagnosis; sensor network; accuracy
2016-05-04
河南省科技廳科技計(jì)劃課題“基于云模型和模糊數(shù)學(xué)的無(wú)線傳感器網(wǎng)絡(luò)魯棒性研究”(152102210027);河南省高等學(xué)校重點(diǎn)科研項(xiàng)目“基于貝葉斯的傳感器網(wǎng)絡(luò)故障檢測(cè)研究”(15A520054)
何永強(qiáng)(1977 — ),男,河南扶溝人,碩士,副教授,研究方向?yàn)橛?jì)算機(jī)應(yīng)用、信息管理與信息系統(tǒng)。
TP393
A
1673-1980(2016)05-0090-04