方名菊,章 筠,徐正國
(1.浙江大學 工業(yè)控制技術(shù)研究所,工業(yè)控制技術(shù)國家重點實驗室,浙江 杭州310027;2.上海電氣集團股份有限公司 中央研究院,上海 200070)
基于形式概念的汽輪機相似故障案例檢索
方名菊1,章 筠2,徐正國1
(1.浙江大學 工業(yè)控制技術(shù)研究所,工業(yè)控制技術(shù)國家重點實驗室,浙江 杭州310027;2.上海電氣集團股份有限公司 中央研究院,上海 200070)
作為故障診斷的一種方法,案例推理從以往的歷史案例中檢索相似案例作為新事件的參考解。在整個案例推理過程中,案例檢索是最為關(guān)鍵的一步。案例檢索的內(nèi)容是以一定形式表達的案例,案例檢索的方式是計算新事件與歷史案例間的相似度。判斷新事件與歷史案例的相似度主要考慮兩個問題,一是屬性間的相似度,二是屬性的權(quán)重。形式概念作為知識的一種表示方式,不僅能表達案例與屬性之間關(guān)系,還能反映屬性的權(quán)重。本文在基于形式概念的知識表達方式上,提出了一種改進的相似度計算方法。在改進算法中,引入了參數(shù)。在具體應(yīng)用中,通過選取合適的的值,能為每個屬性合理地分配相應(yīng)的權(quán)重,使得檢索結(jié)果更為精確。其效果在汽輪機故障診斷的實際應(yīng)用中得到了檢驗。
案例檢索;歷史案例;屬性;形式概念;相似度計算
1.1 汽輪機故障診斷方法研究
汽輪機作為發(fā)電設(shè)備的一部分,其結(jié)構(gòu)復(fù)雜,容易發(fā)生故障,一旦發(fā)生故障應(yīng)及時診斷并維修,否則將對電力系統(tǒng)造成極大的壓力,甚至可能導(dǎo)致大規(guī)模停電,對生產(chǎn)生活造成極大的不便。目前關(guān)于汽輪機故障診斷的方法有很多,如基于模型的故障診斷方法[1]、基于故障樹的故障診斷方法[2]、基于神經(jīng)網(wǎng)絡(luò)的故障診斷[3]、基于規(guī)則的故障診斷[4]、基于案例的故障診斷[5]等等。
基于模型的故障診斷[1]直接利用對象原理構(gòu)建診斷模型,可以避免專家知識獲取困難的問題,但模型的建立是在諸多假設(shè)和簡化條件下得到,在實際應(yīng)用中結(jié)果并不一定準確。故障樹[2]將故障原因和結(jié)果通過多層次樹節(jié)點連接形成。故障樹的建立需要對系統(tǒng)的機理有深入的了解,并且該方法的靈活性和自適應(yīng)能力差。人工神經(jīng)網(wǎng)絡(luò)[3]將提取的參數(shù)特征向量作為網(wǎng)絡(luò)輸入,故障類型作為網(wǎng)絡(luò)的輸出,達到故障診斷的目的。該診斷方法具有并行性、容錯性以及自學習能力等優(yōu)點,但是學習樣本獲取困難,神經(jīng)網(wǎng)絡(luò)訓練和結(jié)構(gòu)的優(yōu)化問題一直難以解決。規(guī)則推理[4]根據(jù)專家的以往實踐經(jīng)驗、專家分析問題和解決問題的思路,提取知識中存在的規(guī)則,進行故障診斷。規(guī)則推理存在知識獲取瓶頸,并且其靈活性、自適應(yīng)能力和學習能力差?;诎咐墓收显\斷方法[5]將以往故障發(fā)生時的現(xiàn)象、原因以及解決方案以案例的形式存儲到案例庫中,以案例屬性為依據(jù),通過算法從案例庫中檢索相似案例,獲取相應(yīng)的問題解決方案。案例推理不需要了解系統(tǒng)機理,也不需人從實例中提取規(guī)則,降低了知識獲取的負擔,并且案例推理具有很強的擴展性、學習性和自適應(yīng)能力。
由于工業(yè)現(xiàn)場的復(fù)雜性,設(shè)備運行機理比較復(fù)雜,無法利用機理進行建?;蛘邩?gòu)造故障樹。同時,在樣本不充足的情況下,構(gòu)建的神經(jīng)網(wǎng)絡(luò)會不準確,而案例推理能根據(jù)自身的學習能力和自適應(yīng)能力,彌補該缺點。因此,在機理不明確和樣本不充足的情況下,本文選擇案例推理的方法進行故障診斷。
1.2 案例知識的表達形式
案例推理是基于某種表達形式的案例知識。目前案例知識存在多種表達形式,比如框架表示法[6]、語義表示法[7]、面對對象的表示方法[8]、形式概念表示法[9]等等。
框架[6]是描述對象屬性的一種數(shù)據(jù)結(jié)構(gòu),將一個對象所包含的所有屬性限定在一個框架中,并通過屬性間的關(guān)系進行組織,框架之間通過屬性間的相互關(guān)系建立框架網(wǎng)絡(luò)??蚣鼙硎痉o法表示過程性知識。語義網(wǎng)絡(luò)[7]是一種用實體及其語義關(guān)系來表達知識的有向圖,結(jié)點代表實體,弧代表語義關(guān)系,存在關(guān)系的兩個實體之間通過弧連接。語義網(wǎng)絡(luò)主要描述了實體之間的語義關(guān)系,并且只能表達確定性知識。面向?qū)ο蟊硎痉╗8]將對象所包含的屬性以及相應(yīng)的方法封裝起來,對象之間以某種方式進行聯(lián)系。面向?qū)ο蟊硎痉ǖ闹R創(chuàng)建過程工作量大、性能低。形式概念的表示方法[9]從對象集中提取相同屬性,根據(jù)對象之間的關(guān)聯(lián)性建立層次結(jié)構(gòu)。形式概念既表達了數(shù)據(jù)間的層次結(jié)構(gòu),也表達了對象與屬性間、對象與對象間、屬性與屬性間的關(guān)聯(lián)性。
在汽輪機案例中,無論是對象間或者是屬性間,雖然具有關(guān)聯(lián)性,但并沒有明確的語義關(guān)系。因此,語義表示法并不能用于汽輪機的案例表示。而相對于形式概念而言,面向?qū)ο蟊硎痉üぷ髁看?、性能低。因此,針對具有關(guān)聯(lián)性的過程性知識,我們選擇形式概念進行汽輪機案例知識表示。
2.1 形式概念
形式概念[9]是一種數(shù)據(jù)分析和知識表示的方法,主要與三個概念相關(guān):形式背景、形式概念和概念格。
形式背景為(G、M、I)的組合,G表示對象集,M表示屬性集,I表示對象集與屬性集的關(guān)系,即(g,m)∈I表示對象g含有屬性m。
在形式背景的基礎(chǔ)上創(chuàng)建形式概念,形式概念為(A,B)的一個組合,其中A表示對象集,B表示屬性集,并且滿足h(A)=B,r(B)=A,其中h(A)∶={m∈M|gIm for allg∈A},r(B)∶={g∈G|gIm for allm∈B}。h(A)=B表示對象集A所包含的全部相同屬性集合等于B集合,r(B)=A表示包含屬性集B的全部對象集合等于A集合。
概念格為形式概念的層次數(shù)據(jù)結(jié)構(gòu),將形式概念按一定順序連接起來就構(gòu)成了概念格。概念格中除包含形式概念這個元素外,還包含偏序關(guān)系。偏序關(guān)系表示方法為:(A1,B1)≤(A2,B2),即A1?A2(B2?B1),其中(A2,B2)處于上層結(jié)構(gòu),(A1,B1)處于下層結(jié)構(gòu)。
例如現(xiàn)有形式背景如表1所示,在形式背景的基礎(chǔ)上,利用概念格創(chuàng)建算法[10]創(chuàng)建相應(yīng)的概念格,如圖1所示。
表1 形式背景Tab.1 Formal context
圖1 概念格Fig.1 Formal lattice
在圖1中,圓圈內(nèi)的C代表一個形式概念,上方的Obj和下方的Attr分別表示該形式概念所包含的對象和屬性,并且下層概念包含上層概念的屬性,上層概念包含下層概念的對象,括號中的數(shù)字表示屬性或?qū)ο笤诟拍罡裰谐霈F(xiàn)的頻次。
2.2 基于形式概念的相似度算法研究
本節(jié)先給出Tadrat[11]和Shi[12]的相似度計算方法,并在此基礎(chǔ)上,提出改進算法。
2.2.1 Tadrat提出的算法
Tadrat[11]基于形式概念的相似度計算公式為:
(1)
其中:N代表概念格中形式概念的總數(shù)目;IN、Ip分別表示新事件和形式概念所包含的屬性集;EN、EP分別表示新事件和形式概念所包含的對象集;Fau、Fai、Faj表示屬性u、i、j在概念格中出現(xiàn)的頻次,u表示新事件屬性集與形式概念屬性集所包含的相同屬性,i表示新事件所包含的屬性,j表示形式概念所包含的屬性。FCv、FCh、FCl表示對象v、h、l在概念格中出現(xiàn)的頻次,k表示新事件的初始對象集與形式概念對象集所包含的相同對象,h表示新事件的初始對象集,l表示形式概念的對象集。
新事件所包含的初始對象集通過計算新事件所包含的屬性集與概念格中形式概念所包含屬性集的相同屬性個數(shù),直接將屬性相同個數(shù)最多的形式概念的對象集賦給新事件,作為新事件的對象集。
該算法的不足在于:在相似度計算中引入了案例信息,轉(zhuǎn)移了屬性權(quán)重比例。并且案例信息為不精確信息,會降低計算結(jié)果的準確性。
2.2.2 Shi提出的算法
Shi[12]的基于形式概念的相似度計算方法為:
sim(CP,CN)
(2)
其中,m、n分別表示形式概念和新事件的屬性集,F(xiàn)o、Fr、Fs表示屬性o、r、s在概念格中出現(xiàn)的頻次,o表示新事件屬性集與形式概念屬性集所包含的相同屬性,r表示形式概念包含而新事件不包含的屬性,s表示新事件包含而形式概念不包含的屬性。
2.2 .3 改進算法
上述兩種相似度計算方法都存在一個共同點:屬性在形式概念中出現(xiàn)的頻次越大,其權(quán)重越小。改進算法在保持上述特性的前提下,更改了權(quán)重函數(shù),并引入了可調(diào)系數(shù)k,k可根據(jù)不同的應(yīng)用進行調(diào)節(jié)。
(3)
其中,x表示新事件屬性集與形式概念屬性集所包含的相同屬性,y表示形式概念所包含的屬性,z表示新事件所包含的屬性,F(xiàn)x、Fy、Fz表示屬性x、y、z在概念格中出現(xiàn)的頻次,k為可變正數(shù)。
算法中包含了可調(diào)節(jié)參數(shù)k,通過調(diào)節(jié)k值可以改變不同頻次參數(shù)間的相對權(quán)重,參見圖2。這樣針對不同的應(yīng)用,可以選取合適的值獲得更精確的結(jié)果。而Tadrat和Shi的算法中,相對權(quán)重則是固定的,無法調(diào)節(jié)。圖2假定形式概念總數(shù)為50,分別取k等于1,2,3,4,5求取屬性的權(quán)重。
圖2 k=1,2,3,4,5的屬性權(quán)重分配圖Fig.2 The distribution of attribute weight
本文研究的內(nèi)容為汽輪機故障,以其中的“#1高加正常疏水調(diào)節(jié)閥閥位偏大”故障模式為具體仿真對象,進行算法驗證。文中的數(shù)據(jù)來自于某電廠,但由于歷史案例信息表達的不規(guī)范,歷史案例的故障現(xiàn)象描述中省略了一些進行故障原因判別的必要屬性,導(dǎo)致無法由它所描述的現(xiàn)象推出它所給定的故障原因。因此,結(jié)合專業(yè)知識對歷史案例進行了整理,提取出該故障模式下的特征模式集。整理出的特征模式集可以被看做是部分歷史案例集。
在進行相似度計算之前,先要創(chuàng)建#1高加正常疏水調(diào)節(jié)閥閥位偏大故障特征模式集下的概念格。先是將特征模式集(表2)轉(zhuǎn)化為形式背景(即對象與屬性的0~1關(guān)系表),如表3所示。然后在形式背景的基礎(chǔ)上,根據(jù)形式概念的定義以及相應(yīng)的算法[10]創(chuàng)建形式概念和概念格,如圖3所示。表4表示每種特征模式所對應(yīng)的故障原因。
表2 #1高加正常疏水調(diào)節(jié)閥閥位偏大故障特征模式集Tab.2 Fault feature modes of #1 shell_side_normal_drain_valve_position larger than normal
表3 “#1高加正常疏水調(diào)節(jié)閥閥位偏大”形式背景Tab.3 Formal context of #1 shell_side_normal_drain_valve_position larger than normal
注:Attr1:#1高加正常疏水調(diào)節(jié)閥閥位偏大;Attr2:#1高加水位正常;Attr3:#1高加水位偏高;Attr4:#1緊急事故疏水調(diào)節(jié)閥打開;Attr5:#1緊急事故疏水調(diào)節(jié)閥閥位關(guān)閉;Attr6:疏水端差增大;Attr7:疏水端差正常;Attr8:#2正常疏水調(diào)節(jié)閥閥位正常;Attr9:#2正常疏水調(diào)節(jié)閥閥位增大。
表4 故障原因Tab.4 Fault reason
圖3 “#1高加正常疏水調(diào)節(jié)閥閥位偏大”概念格Fig.3 Formal lattice of #1 shell_side_normal_drain_ valve_position larger than normal
針對汽輪機#1高加正常疏水調(diào)節(jié)閥閥位偏大該類故障模式,改進算法中選取等于6進行仿真。
新事件的表現(xiàn)特征為{#1高加正常疏水調(diào)節(jié)閥閥位偏大、#1高加水位正常、疏水端差增大、#2高加正常疏水調(diào)節(jié)閥閥位正常},即新事件的屬性集為{Attr1,Attr2,Attr6,Attr8}。在利用Tadrat相似度計算方法進行相似度計算時,求出新事件的初始對象集為{Obj2}。針對新事件,利用三種相似度計算方法進行仿真,仿真結(jié)果如圖4所示,其中橫坐標表示形式概念,縱坐標表示相似度。表5列出了三種相似度計算方法檢索出的最相似案例以及相應(yīng)的故障原因。
從圖4中可以看出,Tadrat算法和Shi的算法得出的結(jié)論都與C11相似,而本文的算法與C3最為相似。經(jīng)過驗證,該事件的事故原因為高加汽側(cè)嚴重泄漏,與本文提出的相似度方法計算結(jié)果相同,而與Tadrat和Shi相似度方法的計算結(jié)果不同。并且結(jié)合專業(yè)知識進行分析,在所有的相關(guān)參數(shù)中,一旦疏水端差增大,其他參數(shù)對于結(jié)果的輔助分析作用弱到幾乎可以忽略。
本文利用UCI(University of California Irvine,加州大學爾灣分校)數(shù)據(jù)庫中的balance-scale、blogger數(shù)據(jù)庫對k的選取規(guī)則進行研究。balance-scale數(shù)據(jù)集總共包含625個對象,以其中前100個對象為訓練對象,建立形式概念,然后分別取不同數(shù)量的測試樣本對不同取值的k所導(dǎo)致的計算精確度做比較,比較結(jié)果如圖5所示,其中橫坐標表示k的值,縱坐標表示準確率。blogger數(shù)據(jù)集總共包含100個對象,以前20個對象為訓練對象,建立形式概念。也是選取不同數(shù)量的測試樣本對不同取值的k所導(dǎo)致的計算精確度做比較,比較結(jié)果如圖6所示。結(jié)合圖5和圖6,可以發(fā)現(xiàn),對于某個數(shù)據(jù)集樣本,存在一個確定的k使得計算結(jié)果的準確率最高,并且該值與樣本數(shù)無關(guān)。在本文的實例中,
圖4 相似度方法比較Fig.4 Comparison of similarity measures
通過試驗法發(fā)現(xiàn)k為6時,計算出的結(jié)果更為準確。由于k的取值與樣本數(shù)無關(guān),因此在本文中確定的最優(yōu)的k值可以作為#1高加正常疏水調(diào)節(jié)閥閥位偏大故障模式類案例檢索的k值。
本文選取形式概念作為知識的表示方式,形式概念既描述了過程性知識也表達了知識間的關(guān)聯(lián)性?;谛问礁拍畹闹R表示方法,在Tadrat和Shi的相似度計算方法的基礎(chǔ)上提出了改進算法。相較于其他兩種相似度算法,本文提出的相似度算法更改了權(quán)重函數(shù),并引入了可變參數(shù)。針對不同的應(yīng)用,選取合適的系數(shù),可以使得權(quán)重分配更為合理,計算結(jié)果更為準確。
表5 檢索結(jié)果
Tab.5Retrievalresults
形式概念屬性集對象集故障原因C3#1高加正常疏水調(diào)節(jié)閥閥位偏大、疏水端差增大Obj6高加汽側(cè)嚴重泄漏C11#1高加正常疏水調(diào)節(jié)閥閥位偏大、#1高加水位正常、#1高加緊急事故疏水閥關(guān)閉、疏水端差正常、#2高加正常疏水調(diào)節(jié)閥閥位正常Obj1閥門輕微堵塞
圖5 Balance-scale數(shù)據(jù)集Fig.5 Balance-scale database
圖6 Balance-scale數(shù)據(jù)集Fig.6 Balance-scale database
對汽輪機#1高加正常疏水調(diào)節(jié)閥閥位偏大故障模式下的歷史案例進行了仿真,分別利用三種相似度計算方法進行驗證,結(jié)果表明本文提出的方法計算結(jié)果更為準確。本文所涉及到的案例知識為明確知識,但存在某些故障模式,其案例內(nèi)容包含模糊知識。接下來我們將針對模糊知識,考慮如何利用形式概念進行模糊知識表達,并且設(shè)計相應(yīng)的相似度計算方法。
[1]高松,劉志剛,徐建芳,等.基于模型診斷和專家系統(tǒng)的牽引變壓器故障診斷研究[J].鐵道學報,2013,35(7):42-49.
GAO Song,LIU Zhigang,XU Jianfang,et al.Research on fault diagnosis for traction transformer on the basis of model-based diagnosis and expert system[J].Journal of the China Railway Society,2013,35(7):42-49.
[2]宗群,李光宇,郭萌.基于故障樹的電梯故障診斷專家系統(tǒng)設(shè)計[J].控制工程,2013,20(2):305-308. ZONG Qun,LI Guangyu,GUO Meng.Design of diagnostic expert system for elevator system based on FTA[J].Control Engineering of China,20(2):305-308.
[3]郭建.基于BP神經(jīng)網(wǎng)絡(luò)的汽輪機故障診斷系統(tǒng)研究[D].廣州:華南理工大學,2014.
[4]FRYE D,ZELAZO P D,PALFAI T.Theory of mind and rule-based reasoning[J].Cognitive Development,1995,10(4):483-527.
[5]KOLODNER J L.An introduction to case-based reasoning[J].Artificial Intelligence Review,1992,6(1):3-34.
[6]馮明杰.基于框架的語義題庫推薦系統(tǒng)的研究與應(yīng)用[D].成都:電子科技大學,2014.
[7]CHANG T H,CHU Y H,LEE C C,et al.A semantic representation of energy-related information in future smart homes[J].Energy & Buildings,2012,47(47):169-179.
[8]KHAN A A,CHAUDHRY I A.Object oriented case representation for CBR application in structural analysis[J].Applied Artificial Intelligence,2015,29(4):335-352.
[9]SINGH P K,ASWANI K C,GANI A.A comprehensive survey on formal concept analysis,its research trends and applications[J].International Journal of Applied Mathematics and Computer Science,2016,26(2):495-516.
[10]紀彤坤.概念格Chein算法的研究與改進[D].廣州:華南理工大學,2012.
[11]TADRAT J,BOONJING V,PATTARAINTAKORN P.A new similarity measure in formal concept analysis for case-based reasoning[J].Expert Systems with Applications,2012,39(1):967-972.
[12]SHI C,LAI L,FAN J,et al.Similarity model based on CBR and FCA[C]// IEEE/ACIS International Conference on Software Engineering,Artificial Intelligence,Networking and Parallel/Distributed Computing.IEEE Computer Society,2016:597-603.
(責任編輯:傅 游)
Case Retrieval for Faults of Steam Turbines Based on Formal Concept
FANG Mingju1, ZHANG Yun2, XU Zhengguo1
(1. National Laboratory of Industrial Control Technology,Institute of Industrial Process Control,Zhejiang University, Hangzhou, Zhejiang 310027, China;2. Central Academe, Shanghai Electric Group Co. Ltd, Shanghai 200070, China)
As a fault diagnosis method, case-based reasoning retrieves similar cases from history case base as reference solutions to new events. Case retrieval, the most critical step in the case-based reasoning process, is based on a certain expression of the case and is done by calculating the similarities between the new event and history cases. Two main factors should be taken into consideration when designing a similarity measure: similarity between attributes and weight assigned to each attribute. As a representation of knowledge, formal concept not only represents the relationship between cases and attributes, but it also reflects the weight of each attribute. In this paper, an improved similarity measure was proposed based on the knowledge representation of formal concept. Parameter K was introduced into this new measure. By choosing appropriate value for specific applications, the measure could assign corresponding weight to each attribure, thus obtaining more accurate case retrieval results. The proposed similarity measure was tested in the practical fault diagnosis of a steam turbine, which verified its effectiveness.
case retrieval; history cases; attributes; formal concept; similarity measure
2017-03-11
國家自然科學基金項目(61473254);工業(yè)控制技術(shù)國家重點實驗室項目(ICT1703)
方名菊(1993—),女,四川榮縣人,碩士研究生,主要從事故障診斷方面的研究. 徐正國(1979—),男,江蘇無錫人,副教授,博士生導(dǎo)師,主要從事控制系統(tǒng)可靠性分析、復(fù)雜系統(tǒng)性能退化分析故障診斷方面的研究,本文通信作者.E-mail:xzg@zju.edu.cn
TP277
A
1672-3767(2017)04-0024-07
10.16452/j.cnki.sdkjzk.2017.04.004