陳維義,王克明,鄧萬彬
(1.海軍工程大學(xué) 兵器工程系,湖北 武漢 430033;2.海軍裝備部,北京 100841)
面向CBR的案例庫組織與快速檢索方法
陳維義1,王克明1,鄧萬彬2
(1.海軍工程大學(xué) 兵器工程系,湖北 武漢 430033;2.海軍裝備部,北京 100841)
用面向?qū)ο蟮闹R表示方法實現(xiàn)案例表示,用分層組織結(jié)構(gòu)完成案例庫組織,采用距離相似度計算方法實現(xiàn)案例間的相似度的計算,提出類選、粗選、精選三步走的案例檢索方法。以防空火炮的故障診斷為例,驗證了快速檢索方法的有效性,提高故障診斷效率。
故障診斷;案例推理;案例檢索;專家系統(tǒng)
隨著科技的發(fā)展和計算機(jī)技術(shù)的廣泛應(yīng)用,智能故障診斷技術(shù)得到快速發(fā)展,基于案例推理(Case-Based Reasoning,CBR)的故障診斷專家系統(tǒng)成為故障診斷領(lǐng)域的熱點,越來越受到重視。CBR故障診斷專家系統(tǒng)是通過訪問案例庫中過去相似案例的處理經(jīng)驗而獲得當(dāng)前問題解決方案的一種新的推理模式。
CBR的工作原理是利用已有的經(jīng)驗和知識來解決遇到的新問題。根據(jù)Aamodt,Plaza和國外其他學(xué)者提出的 “4R”[1-2]模型,一個典型的案例推理問題求解過程的基本步驟可以歸納為4個主要的過程,即案例檢索、案例重用、案例修正和案例學(xué)習(xí)。案例的檢索是CBR的關(guān)鍵技術(shù)之一,本文將對CBR案例檢索技術(shù)展開研究。
面向?qū)ο?(Object Orientation,OO)[3]的知識表示方法能將多種知識表示方法按照面向?qū)ο蟮某绦蛟O(shè)計原則組成一種混合知識表示形式,以對象為中心,將對象的屬性、動態(tài)行為特征、相關(guān)領(lǐng)域知識和數(shù)據(jù)處理方法等有關(guān)知識封裝在表達(dá)對象的結(jié)構(gòu)中。本文將采用面向?qū)ο蟮闹R表示方法和數(shù)據(jù)庫技術(shù)相結(jié)合的方法對故障案例進(jìn)行表示。
一個故障案例可以定義為對象:
采用面向?qū)ο蟮闹R表示方法,一個故障案例可表示為如表1所示結(jié)構(gòu)的對象。
表1 故障案例的結(jié)構(gòu)Tab.1 The structure of fault case
故障特征信息包括故障特征向量和故障特征權(quán)重向量。故障特征向量是指在1個故障案例中所有特征值經(jīng)參數(shù)化處理后,按照一定的順序組成的向量。故障特征權(quán)重向量是故障特征值對應(yīng)的權(quán)重組成的向量。采用基于粗糙集理論故障特征權(quán)重提取方法[4-5]。
故障特征向量表示為:
式中:Ai為第i個案例的故障特征向量;Ai(k)為第i個案例中的第k個指標(biāo)參數(shù)化處理后得到的特征值。
故障特征值可分為以下3種類型:
1)數(shù)值型。數(shù)值型是用數(shù)值記錄的定量數(shù)據(jù),案例的特征值就等于實際測量值,使用時只需要考慮其數(shù)值是否在一定的合理的范圍內(nèi)。但對于不同故障的特征值,其量綱是不一樣的,因此在使用這些前,必須先對其進(jìn)行歸一化處理。歸一化處理函數(shù)為:
2)枚舉型。為了便于提取使用需要數(shù)字化處理,建立相應(yīng)特征值索引表。即對每一特征建立故障特征表現(xiàn)與其索引值的對應(yīng)表,索引值分別用0,1,-1等整數(shù)表示,并規(guī)定所有故障特征的正常屬性值都用0表示。不同的故障特征信息其特征值索引表不同,對應(yīng)的索引值個數(shù)也不同。如表2所示。
表2 故障特征索引表Tab.2 The fault case index
3)邏輯型。邏輯型故障特征的觀測值只有True和False兩種取值狀態(tài),根據(jù)對象是否處于故障狀態(tài),作如下定義:
式中:ai為故障案例的第i個屬性;V(ai)為屬性ai的值。
相似度是故障案例之間相似性的一種度量。相似度是案例聚類的依據(jù),也是案例檢索匹配的基礎(chǔ)。
案例間相似度量的基本方法大都是基于距離測度的相似評判方法,常用的距離測度方法有:歐氏距離、曼哈頓距離、無限模距離、海明距離、明考斯基距離、Hausdorff距離、Mahalanobis距離等[6],本文將采用基于海明距離的相似度計算方法。
基于海明距離的相似度計算方法的定義如下:
為了提高系統(tǒng)檢索效率,必須對故障案例庫進(jìn)行分層組織,具體分為3層。以火炮故障案例庫為例,案例庫的組織結(jié)構(gòu)如圖1所示。
圖1 防空火炮故障案例庫Fig.1 The case base of the antiaircraft artillery
第1層是系統(tǒng)總案例庫,第2層是按照防空火炮系統(tǒng)結(jié)構(gòu)分成的各個子庫,第3層是按照故障類型分成的各案例集。
案例集是按照相似度進(jìn)行聚類的,只有相似度滿足一定閾值的一些案例才能聚類在一起,從而構(gòu)成一個案例集。同一個案例集中的案例相似度大,而不同的案例集之間的相似度小。案例相似度的計算用式(5)進(jìn)行計算,案例集之間相似度的計算用式(7)進(jìn)行計算。同一個案例集中的與其他各個案例相似度最大的案例作為本案例集的代表案例,在該案例集中編碼排第一個,以利于下一步案例檢索時計算案例集的相似度。
案例檢索就是要解決如何快速從系統(tǒng)案例庫中的大量案例中,找到與目標(biāo)案例匹配的歷史案例,以解決當(dāng)前的故障問題。隨著CBR故障診斷專家系統(tǒng)的使用,新的案例將不斷添加到案例庫中,案例庫中的案例數(shù)量將不斷增加。案例數(shù)量的增加將案例檢索提出了新的要求。檢查方法可分為以下3步:
1)類選
系統(tǒng)案例庫由多個子案例庫組成,類選就是從系統(tǒng)案例庫中找出與當(dāng)前故障案例匹配的一個子案例庫。
故障診斷的最終目標(biāo)是找到故障發(fā)生的根本原因,定位故障的位置,是一個復(fù)雜的過程。但是根據(jù)當(dāng)前的故障現(xiàn)象,可初步確定故障模式,如目標(biāo)探測系統(tǒng)故障、運(yùn)載系統(tǒng)故障,相對較容易。而子案例庫的構(gòu)建是以設(shè)備的組成結(jié)構(gòu)和原理為基礎(chǔ)的,因此通過人工初步的故障模式判斷,系統(tǒng)通過子案例庫編碼匹配可以找到對應(yīng)的子案例庫。這個過程就是類選的過程。
2)粗選
粗選就是從子案例庫中找出與當(dāng)前故障案例匹配的一個案例集。
子案例庫由多個案例集組成,其中每個案例集有一個代表案例,用式(5)計算當(dāng)前案例與各代表案例的相似度。取相似度最大的代表案例所在案例集作為粗選結(jié)果。計算所得相似度最大的代表案例所在的案例集就是與當(dāng)前故障案例匹配的案例集。
3)精選
精選就是在案例集中找出與當(dāng)前故障狀態(tài)匹配的數(shù)個案例。
案例集由多個具體的案例組成,用式(5)計算當(dāng)前故障案例與案例集中各案例的相似度,設(shè)置一個相似度閾值η,將相似度大于該閾值的案例提取出來,作為精選的結(jié)果。將滿足閾值條件的案例按照發(fā)生頻率從大到小排序,取發(fā)生頻率最大的案例作為最優(yōu)的匹配案例。
檢索步驟如圖2所示。
圖2 案例檢索原理Fig.2 The case retrieval principium
以某型防空火炮發(fā)生的一個故障為例進(jìn)行案例檢索。
故障情況如下:某型防空火炮跟蹤目標(biāo)后無法開火射擊,轉(zhuǎn)為手動射擊后仍然無法開火射擊。
經(jīng)檢查當(dāng)時系統(tǒng)狀態(tài):跟蹤雷達(dá)工作良好,射控電路正常,隨動系統(tǒng)工作正常,供輸彈系統(tǒng)正常,可能是火炮自動機(jī)故障。
檢索第1步類選,初步判斷自動機(jī)故障,進(jìn)入自動機(jī)案例子庫。
故障描述信息如表3所示。
表3 故障描述Tab.3 The description of fault case
檢索第2步粗選,輸入當(dāng)前故障描述信息,經(jīng)量化處理后,診斷系統(tǒng)在自動機(jī)案例子庫中進(jìn)行粗選,取相似度最大的代表案例所在的案例集作為精選的案例集。
檢索第3步精選,在相似度最大的案例集中,計算各案例與當(dāng)前故障的相似度,取相似度閾值η=0.8,將相似度大于該閾值的案例提取出來,取發(fā)生的頻率最大的案例作為精選的結(jié)果。
表4 故障案例檢索Tab.4 The fault case retrieval
檢索得到相似案例如表5所示。
表5 案例檢索結(jié)果Tab.5 The result of case retrieval
用傳統(tǒng)的檢索方法,需要在整個系統(tǒng)案例庫中對所有的案例都要檢索1次,隨著案例的不斷增加,系統(tǒng)案例庫的規(guī)模越來越大,案例檢索效率將越來越低。而采用新的快速檢索方法可以很好地解決這個問題。例如:當(dāng)系統(tǒng)案例庫案例總數(shù)為106個,而分層組織的案例庫中相似案例集中案例數(shù)為104個時,快速檢索方法比傳統(tǒng)的檢索方法效率提高100倍。
本文采用面向?qū)ο蟮闹R表示方法進(jìn)行案例表示,通過對案例庫采用分層組織結(jié)構(gòu),相似案例聚類組織,可以縮小案例檢索范圍。并進(jìn)一步探索出一種高效的案例檢索方法,提高了案例檢索速度。
[1]AAMODT A,PLAZA E.Case-based reasoning:foundational issues,methodological variations,and system approaches,Artificial Intelligence Communications,1994:39 -59.
[2]LEAKE D B.Case-based reasoning:experiences,lessons and future direction,AAAI press/MIT press[M].Menlo Park,CA,1996.
[3]BLAHA M,PREMERLANIW.Object-oriented modeling and design for database application[M],Prentice Hall Inc,1998.
[4]張光軼,蘇艷琴,許愛強(qiáng).粗糙集理論在裝備故障診斷中的應(yīng)用[J].艦船科學(xué)技術(shù),2012,34(1):104 -106.
ZHANG Guang-yi,SU Yan-qin,XU Ai-qiang.Application analysis of the equipment fault diagnosis based on rough set theory[J].Ship Science and Technology,2012(1):104-106.
[5]苗奪謙,李道國.粗糙集理論、算法與應(yīng)用[M].北京:清華大學(xué)出版社,2008:186-190.
MIAO Duo-qian,LIDao-guo.Rough set theory algorithms and applications[M].Beijing:Tsinghua University Press,2008:186-190.
[6]楊健,楊曉光,劉曉彬,等.一種基于k-NN的案例相似度權(quán)重調(diào)整算法[J].計算機(jī)工程與應(yīng)用,2007(23):43.
YANG Jian,YANG Xiao-guang,LIU Xiao-bin,et al.K -NN-based feature weights adjustment algorithm for case similarity measurement[J].Computer Engineering and Applications,2007(23):43
Research on the case base structure and retrieval based on CBR
CHENWei-yi,WANG Ke-ming,DENGWan-bin
(1.Department ofWeaponry Engineering,Naval University of Engineering,Wuhan 430033,China;2.Naval Armament Department,Beijing 100841,China)
This paper realized case representation by the object-oriented knowledge representation approach.The case base is hierarchically organized.The case similarity is calculated by themethod based on distance similarity degree.A new case retrieval strategy which consisted of three steps had been explored,and the three steps were sort selection,rough selection and accurate selection.Finally,an example in the antiaircraft artillery fault diagnosiswas given,which verify the effectiveness of the rapid retrievalmethod,and improves the efficiency of fault diagnosis.
fault diagnosis;case-based reasoning;case retrieval;expert system
TP392
A
1672-7649(2014)04-0126-04
10.3404/j.issn.1672-7649.2014.04.027
2013-03-12;
2013-04-15
陳維義(1966-),男,教授,主要研究方向為武器系統(tǒng)仿真與測試技術(shù)。