余良武 劉東風(fēng) 張文群 房友龍
(海軍工程大學(xué)動力工程學(xué)院1) 武漢 430033) (海軍工程大學(xué)青島油液檢測分析中心2) 青島 266012)
水-乙二醇抗燃液壓液是一種具有防火抗燃性能液壓液,通常簡稱為HFC[1].HFC大多工作在接近明火或高溫物體的場合,保持足夠的抗燃性至關(guān)重要,抗燃性能是其最重要的設(shè)計功能之一[2].在使用過程中由于水分含量變化、油液氧化和可燃物污染等因素的影響,HFC的抗燃性能會發(fā)生變化,因此在日常管理過程中需要對HFC的抗燃性能進(jìn)行監(jiān)測,并根據(jù)監(jiān)測結(jié)果采取相應(yīng)的維護(hù)措施.
文獻(xiàn)[3]規(guī)定HFC的抗燃性能測試包括三個指標(biāo),分別為歧管燃燒特性、噴射燃燒特性,以及芯式燃燒特性.另外,水基抗燃液壓液的抗燃性能主要依靠高含水量來維持,水分含量能夠一定程度反映HFC的抗燃性能,因此HFC的抗燃性能可以利用歧管燃燒特性、噴射燃燒特性、芯式燃燒特性和水分含量四個指標(biāo)來衡量.如果同時對這四個指標(biāo)實施監(jiān)測,工作量較大,測量成本也較高.在對抗燃性能監(jiān)測精度要求不是特別高時,為了降低測量工作量和成本可進(jìn)行指標(biāo)約簡,在保持知識庫分類能力大致不變的前提下減少指標(biāo)數(shù)量[4].
目前常用的指標(biāo)約簡算法可分為統(tǒng)計學(xué)方法和粗糙集理論兩類,統(tǒng)計學(xué)方法主要包括主成分分析法、因子分析法、極小方差廣義法、極大不相關(guān)法、灰色關(guān)聯(lián)分析法等[5].常用的基于粗糙集理論的啟發(fā)式指標(biāo)約簡算法主要有基于差別矩陣的指標(biāo)約簡算法和基于信息熵的指標(biāo)約簡算法[6-7],這兩種算法一般多用于決策系統(tǒng)的指標(biāo)約簡,不能適用于缺少決策指標(biāo)的信息系統(tǒng),而在用HFC的抗燃性能指標(biāo)體系正是一個信息系統(tǒng),決策指標(biāo)是我們需要得到的抗燃性能狀態(tài).本文研究了一種基于知識粒度的指標(biāo)約簡算法,該算法可用于信息系統(tǒng)的指標(biāo)約簡,并將其應(yīng)用于在用HFC抗燃性能指標(biāo)約簡.
定義2知識表達(dá)系統(tǒng)S=(U,A,V,f).其中:A=C∪D,C為條件指標(biāo)集,D為決策指標(biāo)集,若D=?,則稱S為信息系統(tǒng),若D≠?則稱S為決策系統(tǒng).
定義3知識表達(dá)系統(tǒng)S=(U,A,V,f),對于任意給定的指標(biāo)集P?A,稱IND(P)為P對應(yīng)的不可分辨關(guān)系,且有:
IND(P)={(x,y)∈U×U:
?p∈P,f(x,p)=f(y,p)}
(1)
P對應(yīng)的所有等價類劃分的集合記為U/IND(P).
由式(1)中可知,IND(P)為依靠指標(biāo)集P無法區(qū)分的對象的集合,不可分辨關(guān)系可將論域U劃分為不相交的等價類即知識顆粒(knowledge granule),顆粒內(nèi)部的不同對象是不可分辨的,而顆粒間的不同對象是可分辨的.
定義4信息系統(tǒng)S=(U,C),P?C,對于指標(biāo)p0∈P,如果有IND(P-{p0})=IND(P),則稱指標(biāo)p0是多余的或非必要的,反之則稱指標(biāo)p0是必要的.
定義5信息系統(tǒng)S=(U,C),P?C,若所有的p∈P都是必要的,稱P是獨立的,反之則稱P是依賴的.
定義6信息系統(tǒng)S=(U,C),P?C,P中所有必要指標(biāo)的集合稱為P的核,記作Core(P).
定義7信息系統(tǒng)S=(U,C),Q?P?C,若Q是獨立的,且有IND(P)=IND(Q),則稱Q是P的約簡.
需要說明的是指標(biāo)集的約簡并不是唯一的.
定義8信息系統(tǒng)S=(U,C),P?C,U/IND(P)={X1,X2,…,Xm},稱GK(P)為P的知識粒度(knowledge granulation),且有:
(2)
式中:|U|和|Xi|分別為論域和等價劃分Xi中對象的個數(shù).
定義9信息系統(tǒng)S=(U,C),P?C,p0∈P,稱sigP-{p0}(p0)為指標(biāo)集P中指標(biāo)p0的重要度(significance degree),且有:
sigP-{p0}(p0)=GK(P-{p0})-GK(P)(3)
根據(jù)定義9,指標(biāo)集中某指標(biāo)的重要度定義為去除該指標(biāo)后知識粒度的變化量.結(jié)合定義4可知,指標(biāo)是必要的充要條件是sigP-{p0}(p0)>0.
定理1信息系統(tǒng)S=(U,C),P?C,Core(P)={p∈P|sigP-{p}(p)>0}.
定理1給出了一種求指標(biāo)集核的標(biāo)準(zhǔn)方法.
定義10信息系統(tǒng)S=(U,C),P?C,q∈C-P,稱sigP+{q}(q)為指標(biāo)q相對于指標(biāo)集P的重要度,且有:
sigP+{q}(q)=GK(P)-GK(P∪{q})
(4)
根據(jù)定義10,某指標(biāo)相對于指標(biāo)集的重要度定義為增加該指標(biāo)后知識粒度的變化量.sigP+{q}(q)越大說明指標(biāo)q對指標(biāo)集P分類能力的提升越顯著.
定理2信息系統(tǒng)S=(U,C),Q?P?C,若?q∈Q,都有sigQ-{q}(q)>0,且GK(Q)=GK(P),則Q為P的一個約簡[8].
基于上述定義和定理可以導(dǎo)出一種啟發(fā)式指標(biāo)約簡算法,根據(jù)定理1求指標(biāo)核,以核為起點,以指標(biāo)重要度sigP+{q}(q)為啟發(fā),選擇具有最大的重要度的指標(biāo)依次加入核中,最終得到最小約簡.具體算法步驟和描述如下所示.
基于知識粒度的信息系統(tǒng)指標(biāo)約簡算法:
輸入 信息系統(tǒng)S=(U,C),P?C.其中:U為論域,C為條件指標(biāo)集,P為條件指標(biāo)集的子集.
輸出 指標(biāo)集P的約簡Q.
步驟1計算指標(biāo)集P的知識粒度GK(P).
步驟2求指標(biāo)集P的核Core(P).計算P中各指標(biāo)pi的重要度sigP-{pi}(pi),i=1,2,Λ,|P|,當(dāng)sigP-{pi}(pi)>0時,將pi納入核中,即Core(P)={p∈P|sigP-{p}(p)>0}.若GK(Core(P))=GK(P),則算法終止,輸出Q=Core(P),否則轉(zhuǎn)向步驟3.
步驟3令Q=Core(P),以指標(biāo)重要度為啟發(fā)信息,向Core(P)中逐個添加指標(biāo).
1) 對于?c∈P-Q,計算其相對于指標(biāo)集Q的重要度sigQ+{c}(c);
3) 計算Q的知識粒度,若GK(Q)=GK(P),則算法終止,輸出約簡Q.否則返回(1).
從某型船舶不同設(shè)備中取得10個在用HFC油樣,使用電量法測量其水分含量,分別測定噴射燃燒特性、芯式燃燒持久性和歧管燃燒特性.其中歧管燃燒特性的結(jié)果報告是離散的狀態(tài)描述性指標(biāo),包括三個狀態(tài):①在歧管上燃燒,滴下后仍燃燒;②在歧管上燃燒,滴下后不燃燒;③在歧管上不燃燒,滴下后也不燃燒.剩下的水分含量(%)、噴射燃燒時間(s)和芯式燃燒時間(s)均為連續(xù)指標(biāo).粗糙集理論一般只能直接處理離散化數(shù)據(jù),這也是粗糙集理論的一個缺點[9].因此,需要將連續(xù)指標(biāo)離散化,離散化不可避免會造成信息丟失,但是只要控制得當(dāng)還是被認(rèn)為可接受的.本文采用等寬離散化方法,對于噴射燃燒特性,界定燃燒時間小于15 s時為“優(yōu)秀”,大于15 s、小于30 s時為“合格”,大于30 s時為不合格.對于芯式燃燒持久性,界定最大平均燃燒時間小于30 s時為“優(yōu)秀”,大于30 s、小于60 s時為“合格”,大于60 s時為不合格.對于水分含量,界定小于35%時為“偏低”,大于35%、小于40%時為正常,大于40%時為偏高.經(jīng)離散化處理后,抗燃性能測試數(shù)據(jù)統(tǒng)計見表1.
表1 抗燃性能測試數(shù)據(jù)
以水分含量、噴射燃燒特性、芯式燃燒持久性、歧管燃燒特性為條件指標(biāo)集P,10個在用HFC油樣為論域U,按照上節(jié)所研究的基于知識粒度的指標(biāo)約簡算法計算約簡集Q.
條件指標(biāo)集P對U的劃分.
U/IND(P)={(1,4,9),(2,10),
(3,7),(5),(6,8)}
(5)
計算P的知識粒度.
GK(P)=11/50
(6)
計算P中各指標(biāo)的重要度.
sigp-p1(p1)=GK(P-p1)-GK(P)=3/25>0
(7)
sigp-p2(p2)=GK(P-p2)-GK(P)=0(8)
sigp-p3(p3)=GK(P-p3)-GK(P)=0(9)
sigp-p4(p4)=GK(P-p4)-GK(P)=0
(10)
所以有:
Core(P)={p1}={水分含量}
(11)
令:
Q=Core(P)={水分含量}
(12)
計算剩余各指標(biāo)相對于Q的重要度.
sigQ+p2(p2)=GK(Q)-GK(Q+p2)=4/25
(13)
sigQ+p3(p3)=GK(Q)-GK(Q+p3)=3/25
(14)
sigQ+p4(p4)=GK(Q)-GK(Q+p4)=4/25
(15)
比較各指標(biāo)相對于Q的重要度.
sigQ+p2(p2)=sigQ+p4(p4)>sigQ+p3(p3)(16)
所以可選擇噴射燃燒特性或歧管燃燒特性加入Q中,若令Q=Q+p2={水分含量,噴射燃燒特性},則有:
GK(Q)=GK(P)=11/50
(17)
所以{水分含量,噴射燃燒特性}為P的約簡.
若令Q=Q+p4={水分含量,歧管燃燒特性},則有:
GK(Q)=GK(P)=11/50
(18)
所以{水分含量,歧管燃燒特性}也為P的約簡.
由此可知,通過測量水分含量和噴射燃燒特性或水分含量和歧管燃燒特性2個指標(biāo)即可反映HFC的抗燃性能,且實現(xiàn)的分類能力和同時測量4個指標(biāo)是相同的.從測量區(qū)分度上進(jìn)一步考慮,歧管燃燒特性只有3個狀態(tài)結(jié)果,區(qū)分度較差,比較而言噴射燃燒特性測試結(jié)果為連續(xù)的時間變量,區(qū)分度良好,因此可選擇Q為{水分含量,噴射燃燒特性}.
研究了一種基于知識粒度的指標(biāo)約簡算法,介紹了相關(guān)定義、定理和具體的計算步驟,該算法能夠適用于缺少決策指標(biāo)的信息系統(tǒng).利用基于知識粒度的指標(biāo)約簡算法進(jìn)行抗燃性能下屬指標(biāo)集的約簡,將水分含量、噴射燃燒特性、芯式燃燒持久性、歧管燃燒特性4個指標(biāo)約簡為水分含量和噴射燃燒特性2個指標(biāo),在保持知識庫分類能力大致不變的前提下很大程度上減少了指標(biāo)監(jiān)測的工作量和成本.