戰(zhàn)希臣 楊睿英 郭 聚
(海軍航空大學(xué)航空基礎(chǔ)學(xué)院 煙臺(tái) 264001)
裝備是部隊(duì)執(zhí)行各項(xiàng)任務(wù)的基本物質(zhì)保證,其質(zhì)量情況與部隊(duì)作戰(zhàn)能力息息相關(guān)。影響裝備質(zhì)量的因素復(fù)雜多樣,其中基因要素對(duì)裝備質(zhì)量特性的形成具有決定性作用。質(zhì)量基因要素是指在裝備全壽命周期中,對(duì)裝備質(zhì)量產(chǎn)生決定性作用且具有一定遺傳特性的一系列關(guān)鍵指標(biāo)[2]。在對(duì)裝備質(zhì)量進(jìn)行跟蹤管理的過(guò)程中,只要掌握了質(zhì)量基因要素,也就掌握了裝備的整體質(zhì)量狀況。所以,在影響裝備質(zhì)量的眾多因素中篩選出質(zhì)量基因要素,是非常重要的。比如在某型裝備研制生產(chǎn)階段,可根據(jù)該裝備質(zhì)量特性形成的過(guò)程和特點(diǎn),歸納出裝備質(zhì)量的影響因素集,并以之構(gòu)建質(zhì)量指標(biāo)體系。在此基礎(chǔ)上,運(yùn)用基于粗糙集屬性約簡(jiǎn)的方法,可將該裝備研制生產(chǎn)階段的質(zhì)量基因要素指標(biāo)篩選出來(lái)。
借鑒現(xiàn)代產(chǎn)品質(zhì)量管理分析理論,從某型裝備研制生產(chǎn)階段的質(zhì)量特性形成過(guò)程來(lái)看,其關(guān)鍵性影響因素為“5M1E”,即:人(Man)、機(jī)器設(shè)備(Ma?chine)、材料(Material)、測(cè)量(Measurement)、方法(Method)和環(huán)境(Environment)6 個(gè)方面[1]。結(jié)合“5M1E”理論與該裝備實(shí)際研制生產(chǎn)的特點(diǎn),其質(zhì)量的影響因素可歸納為以下7個(gè)方面:人員因素、生產(chǎn)設(shè)備因素、產(chǎn)品原材料因素、技術(shù)工藝因素、環(huán)境因素、資金保障因素和質(zhì)量信息管理因素。通過(guò)在某軍工單位實(shí)地調(diào)研的情況,對(duì)以上質(zhì)量因素進(jìn)行細(xì)化研究,可得到質(zhì)量指標(biāo)因素的二級(jí)指標(biāo),從而構(gòu)建較為完整的裝備質(zhì)量指標(biāo)體系,如圖1所示。
圖1 裝備研制生產(chǎn)階段質(zhì)量指標(biāo)體系
1982年,波蘭的Z.Pawlak教授在現(xiàn)有關(guān)系理論以及集合論的基礎(chǔ)上,提出了粗糙集(Rough Set)的概念,用以處理難以精確計(jì)算以及不完整的數(shù)據(jù)。粗糙集以等價(jià)關(guān)系(不可分辨關(guān)系)將集合中的元素進(jìn)行分類(lèi),并形成與其相對(duì)應(yīng)的劃分。同一劃分被稱(chēng)為等價(jià)類(lèi),可用于信息的簡(jiǎn)化[5]。
粗糙集基于等價(jià)關(guān)系,通過(guò)構(gòu)建信息表,利用可準(zhǔn)確計(jì)算的近似集逼近待定的不精確集合。該集合的邊界區(qū)域?yàn)樯稀⑾陆萍?。通過(guò)等價(jià)關(guān)系可以精確描述上、下近似集,而邊界區(qū)域的模糊元素?cái)?shù)目可以被計(jì)算出來(lái)。粗糙集理論的主要應(yīng)用有兩方面,一是對(duì)現(xiàn)有數(shù)據(jù)集合進(jìn)行屬性約簡(jiǎn);二是分析分類(lèi)規(guī)則[6]。本文主要是應(yīng)用粗糙集屬性約簡(jiǎn)的方法對(duì)裝備質(zhì)量基因要素指標(biāo)進(jìn)行篩選。下面介紹關(guān)于粗糙集的幾個(gè)重要定義。
1)信息表
稱(chēng)四元組S=(U,A,V,f)為信息表(也叫決策表)。其中U={x1,x2,…,xn}為非空有限集合(xn為對(duì)象),稱(chēng)為論域;A為對(duì)象的屬性集合,分為條件屬性C和決策屬性D,A=C∪D,C∩D=φ;V=∪Va是屬性值的集合,Va表示屬性a∈A的屬性值值域;f:U×A→V是賦值函數(shù),用于給所有對(duì)象的屬性賦值,即a∈A,x∈U,fa(x)∈Va。
2)等價(jià)關(guān)系
對(duì) 于 ?a∈R,R?A,x∈U,y∈U,如 果 有fa(x)=fa(y)成立,稱(chēng)對(duì)象x和y是對(duì)屬性R的等價(jià)關(guān)系(也稱(chēng)不可分辨關(guān)系),也就是根據(jù)R中的屬性無(wú)法區(qū)分對(duì)象x和y。表示為
3)等價(jià)類(lèi)與劃分
在U中,具有同樣的等價(jià)關(guān)系IND(R)的集合稱(chēng)為等價(jià)類(lèi),有:
由此可知,正域POSR(X)為一定屬于集合X的對(duì)象組成的集合;負(fù)域NEGR(X)為一定不屬于集合X的對(duì)象組成的集合;邊界域BNDR(X)表示不能確定是否屬于集合X的對(duì)象組成的集合。
關(guān)于上近似、下近似、正域、負(fù)域、邊界域的關(guān)系如圖2所示。圖中,橢圓區(qū)域表示集合X,紅色區(qū)域?yàn)閄的正域(下近似),灰色區(qū)域?yàn)閄的負(fù)域,綠色區(qū)域?yàn)閄的邊界域,紅色∪綠色區(qū)域?yàn)閄的上近似。
圖2 近似集、正域、負(fù)域、邊界域示意圖
6)粗糙集
若R-(X)=R-(X),即BNDR(X)=φ,稱(chēng)X為R的可定義集;若R-(X)≠R-(X),即BNDR(X)≠φ,稱(chēng)X為R的粗糙集(也稱(chēng)不可定義集)。
R-(X)是包含X的最大R可定義集,R-(X)是包含X的最小R可定義集,若X為粗糙集,則X只能通過(guò)R-(X)與R-(X)近似地描述。
7)約簡(jiǎn)與核
信息表中的屬性可能存在冗余屬性,冗余屬性對(duì)信息表的分類(lèi)能力沒(méi)有作用。屬性約簡(jiǎn)也就是保持信息表分類(lèi)能力不變的前提下,去除冗余屬性。
對(duì)信息表S=(U,A,V,f),如果B?A且有IND(B)=IND(A),則B為A的一個(gè)約簡(jiǎn),記為RED(A)。
屬性集A的所有約簡(jiǎn)的交集稱(chēng)為A的核,記為
8)相對(duì)約簡(jiǎn)與相對(duì)核
設(shè)決策屬性D的劃分為U/D={E1,E2,…En},則條件屬性C相對(duì)于決策屬性D的正域?yàn)?/p>
若c∈C,且POS(C-{c})(D)=POSC(D) ,則 稱(chēng)c是C中不必要的,即可約簡(jiǎn)的;否則,稱(chēng)c是C中不可約簡(jiǎn)的。
若R?C,且R中所有元素都是必要的,如果有POSR(D)=POSC(D),則稱(chēng)R是C中相對(duì)于D的約簡(jiǎn),記為REDD(C),所有這樣的約簡(jiǎn)的交集稱(chēng)為C相對(duì)于D的核,記為
約簡(jiǎn)后的屬性集稱(chēng)為屬性約簡(jiǎn)集,信息表的屬性約簡(jiǎn)集一般不唯一,約簡(jiǎn)集中屬性個(gè)數(shù)最少的叫做最小約簡(jiǎn)集。屬性約簡(jiǎn)問(wèn)題一般都是求最小約簡(jiǎn)集,最小約簡(jiǎn)集不一定唯一,可根據(jù)問(wèn)題實(shí)際進(jìn)行選擇。
基于粗糙集的指標(biāo)信息篩選,也就是通過(guò)粗糙集理論的屬性約簡(jiǎn)原理,通過(guò)約簡(jiǎn)得出屬性集的最小約簡(jiǎn)集,從而在最大限度保留原始信息量的前提下,去除冗余指標(biāo),達(dá)到將指標(biāo)體系化繁為簡(jiǎn)的目的,這也正是裝備質(zhì)量基因要素信息的本質(zhì)要求,所以對(duì)于裝備質(zhì)量基因要素信息的篩選可以采用基于粗糙集的屬性約簡(jiǎn)方法。
篩選模型的基本步驟如下。
Step 1指標(biāo)體系初建。根據(jù)指標(biāo)體系建立的一般原則,結(jié)合問(wèn)題對(duì)象特點(diǎn),通過(guò)調(diào)研,仔細(xì)分析問(wèn)題的影響因素集(屬性集),而后由大到小、由表及里地分層構(gòu)建指標(biāo)體系。
Step 2數(shù)據(jù)離散化。通過(guò)實(shí)地調(diào)研、采集歷史數(shù)據(jù)或者專(zhuān)家打分等方法,收集指標(biāo)的相應(yīng)數(shù)據(jù),并根據(jù)篩選模型的要求進(jìn)行數(shù)據(jù)預(yù)處理。由于粗糙集方法不能處理連續(xù)屬性問(wèn)題,所以需要將數(shù)據(jù)離散化。定量指標(biāo)一般為連續(xù)型數(shù)據(jù),可采用等寬離散、等頻離散或者聚類(lèi)等方法離散化(具體方法見(jiàn)文獻(xiàn)[6~8]);對(duì)于定性指標(biāo),可采用專(zhuān)家打分法直接得到離散化數(shù)據(jù)。
Step 3建立信息表。根據(jù)指標(biāo)性質(zhì),區(qū)分條件屬性C和決策屬性D;根據(jù)采集的數(shù)據(jù)樣本份數(shù)確定論域U,而后構(gòu)建信息表。
Step 4屬性約簡(jiǎn)。通過(guò)粗糙集屬性約簡(jiǎn)理論去除冗余屬性(指標(biāo)),得到最小約簡(jiǎn)集,從而得到篩選后的指標(biāo)體系。
Step 5指標(biāo)檢驗(yàn)。采用KW檢驗(yàn)、F統(tǒng)計(jì)量檢驗(yàn)等方法檢驗(yàn)篩選后的指標(biāo)是否符合預(yù)定的數(shù)據(jù)相關(guān)性要求。若不符合要求,則調(diào)整指標(biāo)體系,返回Step 1;若符合要求,則指標(biāo)信息篩選完成。篩選模型的流程如圖3所示。
圖3 指標(biāo)信息篩選模型流程圖
對(duì)于某型裝備研制生產(chǎn)階段的質(zhì)量基因要素信息篩選問(wèn)題,根據(jù)圖1中的質(zhì)量指標(biāo)體系展開(kāi)信息篩選,該指標(biāo)體系由7個(gè)一級(jí)指標(biāo)和25個(gè)二級(jí)指標(biāo)構(gòu)成。質(zhì)量基因要素指標(biāo)屬于一級(jí)指標(biāo),因此主要針對(duì)7個(gè)一級(jí)質(zhì)量指標(biāo)收集數(shù)據(jù)。
為了準(zhǔn)確收集某型裝備研制生產(chǎn)階段質(zhì)量指標(biāo)信息,采取在某軍工單位實(shí)地調(diào)研以及邀請(qǐng)軍工單位和部分院校專(zhuān)家進(jìn)行專(zhuān)家打分的方式,采集7個(gè)指標(biāo)的相關(guān)數(shù)據(jù)。鑒于粗糙集理論對(duì)于離散化數(shù)據(jù)的要求,將各項(xiàng)指標(biāo)參數(shù)劃分為4個(gè)等級(jí),每個(gè)等級(jí)分別對(duì)應(yīng)1~4分,如表1所示。通過(guò)專(zhuān)家打分得到每個(gè)指標(biāo)對(duì)應(yīng)的等級(jí)和分?jǐn)?shù),作為信息表的離散化數(shù)據(jù)。收集15組樣本,并建立信息表,如表2所示。
表1 指標(biāo)參數(shù)等級(jí)表
1)由表2可直接得到論域U,條件屬性C,決策屬性D:
表2 裝備質(zhì)量指標(biāo)信息表
4)根據(jù)以上計(jì)算,可知C的核CORED(C)={c1,c2,c3,c4,c7},c5和c6是兩個(gè)不必要屬性,但不一定能同時(shí)約簡(jiǎn)。下面計(jì)算同時(shí)去除c5和c6時(shí)C相對(duì)于D的正域:
POS(C-c5-c6)(D)=POSC(D),所以,c5和c6可以同時(shí)約簡(jiǎn)。
所以,C的最小約簡(jiǎn)為。經(jīng)過(guò)屬性約簡(jiǎn),環(huán)境條件因素c5和資金保障因素c6被篩除。
指標(biāo)篩選完成后,可采用KW檢驗(yàn)法進(jìn)行檢驗(yàn)以驗(yàn)證篩選指標(biāo)是否合理。
1)KW檢驗(yàn)法
KW檢驗(yàn)即Kruskal-Wallis檢驗(yàn),也稱(chēng)為H檢驗(yàn)。KW檢驗(yàn)是一種秩和檢驗(yàn),根據(jù)所有數(shù)據(jù)從小到大排列,算出每個(gè)數(shù)據(jù)的秩并計(jì)算每組數(shù)據(jù)的秩和,然后根據(jù)下式計(jì)算KW值:
其中,Ni為每組的樣本個(gè)數(shù),Ri為每組的秩和。n為所有數(shù)據(jù)總數(shù),k為組數(shù)。如果樣本中存在結(jié)值(具有相同秩值的數(shù)據(jù)),則需要在KW值中加入校正系數(shù)C:
其中τj是第j個(gè)結(jié)值的個(gè)數(shù)。校正后的KW′值為
求出KW′值后,可通過(guò)查卡方檢驗(yàn)表判斷每組數(shù)據(jù)間是否具有顯著性差異,從而驗(yàn)證篩選指標(biāo)是否合理。
2)用SPSS軟件進(jìn)行篩選指標(biāo)的KW檢驗(yàn)
SPSS軟件是IBM設(shè)計(jì)的一款數(shù)據(jù)分析與計(jì)算軟件,具有實(shí)用高效便利的特點(diǎn)。本文使用SPSS Statistics 26版本進(jìn)行篩選指標(biāo)的KW檢驗(yàn)。
在SPSS菜單欄“分析”中下拉菜單“非參數(shù)檢驗(yàn)”、“舊對(duì)話(huà)框”、“K個(gè)相關(guān)樣本”中打開(kāi)KW檢驗(yàn)功能。分別輸入未篩選的7個(gè)指標(biāo)數(shù)據(jù)和篩選后的5個(gè)指標(biāo)數(shù)據(jù),相關(guān)檢驗(yàn)結(jié)果如圖4、5所示。
圖4 篩選指標(biāo)的KW檢驗(yàn)結(jié)果
圖5 原指標(biāo)的KW檢驗(yàn)結(jié)果
由圖可知,篩選前7個(gè)指標(biāo)的漸進(jìn)顯著性為0.143,篩選后5個(gè)指標(biāo)的漸進(jìn)顯著性為0.101,篩選后的指標(biāo)集的數(shù)據(jù)差異性變大了,說(shuō)明數(shù)據(jù)的相對(duì)獨(dú)立性更好,信息載荷量更大。因此,篩選的指標(biāo)是合理的。至此,將原質(zhì)量指標(biāo)體系的7個(gè)質(zhì)量指標(biāo)成功簡(jiǎn)化為5個(gè)指標(biāo):人員因素、生產(chǎn)設(shè)備因素、產(chǎn)品原材料因素、技術(shù)工藝因素、質(zhì)量信息管理因素,此即某型裝備在研制生產(chǎn)階段的質(zhì)量基因要素。
在現(xiàn)階段裝備質(zhì)量管理中,要提高工作效率、更好地掌握裝備質(zhì)量動(dòng)態(tài)情況,就勢(shì)必要在繁冗復(fù)雜的質(zhì)量指標(biāo)因素中化繁為簡(jiǎn)、提取要素。裝備質(zhì)量基因要素信息篩選工作正是基于此思路展開(kāi)的。本文構(gòu)建的基于粗糙集理論的裝備質(zhì)量基因要素信息篩選模型,為裝備質(zhì)量信息的收集和提取提供了實(shí)用手段,并為后續(xù)的裝備質(zhì)量動(dòng)態(tài)評(píng)估與跟蹤管理以及裝備質(zhì)量信息系統(tǒng)的構(gòu)建提供信息來(lái)源和數(shù)據(jù)支撐。