張匯鋒, 張永杰, 馮 誠, 趙 明, 陳 毓
(1.中國人民解放軍92724部隊(duì),山東 青島 266109;2.海軍航空工程學(xué)院 山東 煙臺(tái) 264001)
訓(xùn)練器材作為教學(xué)訓(xùn)練保障的重要組成部分,器材的配備是否充裕將對(duì)教學(xué)水平的完成和發(fā)揮產(chǎn)生直接的影響。研究影響器材消耗的影響因素,對(duì)后續(xù)制定相關(guān)的保障策略,減少器材的消耗有著至關(guān)重要的作用。粗集理論是處理不完整性和不確定性的新數(shù)學(xué)理論,其最大的特點(diǎn)就是利用數(shù)據(jù)本身所提供的信息,不需要任何附加信息或先驗(yàn)信息或先驗(yàn)知識(shí),在保持知識(shí)庫分類能力不變的條件下,刪除不相關(guān)或不重要的信息,降低信息冗余。本文以某種訓(xùn)練器材為例,基于粗糙集的理論基礎(chǔ),將影響訓(xùn)練器材消耗的相關(guān)因素用粗糙集方法進(jìn)行預(yù)處理,簡化影響因素,排除冗余,找出主要因素。
粗糙集(Rough sets)理論是波蘭學(xué)者Pawlak于1982年提出的一種研究不精確、不確定性知識(shí)的數(shù)學(xué)工具,能有效的分析和處理不精確、不一致、不完整等各種不完備信息;能在保留關(guān)鍵信息的前提下對(duì)數(shù)據(jù)進(jìn)行化簡并求得知識(shí)的最小表達(dá);能識(shí)別并評(píng)估數(shù)據(jù)間的依賴關(guān)系,揭示出概念簡單的模式;能從經(jīng)驗(yàn)數(shù)據(jù)中發(fā)現(xiàn)隱含知識(shí),揭示潛在的規(guī)律[1-2]。
給定一個(gè)對(duì)象論域U,對(duì)于任何子集X?U可稱之為一個(gè)U中的概念或范疇,它們構(gòu)成了特定論域U的分類。其中,Xi?U,Xi≠Φ;Xi∩Xj=Φ,當(dāng) i≠j,i=1,2,…n;且∪Xi=U。
知識(shí)系統(tǒng)通常處理的是U上的分類族。一個(gè)U上的分類族,定義為一個(gè)U上的知識(shí)庫。這樣,知識(shí)庫就是表達(dá)一個(gè)智能系統(tǒng)的各種基本分類方式的集合。常用等價(jià)關(guān)系替代分類,因?yàn)檫@兩個(gè)概念完全可以互相替代。
若R是U上的劃分R={X1,X2,…Xn}表達(dá)的等價(jià)關(guān)系,(U,R)稱為近似空間,U/R是 R(或 U的分類)的所有等價(jià)類族。用[X]R表示子集X屬于R的一個(gè)范疇,且R包括元素 x∈U。
設(shè)R是一個(gè)等價(jià)關(guān)系族,且r?R,若有
則稱r在等價(jià)關(guān)系R中是可以省略的,否則為不可省略的。
設(shè) Q?P,Q 是獨(dú)立的,且 IND(Q)=IND(P),則稱 Q 是等價(jià)關(guān)系族P的一個(gè)約簡(Reduction),記為red(P)。在P中所有不可省關(guān)系的集合稱為等價(jià)關(guān)系族P的核 (core),記為core(P)。它是表達(dá)知識(shí)必不可少的重要屬性集。由此可以得到,知識(shí)約簡與核的關(guān)系是,約簡集red(P)的交集等于P的核[3],即
很多因素能夠影響訓(xùn)練器材消耗數(shù)量的多少,而每種因素對(duì)訓(xùn)練器材消耗的影響程度也各不相同。但歸納總結(jié)目前對(duì)訓(xùn)練器材消耗造成影響的因素可以分為可定量因素和可定性因素兩大類。
通過實(shí)際調(diào)研、考察,參閱有關(guān)文獻(xiàn)中提到的影響訓(xùn)練器材消耗的因素,得出主要的可定量分析的影響如圖1所示。
圖1 訓(xùn)練器材消耗可定量分析的影響因素Fig.1 Quantitative analysis factors of training equipment consumption influencing factors
這些可定量分析的影響因素可歸納為:
1)使用時(shí)間T,訓(xùn)練器材的年使用時(shí)間;
2)使用次數(shù)Y,訓(xùn)練器材的年使用次數(shù);
3)配備數(shù)量G,即該單位的器材總數(shù)量。
4)損壞率N,器材在搬運(yùn)、裝配和維修時(shí)或者在訓(xùn)練過程中由于人為差錯(cuò)、操作不當(dāng)引起的損壞。
其次,在眾多影響訓(xùn)練器材消耗的因素中,包含著一些難以直接用數(shù)值方法進(jìn)行表述的影響因素,我們將這些影響因素歸結(jié)為可定性分析的影響因素。同樣,訓(xùn)練器材消耗中需要考慮的這些可定性分析的影響因素如圖2所示。
圖2 訓(xùn)練器材消耗可定性分析的影響因素Fig.2 Qualitative analysis factors of training equipment consumption influencing factors
在數(shù)據(jù)處理過程中對(duì)這些影響訓(xùn)練器材消耗的可定性分析因素轉(zhuǎn)換成可定量分析的指標(biāo)進(jìn)行量化,并解釋為:
1)丟失概率W,器材由于人為的誤拿誤放,管理不慎,造成訓(xùn)練器材的丟失,從而造成器材的消耗數(shù)量增加;
2)訓(xùn)練水平較差的學(xué)員所占的比例F,學(xué)員訓(xùn)練水平的高低,學(xué)習(xí)狀況的好壞,對(duì)器材的使用熟練,愛護(hù)程度必定會(huì)對(duì)器材的消耗產(chǎn)生不同的影響。學(xué)員的訓(xùn)練水平的高低不僅與學(xué)員的年級(jí)、訓(xùn)練時(shí)間長短有關(guān),而且和學(xué)員的心里素質(zhì)及對(duì)器材的愛護(hù)意識(shí)也有很大關(guān)系;
3)教學(xué)水平較差的教員所占的比例J,教員的教學(xué)水平,對(duì)訓(xùn)練器材的熟悉程度,都會(huì)對(duì)訓(xùn)練器材消耗產(chǎn)生不同的影響,教員水平越高,對(duì)訓(xùn)練器材的使用熟悉程度越高,訓(xùn)練器材發(fā)生故障就會(huì)越少,消耗也就越少;
4)高強(qiáng)度集中訓(xùn)練課程所占的比例X,高強(qiáng)度集中訓(xùn)練課程會(huì)造成訓(xùn)練器材的使用頻繁,強(qiáng)度增大,易造成器材的疲勞,容易導(dǎo)致故障,產(chǎn)生消耗。
5)存放環(huán)境D,不同的存放環(huán)境具有不同的溫度、濕度、風(fēng)吹日曬等外部條件,會(huì)對(duì)器材的消耗產(chǎn)生不同的作用。本文把存放環(huán)境分為2種情況,分別為:室內(nèi)、室外,為分析的方便起見,這2種情況分別為1、2來代替。另外由于每種器材存放時(shí)有無保護(hù)措施的不同,又將其分為有保護(hù)措施存放、裸露存放,并分別用A、B來表示。
6)訓(xùn)練器材保養(yǎng)水平M,訓(xùn)練器材的日常保養(yǎng)水平也會(huì)影響訓(xùn)練器材的故障和消耗,如儲(chǔ)存條件,是否按照規(guī)定存儲(chǔ)方式存儲(chǔ),是否有定期檢查和定期維護(hù)等。
以具體器材為例闡述粗糙集在器材消耗影響因素分析中的應(yīng)用過程,某訓(xùn)練單位編號(hào)010的訓(xùn)練器材2002-2012年的影響消耗因素?cái)?shù)據(jù)整理如表1所示,所有影響因素構(gòu)成屬性集合{T,Y,G,W,F(xiàn),J,X,D,N,M}。
表1 訓(xùn)練器材010消耗數(shù)量影響因素統(tǒng)計(jì)Tab.1 Statistic of training equipment 010 consumption influencing factors
訓(xùn)練器材消耗影響因素集合為 R={T,Y,G,W,F(xiàn),J,X,D,N,M}, 2002 年到 2012 年的歷史數(shù)據(jù)為集合 U={1,2,3,4,5,6,7,8,9,10,11},對(duì) R 中的屬性設(shè)立閾值,超過或等于閾值的記為1,小于閾值的記為0[4-5],其中T的閾值設(shè)為248,Y的閾值設(shè)為208.6,G的閾值設(shè)為 19.8,W的閾值設(shè)為 11.1%,F(xiàn)的閾值設(shè)為 12.1%,J的閾值設(shè)為 12.6%,X的閾值設(shè)為55.68%,N的閾值設(shè)為5.9%,M的閾值設(shè)為86%。根據(jù)上述閾值及處理方法對(duì)010號(hào)訓(xùn)練器材消耗影響因素統(tǒng)計(jì)表中的數(shù)據(jù)做處理得到屬性值表2,如下所示。
表2 訓(xùn)練器材010消耗數(shù)量影響因素屬性值Tab.2 Attribute values of training equipment 010 consumption quantity influence factors
由表2可知L、D各自的屬性值相同,說明每年的裝機(jī)數(shù)量、機(jī)場的地理位置是恒定的,對(duì)故障數(shù)量的變化不會(huì)有太大影響。根據(jù)粗糙集理論可以把它去掉。同時(shí)屬性T、Y的值相同,所以只保留一個(gè),假設(shè)保留T,刪除Y。得約簡屬性值表3。
表3 訓(xùn)練器材010消耗數(shù)量影響因素屬性值約簡表Tab.3 Attribute value reduction of training equipment 010 consumption quantity influence factors
由表3可得到初步約簡后的影響因素集 R1={T,G,W,F(xiàn),J,X,N,M},U={1,2,3,4,5,6,7,8,9,10,11},根據(jù)粗糙集理論可以劃分出如下的等價(jià)類[6]:
關(guān)系IND(R1)有下列等價(jià)類:
可得,以上屬性 N 可省,而 T,G,W,F(xiàn),J,X,M 不可省。 這樣就把原來10個(gè)因素減為了7個(gè)。
通過上述分析,利用粗糙集知識(shí)約簡能夠消除干擾,從眾多訓(xùn)練器材消耗影響因素中較為快速準(zhǔn)確的找到主要影響因素,為訓(xùn)練器材保障提供了一種新的決策方法。本文利用粗糙集的數(shù)據(jù)分析與處理能力,對(duì)輸入因素集進(jìn)行約簡,簡化了數(shù)據(jù)輸入量,其基本思想具有很強(qiáng)的推廣性,適用于多因素問題。
[1]Pawlak Z.Roughsets[J].International Jourmal of Computer and Information Sciences,1982(11):341-356.
[2]Pawlak Z.Rough sets and decision analysis[C]//In:Rough Sets and Web-Based Systems in Decision Support Processing,2000:132-144.
[3]王國胤,姚一豫,于洪.粗糙集理論與應(yīng)用研究綜述[J].計(jì)算機(jī)學(xué)報(bào),2009,32(7):1229-1246.
WANG Guo-yin,YAO Yi-yu,YU Hong.Research of the rough set theory and application [J].Chinese Journal of Computers,2009,32(7):1229-1246.
[4]高尚.基于Rough集理論的神經(jīng)網(wǎng)絡(luò)的武器系統(tǒng)參數(shù)費(fèi)用模型[J].系統(tǒng)工程理論與實(shí)踐,2003,23(4):52-55.
GAO Shang.Neural network weapon system parameter cost model based on Rough set theory[J].Systems Engineering Theory and Practice,2003,23(4):52-55.
[5]曠海蘭,劉新華,陳中,等.粗糙集理論在電力系統(tǒng)數(shù)據(jù)挖掘中的應(yīng)用研究[J].衡陽師范學(xué)院學(xué)報(bào),2006,23(3):70-72.
KUANG Hai-lan,LIU Xin-hua,CHEN Zhong,et al.Rough set theory in power system data mining application[J].Journal of Hengyang Normal University,2006,23(3):70-72.
[6]馬玉良.知識(shí)獲取的Rough Sets理論及其應(yīng)用研究[D].杭州:浙江大學(xué),2005.