崔鐵軍,馬云東(1.遼寧工程技術(shù)大學(xué)安全科學(xué)與工程學(xué)院,遼寧 阜新12000;2.礦山熱動力災(zāi)害與防治教育部重點實驗室,遼寧 阜新12000;.大連交通大學(xué)遼寧省隧道與地下結(jié)構(gòu)工程技術(shù)研究中心,遼寧 大連116028)
因素空間理論由汪培莊先生所創(chuàng),至今得到了一定的發(fā)展,先生最新一篇論文[1]描述了因素空間與因素庫的具體概念并進行了討論。針對作者所研究安全系統(tǒng)工程領(lǐng)域[2~6],遇到了使用傳統(tǒng)方法難以處理的問題。如作者在另一篇文章中描述了這樣一個例子,在對某電器系統(tǒng)安全性進行調(diào)研時,對一位操作者提出系統(tǒng)安全性問題后的回答:系統(tǒng)在12 ℃以下多出現(xiàn)故障,工作七八十天后故障較多,系統(tǒng)嚴(yán)重不穩(wěn)定。這個例子有一些特點,例子是一個多因素決策系統(tǒng);因素的表達是一個域值,即因素是一個范圍;基礎(chǔ)數(shù)據(jù)來源于多個使用者的經(jīng)驗,不同的工作時間和工作環(huán)境使他們對系統(tǒng)的評價基礎(chǔ)不同;基礎(chǔ)數(shù)據(jù)對事物的描述具有模糊性;如何知曉這些描述的置信度:這些描述能否可以相互佐證?
當(dāng)然,目前有一些方法可以對描述語義進行處理。錢怡等[7]對對象定位處理中分類信息融合技術(shù)進行了研究;余曉敏等[8]利用改進SEaTH 算法研究了面向?qū)ο蠓诸愄卣鬟x擇方法;竇丹丹等[9]基于信息熵和SVM 多分類對飛機液壓系統(tǒng)故障進行了診斷;??±诘龋?0]基于全方位優(yōu)化算法改進了馬田系統(tǒng)分類方法;黃恒秋等[11]實現(xiàn)了混合值不完備決策信息系統(tǒng)的粗糙分類方法。但是,就處理如上例特點的問題顯得捉襟見肘。
為解決上述問題,筆者將汪先生在文獻[1]中提出的因素空間對象的屬性表示方法進行了修改,使之在單位屬性圓內(nèi)可以表示無窮多個屬性對對象的影響,進而分析對象的相似性,并轉(zhuǎn)化為相似性的數(shù)值表達,得到對象集聚類劃分的規(guī)則。
因素是分析事物屬性與因果關(guān)聯(lián)的要素。因素空間是以因素命名的坐標(biāo)空間,它是事物描述的普適性的數(shù)學(xué)框架,是人工智能特別是智能數(shù)據(jù)科學(xué)的基本數(shù)學(xué)理論。
因素被數(shù)學(xué)地定義為一種映射。它把一個對象(具體事物)映射成為一個屬性值(用自然語言中的形容詞來描述),這種映射稱為質(zhì)映射;同時,也映射成為一個性態(tài)(用有限維歐氏空間中的實向量來表示),這種映射稱為量映射。例如,身高是一個映射,它把一個對象張三映射成性態(tài)“很高”,同時,也映射成一個量態(tài)1.8(m),如圖1所示。任何事物都同時存在著質(zhì)與量的兩種規(guī)定性。從量變到質(zhì)變,量決定質(zhì)。
基于這一哲理,我們設(shè)定這兩種映射共存。因素f的量映射形成一個(一維或高維)坐標(biāo)軸Xf,f的質(zhì)映射所得的屬性值是Xf中的普通或模糊子集。有關(guān)模糊子集的形成方法早已由模糊集理論解決。
Figure 1 Personal factors expressed in factor space圖1 人的因素空間性態(tài)表述
因素是分析,是抽象,回到具體,便是認識的分析綜合過程。如圖1所示,把諸因素軸聯(lián)合起來,就得到以因素命名的坐標(biāo)架,這就是因素空間。任何事物都可以被看成是因素空間中的點。數(shù)學(xué)的定義便是以因素F為指標(biāo)集的一個集合族。這里F是諸因素所形成的一個集合,由于因素與因素之間存在著布爾運算,F(xiàn)是一個布爾代數(shù),故因素空間被定義成以布爾代數(shù)為指標(biāo)集的集合族。
因素庫是一種新的數(shù)據(jù)庫,它是因素空間理論的數(shù)據(jù)實現(xiàn),它對數(shù)據(jù)的處理采用一系列的基本表格形式。
如圖1所示是汪先生提出的人的因素空間性態(tài)表述圖。該圖能表示因素空間的基本建立思想,即對象集中的某一個對象(一個人)與這個對象屬性之間的關(guān)系,只要屬性確定下來,那么一個實例化的人就確定了。但是,在實際問題中,問題的研究對象往往屬性較多,使用圖1形式,其屬性的大小方向及它們和屬性之間的關(guān)系難以確定且不直觀,難以進行進一步分析。所以,本文提出了屬性圓的概念;同時,為表述方便先給出實例中對象x1的屬性圓,如圖2所示。
定義1 設(shè)系統(tǒng)T=(U,C,D)為決策表,U={x1,x2,…,xm}為對象集合,m為對象數(shù)量;C={a1,a2,…,an}為條件屬性集,n為條件數(shù)量;屬性是一個連續(xù)的區(qū)間,和表示該區(qū)間的上下界,q∈{1,…,n};D={d1,d2,…,dk}為決策集合,k為決策數(shù)量。如需區(qū)別對象之間的變量概念,在變量下方添加xi,如表示對象x1的屬性a1。
Figure 2 Attributes circle of the object x1圖2 對象x1 的屬性圓表示
定義2 構(gòu)建基礎(chǔ)信息決策表Ψ(T)表示系統(tǒng)T。表頭集合為{U,C,D},其中,C中的屬性aq必須歸一化。設(shè)的真實范圍[A,B],對于因素的研究范圍[LL,UL],LL≤A,UL≥B,
通過上面的定義可知,Ψ(T)中的數(shù)據(jù)是經(jīng)過歸一化的,即這為屬性圓的建立提供了基礎(chǔ)。
定義3 屬性圓是在坐標(biāo)系中的一個單位圓,即半徑為1,在這個坐標(biāo)系統(tǒng)中,屬性圓可以表示對象集中的所有對象。屬性圓周上某一點aq與圓心a0的連線為屬性域線(下文簡稱“域線”),代表了論域中所有對象在屬性上(歸一化)的取值范圍,域線長為1。在域線上,表示屬性域值的起點,表示屬性域值的終點。在屬性圓中的線段用L(κ1,κ2)表示,κ1、κ2表示屬性圓中任意的兩個點,如aq域線表示為L(aq,a0)。屬性角為域線L(aq,a0)與L(aq+1,a0)之間的夾角。屬性圓中的面積使用M(κ1,κ2,…,κο)表示,κ1,κ2,…,κο表示屬性圓中任意的多個點,這些點按照出現(xiàn)順序能組成凸多邊形。屬性圓定義的規(guī)則可總結(jié)如式(1)所示的規(guī)則:
式中參數(shù)見定義1及定義2。
為進行分類方法的說明,先給出x1與x6的相似性定義圖,如圖3所示。首先從幾何圖示的角度給出對象相似的概念。如圖2中,表示了一個凸多邊形,其意義為同時表示了對象x1在屬性a2、a3上其特征的大小。圖3表示x1與x6的屬性圓圖的重疊圖(請注意,x1與x6中面積的底紋不同),那么與的重疊部分可以較大程度地反映x1與x6關(guān)于屬性a2、a3的相似程度。
Figure 3 Similarity definition between x1and x6圖3 x1 與x6 的相似性定義圖
但是明顯地使用上述方法確定x1與x6的相似程度存在困難。一方面上述方法與的重疊部分同時反映了x1與x6關(guān)于兩個屬性a2、a3的相似程度,不能就單一屬性確定。另一方面與的重疊部分需要通過復(fù)雜的解析手段才能確定。對于工程應(yīng)用要求簡便快捷的特點顯然是不滿足的。因此,將相似的屬性圓思想轉(zhuǎn)化為數(shù)值計算方法進行定義和使用。
從圖3 可以看出,在a3屬性上和有一部分是重疊的,這部分說明a3屬性有一個區(qū)域?qū)1和x6有著相同的影響,也就是說在這個區(qū)域中x1和x6是相似的?;谠撍枷攵x相似性。
定義5 在系統(tǒng)T中,xi,xj∈U,則定義S(xi,xj,aq)為xi與xj關(guān) 于 屬性aq的 相 似 度,S(xi,xj,aq)的確定方法如下:
當(dāng)i=j(luò)時,S(xi,xj,aq)=1,一個對象與自己相比,自身的相似度為1。
當(dāng)i≠j時,比較與的相對覆蓋區(qū)域情況。
其中,0≤S(xi,xj,aq)≤1。
上述定義的具體體現(xiàn)可見圖3。
定義7 基于xi、xj的總相似度S(xi,xj)的分類規(guī)則。設(shè)為xi、xj對于單一屬性aq的相似性判斷閾值,一般地1≥S(xi,xj,aq)≥λaq意為相似,S(xi,xj,aq)=0意為不相似,意為模糊相似。所以,對于意為相似,S(xi,xj)=0意為不相似,0<意為模糊相似。
任何理論的價值在于其處理實際問題的能力。上述理論的形成也是從實際問題中提煉出來的。
在對一個電器系統(tǒng)進行可靠性分析時,調(diào)研了七位使用過該系統(tǒng)的人員,他們給出了對系統(tǒng)可靠性的評價語言論述。由于他們工作調(diào)度等方面的原因使其操作系統(tǒng)的環(huán)境不同。實際上,就系統(tǒng)中元件發(fā)生故障概率而言,其影響因素是多樣的。比如,電器系統(tǒng)中的二極管,它的故障概率就與工作時間的長短、工作溫度的大小、通過電流及電壓等有直接關(guān)系。如果對這個系統(tǒng)進行分析,各個元件的工作時間和工作適應(yīng)的溫度等可能都不一樣,隨著系統(tǒng)整體的工作時間和環(huán)境溫度的改變,系統(tǒng)的安全性也是不同的[10]。所以,他們給出的系統(tǒng)可靠性評價的基礎(chǔ)環(huán)境是不同的。
使用本文提出的方法試圖將這些操作人員的描述進行分類,如果得到的對象集(語義描述集合)分類與決策集分類相同,那么說明這些操作人員對系統(tǒng)可靠性評價是客觀的,可以相互佐證;如果對象集分類與決策集分類不對應(yīng),那么要增加其他操作者的評價才能進一步確定表述的準(zhǔn)確性。
根據(jù)現(xiàn)場調(diào)研情況,如某位操作者的回答為:系統(tǒng)在12 ℃以下多出現(xiàn)故障,工作七八十天后故障較多,系統(tǒng)嚴(yán)重不穩(wěn)定(由于篇幅所限,七個表述不都給出)。該系統(tǒng)一般100天大修一次,設(shè)定使用時間的域為[0d,100d];使用溫度考慮到系統(tǒng)位于北方戶外且有一定的保護,設(shè)定其域為[0 ℃,40 ℃];濕度是根據(jù)工作期間的季節(jié)氣候大體確定的。
Table 1 Basic information decision tableΨ(T)表1 基礎(chǔ)信息決策表Ψ(T)
Figure 4 Attributes circle of the object x2 ~x7圖4 x2 ~x7 的屬性圓
相似:S(x2,x1)=0.3214,S(x5,x3)=0.5906,S(x6,x3)=0.2315,S(x6,x5)=0.2632,S(x7,x4)=0.2592;
模糊相似:S(x3,x1)=0.0238,S(x4,x3)=0.0204,S(x5,x1)=0.0278,S(x5,x2)=0.0321,S(x5,x4)=0.0165,S(x6,x1)=0.0288,S(x6,x2)=0.0306,S(x6,x4)=0.0765,S(x7,x6)=0.0245;
不相似:S(x3,x2)=0,S(x4,x1)=0,S(x4,x2)=0,S(x7,x1)=0,S(x7,x2)=0,S(x7,x3)=0,S(x7,x5)=0。
對象聚類原則為:嚴(yán)格遵照相似與不相似劃分,參考模糊相似劃分。如S(x2,x1)=0.3214說明對象x2、x1要劃分為一組;S(x3,x2)=0說明對象x3、x2不能劃分為一組。所以,最終對象集U={{x2,x1},{x7,x4},{x5,x3,x6}}。在考慮表1中決策集D與對象集U的對應(yīng)關(guān)系,發(fā)現(xiàn)U→D={{x2,x1}→d1,{x7,x4}→d3,{x5,x3,x6}→d2},這說明對對象的劃分就其決策屬性而言是非奇異的、準(zhǔn)確的。轉(zhuǎn)化為語義即為七位操作人員盡管在不同環(huán)境下對系統(tǒng)進行了可靠性評價,但是這些評價語義是相對客觀的,所在環(huán)境屬性域值與決策等級對應(yīng)較好,評價的語義可以相互佐證。
本文將汪先生提出的因素空間對象的屬性表示方法進行了修改,使其在單位屬性圓內(nèi)可以表示無窮多個屬性對對象的影響,進而分析對象的相似性,并轉(zhuǎn)化為相似性的數(shù)值表達,得到對象集聚類劃分的規(guī)則。規(guī)則應(yīng)按照嚴(yán)格遵照相似與不相似劃分,參考模糊相似劃分的要求對對象集合U進行劃分。如果對象集U與決策集D的對應(yīng)關(guān)系是非奇異的(U→D={{x2,x1}→d1,{x7,x4}→d3,{x5,x3,x6}→d2}),那么說明盡管系統(tǒng)所處的環(huán)境因素不同,但是對系統(tǒng)的某一性質(zhì)(文中為可靠性)的描述語義群中各條評價論述是相對客觀的,可以相互佐證,描述語義群是正確的。如果是奇異的,就需要增加描述語義群的評價論述,進一步加以確定。
Table 2 Similarity table of the objects表2 對象相似表
論文研究中假設(shè)了每個屬性對于對象的影響權(quán)重是相同的,對于權(quán)重不同的研究由于篇幅所限將另文論述。
[1] Wang Pei-zhuang.Factor spaces and factor data-bases[J].Journal of Liaoning Technical University(Natural Science),2013,32(10):1-8.(in Chinese)
[2] Cui Tie-jun,Ma Yun-dong.Prediction of periodic weighting based on optimized functional networks[J].Computer Science,2013,40(6A):242-246.(in Chinese)
[3] Cui Tei-jun,Ma Yun-dong.Prediction of soil settlement outside pit based on DE and SVM[J].China Safety Science Journal,2013,23(1):83-89.(in Chinese)
[4] Cui Tei-jun,Ma Yun-dong,Bai Run-cai.Selection of blast scheme based on coupling of genetic algorithm and artificial neural network[J].China Safety Science Journal,2013,23(2):64-68.(in Chinese)
[5] Cui Tei-jun,Ma Yun-dong.Research on multi-dimensional space fault tree construction and application[J].China Safety Science Journal,2013,23(4):32-37.(in Chinese)
[6] Cui Tei-jun,Ma Yun-dong.Traffic route dynamic guidance technology based on coupling of time recursive and artificial neuron network[J].Application Research of Computers,2013,30(10):2932-2935.(in Chinese)
[7] Qian Yi,Lin Ying,Wu Gang-shan.Research of fusing image classification into object localization[J].Application Research of Computers,2013,30(12):3844-3849.(in Chinese)
[8] Yu Xiao-min,Zhan Fei-bing,Liao Ming-sheng,et al.Object-oriented feature selection algorithms based on improved SEaTH algorithms[J].Geomatics and Information Science of Wuhan University,2012,37(8):921-924.(in Chinese)
[9] Dou Dan-dan,Jiang Hong-kai,He Yi-na.Effectively diagnosing faults for aircraft hydraulic system based on information entropy and multi-classification SVM[J].Journal of Northwestern Polytechnical University,2012,30(4):529-534.(in Chinese)
[10] Niu Jun-lei,Cheng Long-sheng.Classification using improved Mahalanobis-Taguchi system based on omni-optimizer[J].Systems Engineering-Theory & Practice,2012,32(6):1324-1336.(in Chinese)
[11] Huang Heng-qiu,Zeng Ling.Rough classification method in incomplete decision information system with hybrid value[J].Computer Engineering and Applications,2011,47(28):48-51.(in Chinese)
附中文參考文獻:
[1] 汪培莊.因素空間與因素庫[J].遼寧工程技術(shù)大學(xué)學(xué)報(自然科學(xué)版),2013,32(10):1-8.
[2] 崔鐵軍,馬云東.基于泛函網(wǎng)絡(luò)的周期來壓預(yù)測方法研究[J].計算機科學(xué),2013,40(6A):242-246.
[3] 崔鐵軍,馬云東.基于差異進化支持向量機的坑外土體沉降預(yù)測[J].中國安全科學(xué)學(xué)報,2013,23(1):83-89.
[4] 崔鐵軍,馬云東,白潤才.基于ANN 耦合遺傳算法的爆破方案選擇方法[J].中國安全科學(xué)學(xué)報,2013,23(2):64-68.
[5] 崔鐵軍,馬云東.多維空間故障樹構(gòu)建及應(yīng)用研究[J].中國安全科學(xué)學(xué)報,2013,23(4):32-37.
[6] 崔鐵軍,馬云東.時間遞推耦合神經(jīng)網(wǎng)絡(luò)的交通路徑動態(tài)誘導(dǎo)技術(shù)[J].計算機應(yīng)用研究,2013,30(10):2932-2935.
[7] 錢怡,林瑩,武港山.對象定位處理中分類信息融合技術(shù)研究[J].計算機應(yīng)用研究,2013,30(12):3844-3849.
[8] 余曉敏,湛飛并,廖明生,等.利用改進SEaTH 算法的面向?qū)ο蠓诸愄卣鬟x擇方法[J].武漢大學(xué)學(xué)報(信息科學(xué)版),2012,37(8):921-924.
[9] 竇丹丹,姜洪開,何毅娜.基于信息熵和SVM 多分類的飛機液壓系統(tǒng)故障診斷[J].西北工業(yè)大學(xué)學(xué)報,2012,30(4):529-534.
[10] ??±?,程龍生.基于全方位優(yōu)化算法的改進馬田系統(tǒng)分類方法[J].系統(tǒng)工程理論與實踐,2012,32(6):1324-1336.
[11] 黃恒秋,曾玲.混合值不完備決策信息系統(tǒng)的粗糙分類方法[J].計算機工程與應(yīng)用,2011,47(28):48-51.