張凱+楊靖
摘 要:粗糙集理論是一種新的分析和處理不精確、不一致、不完整信息與知識(shí)的數(shù)學(xué)工具,為智能信息處理提供了有效的處理技術(shù),近年來(lái),被廣泛應(yīng)用于專家系統(tǒng)、圖像處理、模式識(shí)別、決策分析等領(lǐng)域。文中介紹了關(guān)于粗糙集的基本理論,并對(duì)其在各領(lǐng)域的應(yīng)用情況進(jìn)行了綜述。
關(guān)鍵詞:粗糙集理論;不確定性;知識(shí)約簡(jiǎn);粗糙模糊集
中圖分類號(hào):TP18 文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):2095-1302(2017)06-00-02
0 引 言
粗糙集理論由波蘭華沙理工大學(xué)Z.Pawlak教授于1982年首先提出,通過(guò)結(jié)合邏輯學(xué)和哲學(xué)中對(duì)不精確、模糊的定義,針對(duì)知識(shí)和知識(shí)系統(tǒng)提出了知識(shí)簡(jiǎn)約、知識(shí)依賴、知識(shí)表達(dá)系統(tǒng)等概念,并在此基礎(chǔ)上形成了完整的理論體系——粗糙集理論。粗糙集理論把知識(shí)看作關(guān)于論域的劃分,認(rèn)為知識(shí)是有粒度的,而知識(shí)的不精確性是由知識(shí)的粒度過(guò)大引起的。從1992年至今,每年都要以粗糙集為主題召開國(guó)際會(huì)議,近兩年,召開的關(guān)于粗糙集的會(huì)議有2015年國(guó)際粗糙集聯(lián)合會(huì)議(IJCRS2015)和2016年第十六屆中國(guó)粗糙集與軟計(jì)算聯(lián)合學(xué)術(shù)會(huì)議(CRSSC2016)。粗糙集越來(lái)越受到各行業(yè)專家和科研人員的重視,隨著對(duì)粗糙集理論研究的不斷加深,越來(lái)越多的領(lǐng)域開始運(yùn)用粗糙集解決問(wèn)題。
1 粗糙集理論
1.1 知識(shí)與知識(shí)系統(tǒng)
將研究對(duì)象構(gòu)成的集合記為U,這是一個(gè)非空有限集,稱為論域U,任何子集,稱其為U中的一個(gè)概念或范疇。把U中任何概念族都稱為關(guān)于U的抽象知識(shí),簡(jiǎn)稱知識(shí)。一個(gè)劃分定義為:X={X1,X2,…,Xn},,Xi≠φ,Xi∩Xj=φ,且i≠j,i,j=1,2,…,n;∪niXi=U。U上的一簇劃分稱為關(guān)于U的一個(gè)知識(shí)系統(tǒng)。
R是U上的一個(gè)等價(jià)關(guān)系,由它產(chǎn)生的等價(jià)類可記為[x]R={y|xRy,y∈U},這些等價(jià)類構(gòu)成的集合U/R={[x]R|x∈U}是關(guān)于U的一個(gè)劃分。若PR,且P≠φ,則∩P也是一種等價(jià)關(guān)系,稱為P上不可分辨關(guān)系,記為ind(P):。
1.2 粗糙集與不精確范疇
給定知識(shí)庫(kù)K=(U,Q),對(duì)于每個(gè)子集和一個(gè)等價(jià)關(guān)系R∈ind (Q),定義在知識(shí)系統(tǒng)U/R下集合X的下近似為:
上近似表示屬于X的對(duì)象組成的最小集合,即X的正域,記為POSR(X),而肯定不屬于X的對(duì)象組成的集合稱為X的負(fù)域,記為NEGR(X)。
在知識(shí)系統(tǒng)U/R下集合X的上近似為:
上近似是可能屬于X的對(duì)象組成的最小集合。集合X的邊界區(qū)域?yàn)椋?/p>
邊界區(qū)域BNR(X)是根據(jù)知識(shí)R,U中既不能肯定包含于集合X,又不能肯定包含于集合的元素構(gòu)成的集合。
1.3 知識(shí)簡(jiǎn)約與知識(shí)依賴
知識(shí)簡(jiǎn)約,是在保持知識(shí)庫(kù)分類能力不變的條件下,刪除其中不相關(guān)或不重要的知識(shí)。令R為一簇等價(jià)關(guān)系,r∈C,若ind(R)=ind(R-r),則稱r為R中不必要的,若對(duì)于每一個(gè)r∈C都為R中必要的,則稱R為獨(dú)立的,否則稱R為依賴的。P中所有必要關(guān)系組成的集合稱為核,記為core (P)。
定義知識(shí)R對(duì)知識(shí)Q的依賴程度為:
顯然,0≤ξQ(R)≤1。當(dāng)ξQ(R)=1時(shí),知識(shí)R完全依賴于知識(shí)Q;當(dāng)ξQ(R)→1時(shí),說(shuō)明定義知識(shí)R對(duì)知識(shí)Q的依賴程度高。ξQ(R)的大小從總體上反應(yīng)了知識(shí)R對(duì)知識(shí)Q的依賴程度。
1.4 知識(shí)表達(dá)系統(tǒng)
在粗糙集理論中,一個(gè)知識(shí)表達(dá)系統(tǒng)可表示為S=(U,R,V,f),為其中U為論域,R為屬性集合,V為屬性值集合,f為一個(gè)信息函數(shù),其對(duì)象的每個(gè)屬性賦予一個(gè)信息值。即。
決策表是一類特殊而重要的知識(shí)表達(dá)系統(tǒng)。設(shè)S=(U, R, V,f)為一個(gè)知識(shí)表達(dá)系統(tǒng),R=C∪D,C∩D=φ,稱C為條件屬性集,稱D為決策屬性集。具有條件屬性集和決策屬性集的知識(shí)系統(tǒng)稱為決策表。
2 粗糙集理論的應(yīng)用
粗糙集理論具有很強(qiáng)的實(shí)用性,目前在各領(lǐng)域已有諸多應(yīng)用。
2.1 故障診斷
文獻(xiàn)[1]中提出了一種基于粗糙集與證據(jù)理論的航空裝備故障診斷方法,利用粗糙集框架實(shí)現(xiàn)對(duì)故障診斷模型的構(gòu)造并對(duì)冗余信息進(jìn)行簡(jiǎn)約,通過(guò)邊界粗糙熵來(lái)衡量每個(gè)條件對(duì)決策的重要程度;文獻(xiàn)[2]利用變精度粗糙集和信息論中互信息增量的特性,針對(duì)傾轉(zhuǎn)旋翼機(jī)在過(guò)度轉(zhuǎn)換時(shí)的故障進(jìn)行診斷,利用OMELM對(duì)變精度粗糙集屬性簡(jiǎn)約進(jìn)行故障分類。
2.2 圖像處理
粗糙集理論對(duì)不精確問(wèn)題能夠提供較好的解決方法,文獻(xiàn)[3]將粗糙集理論與模糊聚類算法相結(jié)合用以解決圖像分割問(wèn)題。文獻(xiàn)[4]依靠粗糙集對(duì)邊界區(qū)域近似有較好的解決能力,將粗糙集近似集與粒子群算法相結(jié)合來(lái)解決圖像分割問(wèn)題,利用粗糙集理論得到圖像的最優(yōu)粒度,再通過(guò)粒度劃分得到圖像的近似集,從而利用近似集得到便捷的精準(zhǔn)刻畫。
2.3 專家系統(tǒng)
粗糙集理論對(duì)規(guī)則的抽取有較好的應(yīng)用,因此能夠?yàn)閷<蚁到y(tǒng)的構(gòu)造提供理論基礎(chǔ)。文獻(xiàn)[5]利用粗糙集理論獲取知識(shí),建立決策表,并利用可辨識(shí)矩陣對(duì)決策表進(jìn)行條件屬性簡(jiǎn)約,能夠獲得需要診斷的故障樹。
2.4 模式識(shí)別
文獻(xiàn)[6]中關(guān)于礦井突水問(wèn)題,可利用粗糙集對(duì)非正態(tài)、非線性和高維數(shù)據(jù)的處理能力,對(duì)存在大量不明確對(duì)應(yīng)關(guān)系的特征進(jìn)行簡(jiǎn)約,剔除與決策無(wú)關(guān)的屬性,得到簡(jiǎn)約樣本。
2.5 信息安全
在信息安全問(wèn)題中,由于數(shù)據(jù)量大、信息種類繁多,無(wú)法形成統(tǒng)一閾值特性,所以很難針對(duì)不同種類的數(shù)據(jù)進(jìn)行準(zhǔn)確判斷。文獻(xiàn)[7]中提出了基于粗糙集合信息熵融合算法的入侵檢測(cè)方法,利用粗糙集分析復(fù)雜信息的能力,對(duì)多樣的入侵?jǐn)?shù)據(jù)特征進(jìn)行表達(dá),構(gòu)建入侵特征集合,根據(jù)決策表求出必要的特征集合,以有效解決多樣數(shù)據(jù)檢測(cè)困難的問(wèn)題,提高效率。
2.6 預(yù)測(cè)研究
文獻(xiàn)[8]將粗糙集與不同預(yù)測(cè)模型相結(jié)合,能夠更加準(zhǔn)確的預(yù)測(cè)行業(yè)與個(gè)股新聞對(duì)股票價(jià)格的影響。文獻(xiàn)[9]將粗糙集與數(shù)據(jù)挖掘技術(shù)相結(jié)合來(lái)對(duì)滑坡變形階段進(jìn)行預(yù)測(cè),通過(guò)與多種方法對(duì)比,發(fā)現(xiàn)利用該方法計(jì)算的結(jié)果與專業(yè)人員現(xiàn)場(chǎng)勘查結(jié)果極度吻合。文獻(xiàn)[10]將模糊粗糙集理論與聚類算法相結(jié)合,對(duì)影響風(fēng)速的多種因素進(jìn)行知識(shí)簡(jiǎn)約,實(shí)驗(yàn)證明該方法能夠有效提高風(fēng)速預(yù)測(cè)模型的精度。
2.7 決策分析
粗糙集理論在金融投資預(yù)測(cè)方面也起到了很大的作用,文獻(xiàn)[11]基于優(yōu)勢(shì)粗糙集建立了證券投資分析模型,能夠有效分析出股票的投資價(jià)值。文獻(xiàn)[12]運(yùn)用多粒度粗糙集為決策問(wèn)題提供了新的思路,將多粒度粗糙集運(yùn)用到專家的綜合決策中并證明了研究的有效性。
2.8 風(fēng)險(xiǎn)評(píng)估
每種風(fēng)險(xiǎn)災(zāi)害都是由多種不確定因素引起的,并且各因素耦合度較高,均不利于對(duì)風(fēng)險(xiǎn)的判斷。文獻(xiàn)[13]利用粗糙集對(duì)引起滑坡災(zāi)害風(fēng)險(xiǎn)的多種因素進(jìn)行表達(dá),并建立決策表,證明了將粗糙集與GIS組合的方式能夠有效評(píng)估滑坡地質(zhì)災(zāi)害的風(fēng)險(xiǎn)。文獻(xiàn)[14]利用直覺(jué)模糊粗糙集對(duì)自然災(zāi)害造成電網(wǎng)災(zāi)害的各種不確定因素進(jìn)行評(píng)估,并成功應(yīng)用于遼寧雪災(zāi),取得了較好的效果。
3 結(jié) 語(yǔ)
在粗糙集理論發(fā)展的三十多年間,已取得了許多突破性研究成果,并成功運(yùn)用到生活的各個(gè)方面。粗糙集能夠處理不完整、不精確的大量數(shù)據(jù),在實(shí)際應(yīng)用中,將粗糙集與各種不同分類方法相結(jié)合,能夠更快、更準(zhǔn)確的提取出有用信息是未來(lái)研究的熱點(diǎn)之一。
參考文獻(xiàn)
[1]孫偉超,李文海,李文峰.融合粗糙集與D-S證據(jù)理論的航空裝備故障診斷[J].北京航空航天大學(xué)學(xué)報(bào),2015,41(10):1902-1909.
[2]陳曉,王新民,黃譽(yù),等.傾轉(zhuǎn)旋翼機(jī)飛控系統(tǒng)的變精度粗糙集-OMELM故障診斷方法[J].控制與決策,2015,35(3):433-440.
[3]馬文萍,黃媛媛,李豪,等.基于粗糙集與差分免疫模糊聚類算法的圖像分割[J].軟件學(xué)報(bào),2014,25(11) : 2675-2689.
[4]姚龍洋,張清華,胡帥鵬,等.基于近似集與粒子群的粗糙熵圖像分割方法[J].計(jì)算機(jī)科學(xué)與探索,2016,10(5):699-708.
[5]李英順,姜雙雙,佟維妍,等.基于RST及FTA的綜合傳動(dòng)裝置故障診斷專家系統(tǒng)的應(yīng)用研究[J].組合機(jī)床與自動(dòng)化加工技術(shù),2014 (4):60-63.
[6]王江榮,黃建華,羅資琴,等.基于粗糙集的Logistic回歸模型在礦井突水模式識(shí)別中的應(yīng)用[J].煤田地質(zhì)與勘探,2015,43(6):70-74.
[7]何偉娜,褚龍現(xiàn),姜建國(guó).混合型數(shù)據(jù)庫(kù)中入侵檢測(cè)技術(shù)仿真[J].計(jì)算機(jī)仿真,2015,32(11):425-428.
[8]徐偉,李韻喆.行業(yè)與個(gè)股新聞對(duì)股票價(jià)格影響的定量分析[J].經(jīng)濟(jì)界,2015(20):31-32.
[9]韓舸,龔?fù)?,吳婷,?利用粗糙集的滑坡分階段位移預(yù)測(cè)方法——以白家包滑坡為例[J].吉林大學(xué)學(xué)報(bào)(地球科學(xué)版), 2014,44(3): 925 -931.
[10]劉興杰,岑添云,鄭文書,等.基于模糊粗糙集與改進(jìn)聚類的神經(jīng)網(wǎng)絡(luò)風(fēng)速預(yù)測(cè)[J].中國(guó)電機(jī)工程學(xué)報(bào),2014,34(19):3162-3169.
[11]楊博翔.基于優(yōu)勢(shì)粗糙集的證券投資決策研究及應(yīng)用[J].山東農(nóng)業(yè)大學(xué)學(xué)報(bào)(自然科學(xué)版),2016,47(5):785-788.
[12]郭慶,吳磊.多粒度背景下直覺(jué)模糊信息系統(tǒng)的粗糙集及其決策[J].系統(tǒng)工程與電子技術(shù),2016,38(2):347-351.
[13]劉彥花,葉國(guó)華. 基于粗糙集與GIS的滑坡地質(zhì)災(zāi)害風(fēng)險(xiǎn)評(píng)估[J].災(zāi)害學(xué),2015,30(2):108-114.
[14]劉鑫蕊,付倩,孫秋野,等.直覺(jué)模糊粗糙集理論在電網(wǎng)災(zāi)害評(píng)估中的應(yīng)用[J].中國(guó)電機(jī)工程學(xué)報(bào),2015,35(22):5692-5702.