袁紅杰 陸永耕 程松遼 賈竹青
摘 要:粗糙集理論是一種新的分析和處理不精確、不一致、不完整信息與知識的數(shù)學工具,為智能信息處理提供了有效的處理技術,近年來,被廣泛應用于專家系統(tǒng)、圖像處理、模式識別、決策分析等領域。文中介紹了關于粗糙集的基本理論,并對其在各領域的應用情況進行了綜述。
關鍵詞:粗糙集理論;不確定性;知識約簡
0 引言
粗糙集理論由波蘭華沙理工大學Z.Pawlak教授于1982年首先提出,通過結合邏輯學和哲學中對不精確、模糊的定義,針對知識和知識系統(tǒng)提出了知識簡約、知識依賴、知識表達系統(tǒng)等概念,并在此基礎上形成了完整的理論體系——粗糙集理論。粗糙集理論把知識看作關于論域的劃分,認為知識是有粒度的,而知識的不精確性是由知識的粒度過大引起的。從 1992年至今,每年都要以粗糙集為主題召開國際會議,近兩年,召開的關于粗糙集的會議有2015年國際粗糙集聯(lián)合會議和2016年第十六屆中國粗糙集與軟計算聯(lián)合學術會議。粗糙集越來越受到各行業(yè)專家和科研人員的重視,隨著對粗糙集理論研究的不斷加深,越來越多的領域開始運用粗糙集解決問題。
(一).粗糙集理論
1.1 知識與知識系統(tǒng)
將研究對象構成的集合記為U,這是一個非空有限集,稱為論域U,任何子集 ,稱其為U中的一個概念或范疇。把U中任何概念族都稱為關于U的抽象知識,簡稱知識。
R是U上的一個等價關系,由它產生的等價類可記為 ,這些等價類構成的集合 是關于U的一個劃分。若 ,且P≠φ,則∩P也是一種等價關系,稱為P上不可分辨關系,記為ind(P):
。
1.2 粗糙集與不精確范疇
給定知識庫K=(U,Q),對于每個子集 和一個等價關系 R ind(Q),定義在知識系統(tǒng)U/R下集合X 的下近似為:
上近似表示屬于X的對象組成的最小集合,即X的正域,記為
,而肯定不屬于X的對象組成的集合稱為X的負域,記為
。
在知識系統(tǒng)U/R下集合 X 的上近似為:
上近似是可能屬于X的對象組成的最小集合。集合X的邊界區(qū)域為:
邊界區(qū)域是根據(jù)知識 R,U 中既不能肯定包含于集合 X,又不能肯定包含于集合X的元素構成的集合。
1.3 知識簡約與知識依賴
知識簡約,是在保持知識庫分類能力不變的條件下,刪除其中不相關或不重要的知識。令R為一簇等價關系, ,若ind(R)=ind(R-r),則稱r為R中不必要的,若對于每一個 都為R中必要的,則稱R為獨立的,否則稱R為依賴的。P中所有必要關系組成的集合稱為核,記為core(P)。
定義知識R對知識Q的依賴程度為:
1.4 知識表達系統(tǒng)
在粗糙集理論中,一個知識表達系統(tǒng)可表示為S=(U,R,V,f),為其中U為論域,R為屬性集合,V為屬性值集合,f為一個信息函數(shù),其對象的每個屬性賦予一個信息值。即 。
決策表是一類特殊而重要的知識表達系統(tǒng)。設S=(U,R,V,f)為一個知識表達系統(tǒng),R=C∪D,C∩D=φ,稱C為條件屬性集,稱D為決策屬性集。具有條件屬性集和決策屬性集的知識系統(tǒng)稱為決策表。
(二). 粗糙集理論的應用
粗糙集理論具有很強的實用性,目前在各領域已有諸多應用。
2.1 故障診斷
文獻[1]中提出了一種基于粗糙集與證據(jù)理論的航空裝備故障診斷方法,利用粗糙集框架實現(xiàn)對故障診斷模型的構造并對冗余信息進行簡約,通過邊界粗糙熵來衡量每個條件對決策的重要程度;文獻[2]利用變精度粗糙集和信息論中互信息增量的特性,針對傾轉旋翼機在過度轉換時的故障進行診斷,利用OMELM對變精度粗糙集屬性簡約進行故障分類。
2.2 圖像處理
粗糙集理論對不精確問題能夠提供較好的解決方法,文獻[3]將粗糙集理論與模糊聚類算法相結合用以解決圖像分割問題。文獻[4]依靠粗糙集對邊界區(qū)域近似有較好的解決能力,將粗糙集近似集與粒子群算法相結合來解決圖像分割問題,利用粗糙集理論得到圖像的最優(yōu)粒度,再通過粒度劃分得到圖像的近似集,從而利用近似集得到便捷的精準刻畫。
2.3 專家系統(tǒng)
粗糙集理論對規(guī)則的抽取有較好的應用,因此能夠為專家系統(tǒng)的構造提供理論基礎。文獻[5]利用粗糙集理論獲取知識,建立決策表,并利用可辨識矩陣對決策表進行條件屬性簡約,能夠獲得需要診斷的故障樹。
2.4 模式識別
文獻[6]中關于礦井突水問題,可利用粗糙集對非正態(tài)、非線性和高維數(shù)據(jù)的處理能力,對存在大量不明確對應關系的特征進行簡約,剔除與決策無關的屬性,得到簡約樣本。
2.5 決策分析
粗糙集理論在金融投資預測方面也起到了很大的作用,文獻[7]基于優(yōu)勢粗糙集建立了證券投資分析模型,能夠有效分析出股票的投資價值。文獻[8]運用多粒度粗糙集為決策問題提供了新的思路,將多粒度粗糙集運用到專家的綜合決策中并證明了研究的有效性。
(三).結語
在粗糙集理論發(fā)展的三十多年間,已取得了許多突破性研究成果,并成功運用到生活的各個方面。粗糙集能夠處理不完整、不精確的大量數(shù)據(jù),在實際應用中,將粗糙集與各種不同分類方法相結合,能夠更快、更準確的提取出有用信息是未來研究的熱點之一。
參考文獻:
[1] 孫偉超,李文海,李文峰 . 融合粗糙集與D-S證據(jù)理論的航空裝備故障診斷[J]. 北京航空航天大學學報,2015,41(10):1902-1909.
[2] 陳曉,王新民,黃譽,等. 傾轉旋翼機飛控系統(tǒng)的變精度粗糙集OMELM故障診斷方法[J]. 控制與決策,2015,35(3):433-440.
[3] 馬文萍,黃媛媛,李豪,等. 基于粗糙集與差分免疫模糊聚類算法的圖像分割 [J]. 軟件學報,2014,25(11):2675-2689.
[4] 姚龍洋,張清華,胡帥鵬,等. 基于近似集與粒子群的粗糙熵圖像分割方法 [J]. 計算機科學與探索,2016,10(5):699-708.
[5] 李英順,姜雙雙,佟維妍,等. 基于 RST 及 FTA 的綜合傳動裝置故障診斷專家系統(tǒng)的應用研究[J]. 組合機床與自動化加工技術,2014(4):60-63.
[6] 王江榮,黃建華,羅資琴,等. 基于粗糙集的 Logistic 回歸模型在礦井突水模式識別中的應用 [J]. 煤田地質與勘探,2015,43(6):70-74.
[7] 楊博翔.基于優(yōu)勢粗糙集的證券投資決策研究及應用[J]. 山東農業(yè)大學學報(自然科學版),2016,47(5):785-788.
[8] 郭慶,吳磊. 多粒度背景下直覺模糊信息系統(tǒng)的粗糙集及其決策[J]. 系統(tǒng)工程與電子技術,2016,38(2):347-351.
作者簡介:
袁紅杰(1994-),碩士研究生,研究方向為故障診斷。