彭連貴 閻瑞霞 陳昭君
(上海工程技術(shù)大學(xué)管理學(xué)院 上海 201620)
Pawlak粗糙集理論[1]作為一種處理不精確、不確定與不完全數(shù)據(jù)的理論,在人工智能、模式識(shí)別以及決策分析等方面得到了廣泛的應(yīng)用和研究。
經(jīng)典粗糙集理論的核心在于利用等價(jià)關(guān)系從近似空間中導(dǎo)出一對(duì)下、上近似算子。因此,粗糙集理論的研究主要集中在三個(gè)方面:等價(jià)關(guān)系、近似空間和論域。針對(duì)很多問(wèn)題中論域上的二元關(guān)系不是等價(jià)的,學(xué)者們研究了基于相似關(guān)系、一般關(guān)系和優(yōu)勢(shì)關(guān)系的粗糙集[2];針對(duì)現(xiàn)實(shí)生活的模糊性和不確定性,學(xué)者們研究了模糊近似空間[3]、變精度[4]和灰色空間下的粗糙集[5];粗糙集論域擴(kuò)展的研究是從Yao[6]研究粗糙集代數(shù)的信任函數(shù)開(kāi)始的,之后,學(xué)者們對(duì)論域擴(kuò)展的粗糙集模型進(jìn)行了研究。孫文鑫[7]將單論域擴(kuò)展到了雙論域,擴(kuò)展了其應(yīng)用性;閻瑞霞等[8]考察了雙論域粗糙集的不確定性度量;張超等[9]將模糊語(yǔ)言與粗糙集融合,定義了一種新的粗糙集模型。
Zadeh L.A[10]在1996年提出并討論的模糊信息?;瘑?wèn)題之后,信息?;碚摚?1]在集合理論和區(qū)間分析、模糊集、粗糙集、概率論、熵空間理論等架構(gòu)內(nèi)不斷的發(fā)展。Qian 等[12~15]通過(guò)分析粒計(jì)算與粗糙集理論之間的關(guān)聯(lián),將粒計(jì)算和粗糙集結(jié)合起來(lái)并提出動(dòng)態(tài)粒度理念,之后將單粒度粗糙集擴(kuò)展到多粒度粗糙集。多粒度粗糙集模型作為一種新的多視角數(shù)據(jù)分析方法,克服了經(jīng)典粗糙集理論的缺陷,在目標(biāo)識(shí)別[16]、Web挖掘[17]、輿情預(yù)警決策[18]等眾多方面廣泛應(yīng)用。
在多粒度粗糙集研究中,論域與粒度的權(quán)重問(wèn)題一直是學(xué)者研究的熱點(diǎn)。孫文鑫將單論域擴(kuò)展到雙論域上,卻忽略了在實(shí)際應(yīng)用中不是每個(gè)粒度都是平等的,有的粒度比較重要,需要賦予更大的權(quán)重,而有的粒度作用小,可賦予較小的權(quán)重。張明[19]提出了基于加權(quán)粒度的多粒度粗糙集,差異地考慮了不同粒度在實(shí)際情況下具有不同重要度,卻沒(méi)有放到雙論域上進(jìn)行研究。針對(duì)雙論域粗糙集在粒度重要程度上考慮的不足和加權(quán)多粒度粗糙集在論域擴(kuò)展上的不足,分析并建立雙論域上基于加權(quán)的多粒度粗糙集模型,考慮雙論域內(nèi)不同粒度重要程度的差異性,定義粗糙集模型的上下近似并對(duì)其性質(zhì)進(jìn)行了進(jìn)一步的研究。
定義1[20]設(shè)U和V為兩個(gè)非空有限論域,設(shè)R是U和V上的任意二元關(guān)系集,且假設(shè),為R的m個(gè)屬性子集族,′是V和U上R的逆關(guān)系。,R和R′的特征函數(shù)定義如下:
設(shè)論域U中有m個(gè)元素,論域V中有n個(gè)元素,利用特征函數(shù)定義R的關(guān)系矩陣記為
顯然R′的關(guān)系矩陣為矩陣A的轉(zhuǎn)置A'。如果關(guān)系矩陣A中不存在一行或一列元素全為零,則稱(chēng)關(guān)系矩陣A為信息矩陣。
為了簡(jiǎn)單描述,將論域U,V和關(guān)系R,R′構(gòu)成的系統(tǒng)記為信息系統(tǒng)(U,V,R),其中U和V為兩個(gè)非空的有限論域,和互為逆關(guān)系。
定義2[20]在信息系統(tǒng)(U,V,R)中,,論域V到論域U的粗糙集近似算子P(U)為
針對(duì)多粒度粗糙集論域擴(kuò)展與屬性子集權(quán)重研究中的不足,分析并建立雙論域上基于加權(quán)的多粒度粗糙集模型,在將論域進(jìn)行擴(kuò)展的同時(shí),考慮不同粒度所具有的權(quán)重的不同。下面給出雙論域上的基于加權(quán)的多粒度粗糙集模型的定義及其相關(guān)性質(zhì)。
定義3設(shè)U,V是兩個(gè)不同的非空有限論域,設(shè)R是U和V上的二元關(guān)系集,包含n個(gè)屬性,且假設(shè)為R的m個(gè)屬性子集劃分,(U,V,R)為雙論域上的一般近似空間,,由R導(dǎo)出的粒度空間對(duì)應(yīng)的粒度權(quán)重為,則對(duì)于?,X關(guān)于R的加權(quán)多粒度粗糙集的上下近似定義為
定理1設(shè)U,V是兩個(gè)不同的非空有限論域,設(shè)R是U和V上的二元關(guān)系集,包含n個(gè)屬性,且假設(shè)為 R 的 m個(gè)屬性子集劃分,(U,V,R)為雙論域上的一般近似空間,,由R導(dǎo)出的粒度空間對(duì)應(yīng)的粒度權(quán)重為,則有
定理2設(shè)U,V是兩個(gè)不同的非空有限論域,設(shè)R是U和V上的二元關(guān)系集,包含n個(gè)屬性,且假設(shè)RT={R1,R2,…,Rm}為 R 的 m 個(gè)屬性子集劃分,(U,V,R)為雙論域上的一般近似空間,0<β≤1,由R 導(dǎo)出的粒度空間 U R1,U R2,…,U Rm對(duì)應(yīng)的粒度 權(quán) 重 為,對(duì) 于,則有
定理3設(shè)U,V是兩個(gè)不同的非空有限論域,設(shè)R是U和V上的二元關(guān)系集,包含n個(gè)屬性,且假設(shè)為R的m個(gè)屬性子集劃分,(U,V,R)為雙論域上的一般近似空間,0<β≤1,由R導(dǎo)出的粒度空間 U R1,U R2,…,U Rm對(duì)應(yīng)的粒度權(quán)重為,有
3)證明過(guò)程類(lèi)似于2)。
定理4設(shè)U,V是兩個(gè)不同的非空有限論域,設(shè)R是U和V上的二元關(guān)系集,包含n個(gè)屬性,且假設(shè)RT={R1,R2,…,Rm}為 R 的 m個(gè)屬性子集劃分,(U,V,R)為雙論域上的一般近似空間,0<β≤1,由R導(dǎo)出的粒度空間 U R1,U R2,…,U Rm對(duì)應(yīng)的粒度 權(quán) 重 為,則 對(duì)如果,則有
2)證明過(guò)程類(lèi)似于性質(zhì)(1)。
定義3設(shè)U,V是兩個(gè)不同的非空有限論域,設(shè)R是U和V上的二元關(guān)系集,包含n個(gè)屬性,且假設(shè)為的m個(gè)屬性子集劃分,為雙論域上的一般近似空間,0<β≤1,由導(dǎo)出的粒度空間對(duì)應(yīng)的粒度權(quán)重為,則對(duì)?Y∈U,X關(guān)于R′的加權(quán)多粒度粗糙集的上下近似定義為其中,稱(chēng)為Y關(guān)于屬性子集族R′的雙論域上的基于加權(quán)粒度的多粒度粗糙集。
雙論域上基于加權(quán)粒度的多粒度粗糙集在將論域擴(kuò)展的同時(shí)考慮粒度的不同重要性的現(xiàn)實(shí)情況,在現(xiàn)實(shí)中的應(yīng)聘案例中有很好的應(yīng)用性。表1~3描述的是外貿(mào)公司選聘人才的情況,其中是由該外貿(mào)公司五位應(yīng)聘者組成的一個(gè)論域,是由公司要求應(yīng)聘者要具備的技能構(gòu)成的一個(gè)論域。其中y1表示的是口才表達(dá),y2表示的是專(zhuān)業(yè)技能,y3表示的是英語(yǔ)技能,y4表示的是工作態(tài)度。應(yīng)聘者分別由一位主面試官,兩位副面試官為其打分,其中數(shù)字1表示該應(yīng)聘者具備此項(xiàng)能力,0表示該應(yīng)聘者不具備此項(xiàng)能力。
表1 專(zhuān)家1打分情況表
表2 專(zhuān)家2打分情況表
表3 專(zhuān)家3打分情況表
根據(jù)AHP方法,確定專(zhuān)家1、專(zhuān)家2、專(zhuān)家3對(duì)應(yīng)的權(quán)重分配為。通過(guò)專(zhuān)家對(duì)應(yīng)聘者的評(píng)估,我們知道這五位應(yīng)聘者成功應(yīng)聘的為。試問(wèn)在滿(mǎn)足題設(shè)條件的情況下,這五位應(yīng)聘者要想都應(yīng)聘成功,必須具備哪幾項(xiàng)能力,應(yīng)該具備哪些能力。根據(jù)定義3計(jì)算得
比較文獻(xiàn)[7]中粗糙集模型的運(yùn)算結(jié)果發(fā)現(xiàn):閾值β=2/3的題設(shè)情況下,雙論域粗糙集在進(jìn)行運(yùn)算時(shí)遍歷;而文中提出的粗糙集模型可以有選擇的訪(fǎng)問(wèn)或來(lái)進(jìn)行運(yùn)算。且在計(jì)算機(jī)中設(shè)計(jì)運(yùn)算時(shí),首先選擇或,而不會(huì)選擇訪(fǎng)問(wèn),時(shí)間效率提高了33%;當(dāng)在情況下,遍歷所有的屬性子集,必然造成冗余運(yùn)算和時(shí)間的浪費(fèi);而雙論域上基于加權(quán)的多粒度粗糙集卻很好地克服了這一點(diǎn),從可以知道,該模型在滿(mǎn)足一定權(quán)值積累的要求時(shí)即可;關(guān)注那些對(duì)事件發(fā)展具有顯著影響的因子,可以大大提高事件處理的效率。將該模型運(yùn)算的結(jié)果。與文獻(xiàn)[19]模型的運(yùn)算結(jié)果進(jìn)行對(duì)比發(fā)現(xiàn),該模型具有更高的精確度。
粗糙集處理模糊信息的優(yōu)越性,使其廣泛應(yīng)用于諸多領(lǐng)域。為了克服雙論域上基于一般關(guān)系的多粒度粗糙集在屬性子集權(quán)重上考慮的不足與加權(quán)多粒度粗糙集在論域擴(kuò)展問(wèn)題上討論的不足,分析并建立雙論域上的基于加權(quán)的多粒度粗糙集模型。通過(guò)實(shí)例的分析驗(yàn)證發(fā)現(xiàn):該模型不僅在處理簡(jiǎn)單問(wèn)題具有很好的效果,而且在處理復(fù)雜事件時(shí),也能夠很好地解決問(wèn)題,同時(shí)在保證運(yùn)算精度的情況下,節(jié)約運(yùn)算的時(shí)間,提高效率。
文章提出一種新的粗糙集模型仍需要繼續(xù)深入研究該模型的不確定性度量和穩(wěn)定性,以及在實(shí)際生活中的應(yīng)用等問(wèn)題,不斷將其優(yōu)化,使其發(fā)揮更大的作用。