亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于集成學(xué)習(xí)的決策粗糙集特定類屬性約簡算法

        2021-06-21 02:30:36甘秀娜王月波
        關(guān)鍵詞:區(qū)域

        李 明 甘秀娜 王月波

        1(石家莊鐵道大學(xué)四方學(xué)院經(jīng)濟(jì)管理系 河北 石家莊 051132)2(石家莊鐵路職業(yè)技術(shù)學(xué)院組織人事部 河北 石家莊 050041)3(河北銀行股份有限公司信息技術(shù)部 河北 石家莊 050000)

        0 引 言

        粗糙集模型是目前處理不確定性數(shù)據(jù)的一種重要的機(jī)器學(xué)習(xí)和數(shù)據(jù)挖掘理論[1],近年來受到學(xué)者們的廣泛關(guān)注和研究。決策粗糙集模型[2]是傳統(tǒng)粗糙集的重要延伸,Yao[2]通過在決策粗糙集中融入最小化決策代價(jià)的原則,提出了三支決策理論,進(jìn)一步地?cái)U(kuò)大決策粗糙集的應(yīng)用范圍[3],目前決策粗糙集與三支決策已成功運(yùn)用于數(shù)據(jù)挖掘等各個(gè)領(lǐng)域[4-6]。

        屬性約簡是粗糙集理論的主要研究內(nèi)容[1],在決策粗糙集模型中,學(xué)者們提出了多種屬性約簡方法。第一類為基于正區(qū)域的屬性約簡,例如:Yao等[7]在決策粗糙集中提出了正區(qū)域?qū)傩约s簡,這也是決策粗糙集模型最早的屬性約簡方法;Ma等[8]對(duì)文獻(xiàn)[7]方法進(jìn)一步改進(jìn),將決策邊界域和決策負(fù)區(qū)域也加入到?jīng)Q策區(qū)域?qū)傩约s簡的范疇,提出了保持決策區(qū)域的屬性約簡算法;Meng等[9]在算法的效率上進(jìn)行改進(jìn),提出了一種正區(qū)域的快速?zèng)Q策粗糙集屬性約簡;Gao等[10]通過信息熵的視角,提出一種最大決策熵的決策粗糙集屬性約簡算法;姚晟等[11]進(jìn)一步對(duì)正區(qū)域?qū)傩约s簡進(jìn)行改進(jìn),提出一種決策區(qū)域最大化的決策粗糙集屬性約簡。第二類為基于決策代價(jià)的屬性約簡方法,Jia等[12-13]在決策粗糙集中定義了最小化決策代價(jià)屬性約簡,并設(shè)計(jì)了多種相應(yīng)的啟發(fā)式屬性約簡算法;Dou等[14]利于多代價(jià)的策略,提出了相應(yīng)的最小化決策代價(jià)的屬性約簡;Song等[15]在模糊決策粗糙集下定義了決策代價(jià),同時(shí)相應(yīng)的最小化決策代價(jià)屬性約簡算法也被提出;Li等[16]將決策粗糙集推廣至鄰域空間,并提出鄰域空間下的最小化決策代價(jià)屬性約簡??傊?,決策粗糙集在這兩方面的屬性約簡中已取得了豐碩的成果。

        然而在實(shí)際應(yīng)用環(huán)境下,往往只考慮某個(gè)或某幾個(gè)特定的決策類,并且在進(jìn)行決策區(qū)域的屬性約簡時(shí)也需要考慮代價(jià)的問題。例如:在醫(yī)療診斷中可能只關(guān)注患病的樣本類,并且在保證診斷正確率的同時(shí)也要盡可能地降低診斷所付出的代價(jià),這對(duì)目前的屬性約簡方法帶來一定的挑戰(zhàn)。針對(duì)特定類的問題,Yao等[17]在傳統(tǒng)粗糙集模型中提出了基于特定類的屬性約簡,在此基礎(chǔ)上,Ma等在決策粗糙集下分別提出了特定類的正區(qū)域?qū)傩约s簡[18]和決策代價(jià)屬性約簡[19];彭莉莎等[20]提出了基于概率的特定類屬性約簡。然而這些研究成果也僅限于單一的屬性約簡視角,未同時(shí)考慮決策區(qū)域和決策代價(jià)的屬性約簡問題。

        為了在特定類視角下同時(shí)兼顧決策區(qū)域和決策代價(jià),本文將這兩方面同時(shí)作為決策粗糙集屬性約簡的優(yōu)化目標(biāo),定義一種特定類的屬性約簡,在該屬性約簡中,約簡結(jié)果在保證決策區(qū)域極大化的同時(shí),使得進(jìn)行決策區(qū)域劃分時(shí)也具有較低的決策代價(jià),并且這些約簡的目標(biāo)都是針對(duì)特定決策類的。為了實(shí)現(xiàn)這種屬性約簡,本文接著利用集成學(xué)習(xí)的方法,設(shè)計(jì)出了相應(yīng)的屬性約簡算法,最后通過與單一的決策區(qū)域?qū)傩约s簡和單一的最小化決策代價(jià)屬性約簡進(jìn)行實(shí)驗(yàn)分析對(duì)比,證明了本文算法的有效性和優(yōu)越性。

        1 決策粗糙集模型與三支決策

        決策信息系統(tǒng)[1]表示為二元組S=(U,C∪D),這里的U為非空有限對(duì)象集,被稱為論域。C為非空有限條件屬性集,D為非空有限決策屬性集,并且C∩D=?。對(duì)于對(duì)象?x∈U在屬性?a∈C∪D均有一個(gè)確定的屬性值,表示為f(x,a),通過對(duì)象、屬性與屬性值這三個(gè)組成部分,構(gòu)建了整個(gè)決策信息系統(tǒng)。

        定義1[1]考慮決策信息系統(tǒng)S=(U,C∪D),屬性子集A?C確定的等價(jià)關(guān)系定義為:

        EA={(x,y)∈U×U|?a∈A,f(x,a)=f(y,a)}

        (1)

        等價(jià)關(guān)系滿足自反性、對(duì)稱性和傳遞性。基于等價(jià)關(guān)系可以將論域誘導(dǎo)出一個(gè)劃分,表示為U/EA。在U/EA中,包含對(duì)象x的等價(jià)類[x]A定義為:

        [x]A={y∈U|(x,y)∈EA}

        (2)

        定義2[1]考慮決策信息系統(tǒng)S=(U,C∪D),屬性子集A?C確定的等價(jià)關(guān)系為EA,對(duì)于對(duì)象集X?U關(guān)于等價(jià)關(guān)系EA的下近似集和上近似集分別定義為:

        (3)

        (4)

        由于傳統(tǒng)的粗糙集建立在等價(jià)關(guān)系基礎(chǔ)之上,對(duì)象與近似集之間的粗糙逼近關(guān)系過于嚴(yán)格。為了進(jìn)行改進(jìn),Yao[2]提出了一種決策粗糙集模型與三支決策理論,通過一對(duì)閾值來限定等價(jià)類與近似集之間的逼近程度,提高了粗糙集模型的容噪性能[3]。

        設(shè)決策信息系統(tǒng)中的狀態(tài)集為Ω={X,Xc},Xc為X的補(bǔ)集,分別表示對(duì)象屬于狀態(tài)X或不屬于狀態(tài)X,設(shè)動(dòng)作集為Γ={aP,aB,aN},分別表示對(duì)象分類入狀態(tài)X的正區(qū)域POS(X)、邊界域BUN(X)和負(fù)區(qū)域NEG(X),即接受、延遲和拒絕三種決策行為。當(dāng)對(duì)象處于不同狀態(tài)時(shí)采取不同的動(dòng)作行為,三支決策模型定義了相應(yīng)的決策代價(jià)矩陣,具體如表1所示。在表1中,λPP、λBP和λNP分別表示對(duì)象處于狀態(tài)X時(shí)采取aP、aB和aN決策動(dòng)作時(shí)所產(chǎn)生的代價(jià);λPN、λBN和λNN分別表示對(duì)象處于狀態(tài)Xc時(shí)采取aP、aB和aN決策動(dòng)作時(shí)所產(chǎn)生的代價(jià)。

        表1 決策代價(jià)矩陣

        考慮決策信息系統(tǒng)S=(U,C∪D),對(duì)于屬性子集A?C確定的等價(jià)關(guān)系為EA,對(duì)象?x∈U誘導(dǎo)出的等價(jià)類為[x]A,那么對(duì)象x隸屬于對(duì)象集X?U和Xc的概率表示為:

        (5)

        給定決策代價(jià)矩陣,那么對(duì)象x∈U采取不同動(dòng)作的決策代價(jià)可表示為:

        (1)CostaP(x)=λPP·P(X|[x]A)+λPN·P(Xc|[x]A)。

        (2)CostaB(x)=λBP·P(X|[x]A)+λBN·P(Xc|[x]A)。

        (3)CostaN(x)=λNP·P(X|[x]A)+λNN·P(Xc|[x]A)。

        根據(jù)貝葉斯決策準(zhǔn)則,可以得到如下最小化決策代價(jià)規(guī)則:

        (1) 當(dāng)CostaP(x)≤CostaB(x)且CostaP(x)≤CostaN(x)時(shí),則有x∈POS(X);

        (2) 當(dāng)CostaB(x)≤CostaP(x)且CostaB(x)≤CostaN(x)時(shí),則有x∈BUN(X);

        (3) 當(dāng)CostaN(x)≤CostaP(x)且CostaN(x)≤CostaB(x)時(shí),則有x∈NEG(X)。

        進(jìn)一步推導(dǎo)可以得到:

        (1) 若P(X|[x]A)≥α且P(X|[x]A)≥γ,那么x∈POS(X);

        (2) 若P(X|[x]A)≤α且P(X|[x]A)≥β,那么x∈BUN(X);

        (3) 若P(X|[x]A)≤β且P(X|[x]A)≤γ,那么x∈NEG(X)。

        其中:

        那么對(duì)于決策信息系統(tǒng)S=(U,C∪D),屬性子集A?C確定的等價(jià)關(guān)系為EA,對(duì)象集X在等價(jià)關(guān)系EA下的三支決策區(qū)域[2]表示為:

        (6)

        同時(shí),決策屬性D在信息系統(tǒng)下誘導(dǎo)的決策類劃分表示為πD={D1,D2,…,Dm},那么決策屬性D關(guān)于屬性子集A的三支決策區(qū)域[7]為:

        (7)

        2 基于特定類的決策代價(jià)屬性約簡

        決策粗糙集模型下的三支決策給出了一種新的決策模式[2-3,5-6],進(jìn)一步降低了決策行為的決策代價(jià)。然而,實(shí)際應(yīng)用系統(tǒng)中的某些屬性對(duì)決策和分類不相關(guān),這些屬性的刪除可能會(huì)保持或者降低整個(gè)信息系統(tǒng)的決策代價(jià)[12-13]。針對(duì)這類研究問題,學(xué)者們提出了一種最小化決策代價(jià)的屬性約簡算法[12],該算法旨在找出信息系統(tǒng)擁有最小決策代價(jià)的屬性子集。

        考慮決策信息系統(tǒng)S=(U,C∪D),給定決策代價(jià)矩陣,屬性子集A?C確定的等價(jià)關(guān)系為EA。決策屬性D誘導(dǎo)的決策類劃分為πD={D1,D2,…,Dm},那么對(duì)象?x∈U對(duì)于不同決策規(guī)則所產(chǎn)生的決策代價(jià)[12]表示為:

        (1) 接受決策:p(x)·λPP+(1-p(x))·λPN;

        (2) 延遲決策:p(x)·λBP+(1-p(x))·λBN;

        (3) 拒絕決策:p(x)·λNP+(1-p(x))·λNN。

        這里的p(x)=P(Dmax([x]A)|[x]A),并且:

        (8)

        通常當(dāng)對(duì)象決策為正確的區(qū)域時(shí),是不會(huì)產(chǎn)生任何代價(jià)的,因此代價(jià)λPP=λNN=0,那么決策規(guī)則代價(jià)可以進(jìn)一步簡化為:

        (1) 接受決策:(1-p(x))·λPN;

        (2) 延遲決策:p(x)·λBP+(1-p(x))·λBN;

        (3) 拒絕決策:p(x)·λNP。

        那么整個(gè)決策信息系統(tǒng)的決策總代價(jià)[12]可以表示為如下形式:

        (9)

        基于決策代價(jià)的屬性約簡,即找出決策總代價(jià)最小的屬性子集,其定義如下所示。

        定義3[12]考慮決策信息系統(tǒng)S=(U,C∪D),給定決策代價(jià)矩陣,屬性子集A?C確定的等價(jià)關(guān)系為EA。決策屬性D誘導(dǎo)的決策類劃分為πD={D1,D2,…,Dm},若屬性子集A是屬性集C的最小決策代價(jià)屬性約簡集,那么當(dāng)且僅當(dāng):

        (2) ?A′?A,COSTA′(πD)>COSTA(πD)。

        根據(jù)定義3所示的屬性約簡定義,學(xué)者們提出了多種屬性約簡算法以及多種擴(kuò)展的屬性約簡算法[14-16],并且目前提出的這些算法均是針對(duì)全局的決策類,即算法得到約簡子集使得所有決策類整體決策代價(jià)最小。然而,對(duì)于實(shí)際中的某些情形,我們可能只關(guān)注某個(gè)或某幾個(gè)決策類,例如在疾病診斷中,如果對(duì)患病的樣本進(jìn)行屬性約簡,得到約簡結(jié)果可以進(jìn)一步降低決策代價(jià),提高診斷的質(zhì)量。如果對(duì)于某一類疾病,基于該類別進(jìn)行屬性約簡,那么得到的約簡結(jié)果與該種疾病是相適應(yīng)的,不同疾病得到與之對(duì)應(yīng)的屬性子集,這樣可以提高醫(yī)療診斷的效率和性能。因此針對(duì)某個(gè)或某幾個(gè)類進(jìn)行屬性約簡可以達(dá)到更好的處理性能,提高實(shí)際運(yùn)用的適用性。

        考慮決策信息系統(tǒng)S=(U,C∪D),屬性子集A?C確定的等價(jià)關(guān)系為EA。決策屬性D誘導(dǎo)的決策類劃分為πD={D1,D2,…,Dm},給定特定決策類Dt∈πD以及對(duì)應(yīng)的決策代價(jià)矩陣,那么對(duì)象?x∈U關(guān)于特定決策類Dt的決策代價(jià)表示為:

        (1) 接受決策:(1-pDt(x))·λPN;

        (2) 延遲決策:pDt(x)·λBP+(1-pDt(x))·λBN;

        (3) 拒絕決策:pDt(x)·λNP。

        這里的pDt(x)=P(Dt|[x]A)。

        那么整個(gè)決策信息系統(tǒng)關(guān)于決策類Dt的決策總代價(jià)可以表示為:

        (10)

        決策信息系統(tǒng)決策類Dt的決策總代價(jià)滿足如下性質(zhì)。

        定理1考慮決策信息系統(tǒng)S=(U,C∪D),給定特定決策類Dt∈πD,Dt相應(yīng)的決策代價(jià)矩陣如表2所示,設(shè)兩個(gè)屬性子集滿足A1?A2?C,并且確定的等價(jià)關(guān)系分別為EA1和EA2,那么決策類Dt關(guān)于屬性集A1和A2的決策代價(jià)滿足:

        證明根據(jù)等價(jià)關(guān)系的定義可以得到,隨著屬性的增加,對(duì)象的等價(jià)類是單調(diào)性變化的,即滿足當(dāng)A1?A2時(shí)有[x]A2?[x]A1。然而隨著屬性的變化,三支決策區(qū)域卻不是單調(diào)性變化的[7-8],即隨著屬性數(shù)量的增加,三支決策區(qū)域的變化是隨機(jī)的。對(duì)于?x∈U,屬性變化前后x隸屬區(qū)域的變化可分為9種,分別表示為:

        為了簡便,假設(shè)屬性增加時(shí)只有一個(gè)等價(jià)類發(fā)生變化,多個(gè)等價(jià)變化時(shí)可根據(jù)單個(gè)變化進(jìn)行類推。當(dāng)對(duì)象x的區(qū)域隸屬變化滿足情形(1)、(5)和(9)時(shí),可以直接得到COSTA1(Dt)=COSTA2(Dt)。

        COSTA2(Dt)-COSTA1(Dt)=

        COSTA1(Dt)≥COSTA2(Dt)

        COSTA2(Dt)-COSTA1(Dt)=

        綜上所述,可以得到COSTA1(Dt)≥COSTA2(Dt)。

        證明完畢。

        定理1表明了特定類的決策代價(jià)隨著屬性滿足單調(diào)性的變化,這也進(jìn)一步地解釋了三支決策的實(shí)際意義[2],即隨著屬性的增加,可用于決策的有用信息會(huì)越來越多,從而決策的準(zhǔn)確率會(huì)更高,決策代價(jià)會(huì)更小。在決策的過程中,并不是所有的屬性都是對(duì)決策有用的,有些屬性的加入并不會(huì)降低決策代價(jià),因此這類屬性需要進(jìn)行刪除。基于此,接下來將給出特定類的最小化決策代價(jià)屬性約簡的定義。

        定義4考慮決策信息系統(tǒng)S=(U,C∪D),給定特定的決策類Dt∈πD以及對(duì)應(yīng)的決策代價(jià)矩陣,屬性子集A?C確定的等價(jià)關(guān)系為EA,若屬性子集A是C的決策類Dt最小決策代價(jià)屬性約簡,那么當(dāng)且僅當(dāng):

        (1)COSTA(Dt)=COSTC(Dt);

        (2) ?A′?A,COSTA′(Dt)>COSTA(Dt)。

        在定義4中,由于特定類決策代價(jià)的單調(diào)性,因此屬性全集C擁有最小的決策代價(jià),那么屬性約簡的目的是為了找出與屬性全集C有著同樣決策代價(jià)的屬性子集,并且該屬性子集中不包含其他任何的冗余屬性,即屬性約簡集滿足極小性。

        核屬性集[1]在尋找屬性約簡的過程中發(fā)揮著很重要的作用,由于滿足屬性約簡定義的屬性子集并不唯一,但是核屬性集是確定的,并且是所有屬性約簡結(jié)果的交集,因此找出屬性約簡的核屬性具有很重要的意義。

        定義5考慮決策信息系統(tǒng)S=(U,C∪D),給定特定的決策類Dt∈πD以及對(duì)應(yīng)的決策代價(jià)矩陣,若屬性子集族REDDt表示決策類Dt所有屬性約簡結(jié)果的集合,那么核屬性集可定義為:

        根據(jù)定義5所示的核屬性集定義,采用其他學(xué)者的研究方法,核屬性集可直接計(jì)算為:

        Core(Dt)={a∈C|COSTC-{a}(Dt)>COSTC(Dt)}

        3 基于集成學(xué)習(xí)的特定類屬性約簡

        在決策粗糙集模型中,目前主要有兩種類型的屬性約簡受到學(xué)者們的廣泛關(guān)注:一是基于決策代價(jià)的屬性約簡;二是基于決策正區(qū)域的屬性約簡。實(shí)際應(yīng)用環(huán)境下可能需要綜合考慮這兩類問題進(jìn)行屬性約簡,Li等[21]在全局類下提出了多目標(biāo)的屬性約簡,使得約簡的結(jié)果具有更為廣泛的適用性能。在特定類視角下,Ma等[18]提出了基于正區(qū)域的三支決策特定類屬性約簡,因此本節(jié)將Ma等的正區(qū)域?qū)傩约s簡與上節(jié)提出的決策代價(jià)屬性約簡進(jìn)行綜合,提出特定類的決策粗糙集多目標(biāo)屬性約簡算法。

        定義6[18]考慮決策信息系統(tǒng)S=(U,C∪D),給定特定的決策類Dt∈πD以及對(duì)應(yīng)的決策代價(jià)矩陣,屬性子集A?C確定的等價(jià)關(guān)系為EA,若屬性子集A是C的決策類Dt正區(qū)域?qū)傩约s簡,那么當(dāng)且僅當(dāng):

        由于三支決策模型中決策類的三個(gè)區(qū)域并不是隨屬性集單調(diào)性變化的,即屬性子集的正區(qū)域既可能會(huì)大于屬性全集的正區(qū)域,也可能會(huì)小于屬性全集的正區(qū)域。因此屬性約簡結(jié)果需要保證約簡集的正區(qū)域不低于屬性全集的正區(qū)域,并且約簡集是所有屬性子集中最小的,這樣就保證了屬性約簡結(jié)果具有較高的區(qū)分性能[18]。

        接下來將綜合特定類的正區(qū)域?qū)傩约s簡與本文提出的特定類決策代價(jià)屬性約簡,探討其屬性約簡的問題。

        屬性約簡[21]同時(shí)將多個(gè)目標(biāo)作為屬性約簡的內(nèi)容,使得約簡結(jié)果能夠同時(shí)對(duì)多個(gè)目標(biāo)達(dá)到屬性約簡的效果。本文將同時(shí)考慮特定類的決策正區(qū)域和決策代價(jià),但是多目標(biāo)的屬性約簡結(jié)果不一定達(dá)到局部最優(yōu)。故所得到的約簡結(jié)果不一定既具有最小的決策代價(jià)又具有最大的決策正區(qū)域,因此這里采用全局最優(yōu)的方式進(jìn)行屬性約簡。

        (11)

        在定義7中,當(dāng)屬性子集A的決策代價(jià)越小,且決策正區(qū)域越大時(shí),綜合目標(biāo)函數(shù)F(Dt)則越小。因此對(duì)于所提出屬性約簡,其優(yōu)化的目標(biāo)是選擇出屬性子集使得F(Dt)盡可能的小。

        (1)FA(Dt)≤FC(Dt);

        (2) ?A′?A,FA′(Dt)>FA(Dt)。

        集成學(xué)習(xí)[22]是一種常用機(jī)器學(xué)習(xí)方法,該方法讓多個(gè)學(xué)習(xí)模型進(jìn)行集成,通過整合共同的學(xué)習(xí)結(jié)果來對(duì)最終的結(jié)果進(jìn)行學(xué)習(xí),本文需要得到特定類下正區(qū)域和決策代價(jià)整體最優(yōu)的屬性約簡結(jié)果。首先分別計(jì)算正區(qū)域?qū)傩约s簡和決策代價(jià)屬性約簡的核屬性集,然后將得到的核屬性集進(jìn)行求取交集。交集可以看成正區(qū)域與決策代價(jià)得到的集成結(jié)果,然后在這個(gè)集成結(jié)果的基礎(chǔ)上逐漸去整合剩余屬性來得到最終的屬性約簡結(jié)果。具體的算法實(shí)現(xiàn)如算法1所示。

        算法1基于集成學(xué)習(xí)的特定類屬性約簡算法

        輸入:決策信息系統(tǒng)S=(U,C∪D),決策類Dt∈πD,決策類Dt的決策代價(jià)矩陣。

        輸出:決策類Dt的屬性約簡集RedDt。

        步驟1初始化Red(Dt)=?,并根據(jù)決策代價(jià)矩陣計(jì)算閾值α和β。

        步驟2根據(jù)定義5計(jì)算決策類Dt的決策代價(jià)核屬性集,記為Corecost(Dt)。

        步驟3根據(jù)文獻(xiàn)[18]計(jì)算決策類Dt的正區(qū)域核屬性集,記為Corepos(Dt)。

        步驟4記:

        Core(Dt)=Corecost(Dt)∩Corepos(Dt)

        RCore(Dt)=C-Core(Dt)

        并令Red(Dt)=Core(Dt)。

        步驟5比較FRed(Dt)(Dt)與FC(Dt)的大小,若FRed(Dt)(Dt)>FC(Dt),跳轉(zhuǎn)入步驟6。若FRed(Dt)(Dt)≤FC(Dt),跳轉(zhuǎn)進(jìn)入步驟7。

        步驟6對(duì)于?a∈RCore(Dt),計(jì)算:

        如果FRed(Dt)(Dt)-FRed(Dt)∪{amax}(Dt)>0,那么:

        Red(Dt)=Red(Dt)∪{amax}

        RCore(Dt)=RCore(Dt)-{amax}

        并重新跳轉(zhuǎn)進(jìn)入步驟5。

        步驟7對(duì)于?a∈Red(Dt),若存在FRed(Dt)-{a}(Dt)≤FC(Dt),那么Red(Dt)=Red(Dt)-{a},并重復(fù)步驟7,否則跳轉(zhuǎn)入步驟8。

        步驟8返回決策類Dt的約簡結(jié)果Red(Dt)。

        4 實(shí)驗(yàn)與結(jié)果分析

        本節(jié)將通過進(jìn)行實(shí)驗(yàn)來驗(yàn)證本文所提出的屬性約簡算法的有效性和優(yōu)越性。

        4.1 數(shù)據(jù)集

        表3所示的是實(shí)驗(yàn)中所運(yùn)用的UCI數(shù)據(jù)集[23]。其中:|U|表示數(shù)據(jù)集中對(duì)象的數(shù)量;|C|表示條件屬性的數(shù)量;|πD|表示數(shù)據(jù)集決策類的數(shù)量。

        表3 實(shí)驗(yàn)數(shù)據(jù)集

        4.2 實(shí)驗(yàn)設(shè)置

        4.3 分類精度比較

        表4-表6展示的是各個(gè)屬性約簡算法得到的屬性約簡集在不同分類算法下的分類精度,其中分類精度結(jié)果采用十折交叉驗(yàn)證法進(jìn)行計(jì)算得到,加粗的數(shù)值表示每行結(jié)果的最大值。本文提出的屬性約簡算法是針對(duì)具體的決策類,因此每個(gè)決策類將得到相應(yīng)的屬性約簡結(jié)果,然后基于每個(gè)決策類對(duì)應(yīng)的屬性約簡集利用分類器對(duì)其進(jìn)行分類精度計(jì)算,得到每個(gè)決策類的分類精度結(jié)果,最后將每個(gè)決策類的精度進(jìn)行綜合,得到整個(gè)數(shù)據(jù)集的分類精度。

        表4 各個(gè)數(shù)據(jù)集屬性約簡集的J48分類精度結(jié)果

        續(xù)表5

        表6 各個(gè)數(shù)據(jù)集屬性約簡集的SMO分類精度結(jié)果

        在表4所示的J48分類精度結(jié)果中,可以發(fā)現(xiàn)本文算法得到的屬性約簡結(jié)果在大部分?jǐn)?shù)據(jù)集下最高,只在數(shù)據(jù)集Lymphography和數(shù)據(jù)集Cancer低于其他算法。正區(qū)域算法在Lymphography有著最高的分類精度,粒子群優(yōu)化算法在Cancer下有著最高的分類精度,并且正區(qū)域算法和粒子群優(yōu)化算法的分類精度總體上要高于決策代價(jià)算法。在表5所示的RandomForest分類精度結(jié)果中,同樣除Lymphography和Mushroom以外的所有數(shù)據(jù)集,本文所提出的算法具有最高的分類精度,其余算法在少部分?jǐn)?shù)據(jù)集的分類精度稍高,并且決策代價(jià)算法稍低于正區(qū)域算法和粒子群優(yōu)化算法。在表6所示的SMO分類精度結(jié)果中,同樣可以看出本文算法在大部分?jǐn)?shù)據(jù)集下的分類精度是最高的。

        表5 各個(gè)數(shù)據(jù)集屬性約簡集的RandomForest分類精度結(jié)果

        綜合表4-表6的實(shí)驗(yàn)結(jié)果,表明本文算法得到的屬性約簡結(jié)果具有更好的分類性能。這主要是由于本文算法是一種多目標(biāo)的屬性約簡算法,約簡結(jié)果兼顧了數(shù)據(jù)集的分類性能和決策代價(jià),并且約簡的對(duì)象是具體的決策類,那么每個(gè)決策類可以得到與之相適應(yīng)的約簡結(jié)果,從而進(jìn)一步地提高了每個(gè)決策類的分類性能,因此數(shù)據(jù)集整體的分類精度要更高。

        4.4 決策代價(jià)比較

        表7展示的是在屬性約簡結(jié)果下,各個(gè)數(shù)據(jù)集每個(gè)決策類的決策代價(jià)結(jié)果,其中加粗的數(shù)值表示每行結(jié)果的最小值。在表7中,最小的決策代價(jià)主要分布在本文的屬性約簡算法和決策代價(jià)算法,這主要是由于這兩類算法都是關(guān)于最小化決策代價(jià)的算法,而其余的算法未考慮決策代價(jià)問題,因此得到的決策代價(jià)均高于這兩種算法。對(duì)比本文算法和決策代價(jià)算法,可以發(fā)現(xiàn)本文算法只在少部分?jǐn)?shù)據(jù)集下的決策代價(jià)稍高于決策代價(jià)算法,而決策代價(jià)算法的決策代價(jià)高于本文算法的決策類,其決策代價(jià)值大幅度高于本文算法。產(chǎn)生這種現(xiàn)象的主要原因是由于決策代價(jià)算法進(jìn)行的是全局的屬性約簡,得到的約簡結(jié)果只保證整體決策代價(jià)最小,而某些特定決策類的決策代價(jià)可能會(huì)更高。但本文的算法是基于特定的決策類,每個(gè)決策類得到了對(duì)應(yīng)的最小決策代價(jià)屬性子集,因此整體的決策代價(jià)要小于決策代價(jià)算法。

        表7 各個(gè)決策類在屬性約簡結(jié)果下的決策代價(jià)比較

        綜合兩部分實(shí)驗(yàn)結(jié)果,表明了本文所提出的屬性約簡算法同時(shí)兼顧了分類精度和決策代價(jià)兩方面性能,并且針對(duì)特定的決策類進(jìn)行屬性約簡,得到了對(duì)應(yīng)決策類的約簡結(jié)果,在屬性約簡方面有著很好的自適應(yīng)性,其優(yōu)越性更高。

        5 結(jié) 語

        決策粗糙集是一種重要的擴(kuò)展粗糙集模型,其中基于正區(qū)域的屬性約簡和基于決策代價(jià)的屬性約簡是該模型的研究重點(diǎn)。在實(shí)際應(yīng)用中,屬性約簡的研究對(duì)象可能只針對(duì)某個(gè)決策類,并且需要同時(shí)考慮約簡的正區(qū)域和決策代價(jià)。本文針對(duì)信息系統(tǒng)的特定決策類,將正區(qū)域和決策代價(jià)同時(shí)作為屬性約簡的優(yōu)化目標(biāo),定義一種特定類的屬性約簡,并利用集成學(xué)習(xí)的方法設(shè)計(jì)出相應(yīng)的啟發(fā)式屬性約簡算法,實(shí)驗(yàn)結(jié)果驗(yàn)證了該算法的有效性和優(yōu)越性。今后擬將該算法進(jìn)一步擴(kuò)展至鄰域信息系統(tǒng)以及混合型信息系統(tǒng),提高特定類屬性約簡的適用范圍。

        猜你喜歡
        區(qū)域
        分割區(qū)域
        探尋區(qū)域創(chuàng)新的密碼
        科學(xué)(2020年5期)2020-11-26 08:19:22
        基于BM3D的復(fù)雜紋理區(qū)域圖像去噪
        軟件(2020年3期)2020-04-20 01:45:18
        小區(qū)域、大發(fā)展
        商周刊(2018年15期)2018-07-27 01:41:20
        論“戎”的活動(dòng)區(qū)域
        區(qū)域發(fā)展篇
        區(qū)域經(jīng)濟(jì)
        關(guān)于四色猜想
        分區(qū)域
        公司治理與技術(shù)創(chuàng)新:分區(qū)域比較
        人妻无码一区二区| 久久久亚洲欧洲日产国码二区| 国产无遮挡又爽又刺激的视频老师 | 水蜜桃无码视频在线观看| 无码天堂亚洲国产av麻豆| 一区二区三区手机看片日本韩国| 亚洲综合网国产精品一区| 国产成人精品综合在线观看| 麻豆AV免费网站| 在线观看国产av一区二区| 夜夜爽夜夜叫夜夜高潮| 俄罗斯老熟妇色xxxx| 久久水蜜桃亚洲av无码精品麻豆| 日本久久黄色高清视频| 又黄又爽又色视频| 国产午夜精品久久久久免费视| 天啦噜国产精品亚洲精品| 一区二区精品天堂亚洲av | 西西人体444www大胆无码视频 | 亚洲一区二区高清精品| 国产精品久久av高潮呻吟| 18国产精品白浆在线观看免费 | 97在线视频人妻无码| 亚洲熟妇丰满大屁股熟妇| 中文字幕午夜AV福利片| 人妖一区二区三区在线| 人妻少妇精品中文字幕av| 综合网在线视频| 日韩中文字幕一区在线| 久久aaaa片一区二区| aaaaa级少妇高潮大片免费看| AV无码系列一区二区三区| 男人的天堂手机版av| 欧美亚洲色综久久精品国产| 日韩欧美中文字幕公布| 亚洲av国产精品色a变脸| 亚洲乱码国产乱码精华 | 日本一道本加勒比东京热| 4455永久免费视频| 国产亚洲精品第一综合麻豆| 成在线人免费无码高潮喷水|