亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        鄰域粗糙集屬性約簡(jiǎn)方法研究

        2018-08-10 06:06:58李京政竇慧莉
        電子設(shè)計(jì)工程 2018年15期
        關(guān)鍵詞:質(zhì)量

        傅 凡,李京政,竇慧莉

        (1.江蘇省光電子技術(shù)中心江蘇鎮(zhèn)江212000;2.江蘇科技大學(xué)計(jì)算機(jī)學(xué)院,江蘇鎮(zhèn)江212003)

        經(jīng)典Pawlak粗糙集模型是建立在等價(jià)關(guān)系基礎(chǔ)上的,適用于處理離散型數(shù)據(jù),不適用于直接處理現(xiàn)實(shí)中廣泛存在的數(shù)值型數(shù)據(jù),而將數(shù)值型數(shù)據(jù)離散化會(huì)導(dǎo)致數(shù)據(jù)信息的丟失。鑒于此,眾多學(xué)者提出了多種粗糙集拓展模型[2-6],例如模糊粗糙集,鄰域粗糙集等,其中,鄰域粗糙集從使用距離構(gòu)建鄰域的角度出發(fā),其直觀簡(jiǎn)潔的形式以及廣泛的應(yīng)用范圍得到了很多學(xué)者的關(guān)注。

        在粗糙集的研究進(jìn)程中,屬性約簡(jiǎn)[7-13]一直是重要研究?jī)?nèi)容。所謂屬性約簡(jiǎn),就是依據(jù)粗糙集理論中的某種評(píng)價(jià)函數(shù)設(shè)置一個(gè)約束條件,使得刪除數(shù)據(jù)中的無(wú)關(guān)/冗余屬性后能夠滿足這一約束,其目的是簡(jiǎn)化后續(xù)問(wèn)題處理、加速問(wèn)題求解或提升學(xué)習(xí)模型的泛化性能。目前在粗糙集理論中常用的評(píng)價(jià)函數(shù)有近似質(zhì)量[14]、條件熵、近似分布[15]等,約束條件一般有保持度量不變或使得度量指標(biāo)的變化在給定閾值范圍內(nèi)。可以知道,基于一種評(píng)價(jià)函數(shù)的屬性約簡(jiǎn)求解出的屬性子集可以保證對(duì)應(yīng)的度量指標(biāo)在約束條件內(nèi)。從多準(zhǔn)則,多視角考慮,評(píng)價(jià)函數(shù)的多樣性會(huì)對(duì)約簡(jiǎn)結(jié)果產(chǎn)生的影響也是研究的主要問(wèn)題,基于一種評(píng)價(jià)函數(shù)的屬性約簡(jiǎn)求解出的屬性子集是否能滿足其它度量指標(biāo)的約束條件,這也為考慮多個(gè)評(píng)價(jià)函數(shù)的屬性約簡(jiǎn)提供一個(gè)新的方向。

        1 鄰域粗糙集與鄰域分類器

        在鄰域粗糙集中,一個(gè)決策系統(tǒng)可以表示為二元組DS=<U,AT∪D>,其中U是非空有限的樣本集合,AT是所有條件屬性集合,D=0u0k0we表示決策屬性的合集且AT∩D=?。?xi∈U,d(xi)是樣本xi的類別標(biāo)記。鄰域是通過(guò)給定半徑考察樣本的鄰居。不妨假設(shè)M=(rij)n×n為論域上的距離矩陣,rij表示樣本xi與xj之間的某一種距離度量,給定參數(shù)δ∈[0,1],?xi∈U,xi的鄰域半徑為:

        δA(xi)表示在樣本xi鄰域半徑內(nèi)的所有樣本。

        定義1 令DS=<U,AT∪myomwcm>為一決策系統(tǒng),?A?AT,根據(jù)屬性集合A可以得到所有樣本之間的距離矩陣,?xi∈U,?X?U,X的鄰域下近似集與上近似集分別定義如下:

        定義2給定一個(gè)決策系統(tǒng)DS,?A?AT,?X?U,X相對(duì)于A的近似質(zhì)量為:

        其中|X|表示集合X的基數(shù)。

        在鄰域粗糙集的基礎(chǔ)上,文獻(xiàn)[16]設(shè)計(jì)出鄰域分類器進(jìn)行分類學(xué)習(xí)研究,算法1給出了鄰域分類器的詳細(xì)流程。

        算法1:鄰域分類器

        輸入:決策系統(tǒng)DS,待預(yù)測(cè)樣本xi,鄰域半徑參數(shù)δ。

        輸出:樣本的預(yù)測(cè)類別標(biāo)記PAT(xi)。

        步驟1:?xj∈U,計(jì)算δAT(xi);

        步驟 2:?Xp?U/IND(m2kgwey),計(jì)算Pr(Xp,δAT(xi))=;

        步 驟 3:Xq=arg max{Pr(Xp,δAT(xi))| ?Xp∈U/IND(iisesws)};

        步驟4:PAT(xi)=q,輸出ρAT(xi)。

        利用鄰域分類器,相應(yīng)的,文獻(xiàn)[16]進(jìn)一步給出了鄰域決策錯(cuò)誤率的概念,以下是鄰域決策錯(cuò)誤率的形式化定義。

        定義3令DS為一決策系統(tǒng),決策系統(tǒng)的鄰域決策錯(cuò)誤率為:

        顯然,這是一種留一驗(yàn)證方法。從分類學(xué)習(xí)的視角來(lái)看,鄰域決策錯(cuò)誤率越低,表明分類性能越好。

        2 屬性約簡(jiǎn)

        定義4給定一決策系統(tǒng)DS,?A?AT,A被當(dāng)作約簡(jiǎn)當(dāng)且僅當(dāng)f(A,D)=f(AT,D)且?B?A,f(B,D)≠f(AT,D)。

        定義4所示的屬性約簡(jiǎn)定義是一個(gè)能夠保持決策系統(tǒng)中某種度量不發(fā)生變化的最小屬性子集,其中,f(A,D)表示利用屬性集合A的評(píng)價(jià)函數(shù),以此求得在屬性子集上的某種度量指標(biāo),這種度量指標(biāo)可以是近似質(zhì)量,鄰域決策錯(cuò)誤率等。進(jìn)一步考察屬性的重要度,?B∈AT且對(duì)于任意的a∈AT-B,如果f(B∪{a},D)=f(B,D),那么就表明屬性a對(duì)于計(jì)算某種度量沒(méi)有帶來(lái)任何貢獻(xiàn),a是冗余的;如果f(B∪{a},D)≠f(B,D),那么就表示加入屬性a后對(duì)于計(jì)算這種度量產(chǎn)生了影響??蓸?gòu)建如下所示的屬性重要度:

        根據(jù)上述屬性重要度,算法2構(gòu)建了一個(gè)啟發(fā)式求解屬性約簡(jiǎn)的過(guò)程,其目標(biāo)是獲得以定義4為依據(jù)的約簡(jiǎn)。

        算法2:?jiǎn)l(fā)式算法

        輸入:鄰域決策系統(tǒng)DS=<U,AT∪D>。

        輸出:約簡(jiǎn)red。

        步驟1:令red←?;

        步驟2:若f(red,D)≠f(AT,D),則執(zhí)行以下循環(huán),否則執(zhí)行步驟3;

        (1)?ai∈AT-red,計(jì)算 Sig(ai,red,D);

        (2)選擇aj,滿足 Sig(aj,red,D)=max{Sig(ai,red,D)|?ai∈AT-red},令red=red∪{aj},返回步驟 2;

        (3)計(jì)算f(red,D);

        步驟3輸出red。

        3 實(shí)驗(yàn)分析

        利用算法2,在求解屬性約簡(jiǎn)的過(guò)程中使用了近似質(zhì)量與鄰域決策錯(cuò)誤率兩種度量準(zhǔn)則,分別記為近似質(zhì)量約簡(jiǎn)(AQR),鄰域決策錯(cuò)誤率約簡(jiǎn)(NDERR)。實(shí)驗(yàn)中選取了6組UCI數(shù)據(jù)集,表1列出了它們的基本信息。使用歐氏距離構(gòu)造樣本之間的距離矩陣,鄰域半徑參數(shù)δ分別設(shè)定為0.1、0.2、0.3。在此基礎(chǔ)上進(jìn)行了2組實(shí)驗(yàn),分別比較了利用算法AQR與NDERR求得的近似質(zhì)量和鄰域決策錯(cuò)誤率。

        表1 實(shí)驗(yàn)數(shù)據(jù)的基本信息

        表2列出了利用近似質(zhì)量約簡(jiǎn)與鄰域決策錯(cuò)誤率約簡(jiǎn)求得的近似質(zhì)量的對(duì)比;表3列出了利用近似質(zhì)量約簡(jiǎn)與鄰域決策錯(cuò)誤率約簡(jiǎn)求得的鄰域決策錯(cuò)誤率的對(duì)比。

        表2 兩種約簡(jiǎn)在近似質(zhì)量的對(duì)比

        觀察表2與表3可以得到如下結(jié)論,在大多數(shù)數(shù)據(jù)集上,由近似質(zhì)量約簡(jiǎn)求得的近似質(zhì)量都要高于由鄰域決策錯(cuò)誤率約簡(jiǎn)求得的近似質(zhì)量,平均要高0.09左右。相應(yīng)的,由鄰域決策錯(cuò)誤率約簡(jiǎn)求得的鄰域決策錯(cuò)誤率要低于由近似質(zhì)量約簡(jiǎn)求得的鄰域決策錯(cuò)誤率,平均要低0.03左右,除了在數(shù)據(jù)Diabetic Retinopathy Debrecen上兩者相等以外。也就是說(shuō),近似質(zhì)量約簡(jiǎn)并不能保證約簡(jiǎn)結(jié)果在鄰域決策錯(cuò)誤率上能夠滿足約束條件,鄰域決策錯(cuò)誤率約簡(jiǎn)也不能保證約簡(jiǎn)結(jié)果在近似質(zhì)量上能夠滿足約束條件。

        4 結(jié) 論

        在鄰域粗糙集上考慮基于一種評(píng)價(jià)函數(shù)的屬性約簡(jiǎn)結(jié)果可以滿足相應(yīng)度量指標(biāo)的約束條件,不能夠保證在其他度量指標(biāo)的約束條件。一方面,我們證實(shí)了傳統(tǒng)屬性約簡(jiǎn)的有效性;另一方面,由于基于一種評(píng)價(jià)函數(shù)的屬性約簡(jiǎn)在度量指標(biāo)的單一性,考慮多個(gè)評(píng)價(jià)函數(shù)的屬性約簡(jiǎn)方法也成為一個(gè)新的研究方向。

        猜你喜歡
        質(zhì)量
        聚焦質(zhì)量守恒定律
        “質(zhì)量”知識(shí)鞏固
        “質(zhì)量”知識(shí)鞏固
        質(zhì)量守恒定律考什么
        做夢(mèng)導(dǎo)致睡眠質(zhì)量差嗎
        焊接質(zhì)量的控制
        關(guān)于質(zhì)量的快速Q(mào)&A
        初中『質(zhì)量』點(diǎn)擊
        質(zhì)量投訴超六成
        汽車觀察(2016年3期)2016-02-28 13:16:26
        你睡得香嗎?
        民生周刊(2014年7期)2014-03-28 01:30:54
        亚洲国产精品久久人人爱| 国内人妖一区二区在线播放| 国产精品国产三级国产专播| 激情综合五月| 久久久无码人妻精品一区| 伊人色网站| av二区三区在线观看| 国产青青草在线观看视频| 久久久g0g0午夜无码精品| 日本亚洲欧美在线观看| 97自拍视频国产在线观看| 亚洲人不卡另类日韩精品| 熟女少妇在线视频播放 | 国产精品九九久久一区hh| 四虎成人精品无码永久在线| 成人无码激情视频在线观看| 成人国产一区二区三区av| 又色又爽又黄的视频软件app| 人妻少妇av无码一区二区| 99久久久69精品一区二区三区| h视频在线免费观看视频| 日韩人妻无码一区二区三区久久| а天堂中文在线官网| 国产精品一区二区在线观看99| 国产一区二区高清不卡在线| 白白在线视频免费观看嘛| 性色av无码久久一区二区三区| 天天干夜夜躁| 日韩精品免费av一区二区三区 | 91亚洲无码在线观看| 中文字幕色婷婷在线视频| 色窝窝亚洲av网在线观看| 精品国产18久久久久久| 亚洲AV秘 无码一区二区久久| 日本一区二区三区视频免费在线| 成人综合网站| 国产精品久久久久久久久免费观看 | 国产毛片av最新视频| 久久伊人色av天堂九九| 一区二区三区国产美女在线播放| 久久国产精品一区av瑜伽|