亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        一種快速求核算法

        2015-11-18 02:12:41周世睿郭星
        關(guān)鍵詞:決策表粗糙集等價

        周世睿,郭星

        (安徽大學(xué)計算機科學(xué)技術(shù)學(xué)院,安徽,合肥 230000)

        一種快速求核算法

        周世睿,郭星

        (安徽大學(xué)計算機科學(xué)技術(shù)學(xué)院,安徽,合肥 230000)

        隨著粗糙集理論在諸多領(lǐng)域的廣泛應(yīng)用,特別是針對海量數(shù)據(jù)應(yīng)用粗糙集理論,對于實時性有了更高要求,在這種情況下針對求核與屬性約簡也提出了更高的要求,目前有許多粗糙集求核算法,但是在時間復(fù)雜度或者空間復(fù)雜度上都或多或少有著缺陷.本研究利用基數(shù)排序和二分法的思想設(shè)計了一種快速求核算法,其時間復(fù)雜度為O(|U||C|2)通過實驗,證明了算法的正確性和高效性.

        粗糙集;基數(shù)排序;二分法;核

        1 引言

        Rough粗糙集理論是波蘭數(shù)學(xué)家Pawlak[1]在1982年提出的,是一種描述模糊與處理不確定數(shù)學(xué)問題的數(shù)學(xué)工具,由于無需先驗知識,并且可以從規(guī)模巨大的數(shù)據(jù)中挖掘出隱含的信息,被廣泛應(yīng)用于人工智能、模式識別、數(shù)據(jù)挖掘等領(lǐng)域.啟發(fā)式屬性約簡算法由于時間復(fù)雜度低,速度較快,因而應(yīng)用較為廣泛.求核作為常見啟發(fā)式算法的重要步驟,重要程度不言而喻.

        Skowron在1995年最早提出了基于差別矩陣的求核算法,Hu[2,3]等人對此算法加以改進.葉東毅[4]利用實例證明了Hu算法在對不一致決策表求核中存在錯誤,在改進差別矩陣的基礎(chǔ)上,給出了一個新的差別矩陣的定義和求核方法;趙軍[5]等基于決策系統(tǒng)的一致性,提出了一種不需要建立差別矩陣的核屬性計算方法,但是該方法在處理不相容策表時,具有很大的局限性,為了解決因決策表的不相容性導(dǎo)致所求得的核出現(xiàn)錯誤的問題,閆德勤等將決策表規(guī)范化后再構(gòu)造差別矩陣,然后利用規(guī)范化后建立的差別矩陣求核屬性,其時間復(fù)雜度為O(|U||C|2);楊明[7]提出了一種改進的差別矩陣及其求核方法.徐章艷[8]等給出了簡化的差別矩陣的定義,并設(shè)計了一種求核算法,算法的時間復(fù)雜度被降為max(O(|U/C|2|C|),O(|U||C|)但以上方法均需要創(chuàng)建差別矩陣或者簡化的差別矩陣,如果樣本的對象集很大,差別矩陣就要占用很多的空間,增加了計算量和計算時間,影響了計算效率[11,12]在本論文中的將介紹一種快速求核算法,該算法可以對不一致粗糙集求核,避免HU算法在不一致粗糙集求核中存在的問題,并且有較好的時間復(fù)雜度.本算法首先對不一致粗糙集進行預(yù)處理,通過修改不一致決策表內(nèi)決策屬性屬性值,將不一致決策表轉(zhuǎn)化為一致性決策表,并證明該一致性決策表的核屬性等同于不一致決策表核屬性.然后進行求核.并通過UCI數(shù)據(jù)集的實驗證明本文的求核算法有較好的時間、空間復(fù)雜度.

        2 基本定義

        定義1[1]稱五元組S=(U,A∪d,V,f)為信息系統(tǒng),其中U為所有對象形成的非空有限集合,稱為論域;A為屬性的有限集合,d為決策屬性.

        定義2[2]若P?U,且P不等于空集,則P中所有等價關(guān)系的交集也是一個等價關(guān)系,稱為P上的不可分辨關(guān)系,記為IND(P),且有IND(P)=∩[X]R.表示與等價關(guān)系族P相關(guān)的知識,稱為K中關(guān)于U的P的基本知識即P的基本集.為簡單起見,我們用U/P代替U/IND(P),IND(P)的等價類稱為知識的基本概念或基本范疇.

        定義3[2]在決策表S中,若對任意Xi∈U/C,存在Yj∈U/D,使得Xi∈Yj,則S為一致決策表.

        定義4[4]葉東毅教授差別矩陣Mij中元素mij定義如下:

        定義5[9]在決策表S=(U,A∪d,V,f)中,若POSc(D)=POS (c-{a})(D),且a∈C,則a稱為C中相對D不必要的.若POSc (D)≠POS(c-{a})(D),則a稱為C中相對D必要的.Core(C)是C中所有必要屬性集合,稱為C的核集.

        定義6[10]指出決策表核為差別矩陣中所有單個元素屬性的合集,其求核公式為:

        定義7[4]不可分辨關(guān)系,在決策表S=(U,A∪d,V,f)中,定義如下:

        定義8新的決策表定義方式:S'=(U',C∪D',V',f')其中D'=D'∪{*},f'為信息函數(shù)滿足?x∈UC,有如下定義:

        顯然,新決策表S'是一個相容決策表.

        定義9決策表分解對于決策表S=(U,C∪D,V,f)分解為兩個子表:S1=(U1,C1'∪D,V,f)與子表S2=(U2,C2'∪D,V,f),其中:

        3 等價性證明

        3.1 證明原決策表S與轉(zhuǎn)化后的一致性決策表S'核集具有等價性

        葉東毅定義的差別矩陣,求核算法,改進了Hu算法不能處理不一致性決策表的問題,但時間空間性能較差.設(shè)Mij為原決策表S根據(jù)定義4轉(zhuǎn)化的差別矩陣,Mij'?{mij'}為S'根據(jù)定義8轉(zhuǎn)化的差別矩陣,當(dāng)?mij∈M(mij≠?),?ma,b'=mij且mij'?M'.

        證明因為mij不為空,根據(jù)定理1可知:

        反之,證明必要性.類似可證.

        3.2 證明:決策表S的核集CORE(C)與子表S1、S2核集CORE(C1)CORE(C2)具有等價性,即CORE(C)=CORE(C1)∪CORE(C2);該證明可以從兩個方面進行,證明其充分性、必要性;充分性:若?(ci∈C)∧(ci∈CORE(C)則必存在ci∈CORE (C1)∪CORE(C2)

        證明根據(jù)定義6,核屬性是差別矩陣中所有單個元素屬性的集合,決策表S的差別矩陣記作Mij={mij},則一定有mij=ci,當(dāng)ci∈C1時,由于mij=ci,即對象xi、xj在非ci的所有屬性上取值相同,即只有ci能唯一分辨xi、xj兩個對象.所以{xi, xj}?[xi]C2,|[xi]C2|≠1,所以根據(jù)定義9,xi、xj都屬于U1,所以ci∈CORE(C1),同理當(dāng)ci∈C2時,有ci∈CORE(C1);綜上充分性得證.

        必要性:若?ci∈CORE(C1)∪CORE(C2)且ci∈C則必存在:(ci∈C)∧(ci∈CORE(C))

        證明因為ci∈CORE(C1)∪CORE(C2)且ci∈C,當(dāng)ci∈CORE(C1)時,根據(jù)定義6,核屬性是差別矩陣中所有單個元素屬性的集合,決策表的S1差別矩陣記作M1ij={mij},則一定有mij=ci,由于mij=ci,即對象xi、xj在非ci的所有屬性上取值相同,即只有ci能唯一分辨xi、xj兩個對象.此時f(xi,t1)=f(xj,t1).根據(jù)定義5,可知U/t1=U/C2;所以f(xi,C2)=f(xj,C2),綜上此時ci∈CORE(C1).當(dāng)ci∈CORE(C2)時,類似可證,綜上,必要性得證.

        實例分析:

        Step1對于等價類,取代表元素,去除冗余對象:

        去除第九個對象;

        添加兩個新屬性t1、t2,令U/t1=U/C2、U/t2=U/C1根據(jù)定義4:

        產(chǎn)生兩個子表S1、S2

        S1

        S2

        4 算法具體步驟及性能比較分析

        輸入:一個決策表S=(U,C∪D,V,f),其中U為對象集合,C為條件屬性集合,D為決策屬性集合.

        輸出:決策表S的核集CORE(C)

        Step1:利用基數(shù)排序思想,對U按C生成等價類{[x1]C,[x2]C,[x2]C,…[xn]C},然后利用定義2,修改決策屬性,將不一致決策表轉(zhuǎn)化為一致決策表.

        Step2:刪除一致性決策表中冗余信息.

        Step3:讀取決策表S內(nèi)元素個數(shù),記作n.

        Step3:分別計算U按C1,C2生成的等價類,其中

        C1={c1,c2,c3…cn/2},通過等價類計算結(jié)果,按照定義5構(gòu)造決策表S1,S2.

        Step4:分別計算S1,S2的核集,按照定義5得出核集:

        時間復(fù)雜度分析:step1,采用基數(shù)排序思想,劃分等價類時間復(fù)雜度為:0(U*C).

        Step2,在每一個等價類中提取一個代表元素,其時間復(fù)雜度為:0(C).

        Step3時間復(fù)雜度為0(U*C)

        實驗本文選取了UCI數(shù)據(jù)庫中中5組數(shù)據(jù),分別用葉東毅教授求核方法與本文求核方法進行實驗比較,實驗環(huán)境為2.60GHz,2G內(nèi)存,Window XP操作系統(tǒng),算法開發(fā)在VS2010下進行,實驗結(jié)果如下表所示:

        數(shù)據(jù)庫對象數(shù)目核屬性數(shù)目葉方法時間本文方法時間本文方法求核正確率Housing86620.9870.125100% Mushroom8124613.2293.05100% Zoo10120.1370.52100% Car1728615.4637.632100% Solar-Flare103644.1351.072100%

        5.結(jié)論

        本文將基數(shù)排序與二分法結(jié)合,提出了一種新的求核算法,并通過例子證明了該算法的正確性.本算法時間復(fù)雜度為O(|C||U|2).由于本算法不需求取差別矩陣,空間復(fù)雜度與時間復(fù)雜度都較優(yōu).

        〔1〕Pawlak Z.rough sets[J].International of computer and information I science,1982,11(5):341-356.

        〔2〕Hu X,Cercone N.Learning in relational databases:.rough set approach[J]Computational intelligence,1995,11(2):323-338.

        〔3〕Skowron A,Rauszer C.The discernibility matrices and functions in information systems[M]/Intelligent Decision Support.Springer Nether lands,1992:331-362.

        〔4〕葉東毅,陳昭炯.一個新的差別矩陣及其求核方法[J].電子學(xué)報,2002,30(7):1086-1088.

        〔5〕趙軍,土國撤,吳中福,等.一種高效的屬性核計算方法[J].小型微型計算機系統(tǒng),2003,24(11):1950-1953.

        〔6〕閆德勤,劉菲斐.屬性約簡中的差別矩陣與近似精度[J].小型微型計算機系統(tǒng),2005,26(11):1975-1977.

        〔7〕楊明.一種基J飛改進差別矩陣的屬性約簡增量式更新算法[J].計算機學(xué)報,2007,30(5):815-822.

        〔8〕徐章艷,楊炳儒,宋威.一個基于差別矩陣的快速求核算法[J].計算機工程與應(yīng)用,2006,42(6):4-6.

        〔9〕葛浩,李龍澎,楊傳健.向向數(shù)據(jù)刪除的核屬性更新算法[J].控制與決策,2012,27(5).

        〔10〕蔣瑜,王嘉響.一種快速屬性核求解算法「J].計算機工程與應(yīng)用,2011,47(26):53-54.

        〔11〕錢文彬,楊炳儒,徐章艷,等.一種高效的核屬性動態(tài)更新算法[J].計算機科學(xué),2012,39(7):210-214.

        〔12〕胡秦斌.一種基于決策信息系統(tǒng)的求核屬性算法[J].微電子學(xué)與計算機,2012,29(007):23-25.

        〔13〕張文修,吳偉志,梁吉業(yè),等.粗糙集理論和方法[M].北京:科學(xué)出版社,2001.

        TP181

        A

        1673-260X(2015)05-0006-03

        猜你喜歡
        決策表粗糙集等價
        基于決策表相容度和屬性重要度的連續(xù)屬性離散化算法*
        基于Pawlak粗糙集模型的集合運算關(guān)系
        n次自然數(shù)冪和的一個等價無窮大
        中文信息(2017年12期)2018-01-27 08:22:58
        多?;植诩再|(zhì)的幾個充分條件
        雙論域粗糙集在故障診斷中的應(yīng)用
        收斂的非線性迭代數(shù)列xn+1=g(xn)的等價數(shù)列
        正反轉(zhuǎn)電機缺相保護功能的實現(xiàn)及決策表分析測試
        兩個域上的覆蓋變精度粗糙集模型
        環(huán)Fpm+uFpm+…+uk-1Fpm上常循環(huán)碼的等價性
        關(guān)于環(huán)Fpm+uFpm上常循環(huán)碼的等價性
        巨爆乳中文字幕爆乳区| 国产亚洲成人精品久久久| 男奸女永久免费视频网站| 国产乱人伦偷精品视频免| 国产黄大片在线观看| 精品久久久久久久久午夜福利| 免费观看又色又爽又湿的视频| 亚洲美免无码中文字幕在线| 国产精品露脸张开双腿| 国产成人久久精品77777综合| 国产一区二区三区尤物| 国产亚洲一区二区三区| 日韩精品真人荷官无码| 日本一卡2卡3卡四卡精品网站| 久久精品国产夜色| 日韩美女av二区三区四区| 日本在线一区二区免费| 国产精品一区二区av麻豆| 天美传媒一区二区| 精品人妻中文av一区二区三区 | 日本视频一区二区三区三州| 中文字幕精品一区二区的区别| 人妻中文字幕乱人伦在线| 超清精品丝袜国产自在线拍| 国产成人精品三级麻豆| 中文字幕亚洲区第一页| 国产人妖在线观看一区二区三区| 国产一级内射视频在线观看| 日韩少妇内射免费播放| 在线观看欧美精品| 国产福利小视频91| 亚洲粉嫩视频在线观看| 亚洲中文久久精品字幕| 我爱我色成人网| 不卡视频一区二区三区| 国产大屁股白浆一区二区三区| 在线日本看片免费人成视久网| 99久久人妻精品免费二区| 日本香蕉久久一区二区视频| 精品中文字幕久久久人妻| 精品露脸国产偷人在视频|