亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        面向連續(xù)參數(shù)的多粒度屬性約簡(jiǎn)方法研究

        2021-08-07 07:42:56宋晶晶程富豪王平心楊習(xí)貝
        計(jì)算機(jī)與生活 2021年8期
        關(guān)鍵詞:約簡(jiǎn)粗糙集約束條件

        吳 將,宋晶晶,2+,程富豪,王平心,楊習(xí)貝,4

        1.江蘇科技大學(xué) 計(jì)算機(jī)學(xué)院,江蘇 鎮(zhèn)江 212100

        2.數(shù)據(jù)科學(xué)與智能應(yīng)用福建省高校重點(diǎn)實(shí)驗(yàn)室,福建 漳州 363000

        3.江蘇科技大學(xué) 理學(xué)院,江蘇 鎮(zhèn)江 212100

        4.江蘇科技大學(xué) 經(jīng)濟(jì)管理學(xué)院,江蘇 鎮(zhèn)江 212100

        粗糙集理論[1]最早是由波蘭學(xué)者Pawlak 提出的,這一理論近年來(lái)在數(shù)據(jù)挖掘、人工智能、決策分析等領(lǐng)域[2-4]受到了廣泛關(guān)注。在粗糙集理論與方法中,屬性約簡(jiǎn)問(wèn)題[5-10]一直是眾多學(xué)者關(guān)注的焦點(diǎn)。作為一種特征選擇機(jī)制,約簡(jiǎn)的目的是獲得滿足給定約束條件的最小屬性子集,進(jìn)而達(dá)到降低不確定性、提升學(xué)習(xí)器泛化性能等目的。在數(shù)據(jù)分析中,屬性約簡(jiǎn)中的約束條件往往可以通過(guò)一些度量準(zhǔn)則進(jìn)行構(gòu)造,如近似質(zhì)量、條件熵等[6,8]。

        經(jīng)典粗糙集方法僅能處理符號(hào)型數(shù)據(jù),但在解決實(shí)際應(yīng)用問(wèn)題時(shí),連續(xù)型數(shù)據(jù)是廣泛存在的。因此已有諸多學(xué)者構(gòu)建了很多拓展的粗糙集模型以用于分析及處理連續(xù)型數(shù)據(jù):如基于高斯核函數(shù)的模糊粗糙集[10]和基于鄰域關(guān)系的鄰域粗糙集[5]。這兩者均可以視作是使用參數(shù)化的方法構(gòu)造二元關(guān)系及相應(yīng)的粗糙集模型。但值得注意的是,利用這些參數(shù)化粗糙集進(jìn)行屬性約簡(jiǎn)問(wèn)題的研究時(shí),會(huì)帶來(lái)諸如參數(shù)計(jì)算量過(guò)大等一系列問(wèn)題。鑒于此,已有學(xué)者將參數(shù)視為粒度的表現(xiàn)形式[11-13],對(duì)多粒度環(huán)境下的屬性約簡(jiǎn)問(wèn)題進(jìn)行了初步探索。然而,已有的研究成果仍然存在一些可以提升的空間:(1)在多個(gè)參數(shù)所對(duì)應(yīng)的多粒度結(jié)構(gòu)下進(jìn)行約簡(jiǎn)求解時(shí),一種常用的策略是針對(duì)于每一個(gè)參數(shù),分別求解約簡(jiǎn)。顯然,當(dāng)參數(shù)體量較大時(shí),這一過(guò)程會(huì)帶來(lái)較高的時(shí)間消耗。(2)在多個(gè)不同的參數(shù)下,可以得到多個(gè)約簡(jiǎn),當(dāng)參數(shù)之間差異性較小時(shí),這些約簡(jiǎn)結(jié)果有可能存在較大的差異性。換言之,單個(gè)約簡(jiǎn)一般只能表示某個(gè)粒度意義下滿足約束條件的最小屬性子集,而對(duì)于其他相鄰參數(shù)所對(duì)應(yīng)的粒度,約簡(jiǎn)的結(jié)果有可能大相徑庭。因此,多參數(shù)意義下的多個(gè)約簡(jiǎn)結(jié)果并不具有普適性。

        為了解決上述問(wèn)題,本文從連續(xù)參數(shù)的視角出發(fā),提出了多粒度屬性約簡(jiǎn)的一種新模式,主要包括兩部分內(nèi)容:首先在一個(gè)連續(xù)參數(shù)區(qū)間內(nèi),構(gòu)造了多粒度屬性約簡(jiǎn)的約束條件,然后利用前向貪心搜索策略,設(shè)計(jì)了求解多粒度約簡(jiǎn)的算法。與多個(gè)參數(shù)意義下分別求解約簡(jiǎn)的模式不同,連續(xù)參數(shù)下多粒度屬性約簡(jiǎn)的目的不是分別針對(duì)每個(gè)參數(shù)進(jìn)行約簡(jiǎn)求解,而是根據(jù)多粒度約束條件求得一個(gè)約簡(jiǎn),進(jìn)而有望降低約簡(jiǎn)求解的時(shí)間消耗。

        1 基礎(chǔ)知識(shí)

        1.1 鄰域粗糙集

        在粗糙集中,決策系統(tǒng)可以表示為一個(gè)二元組DS=,其中,U={x1,x2,…,xn} 是所有樣本構(gòu)成的非空有限集合,稱為論域;AT是所有條件屬性的集合;d是決策屬性,用以描述樣本的標(biāo)記。U/IND(d)={X1,X2,…,Xk}表示由決策屬性d所誘導(dǎo)出論域上的劃分,?Xp∈U/IND(d),Xp表示具有相同標(biāo)記的樣本所構(gòu)成的第p個(gè)決策類。

        在粗糙集理論中,信息?;痆14-19]的進(jìn)程一般是通過(guò)利用條件屬性所提供的信息來(lái)構(gòu)建二元關(guān)系,進(jìn)而能夠?qū)φ撚蛑械臉颖具M(jìn)行區(qū)分。以鄰域粗糙集模型為例,可以通過(guò)在論域上使用鄰域關(guān)系[5]來(lái)進(jìn)行信息?;?,鄰域關(guān)系的定義如下所示。

        定義1給定決策系統(tǒng)DS=與半徑δ,?B?AT,鄰域關(guān)系可以定義為:

        其中,ΔB(xi,xj)表示利用條件屬性子集B所提供的信息得到的樣本xi與xj之間的距離。

        使用如式(1)所示的鄰域關(guān)系對(duì)論域進(jìn)行信息?;傻玫剿袠颖镜泥徲?,?xi∈U,xi的鄰域可以表示為δB(xi)={xj∈U|ΔB(xi,xj)≤δ},δB(xi)中的樣本被視作與xi是不可區(qū)分的,而δB(xi)之外的樣本則被視作與xi是可區(qū)分的。因此,每個(gè)樣本的鄰域即表示了一個(gè)信息粒,所有樣本的信息粒的合集就是信息粒化的結(jié)果。一般來(lái)說(shuō),如果半徑δ較小,那么利用式(1)將會(huì)得到較細(xì)的信息粒化結(jié)果;反之,將會(huì)得到較粗的信息?;Y(jié)果。為了量化地描述信息?;Y(jié)果的粗細(xì)程度,可以使用如下定義所示的粒度概念。

        定義2[13]給定決策系統(tǒng)DS=與半徑δ,?B?AT,粒度可定義為:

        其中,|X|表示集合X的基數(shù)。

        因?yàn)槭剑?)所示的鄰域關(guān)系滿足自反性,所以在定義2中,有成立。在特殊情況下:(1)當(dāng)鄰域關(guān)系為ω={(xi,xi)∈U×U:?xi∈U} 時(shí),可得到最細(xì)的信息粒,此時(shí)粒度取最小值1/|U|;(2)當(dāng)鄰域關(guān)系為η={(xi,xj)∈U×U:?xi,xj∈U}時(shí),可得到最粗的信息粒,此時(shí)粒度取最大值1。

        定義3[8-9]給定決策系統(tǒng)DS=與半徑δ,?B?AT,d關(guān)于B的下近似集和上近似集可分別定義為:

        作為粗糙集理論中屬性約簡(jiǎn)中常用的度量準(zhǔn)則,近似質(zhì)量的形式化描述如定義4 所示。

        定義4[20]給定決策系統(tǒng)DS=與半徑δ,?B?AT,d關(guān)于B的近似質(zhì)量可以定義為:

        條件熵作為另一種常用的度量,它能反映條件屬性相對(duì)于決策屬性的鑒別能力。根據(jù)實(shí)際應(yīng)用的不同,條件熵有很多定義的形式[17-19],其中一種具有單調(diào)性的條件熵定義如定義5 所示。

        定義5[21]給定決策系統(tǒng)DS=與半徑δ,?B?AT,d關(guān)于B的條件熵可以定義為:

        其中,[xi]d表示與樣本xi屬于同一決策類的樣本的合集。

        條件熵的值越小,則條件屬性相對(duì)于決策屬性的鑒別能力越強(qiáng)。

        1.2 多粒度屬性約簡(jiǎn)

        屬性約簡(jiǎn)是粗糙集理論研究中的一個(gè)核心問(wèn)題,其本質(zhì)是去除條件屬性中的冗余和不相關(guān)屬性,以得到滿足給定約束條件的最小屬性子集。為了更深入地理解屬性約簡(jiǎn)的本質(zhì),Yao 等人[6]從粒計(jì)算角度出發(fā),給出了屬性約簡(jiǎn)的形式化方法。但由于Yao等人提出的屬性約簡(jiǎn)定義只適用于描述單個(gè)粒度下的約簡(jiǎn),而單粒度約簡(jiǎn)無(wú)法為參數(shù)化粒度的選擇提供有力的支撐,且無(wú)法展現(xiàn)不同粒度所對(duì)應(yīng)約簡(jiǎn)的性能的變化趨勢(shì)[11],因此,Jiang 等人[12]采用鄰域的方法,給出了一種多粒度屬性約簡(jiǎn)的形式化描述方法,如定義6 所示。

        定義6[12]給定決策系統(tǒng)DS=,一組半徑{δ1,δ2,…,δs}和關(guān)于δt(1 ≤t≤s)的約束條件,?B?AT,B={B1,B2,…,Bs}被稱為一個(gè)關(guān)于φ的多粒度約簡(jiǎn),?Bt∈B,當(dāng)且僅當(dāng):

        (1)Bt滿足約束條件;

        顯然,定義6 所示的多粒度約簡(jiǎn)是多個(gè)單粒度約簡(jiǎn)的合集。其中,φ代表度量準(zhǔn)則,可表示由近似質(zhì)量構(gòu)造的約束條件或者由條件熵構(gòu)造的約束條件。當(dāng)使用近似質(zhì)量構(gòu)造的約束條件時(shí),為,此時(shí)每一單粒度約簡(jiǎn)是一個(gè)能夠保證當(dāng)前粒度下近似質(zhì)量不會(huì)被降低的最小屬性子集Bt;當(dāng)使用條件熵構(gòu)造的約束條件時(shí),φδt為,此時(shí)每一單粒度約簡(jiǎn)是一個(gè)能夠保證當(dāng)前粒度下條件熵不會(huì)被升高的最小屬性子集Bt。

        目前,前向貪心搜索策略在約簡(jiǎn)的求解問(wèn)題中受到眾多學(xué)者的青睞,這一方法在每次迭代的過(guò)程中將屬性重要度最大的屬性加入到約簡(jiǎn)集合中,直至所選擇的屬性子集滿足約束條件。鑒于此,可以采用如定義7 所示的形式對(duì)候選屬性進(jìn)行評(píng)估。

        定義7給定決策系統(tǒng)DS=與半徑δ,?B?AT,?ai∈AT-B,屬性ai相對(duì)于B的屬性重要度可定義為:

        式(7)表示利用近似質(zhì)量計(jì)算屬性重要度,若加入ai后近似質(zhì)量的值越大,則說(shuō)明ai的重要度越高;式(8)表示利用條件熵計(jì)算屬性重要度,若加入ai后條件熵的值越小,則說(shuō)明ai的重要度越高。

        實(shí)際上,定義6 所示的多粒度約簡(jiǎn)是多個(gè)單粒度約簡(jiǎn)的合集,因而多粒度約簡(jiǎn)求解可通過(guò)重復(fù)單粒度約簡(jiǎn)求解過(guò)程來(lái)實(shí)現(xiàn)。采用前向貪心搜索策略,運(yùn)用定義7 所示的屬性重要度,可設(shè)計(jì)出如算法1 所示的多粒度約簡(jiǎn)求解過(guò)程。

        算法1離散參數(shù)下的多粒度約簡(jiǎn)合集求解算法

        利用算法1 求解多粒度約簡(jiǎn)的時(shí)間復(fù)雜度為O(s×|U|2×|AT|2),主要是因?yàn)椋海?)在單個(gè)粒度下計(jì)算鄰域的時(shí)間復(fù)雜度為O(|U|2×|AT|2),而在最壞的情況下,每個(gè)條件屬性都需要被評(píng)估且加入約簡(jiǎn)集合中,即AT中沒(méi)有冗余的屬性,則單粒度下求解約簡(jiǎn)的時(shí)間復(fù)雜度為O(|U|2×|AT|2);(2)對(duì)于求解s個(gè)粒度下的約簡(jiǎn)是將單粒度求解約簡(jiǎn)的過(guò)程重復(fù)s次,因此求解多粒度約簡(jiǎn)的時(shí)間復(fù)雜度為O(s×|U|2×|AT|2)。

        2 連續(xù)參數(shù)意義下多粒度屬性約簡(jiǎn)

        不難發(fā)現(xiàn),算法1 所示的多粒度約簡(jiǎn)求解過(guò)程是在離散化參數(shù)的基礎(chǔ)上實(shí)現(xiàn)的,這種重復(fù)求解單個(gè)參數(shù)所對(duì)應(yīng)約簡(jiǎn)的策略,當(dāng)參數(shù)體量過(guò)大時(shí)會(huì)導(dǎo)致求解約簡(jiǎn)的時(shí)間消耗急劇增加。鑒于此,本文將提出一種基于連續(xù)參數(shù)的多粒度屬性約簡(jiǎn)框架:給定參數(shù)區(qū)間[δ1,δs],設(shè)計(jì)相應(yīng)的約束條件求得約簡(jiǎn),期望用此約簡(jiǎn)結(jié)果表示在整個(gè)區(qū)間[δ1,δs]下求得的各個(gè)多粒度約簡(jiǎn),而不再針對(duì)連續(xù)參數(shù)中的每一個(gè)參數(shù)進(jìn)行求解約簡(jiǎn)得到的多粒度約簡(jiǎn)結(jié)果。

        在連續(xù)參數(shù)下多粒度求解約簡(jiǎn)的過(guò)程中,如何設(shè)計(jì)和求解約束條件φ是一個(gè)關(guān)鍵問(wèn)題。從算法1中可以看出,多粒度約簡(jiǎn)合集的求解是通過(guò)重復(fù)求解單粒度約簡(jiǎn)來(lái)實(shí)現(xiàn)的。針對(duì)連續(xù)參數(shù)下約簡(jiǎn)求解問(wèn)題,在仔細(xì)分析粒度的公式(定義2)的基礎(chǔ)上,可以觀察到,對(duì)于給定的參數(shù)區(qū)間[δ1,δs],利用最小參數(shù)δ1可獲得一個(gè)最細(xì)粒度,利用最大參數(shù)δs可獲得一個(gè)最粗粒度。因此,本文將使用最細(xì)粒度和最粗粒度下度量準(zhǔn)則的融合策略來(lái)進(jìn)行屬性約簡(jiǎn)。

        定義8給定決策系統(tǒng)DS=與一個(gè)半徑區(qū)間[δ1,δs],?B?AT,B被稱為條件屬性AT的一個(gè)關(guān)于φ在連續(xù)參數(shù)下的約簡(jiǎn),當(dāng)且僅當(dāng):

        (1)B滿足約束條件;

        (2)?B′?B,B′不滿足約束條件。

        在定義8 中,與定義7 類似,其中,φ代表度量準(zhǔn)則,可表示由近似質(zhì)量構(gòu)造的約束條件或者由條件熵構(gòu)造的約束條件。但與定義7 不同,當(dāng)使用由近似質(zhì)量構(gòu)造的約束條件時(shí),且”,即定義8 給出的約簡(jiǎn)是一個(gè)能夠保證在連續(xù)參數(shù)上,利用δ1和δs計(jì)算出的近似質(zhì)量不會(huì)降低的最小屬性子集B;當(dāng)使用由條件熵構(gòu)造的約束條件時(shí),為“且”,即定義8 給出的約簡(jiǎn)是一個(gè)能夠保證在連續(xù)參數(shù)上,利用δ1和δs計(jì)算出的條件熵不會(huì)增大的最小屬性子集B。

        運(yùn)用定義8 和以上對(duì)約束條件的構(gòu)造,可設(shè)計(jì)出如算法2 所示的連續(xù)參數(shù)下多粒度約簡(jiǎn)求解算法。

        算法2連續(xù)參數(shù)下的多粒度約簡(jiǎn)求解算法

        算法2 的時(shí)間復(fù)雜度為O(|U|2×|AT|2)。對(duì)于計(jì)算連續(xù)參數(shù)下的約簡(jiǎn),只需執(zhí)行一次算法2,但對(duì)于算法1 而言,需要針對(duì)s個(gè)參數(shù)進(jìn)行約簡(jiǎn)的求解,此時(shí)算法1 將被執(zhí)行s次。顯然,當(dāng)s>1 時(shí),算法2 求解多粒度約簡(jiǎn)的時(shí)間復(fù)雜度小于算法1 求解多粒度約簡(jiǎn)的時(shí)間復(fù)雜度,因此從這一角度來(lái)看,采用算法2 有望降低求解多粒度約簡(jiǎn)的時(shí)間消耗。

        3 實(shí)驗(yàn)分析

        為了驗(yàn)證算法2 的有效性,在連續(xù)參數(shù)下求解多粒度的約簡(jiǎn),本文參考了文獻(xiàn)[7]中選取半徑區(qū)間的方法并使用了該文獻(xiàn)實(shí)驗(yàn)的8 組數(shù)據(jù)。數(shù)據(jù)的基本描述如表1 所示。

        文獻(xiàn)[7]在選取半徑和半徑區(qū)間的過(guò)程中,使用了100 個(gè)不同半徑δ=0.01,0.02,…,1.00,并計(jì)算了相應(yīng)的近似質(zhì)量。對(duì)于每一個(gè)數(shù)據(jù)集,選擇了近似質(zhì)量大于0.1 的半徑區(qū)間,這主要是因?yàn)樵诖植诩碚撝校^小的近似質(zhì)量對(duì)刻畫確定性的意義不大。使用該方法選取各個(gè)數(shù)據(jù)集的10 個(gè)半徑和半徑區(qū)間,具體描述如表2 所示。

        值得注意的是,在連續(xù)參數(shù)下求得的一個(gè)多粒度約簡(jiǎn)是保持近似質(zhì)量不會(huì)降低或條件熵不會(huì)增大的最小屬性子集。但是,經(jīng)過(guò)大量實(shí)驗(yàn)發(fā)現(xiàn),連續(xù)參數(shù)下求解多粒度約簡(jiǎn)的約束是很嚴(yán)格的,不利于冗余屬性的刪除,故可通過(guò)控制閾值的方式來(lái)控制約簡(jiǎn)的約束條件[19]。為了能夠更有效進(jìn)行實(shí)驗(yàn)對(duì)比分析,閾值ε的取值分別為5%和10%。故本次實(shí)驗(yàn)中約簡(jiǎn)的約束條件為:當(dāng)使用由近似質(zhì)量構(gòu)造約束條件時(shí),形如“且”;當(dāng)使用由條件熵構(gòu)造的約束條件時(shí),形如“且”。為了驗(yàn)證新提出算法的有效性,實(shí)驗(yàn)采用了五折交叉驗(yàn)證的方法。在上述的8 組數(shù)據(jù)集中,利用五折交叉驗(yàn)證,分別計(jì)算了離散參數(shù)下和連續(xù)參數(shù)下求得約簡(jiǎn)的時(shí)間消耗與約簡(jiǎn)中屬性所提供的分類精度,其中在計(jì)算分類精度時(shí)使用的方法分別為K最近鄰算法(K-nearest neighbor,KNN)與支持向量機(jī)(support vector machine,SVM)。

        Table 1 Description of data sets表1 數(shù)據(jù)集描述

        Table 2 Used radii and radii interval for data sets表2 數(shù)據(jù)集使用的半徑和半徑區(qū)間

        3.1 時(shí)間消耗對(duì)比

        觀察表3,不難得出以下結(jié)論:

        (1)無(wú)論是使用算法1 還是算法2,相較于使用條件熵作為度量準(zhǔn)則,在使用近似質(zhì)量作為度量準(zhǔn)則時(shí),計(jì)算約簡(jiǎn)的時(shí)間消耗較高。通過(guò)觀察實(shí)驗(yàn)結(jié)果,認(rèn)為主要是因?yàn)樵谑褂媒瀑|(zhì)量作為度量時(shí),約簡(jiǎn)集合中包含屬性個(gè)數(shù)往往比使用條件熵時(shí)所求得的約簡(jiǎn)集合中包含的屬性個(gè)數(shù)更多,此時(shí)帶來(lái)了屬性評(píng)估及屬性選擇迭代次數(shù)的增多。

        (2)使用算法2 計(jì)算約簡(jiǎn)的時(shí)間消耗顯著低于使用算法1 計(jì)算約簡(jiǎn)的時(shí)間消耗。這是因?yàn)楫?dāng)給定10個(gè)半徑時(shí),算法1 需要重復(fù)10 次前向貪心搜索策略,從而獲得多粒度下的約簡(jiǎn)合集。然而,在連續(xù)參數(shù)下求解約簡(jiǎn)只需要執(zhí)行1 次就可以得到多粒度約簡(jiǎn)結(jié)果。以“Amphetamines Consumption(ID:1)”數(shù)據(jù)集為例,使用近似質(zhì)量作為度量時(shí),約束條件的閾值為5%和10%的算法1 計(jì)算多粒度的約簡(jiǎn)合集消耗的時(shí)間為34.975 7 s 和34.335 6 s,約束條件的閾值為5%和10%的算法2 計(jì)算多粒度約簡(jiǎn)消耗的時(shí)間分別為7.796 5 s 和7.559 6 s。很明顯,算法1 的時(shí)間消耗大于算法2 的時(shí)間消耗。

        (3)當(dāng)約束條件的閾值設(shè)置為5%時(shí),計(jì)算約簡(jiǎn)的時(shí)間消耗一般要高于約束條件的閾值為10%時(shí)計(jì)算約簡(jiǎn)的時(shí)間消耗。這是因?yàn)橄鄬?duì)于閾值為5%的約束條件而言,閾值為10%時(shí)的約束更為寬松,因而約簡(jiǎn)求解時(shí)屬性評(píng)估及屬性選擇的迭代次數(shù)減少了,帶來(lái)了更低的時(shí)間消耗。以“Statlog(German Credit)(ID:6)”數(shù)據(jù)集為例,在算法2 中使用條件熵作為度量時(shí),約束條件的閾值為5%計(jì)算約簡(jiǎn)的時(shí)間消耗為4.313 6 s,而約束條件的閾值為10%計(jì)算約簡(jiǎn)的時(shí)間消耗為4.136 4 s。

        3.2 分類精度對(duì)比

        通過(guò)表4 和表5 展示的結(jié)果,不論采用KNN 分類器還是SVM 分類器,不難得出以下結(jié)論:

        (1)無(wú)論是使用近似質(zhì)量還是條件熵作為度量準(zhǔn)則時(shí),在大多數(shù)情況下,算法2 求得約簡(jiǎn)中屬性所提供的分類精度比算法1 求得約簡(jiǎn)中屬性所提供的分類精度高。這說(shuō)明算法2 的連續(xù)參數(shù)下求得的多粒度約簡(jiǎn)能夠帶來(lái)更好的分類性能。以“Libras(ID:4)”數(shù)據(jù)集為例,使用近似質(zhì)量作為度量準(zhǔn)則并將約束條件的閾值設(shè)為10%,采用KNN 分類器,算法1 求得約簡(jiǎn)中屬性所提供的分類精度為0.715 8,算法2 求得約簡(jiǎn)中屬性所提供的分類精度為0.775 0;采用SVM 分類器,算法1 求得約簡(jiǎn)中屬性所提供的分類精度為0.443 6,算法2 求得約簡(jiǎn)中屬性所提供的分類精度為0.602 8。

        (2)在大多數(shù)情況下,約束條件的閾值為5%和10%求得約簡(jiǎn)中屬性所提供的分類精度相差甚微。以“Forest type mapping(ID:3)”為例,算法2 使用近似質(zhì)量作為度量準(zhǔn)則時(shí),使用KNN 分類器,約束條件的閾值為5%和10%求得約簡(jiǎn)中屬性所提供的分類精度分別為0.858 5 和0.858 5。

        Table 3 Comparison of elapsed time of obtaining reduct表3 求解約簡(jiǎn)的時(shí)間消耗對(duì)比 s

        Table 4 Comparison of classification accuracies based on KNN表4 KNN 分類器下的分類準(zhǔn)確率對(duì)比

        Table 5 Comparison of classification accuracies based on SVM表5 SVM 分類器下的分類準(zhǔn)確率對(duì)比

        4 結(jié)束語(yǔ)

        與傳統(tǒng)約簡(jiǎn)求解方法不同,為了降低多粒度約簡(jiǎn)求解的時(shí)間消耗,本文提出了一個(gè)面向連續(xù)參數(shù)的多粒度屬性約簡(jiǎn)框架。首先構(gòu)造了連續(xù)參數(shù)下求解約簡(jiǎn)的約束條件,然后利用前向貪心搜索策略,設(shè)計(jì)了求解連續(xù)參數(shù)意義下多粒度約簡(jiǎn)的算法,最后將新提出的算法與離散參數(shù)意義下約簡(jiǎn)的求解方法進(jìn)行了對(duì)比。實(shí)驗(yàn)結(jié)果表明,所提算法不僅能夠有效地降低約簡(jiǎn)求解的時(shí)間消耗,而且所求得的約簡(jiǎn)亦能夠提供滿意的分類性能。在本文工作的基礎(chǔ)上,可就以下的問(wèn)題展開進(jìn)一步的探討:

        (1)文中僅使用近似質(zhì)量和條件熵作為度量準(zhǔn)則,未來(lái)工作中可以進(jìn)一步考慮其他度量方式,如鄰域鑒別指數(shù)[8]、決策錯(cuò)誤率[20]等。

        (2)本文僅使用了鄰域粗糙集模型來(lái)構(gòu)建連續(xù)參數(shù)下多粒度求解約簡(jiǎn)的方法,可以將連續(xù)參數(shù)的思想拓展引入到其他的粗糙集模型,如模糊粗糙集模型。

        猜你喜歡
        約簡(jiǎn)粗糙集約束條件
        基于一種改進(jìn)AZSVPWM的滿調(diào)制度死區(qū)約束條件分析
        基于Pawlak粗糙集模型的集合運(yùn)算關(guān)系
        基于二進(jìn)制鏈表的粗糙集屬性約簡(jiǎn)
        A literature review of research exploring the experiences of overseas nurses in the United Kingdom (2002–2017)
        實(shí)值多變量維數(shù)約簡(jiǎn):綜述
        基于模糊貼近度的屬性約簡(jiǎn)
        線性規(guī)劃的八大妙用
        多?;植诩再|(zhì)的幾個(gè)充分條件
        雙論域粗糙集在故障診斷中的應(yīng)用
        兩個(gè)域上的覆蓋變精度粗糙集模型
        免费观看在线一区二区| 亚洲伊人一本大道中文字幕| 国产精品熟女一区二区| 无码国产精品一区二区免费97| 亚洲综合精品在线观看中文字幕 | 一区二区三区国产亚洲网站| 亚洲另类丰满熟妇乱xxxx| 国产激情久久久久久熟女老人av| 四虎影院在线观看| 亚洲无码观看a| 免费在线视频亚洲色图| 日韩精品成人无码专区免费| 亚洲av无码专区亚洲av| 亚洲高清一区二区三区在线观看| 日韩人妻免费视频一专区| 欧美日韩精品久久久免费观看| 男女扒开双腿猛进入免费看污 | 日韩国产人妻一区二区三区| 高中生粉嫩无套第一次| 日韩不卡av高清中文字幕| 国产自拍视频免费在线观看| 日本熟妇美熟bbw| 久久亚洲av成人无码国产| 日韩精品中文字幕 一区| 久久精品亚洲成在人线av乱码| 国产边摸边吃奶叫床视频| 国产成人久久综合热| 亚洲高清av一区二区| 成熟人妻换xxxx| 中文字幕久无码免费久久| 国产成人cao在线| 丝袜美腿制服诱惑一区二区| 少妇人妻精品一区二区三区| 欧美专区在线| 国产免费99久久精品| 国产成人无码专区| 国产免费午夜a无码v视频| 日本少妇被黑人xxxxx| 国产一级淫片免费播放电影| 亚洲精品成人一区二区三区| 久久精品国产自在天天线|