亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于rough sets的不完備數(shù)據(jù)分析研究

        2011-01-31 15:38:54趙東陽
        科學(xué)之友 2011年12期
        關(guān)鍵詞:約簡粗糙集結(jié)點(diǎn)

        趙東陽

        (魯東大學(xué)信息科學(xué)與工程學(xué)院,山東 煙臺 264025)

        1982年,波蘭數(shù)學(xué)家Pawlak等人首次提出了粗糙集理論,粗糙集理論的主要思想是在保持知識庫分類能力不變的前提下,導(dǎo)出問題的決策和分類規(guī)則。粗糙集理論自身的特點(diǎn)和優(yōu)勢使其在數(shù)據(jù)挖掘方面獲得了巨大的成功,在數(shù)據(jù)挖掘和數(shù)據(jù)庫知識發(fā)現(xiàn)等研究領(lǐng)域正在扮演越來越重要的角色,逐漸成為該領(lǐng)域研究的重要分支。

        1 不完備信息系統(tǒng)RS處理方法

        Pawlak所提出的RS理論是面向完備信息系統(tǒng)的,在面對某些不完備系統(tǒng)時(shí),必須對 RS理論的基本概念進(jìn)行必要的擴(kuò)充,以使其能夠?qū)@些系統(tǒng)進(jìn)行直接處理。擴(kuò)充法是一種直接處理方法,也是研究不完備信息系統(tǒng)的最有效的方法。

        1.1 容差關(guān)系

        在“遺漏”語義下處理不完備信息系統(tǒng)而定義的一種二元關(guān)系即容差關(guān)系。每個(gè)個(gè)體對象都具有潛在的完備信息,而當(dāng)前只是遺漏了這些值,于是由于這些不精確的知識迫使人們?nèi)ヌ幚碇挥胁糠中畔⒌牟煌陚湫畔⒈怼?/p>

        1.2 非對稱相似關(guān)系

        由Stefanow ski 等人提出的面向不完備信息系統(tǒng)的相似關(guān)系則是基于對“缺失值”語義的如下理解:一個(gè)屬性的缺失值不僅可能由于現(xiàn)有知識的不精確,還可能因?yàn)樗揪筒荒苡矛F(xiàn)有的屬性值來描述。因此相似關(guān)系中不允許比較缺失值,不完備信息系統(tǒng)S=(U,A)上的相似關(guān)系定義S為:

        顯然,相似關(guān)系S是不對稱的,實(shí)質(zhì)上是一種包含關(guān)系的表示,因?yàn)橹灰獫M足“x的描述”包含于“y的描述”就可以認(rèn)為“x相似于y”。

        1.3 限制容差關(guān)系

        王國胤教授將容差關(guān)系和相似關(guān)系看作是對不可分辨關(guān)系擴(kuò)充的兩個(gè)極端,因?yàn)槿莶铌P(guān)系的條件太寬松,易于將根本沒有相同已知屬性信息的實(shí)例誤分到同一個(gè)容差類;而相似關(guān)系卻可能將具有很多相同關(guān)系一直屬性信息的實(shí)例分到不同的相似類。因此,王國胤教授提出了一種介于這兩種極端擴(kuò)充之間的限制容差關(guān)系——限制容差關(guān)系的粗糙集模型。該模型是基于容差關(guān)系與基于非對稱相似關(guān)系粗糙集模型的改進(jìn)。

        1.4 量化容差關(guān)系

        為了進(jìn)一步刻畫容差關(guān)系和相似關(guān)系中兩個(gè)實(shí)例之間的“相似”程度,Stefanow ski等人提出了基于量化容差關(guān)系的擴(kuò)充 RS理論模型。通過應(yīng)用不同的比較規(guī)則可以得到不同類型的量化容差關(guān)系。給定一個(gè)量化容差關(guān)系,對論域U中的每個(gè)實(shí)例,Stefanow ski定義了“容差類”的概念,它是一個(gè)用關(guān)于參考元素的“容差度”作為成員函數(shù)的模糊集。量化容差關(guān)系著重于對存在容差關(guān)系或相似關(guān)系的實(shí)例之間的“容差(或相似)程度”進(jìn)行進(jìn)一步的細(xì)化,其研究思路是自然、正確的。

        2 屬性約簡

        數(shù)據(jù)挖掘要處理的初始信息系統(tǒng)中經(jīng)常包含大量的無關(guān)或冗余屬性,這些屬性的存在不僅會阻礙挖掘進(jìn)程,而且會降低最終挖掘知識的正確性和精簡度。RS理論中將刪除信息系統(tǒng)中的無關(guān)或冗余屬性的過程稱作屬性約簡。通過屬性約簡最終得到的屬性集成為信息系統(tǒng)的一個(gè)約簡(Reduct),它是保持原始決策表中條件屬性和決策屬性的依賴關(guān)系不發(fā)生變化的最小屬性集合。由于求取一個(gè)決策表的所有約簡是一個(gè) NP問題,通常在實(shí)際應(yīng)用中很難實(shí)現(xiàn)。因此 Liang等人提出了一種不完備信息系統(tǒng)中求取屬性約簡的啟發(fā)性算法。對數(shù)據(jù)進(jìn)行屬性約簡的意義,主要從以下幾個(gè)方面考慮:①從機(jī)器學(xué)習(xí)的角度來看,屬性約簡對于去除噪聲非常有意義;②對一些學(xué)習(xí)算法而言,訓(xùn)練或分類時(shí)間隨著數(shù)據(jù)維數(shù)的增加而增加,經(jīng)過屬性約簡可以降低計(jì)算復(fù)雜度,減少計(jì)算時(shí)間;③假如不進(jìn)行屬性約簡,噪聲或不相關(guān)屬性和期望屬性對分類的作用一樣,就會對最終結(jié)果產(chǎn)生負(fù)面影響;④當(dāng)用較多的特征來描述數(shù)據(jù)時(shí),數(shù)據(jù)均值將表現(xiàn)得更加相似,難以區(qū)分。

        3 規(guī)則抽取

        使用 RS理論進(jìn)行數(shù)據(jù)挖掘,其最終獲得的知識是以規(guī)則的形式給出的。規(guī)則抽取是數(shù)據(jù)挖掘中最重要和最關(guān)鍵的一步,它是指從經(jīng)過處理的決策表中抽取出以規(guī)則形式表示的知識。目前用于分類問題的方法主要分為兩類:符號方法和連接主義方法。符號方法是基于決策樹、粗集理論等技術(shù),得到的分類知識以分類規(guī)則的形式出現(xiàn);而連接主義方法則以神經(jīng)網(wǎng)絡(luò)為代表,其知識蘊(yùn)含在結(jié)構(gòu)中不易為人所理解,因此一度被人們認(rèn)為不適合進(jìn)行數(shù)據(jù)挖掘。然而由于神經(jīng)網(wǎng)絡(luò)在分類問題中具有分類精度高、魯棒性好等優(yōu)點(diǎn),很多研究者都致力于從神經(jīng)網(wǎng)絡(luò)中抽取分類規(guī)則。神經(jīng)網(wǎng)絡(luò)的基本思路是基于搜索的算法,對于任一給定的隱結(jié)點(diǎn)或輸出結(jié)點(diǎn),先提取符號規(guī)則,然后對生成的規(guī)則按網(wǎng)絡(luò)的傳導(dǎo)途徑進(jìn)行連接和整理。有的文獻(xiàn)提出了一種從訓(xùn)練后的三層前饋網(wǎng)絡(luò)中抽取分類規(guī)則的方法。該方法首先對每個(gè)隱層結(jié)點(diǎn)的輸出值進(jìn)行離散化;然后分別導(dǎo)出隱層結(jié)點(diǎn)與輸出層結(jié)點(diǎn)之間的規(guī)則(規(guī)則集 1)和輸入層結(jié)點(diǎn)與隱層結(jié)點(diǎn)之間的規(guī)則(規(guī)則集2);最后將兩部分規(guī)則進(jìn)行合并得到最終的分類規(guī)則。總之,從神經(jīng)網(wǎng)絡(luò)中抽取規(guī)則是一個(gè)復(fù)雜的過程,這其中隱結(jié)點(diǎn)的離散化過程不僅繁瑣,而且易丟失信息。另外,當(dāng)數(shù)據(jù)量增多、網(wǎng)絡(luò)規(guī)模變大時(shí),網(wǎng)絡(luò)訓(xùn)練和規(guī)則抽取的時(shí)間代價(jià)將會非常大。

        1 陳珂、宣仲良.一種基于粗糙集理論的 ROUSTIDA改進(jìn)算法[J].電腦與信息技術(shù),2008(3):32~33.

        2 朱小飛、卓麗霞.一種基于量化容差關(guān)系的不完備數(shù)據(jù)分析方法[J].重慶工學(xué)院學(xué)報(bào),2005(5):23~24.

        猜你喜歡
        約簡粗糙集結(jié)點(diǎn)
        基于Pawlak粗糙集模型的集合運(yùn)算關(guān)系
        基于二進(jìn)制鏈表的粗糙集屬性約簡
        實(shí)值多變量維數(shù)約簡:綜述
        Ladyzhenskaya流體力學(xué)方程組的確定模與確定結(jié)點(diǎn)個(gè)數(shù)估計(jì)
        基于模糊貼近度的屬性約簡
        多?;植诩再|(zhì)的幾個(gè)充分條件
        雙論域粗糙集在故障診斷中的應(yīng)用
        兩個(gè)域上的覆蓋變精度粗糙集模型
        一種改進(jìn)的分布約簡與最大分布約簡求法
        河南科技(2014年7期)2014-02-27 14:11:29
        基于Raspberry PI為結(jié)點(diǎn)的天氣云測量網(wǎng)絡(luò)實(shí)現(xiàn)
        一本一道av中文字幕无码| 在线观看欧美精品| 少妇人妻偷人精品无码视频| av中文字幕少妇人妻| 国内精品女同一区二区三区| 国产一区二区三区精品免费av| 欧美成人精品a∨在线观看| 亚洲熟女乱色一区二区三区| 免费国产黄片视频在线观看| 亚洲国产精品av麻豆一区| 中国孕妇变态孕交xxxx| 国产成人精品999在线观看| 亚洲成在人网av天堂| 丝袜人妻中文字幕首页| 精品国产一区二区三区2021| 人妻系列无码专区久久五月天| 狠狠色狠狠色综合网老熟女| 高清不卡av在线播放| 久久人妻av一区二区软件| 国产精品久久婷婷六月丁香| 91精品国产高清久久久久| 国产高清人肉av在线一区二区| 日韩国产精品无码一区二区三区 | 国产亚洲欧美精品久久久| 高清无码一区二区在线观看吞精| 亚洲成av人片在线天堂无| 日本免费大片一区二区| 少妇高潮惨叫正在播放对白| 999久久66久6只有精品| 成人av资源在线观看| 久久久噜噜噜久久| 97se在线| 一级午夜理论片日本中文在线| 国精产品一区一区三区有限在线 | 欧洲freexxxx性少妇播放 | 男男车车的车车网站w98免费| AV人人操| 网站在线观看视频一区二区| 亚洲中文字幕日产无码| 国产在线精品一区二区| 大陆啪啪福利视频|