亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于粗糙集的數(shù)據(jù)挖掘算法研究

        2018-12-24 15:06:05許曉燕三門峽職業(yè)技術學院
        數(shù)碼世界 2018年7期
        關鍵詞:論域粗糙集決策樹

        許曉燕 三門峽職業(yè)技術學院

        引言:粗糙集理論是由波蘭著名數(shù)學家Pawlak Z所提出的,該理論在分析與表達不完整與不準確數(shù)據(jù)中非常適用,粗糙集理論是通過對一個或一組機構中所產(chǎn)生的信息數(shù)據(jù)進行測量與觀察,以實現(xiàn)對信息數(shù)據(jù)的分類,并從中找出數(shù)據(jù)所具備的某些特點、對象及過程等,以為認知科學與信息科學提供可靠的研究方法與全新的科學邏輯,其也是實現(xiàn)信息智能化處理的重要處理技術。通常來說,數(shù)據(jù)挖掘作為知識發(fā)現(xiàn)中的關鍵環(huán)節(jié),其是在某種約束的基礎上,通過數(shù)據(jù)發(fā)現(xiàn)與數(shù)據(jù)分析算法的應用,以從中找出特定模式。對數(shù)學挖掘進行研究的主要方法有回歸、分類、歸納及聚類等,正是由于數(shù)據(jù)挖掘中存在諸多不準確與不完整的數(shù)據(jù),這也使粗糙集理論成為數(shù)據(jù)挖掘中的重要方法之一。不過,由于大量數(shù)據(jù)的產(chǎn)生,使數(shù)據(jù)集也變得越來越復雜,僅僅采用粗糙集理論來對數(shù)據(jù)集進行分類,其結果的穩(wěn)定性與精度也往往較差,而且在交互驗證方面的能力較為欠缺,因此需要將其與其他方法進行結合應用才能取得更好的應用效果。為此,本文便針對上述不足,對基于粗糙集的數(shù)據(jù)挖掘算法進行了研究,并將決策樹與粗糙集結合起來,以提高數(shù)據(jù)挖掘算法的各方面性能。

        1 粗糙集理論分析

        粗糙集理論是以現(xiàn)有知識來劃分特定問題中的論域,并根據(jù)劃分后論域中各個組成對概念的支持程度來進行分類,這種支持程度包括肯定支持、不支持與可能支持。其通過上下限定域與邊界這三個近似集合來對上述三種支持程度進行表示。

        1.1 粗糙集定義

        在粗糙集理論中共包含三大定義,在第一定義中,論域由U進行表示,該論域?qū)儆谝粋€對象集合,在論域U上存在一個劃分R,由此可稱<U,R>是近似空間,當并且時,則任何滿足該條件的 ,其均為論域 中的等價關系,由此可判定為和P之間具備不可分辨關系,可利用 來對這種關系進行表示。當時,則 的下近似集與上近似集分別可表示為與,而X的邊界域則可表示成。在第二定義中,在某一知識系統(tǒng)中,可將其表示為 ,并且在該知識系統(tǒng)中,其對象集合、屬性集合以及屬性值集合分別由U、Ω與進行表示,各個滿足的均存在一個映射函數(shù),可由對其進行表示,對于來說,可將其表示為,其代表對象中第個屬性所具備的值。在第三定義中,可將論域U的分辨矩陣進行定義,使其表述為,而在該知識表述中的,可表示為,通過該分辨矩陣的定義,能夠?qū)Υ植诩疘nd(Ω)進行轉(zhuǎn)換,使其成為M(Ω)。

        1.2 粗糙集在數(shù)據(jù)挖掘中的知識表達

        精糙集在數(shù)據(jù)挖掘的知識表達中,主要是通過決策系統(tǒng)來表達知識的,其也是數(shù)據(jù)挖掘中對知識進行表達的重要方式,可以說,決策系統(tǒng)自身便是一個包含有決定域的系統(tǒng)。設定,由 來表示決策知識系統(tǒng),即在 中包含有一個特定子集 ,該子集代表條件屬性集合,而在 中還包括一個特定子集 ,該子集可用來對決策屬性集合進行表示。在該決策系統(tǒng)中,可將其分辨矩陣進行定義,即其中可表示為決策系統(tǒng)中,當Ind(C,D)表示為時,其在該決策系統(tǒng)中具備不可分辨關系。在決策系統(tǒng)所包含的條件屬性C中,與其相對應的約減集則屬于非空子集,則相等,其約減可表示成,而全部約減集之間的交集則可表示為之間相等。

        2 基于粗糙集的數(shù)據(jù)挖掘算法研究

        在基于粗糙集的數(shù)據(jù)挖掘算法中,其挖掘數(shù)據(jù)庫中存在的規(guī)則需要通過以下步驟來實現(xiàn),第一步為預處理步驟,預處理能夠?qū)崿F(xiàn)數(shù)據(jù)庫中所包含的初始數(shù)據(jù)與粗糙集之間的形式轉(zhuǎn)換,同時對決策與條件屬性進行確定;第二步為數(shù)據(jù)約減,通過對不可分辨矩陣的生成以得到相應的約減屬性集;第三步是挖掘規(guī)則,首先要根據(jù)約減屬性集來建立約減信息表,然后通過可信度閾值來對規(guī)則進行挖掘?;诖植诩臄?shù)據(jù)挖掘算法共分為兩種,第一種為分辨矩陣生成算法,該算法將 輸入到數(shù)據(jù)庫當中,以使初始數(shù)據(jù)和粗糙集進行形式轉(zhuǎn)換,進而輸出相應的分辨矩陣,即 。該算法共分為六步,第一步是將 進行轉(zhuǎn)換,從而得到一個維度為 的空屬性集矩陣;第二步是根據(jù)得出的空屬性集矩陣來生成分辨矩陣,并由分辨矩陣得到 ;第三步是對分辨矩陣進行求核,如果 ,在 中添加 ;第四步是把包含 的矩陣進行元素置空;第五步是得出矩陣中次數(shù)出現(xiàn)最多的屬性,用 來表示該屬性,然后將其添加到 當中,并將矩陣中包含的 屬性進行元素置空;第六步是假如 不等于 ,則需要返回到第五步中進行求核,如果相等,則算法結束。第二種為規(guī)則挖掘算法,該算法的輸入內(nèi)容包括可信度的閾值,由 來對該閾值進行表示,此外輸入內(nèi)容還包括條件屬性。規(guī)則挖掘算法的最終輸出為規(guī)則集。規(guī)則挖掘算法在應用過程中共分為三個步驟,第一步是將條件屬性 作為輸入條件;第二步是在 中獲得和C1屬性相一致的元素,并對元素的數(shù)量進行統(tǒng)計,由N代表元素數(shù)量,然后找到和屬性D與C1均一致的元素,并對元素數(shù)量進行統(tǒng)計,由M代表元素數(shù)量;第三步是如果劃分大小與N之間的商比可信度閾值高,并且挖掘出的規(guī)則不處于規(guī)則表中,則對該規(guī)則進行輸出。

        決策系統(tǒng)通過計算能夠生成該系統(tǒng)的分辨矩陣,通過該分辨矩陣能夠得出 與 相等,并以約減作為出發(fā)點,以此衍生出相應的節(jié)點,并通過決策系統(tǒng)將各個節(jié)點中滿足 的節(jié)點規(guī)則進行記錄,然后將其存儲到規(guī)則集當中。粗糙理論是根據(jù)等價關系來生成近似空間的,在該近似空間中所包含的上近似集與下近似集能夠為人們在找出確定與不確定區(qū)域中帶來幫助,從而使該理論能夠適用于數(shù)據(jù)挖掘工作中。

        3 基于粗糙集的數(shù)據(jù)挖掘算法的優(yōu)劣勢及解決策略

        通過上述分析可知,基于粗糙集的數(shù)據(jù)挖掘算法是利用等價關系來對集合中的對象實施分類的,通過對集合進行某種形式的劃分,以使其能夠和等價關系相對應,并根據(jù)等價類粒度來進行信息處理,從而使信息得到簡化?;诖植诩臄?shù)據(jù)挖掘算法在應用方面具備以下優(yōu)勢,其一,其可通過固定算法來對問題進行表達與解決,并且能夠通過軟計算的方式來對不確定、不完整與不精確的數(shù)據(jù)進行處理,從而使算法具備成本低與魯棒性強的優(yōu)勢;其二,基于粗糙集的數(shù)據(jù)挖掘算法不需預先提供某種屬性或特征來進行數(shù)學描述,其能夠?qū)栴}所具備的潛在規(guī)律進行直接挖掘,同時其在不確定性問題的描述方面較為客觀;其三,基于粗糙集的數(shù)據(jù)挖掘算法能夠適用于各種確定與不確定的數(shù)據(jù)分析,并且能夠?qū)Σ煌暾c不精確的多變量數(shù)據(jù)進行分析,使數(shù)據(jù)得到簡化的同時,找出數(shù)據(jù)中存在的知識與推理決策規(guī)則,其數(shù)學意義非常清晰;其四,基于粗糙集的數(shù)據(jù)挖掘算法是對不確定性與模糊性問題進行處理的重要工具,其能夠通過上下近似集差來對問題的不確定性進行描述,并且能夠計算含糊元素的數(shù)量,有效降低了算法的隨意性。雖然粗糙集的數(shù)據(jù)挖掘算法具備非常明顯的應用優(yōu)勢,但其自身也存在一定的不足,隨著數(shù)據(jù)量的不斷增長,決策表規(guī)模也不斷擴大,僅僅通過粗糙集的應用是難以滿足各種類型數(shù)據(jù)集處理的,而且采用粗糙集理論來對數(shù)據(jù)進行挖掘后分類,其分類結果常常是確定的,這也使算法的交互驗證能力較差,造成數(shù)據(jù)挖掘的結果穩(wěn)定性較差,精度較低。因此,需要在基于粗糙集的數(shù)據(jù)挖掘算法中引入其他方法來對該問題進行解決。

        4 基于粗糙集與決策樹結合的數(shù)據(jù)挖掘算法

        為了解決基于粗糙集的數(shù)據(jù)挖掘算法交互驗證能力差、結果穩(wěn)定性不足、精度較低的問題,需要將決策樹引入到該算法當中,以使粗糙集理論能夠和決策樹進行結合應用,決策樹作為一種歸納推理算法,其在各個領域中的應用十分廣泛,決策樹的分類精度較高,并且其構造也較為簡單,非常適用于噪聲數(shù)據(jù)的處理,同時考慮到單變量決策樹往往具備較大的規(guī)模,處理全部的數(shù)據(jù)集是無法實現(xiàn)的,因此需要通過多變量決策樹來降低決策樹的規(guī)模,以使分類精度得到相應的提高。具體實施如下:首先是對決策表進行預處理,采用基于粗糙集的數(shù)據(jù)挖掘算法來對數(shù)據(jù)集進行屬性約減,以使冗余屬性得以清除,進而使決策表的維度降低,然后通過聚類技術的應用來劃分等價類對象,以使同組對象的相似性更大,并從各個組中提取一個對象當作處理樣本,以使數(shù)據(jù)量減少,然后將屬性作為權重,并引入到相似度求解公式中,這樣能夠使數(shù)據(jù)對象具備更高的相似度,此外,還需要將屬性集的重要程度當作決策樹中節(jié)點的衡量標準,并將兩等價類之間的相對泛化當作決策樹中節(jié)點檢驗的標準,同時確保各個節(jié)點的屬性個數(shù)不能超過兩個。

        5 結束語

        綜上所述,本文通過對粗糙集理論進行分析,明確了粗糙集的定義及其知識表達,并對基于粗糙集的數(shù)據(jù)挖掘算法進行了深入的研究,闡述了粗糙集理論在數(shù)據(jù)挖掘算法中的具體應用,分析了其應用的可行性,在此基礎上分析了基于粗糙集的數(shù)據(jù)挖掘算法的優(yōu)勢與不足,并針對其不足之處提出了相應的解決策略,通過粗糙集與決策樹兩種方法的結合來進行數(shù)據(jù)挖掘,不僅能夠改善數(shù)據(jù)挖掘算法的交互驗證能力,還能提高數(shù)據(jù)挖掘結果的精度與穩(wěn)定性,從而使基于粗糙集的數(shù)據(jù)挖掘算法更能滿足人們的數(shù)據(jù)挖掘需求。

        猜你喜歡
        論域粗糙集決策樹
        基于Pawlak粗糙集模型的集合運算關系
        基于變論域模糊控制的Taylor逼近型內(nèi)模PID算法
        一種針對不均衡數(shù)據(jù)集的SVM決策樹算法
        變論域自適應模糊PID控制系統(tǒng)仿真與應用
        測控技術(2018年10期)2018-11-25 09:35:52
        決策樹和隨機森林方法在管理決策中的應用
        電子制作(2018年16期)2018-09-26 03:27:06
        多?;植诩再|(zhì)的幾個充分條件
        基于決策樹的出租車乘客出行目的識別
        雙論域粗糙集在故障診斷中的應用
        微生物燃料電池的變論域自適應模糊控制研究
        電源技術(2016年2期)2016-02-27 09:04:56
        兩個域上的覆蓋變精度粗糙集模型
        日韩av中出在线免费播放网站| 午夜久久久久久禁播电影| 日韩网红少妇无码视频香港| 国产莉萝无码av在线播放| 免费无码国产v片在线观看| 色婷婷精品综合久久狠狠| 国产一区二区一级黄色片| 手机在线播放av网址| 日本一道综合久久aⅴ免费| 国模欢欢炮交啪啪150 | 亚洲成av人片女在线观看| 少妇内射兰兰久久| 久久久久久久性潮| 国产精品国产三级国产AvkTV | 亚洲综合天堂av网站在线观看| 国产色无码精品视频国产| 午夜家庭影院| 日本一极品久久99精品| 中文字幕亚洲一区二区三区| 精品亚洲a∨无码一区二区三区| 少妇下蹲露大唇无遮挡| 久久久久久中文字幕有精品| 一区二区亚洲 av免费| 国产亚洲午夜精品久久久| 亚洲香蕉成人av网站在线观看| 国产成人精品av| 久久99亚洲综合精品首页| 国产高清大片一级黄色| 日本视频二区在线观看| 无码av天堂一区二区三区| 深夜国产成人福利在线观看女同| 人妻少妇精品视频中文字幕国语| 久久av粉嫩一区二区| 亚洲成a人片在线观看无码3d| 亚洲欧洲精品成人久久曰影片| 免費一级欧美精品| 精品人妻码一区二区三区红楼视频 | 亚洲综合国产精品一区二区| 四虎永久在线精品免费一区二区 | 麻豆av毛片在线观看| 国产精品久久久天天影视|