亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        決策樹ID3算法的研究與應(yīng)用

        2014-12-31 00:00:00杜麗英趙秀菊

        摘 要:決策樹算法是數(shù)據(jù)挖掘中常用的重要方法,廣泛應(yīng)用于分類和預(yù)測。本文對決策樹的ID3算法的基本思想進(jìn)行了介紹,通過應(yīng)用實(shí)例說明了構(gòu)造決策樹的實(shí)現(xiàn)過程。

        關(guān)鍵詞:決策樹;分類;ID3算法

        中圖分類號:TP311.13

        隨著計(jì)算機(jī)網(wǎng)絡(luò)技術(shù)和數(shù)據(jù)庫管理系統(tǒng)的不斷普及,在各應(yīng)用領(lǐng)域的信息系統(tǒng)的數(shù)據(jù)庫中積累了大量的數(shù)據(jù),如何從這些數(shù)據(jù)中提取出潛藏在其中的有用的信息和規(guī)則呢?從數(shù)據(jù)庫中數(shù)據(jù)發(fā)現(xiàn)知識的技術(shù)即數(shù)據(jù)挖掘應(yīng)運(yùn)而生,數(shù)據(jù)挖掘就是從這些大量的數(shù)據(jù)中提取出有意義的、有應(yīng)用價值的信息或知識的過程。決策樹是數(shù)據(jù)挖掘常用的方法之一。

        決策樹方法因其算法易于理解,具有簡單直觀,數(shù)據(jù)分析效率高等特點(diǎn),被廣泛應(yīng)用和研究,目前決策樹算法中較流行的算法有如ID3、C4.5、CART和SPRINT等,基于信息熵的ID3算法是最有影響的分類算法[1]。

        1 決策樹ID3算法

        ID3算法是決策樹中的具有代表性的算法,在建立決策樹的過程中,把信息熵作為節(jié)點(diǎn)屬性的選擇標(biāo)準(zhǔn),即選用具有最大信息增益的屬性,這就使得通過每一個非葉節(jié)點(diǎn),能獲得最多的關(guān)于數(shù)據(jù)記錄的類別信息。具體方法是:計(jì)算數(shù)據(jù)集中所有屬性的信息增益,選擇其中信息增益最大的屬性作為決策樹當(dāng)前節(jié)點(diǎn),依據(jù)該屬性的不同取值建立不同分支,再對各分支對應(yīng)的數(shù)據(jù)子集遞歸地調(diào)用此方法,由此構(gòu)造的決策樹,其中每一個節(jié)點(diǎn)屬性都是具有最大增益率的屬性,通過決策樹可以實(shí)現(xiàn)數(shù)據(jù)記錄的分類。ID3算法涉及的相關(guān)理論知識[2]定義如下:

        2 ID3算法實(shí)例

        以UCI機(jī)器學(xué)習(xí)數(shù)據(jù)集中的天氣表中14條數(shù)據(jù)為例,應(yīng)用ID3算法構(gòu)造決策樹。天氣表中主要有天氣、溫度、濕度、是否有風(fēng)、是否適于打球共5種屬性,其中是否打球?yàn)轭悇e屬性,根據(jù)天氣情況判斷是否適于打高爾夫球。ID3算法創(chuàng)建決策樹確定各個屬性節(jié)點(diǎn)時以信息增益率作為選擇標(biāo)準(zhǔn),具體步驟如下:

        2.1 計(jì)算屬性的信息增益,選取信息增益最大的屬性作為當(dāng)前節(jié)點(diǎn)。

        (3)計(jì)算屬性的信息增益:

        選取各屬性中信息增益最大的屬性作為分支節(jié)點(diǎn),即選擇“天氣”屬性為根節(jié)點(diǎn)。

        2.2 根據(jù)當(dāng)前節(jié)點(diǎn)的屬性不同取值建立節(jié)點(diǎn)的不同分支,不同分支對應(yīng)不同數(shù)據(jù)子集。采用遞歸算法,在各個數(shù)據(jù)子集中計(jì)算屬性的信息增益,選擇其中信息增益最大的為當(dāng)前節(jié)點(diǎn)屬性,這樣逐層建立決策樹[3]。對天氣表中的14條數(shù)據(jù)記錄分別以編號1-14代表。本例中按照“天氣”屬性的不同取值得到不同子集。天氣為晴的子集{1,2,8,9,11},天氣為多云的子集{3,7,12,13},天氣為雨的子集 {4,5,6,10,14}。天氣為多云的子集的各個實(shí)例數(shù)據(jù)都屬于同一個類,因此對應(yīng)分枝的類別標(biāo)記為適合打球,對其余兩個子集將繼續(xù)使用最大信息增益的節(jié)點(diǎn)屬性確定方法,直至各子集中的實(shí)例的類別標(biāo)記都屬于同一個類。

        對天氣為晴的子集{1,2,8,9,11},對天氣除外的屬性求信息增益值,選擇信息增益最大的為當(dāng)前節(jié)點(diǎn)。濕度屬性的信息增益最大,選擇濕度為當(dāng)前節(jié)點(diǎn)并向下分枝。濕度為高時所有例子的類別為不適合打球,該節(jié)點(diǎn)標(biāo)記為不適合。濕度為適中時的例子的類別為適合打球,該節(jié)點(diǎn)標(biāo)記適合。

        最后建立的決策樹如下:

        2.3 根據(jù)建立的決策樹獲取分類規(guī)則。從決策樹的根節(jié)點(diǎn)至各個葉子節(jié)點(diǎn)的各個路徑中節(jié)點(diǎn)屬性的值,可以提取出依據(jù)天氣情況是否適合打高爾夫球的一般分類規(guī)則:

        IF“天氣”:=晴 AND“濕度”=高 THEN“是否適于打球”=不適合

        IF“天氣”:=晴 AND“濕度”=適中 THEN“是否適于打球”=適合

        IF“天氣”:=多云 THEN“是否適于打球”=適合

        IF“天氣”:=雨 AND“是否有風(fēng)”=有風(fēng) THEN “是否適于打球”=不適合

        IF“天氣”:=雨 AND“是否有風(fēng)”=無風(fēng) THEN “是否適于打球”=不適合

        可以將這些規(guī)則應(yīng)用在其他數(shù)據(jù)集上,對是否適于打高爾夫球的情況進(jìn)行分類和預(yù)測。

        3 結(jié)束語

        作為一種能夠發(fā)現(xiàn)大量數(shù)據(jù)中潛在信息和規(guī)則的技術(shù)和方法,數(shù)據(jù)挖掘已經(jīng)成為各界所關(guān)注的熱點(diǎn),其中,決策樹方法以圖形的形式體現(xiàn)挖掘結(jié)果,因其具有形象直觀、分類速度快等特點(diǎn),在實(shí)際中廣泛應(yīng)用于在客戶分類劃分和預(yù)測。ID3算法是決策樹中經(jīng)典的算法,在構(gòu)造的決策樹過程中以信息增益作為選擇節(jié)點(diǎn)屬性的標(biāo)準(zhǔn)[4]。本文著重介紹了決策樹ID3算法的基本思想和特點(diǎn),結(jié)合實(shí)例說明了使用ID3算法構(gòu)造決策樹的過程,通過決策樹獲取的規(guī)則進(jìn)行判斷和預(yù)測,解決了實(shí)際應(yīng)用中的客戶分類等問題。

        參考文獻(xiàn):

        [1]孫愛東,朱梅階,涂書琴.基于屬性值的ID3算法改進(jìn)[J].計(jì)算機(jī)工程與設(shè)計(jì),2008(12):3011-3012.

        [2]黃文.決策樹的經(jīng)典算法:ID3與C4.5[J].四川文理學(xué)院學(xué)報(bào)(自然科學(xué)),2007(05):16-18.

        [3]王永梅,胡學(xué)鋼.決策樹中ID3算法的研究[J].安徽大學(xué)學(xué)報(bào)(自然科學(xué)版),2011(03):71-75.

        [4]于淑香.決策樹ID3算法的研究與應(yīng)用[J].沙洲職業(yè)工學(xué)院學(xué)報(bào),2011(02):27-30.

        作者簡介:杜麗英(1969-),女,吉林長春人,講師,碩士,研究方向:計(jì)算機(jī)。

        作者單位:吉林建筑大學(xué) 計(jì)算機(jī)科學(xué)與工程學(xué)院,長春 130118;長春市137中學(xué),長春 130051

        基金項(xiàng)目:吉林省教育廳“十二五”科學(xué)技術(shù)研究項(xiàng)目(項(xiàng)目編號:吉教科合字[2012]第198號)。

        丝袜美腿av免费在线观看| 国产av无码专区亚洲av蜜芽| 国产成人亚洲综合色婷婷 | 精品女同一区二区三区| 男人的天堂av网站| 欧洲极品少妇| 亚洲av成人一区二区三区网址 | 国产一级做a爱视频在线| 免费人成在线观看播放视频| 又硬又粗进去好爽免费| 狠狠综合久久av一区二区| 国产激情з∠视频一区二区| 亚洲美女国产精品久久久久久久久 | 青青草成人免费播放视频| 日韩精品人妻中文字幕有码在线| 亚洲男同gay在线观看| 亚洲精品久久久无码av片软件| 亚洲AVAv电影AV天堂18禁| 一区二区三区四区免费国产视频| 亚洲av免费不卡在线观看| 人妻无码中文字幕| 国产女精品视频网站免费| 日韩精品视频在线一二三| 91偷自国产一区二区三区| 亚洲av无码国产综合专区| 亚洲日韩精品欧美一区二区一| 香蕉亚洲欧洲在线一区| 亚洲精品456在线播放狼人| 亚洲中文字幕日产无码| 国产麻豆剧传媒精品国产av| 亚洲精品天堂av免费看| 亚洲情久久久精品黄色| 人人妻人人澡人人爽国产| 亚洲欧美成人一区二区在线电影| 亚洲狼人社区av在线观看| 蜜桃av在线播放视频| www夜片内射视频在观看视频| 国产尤物精品福利视频| 久久精品国产只有精品96| 国产自拍视频免费在线观看| 十四以下岁毛片带血a级|