李梅 張志軍
摘要:在ID3算法中,主要是計(jì)算出各個(gè)屬性的信息增益,比較信息增益的大小,選擇最大取值的屬性作為分裂節(jié)點(diǎn),從而生成決策樹,但是在計(jì)算時(shí),需要多次調(diào)運(yùn)log函數(shù),計(jì)算量特別大,對(duì)決策樹的生成有一定的影響。本文主要利用冪級(jí)展開式對(duì)log函數(shù)進(jìn)行改進(jìn),以此來(lái)提高計(jì)算速度。
關(guān)鍵詞:信息熵;log函數(shù);改進(jìn)
中圖分類號(hào):TP3 文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):1009-3044(2018)29-0020-01
1 ID3算法理論簡(jiǎn)介
參考文獻(xiàn):
[1]趙薇, 蘇建民. 基于ID3算法決策樹的研究與改進(jìn)[J]. 科技信息, 2008(23):383-392.
[2]袁琴琴. 基于決策樹算法的改進(jìn)與應(yīng)用[D]. 長(zhǎng)安大學(xué), 2006.
[3]蘇錦. 基于決策樹方法的學(xué)生成績(jī)分析應(yīng)用[J]. 信息通信, 2017,169(01):52-53.
[4]劉紅巖, 陳劍, 陳國(guó)青. 數(shù)據(jù)挖掘中的數(shù)據(jù)分類算法綜述[J]. 清華大學(xué)學(xué)報(bào)(自然科學(xué)版), 2002,6(42):727-730.
[5]段玉春, 朱曉艷, 孫玉強(qiáng). 一種改進(jìn)的ID3算法[J]. 南陽(yáng)師范學(xué)院學(xué)報(bào)(社會(huì)科學(xué)版), 2006,(09):63-65.
【通聯(lián)編輯:梁書】