摘要:針對現(xiàn)有判定樹算法在處理空缺值和連續(xù)值以及知識表達(dá)上不精確性和復(fù)雜性問題,提出基于云變換和Rough擴(kuò)展模型的判定樹構(gòu)造算法。該算法利用云變換來離散化連續(xù)屬性,然后根據(jù)概念集,采用極大判定法對每個數(shù)值型屬性的原始屬性值進(jìn)行軟劃分,從而得到離散屬性值。最后利用特性關(guān)系下的加權(quán)平均粗糙度來選取當(dāng)前結(jié)點的分裂屬性來遞歸生成判定樹。與C5.0算法相比,新算法可妥善處理空缺值、合理離散連續(xù)屬性。試驗結(jié)果表明,該算法具有良好的實用性。
關(guān)鍵詞:云變換;粗糙集;離散屬性;超熵
中圖分類號:TP39 文獻(xiàn)標(biāo)識碼:A