摘要:決策樹是從一組數(shù)據(jù)中生成分類器的一個(gè)行之有效的方法。其中ID3算法是目前引用率較高的算法。ID3算法是以信息熵為核心的分類預(yù)測(cè)算法。然而ID3算法存在多值偏向問題,可能使得出的決策樹并不是最優(yōu)的。文章將信息增益與關(guān)聯(lián)函數(shù)生活經(jīng)驗(yàn)和相結(jié)合,改進(jìn)ID3算法,克服ID3算法偏向于選擇取值多的屬性的缺點(diǎn),提高ID3算法準(zhǔn)確率。并將改進(jìn)后的ID3算法與原算法比較,證明改進(jìn)后的ID3算法準(zhǔn)確有效。
注:因版權(quán)方要求,不能公開全文,如需全文,請(qǐng)咨詢雜志社