摘要:決策樹是從一組數(shù)據(jù)中生成分類器的一個行之有效的方法。其中ID3算法是目前引用率較高的算法。ID3算法是以信息熵為核心的分類預(yù)測算法。然而ID3算法存在多值偏向問題,可能使得出的決策樹并不是最優(yōu)的。文章將信息增益與關(guān)聯(lián)函數(shù)生活經(jīng)驗和相結(jié)合,改進ID3算法,克服ID3算法偏向于選擇取值多的屬性的缺點,提高ID3算法準(zhǔn)確率。并將改進后的ID3算法與原算法比較,證明改進后的ID3算法準(zhǔn)確有效。
注:因版權(quán)方要求,不能公開全文,如需全文,請咨詢雜志社。
信息通信雜志, 月刊,本刊重視學(xué)術(shù)導(dǎo)向,堅持科學(xué)性、學(xué)術(shù)性、先進性、創(chuàng)新性,刊載內(nèi)容涉及的欄目:電子與信息科學(xué)、信息技術(shù)、通信工程、軟件理論與方法、信息系統(tǒng)及應(yīng)用、通信運營、信息管理、網(wǎng)絡(luò)與資源建設(shè)、信息傳播、信息化教育、電子政務(wù)及商務(wù)、產(chǎn)業(yè)論壇等等。于1987年經(jīng)新聞總署批準(zhǔn)的正規(guī)刊物。