摘要:孤立點(diǎn)檢測(cè)是數(shù)據(jù)挖掘的重要分支之一,旨在發(fā)現(xiàn)一個(gè)數(shù)據(jù)集中與多數(shù)對(duì)象行為明顯不同的一些對(duì)象.針對(duì)分類(lèi)型矩陣數(shù)據(jù),通過(guò)給出一種矩陣對(duì)象自身的內(nèi)聚度和該矩陣對(duì)象與其他矩陣對(duì)象之間的耦合度,定義了矩陣對(duì)象的孤立因子,提出一種面向分類(lèi)型矩陣數(shù)據(jù)的孤立點(diǎn)檢測(cè)算法.在Marketbasket、Microsoft web和MovieLens真實(shí)數(shù)據(jù)集上的實(shí)驗(yàn)結(jié)果表明,與基于共同近鄰(common-neighbor-based,CNB)算法、局部異常因子(local outlierfactor,LOF)算法和基于信息熵(information entropy-based,IE-based)的算法相比,本算法能有效檢測(cè)分類(lèi)型矩陣數(shù)據(jù)中的孤立點(diǎn).
注:因版權(quán)方要求,不能公開(kāi)全文,如需全文,請(qǐng)咨詢雜志社
CSSCI南大期刊 下單
國(guó)際刊號(hào):1000-260X
國(guó)內(nèi)刊號(hào):44-1030/C
雜志詳情