摘要:孤立點(diǎn)檢測(cè)是數(shù)據(jù)挖掘的重要分支之一,旨在發(fā)現(xiàn)一個(gè)數(shù)據(jù)集中與多數(shù)對(duì)象行為明顯不同的一些對(duì)象.針對(duì)分類(lèi)型矩陣數(shù)據(jù),通過(guò)給出一種矩陣對(duì)象自身的內(nèi)聚度和該矩陣對(duì)象與其他矩陣對(duì)象之間的耦合度,定義了矩陣對(duì)象的孤立因子,提出一種面向分類(lèi)型矩陣數(shù)據(jù)的孤立點(diǎn)檢測(cè)算法.在Marketbasket、Microsoft web和MovieLens真實(shí)數(shù)據(jù)集上的實(shí)驗(yàn)結(jié)果表明,與基于共同近鄰(common-neighbor-based,CNB)算法、局部異常因子(local outlierfactor,LOF)算法和基于信息熵(information entropy-based,IE-based)的算法相比,本算法能有效檢測(cè)分類(lèi)型矩陣數(shù)據(jù)中的孤立點(diǎn).
注:因版權(quán)方要求,不能公開(kāi)全文,如需全文,請(qǐng)咨詢雜志社。
深圳大學(xué)學(xué)報(bào)·人文社會(huì)科學(xué)版雜志, 雙月刊,本刊重視學(xué)術(shù)導(dǎo)向,堅(jiān)持科學(xué)性、學(xué)術(shù)性、先進(jìn)性、創(chuàng)新性,刊載內(nèi)容涉及的欄目:文明對(duì)話與文化比較、創(chuàng)意經(jīng)濟(jì)與文化產(chǎn)業(yè)、經(jīng)濟(jì)增長(zhǎng)與金融創(chuàng)新、政治空間與法治社會(huì)、城鄉(xiāng)建設(shè)與社會(huì)治理、人文天地與中國(guó)精神等。于1984年經(jīng)新聞總署批準(zhǔn)的正規(guī)刊物。