摘要:采用AP聚類算法進(jìn)行復(fù)雜網(wǎng)絡(luò)社團(tuán)挖掘,提高了社團(tuán)挖掘的精度,但在處理海量數(shù)據(jù)時(shí)算法速率明顯下降,其中一個(gè)重要原因是單臺(tái)計(jì)算機(jī)的計(jì)算性能無法滿足海量數(shù)據(jù)的計(jì)算需求。為了提高社團(tuán)挖掘AP聚類在處理海量數(shù)據(jù)時(shí)的速率,設(shè)計(jì)出一種在Hadoop框架下進(jìn)行的社團(tuán)挖掘的并行化AP聚類方法;將傳統(tǒng)單機(jī)模式下的社團(tuán)挖掘AP聚類算法在分布式平臺(tái)上分布進(jìn)行并行化。實(shí)驗(yàn)表明,社團(tuán)挖掘的并行化AP聚類方法在社團(tuán)挖掘精度不下降的情況下提高了海量數(shù)據(jù)的社團(tuán)挖掘速率。
注:因版權(quán)方要求,不能公開全文,如需全文,請咨詢雜志社