摘要:譜聚類(lèi)算法是一種可有效學(xué)習(xí)數(shù)據(jù)流形分布和非凸?fàn)罘植嫉木垲?lèi)算法,但其過(guò)程涉及構(gòu)建相似圖、特征分解等高計(jì)算復(fù)雜度步驟,難以直接用于大規(guī)模聚類(lèi).提出一種基于二部圖的快速聚類(lèi)算法(fast clustering based on bipartite graph,FCBG),通過(guò)對(duì)數(shù)據(jù)采樣降低原有數(shù)據(jù)結(jié)構(gòu)規(guī)模,然后基于二部圖學(xué)習(xí)采樣數(shù)據(jù)和原有數(shù)據(jù)關(guān)系.通過(guò)對(duì)二部圖對(duì)應(yīng)的拉普拉斯矩陣施加秩約束,FCBG算法可在優(yōu)化二部圖的邊的權(quán)重的同時(shí),保持二部圖的類(lèi)簇結(jié)構(gòu),最終直接給出聚類(lèi)結(jié)果,不依賴(lài)構(gòu)圖時(shí)每條邊的初始權(quán)重分配.算法計(jì)算復(fù)雜度與數(shù)據(jù)大小呈線性關(guān)系.實(shí)驗(yàn)表明,FCBG算法可有效學(xué)部圖的權(quán)重,并在較少的時(shí)間消耗下獲得高質(zhì)量的聚類(lèi)結(jié)果.
注:因版權(quán)方要求,不能公開(kāi)全文,如需全文,請(qǐng)咨詢(xún)雜志社。
深圳大學(xué)學(xué)報(bào)·人文社會(huì)科學(xué)版雜志, 雙月刊,本刊重視學(xué)術(shù)導(dǎo)向,堅(jiān)持科學(xué)性、學(xué)術(shù)性、先進(jìn)性、創(chuàng)新性,刊載內(nèi)容涉及的欄目:文明對(duì)話(huà)與文化比較、創(chuàng)意經(jīng)濟(jì)與文化產(chǎn)業(yè)、經(jīng)濟(jì)增長(zhǎng)與金融創(chuàng)新、政治空間與法治社會(huì)、城鄉(xiāng)建設(shè)與社會(huì)治理、人文天地與中國(guó)精神等。于1984年經(jīng)新聞總署批準(zhǔn)的正規(guī)刊物。