摘要:譜聚類(lèi)算法是一種可有效學(xué)習(xí)數(shù)據(jù)流形分布和非凸?fàn)罘植嫉木垲?lèi)算法,但其過(guò)程涉及構(gòu)建相似圖、特征分解等高計(jì)算復(fù)雜度步驟,難以直接用于大規(guī)模聚類(lèi).提出一種基于二部圖的快速聚類(lèi)算法(fast clustering based on bipartite graph,FCBG),通過(guò)對(duì)數(shù)據(jù)采樣降低原有數(shù)據(jù)結(jié)構(gòu)規(guī)模,然后基于二部圖學(xué)習(xí)采樣數(shù)據(jù)和原有數(shù)據(jù)關(guān)系.通過(guò)對(duì)二部圖對(duì)應(yīng)的拉普拉斯矩陣施加秩約束,FCBG算法可在優(yōu)化二部圖的邊的權(quán)重的同時(shí),保持二部圖的類(lèi)簇結(jié)構(gòu),最終直接給出聚類(lèi)結(jié)果,不依賴(lài)構(gòu)圖時(shí)每條邊的初始權(quán)重分配.算法計(jì)算復(fù)雜度與數(shù)據(jù)大小呈線(xiàn)性關(guān)系.實(shí)驗(yàn)表明,FCBG算法可有效學(xué)部圖的權(quán)重,并在較少的時(shí)間消耗下獲得高質(zhì)量的聚類(lèi)結(jié)果.
注:因版權(quán)方要求,不能公開(kāi)全文,如需全文,請(qǐng)咨詢(xún)雜志社
CSSCI南大期刊 下單
國(guó)際刊號(hào):1000-260X
國(guó)內(nèi)刊號(hào):44-1030/C
雜志詳情國(guó)際刊號(hào):2096-7586
國(guó)內(nèi)刊號(hào):42-1907/C