摘要:譜聚類算法是一種可有效學習數據流形分布和非凸狀分布的聚類算法,但其過程涉及構建相似圖、特征分解等高計算復雜度步驟,難以直接用于大規(guī)模聚類.提出一種基于二部圖的快速聚類算法(fast clustering based on bipartite graph,FCBG),通過對數據采樣降低原有數據結構規(guī)模,然后基于二部圖學習采樣數據和原有數據關系.通過對二部圖對應的拉普拉斯矩陣施加秩約束,FCBG算法可在優(yōu)化二部圖的邊的權重的同時,保持二部圖的類簇結構,最終直接給出聚類結果,不依賴構圖時每條邊的初始權重分配.算法計算復雜度與數據大小呈線性關系.實驗表明,FCBG算法可有效學部圖的權重,并在較少的時間消耗下獲得高質量的聚類結果.
注:因版權方要求,不能公開全文,如需全文,請咨詢雜志社。
深圳大學學報·人文社會科學版雜志, 雙月刊,本刊重視學術導向,堅持科學性、學術性、先進性、創(chuàng)新性,刊載內容涉及的欄目:文明對話與文化比較、創(chuàng)意經濟與文化產業(yè)、經濟增長與金融創(chuàng)新、政治空間與法治社會、城鄉(xiāng)建設與社會治理、人文天地與中國精神等。于1984年經新聞總署批準的正規(guī)刊物。