摘要:針對(duì)在蛋白質(zhì)相互作用網(wǎng)絡(luò)上的關(guān)鍵蛋白質(zhì)識(shí)別只關(guān)注拓?fù)涮匦?蛋白質(zhì)相互作用數(shù)據(jù)中存在較高比例的假陽(yáng)性數(shù)據(jù)以及基于復(fù)合物信息的關(guān)鍵蛋白質(zhì)識(shí)別算法對(duì)節(jié)點(diǎn)的鄰域信息和復(fù)合物的挖掘?qū)﹃P(guān)鍵蛋白質(zhì)的識(shí)別影響效果考慮不夠全面等導(dǎo)致的識(shí)別準(zhǔn)確率和特異性不高的問(wèn)題,提出一種基于復(fù)合物參與度和密度的關(guān)鍵蛋白質(zhì)預(yù)測(cè)算法PEC。首先融合GO注釋信息和邊聚集系數(shù)構(gòu)造加權(quán)PPI網(wǎng)絡(luò),克服假陽(yáng)性對(duì)實(shí)驗(yàn)結(jié)果的影響;基于蛋白質(zhì)相互作用的邊權(quán)重,構(gòu)造相似度矩陣,設(shè)計(jì)特征值間的最大本征差值來(lái)自動(dòng)確定劃分?jǐn)?shù)目K,同時(shí)根據(jù)加權(quán)網(wǎng)絡(luò)中的蛋白質(zhì)節(jié)點(diǎn)度來(lái)選取K個(gè)初始聚類中心,進(jìn)而利用譜聚類結(jié)合模糊C-means聚類算法實(shí)現(xiàn)復(fù)合物的挖掘,提高聚類的準(zhǔn)確率,降低數(shù)據(jù)的維數(shù);其次基于蛋白質(zhì)節(jié)點(diǎn)的復(fù)合物參與度以及節(jié)點(diǎn)鄰域子圖密度,設(shè)計(jì)出關(guān)鍵節(jié)點(diǎn)的關(guān)鍵性得分。在DIP和Krogan 2個(gè)數(shù)據(jù)集上,將PEC與DC、BC、CC、SC、IC、PeC、WDC、LIDC、LBCC和UC 10種經(jīng)典算法相比,實(shí)驗(yàn)結(jié)果表明,PEC算法能夠識(shí)別出更多的關(guān)鍵蛋白質(zhì),且聚類結(jié)果的準(zhǔn)確率和特異性較高。
注:因版權(quán)方要求,不能公開(kāi)全文,如需全文,請(qǐng)咨詢雜志社
國(guó)際刊號(hào):2096-7586
國(guó)內(nèi)刊號(hào):42-1907/C