摘要:針對(duì)在蛋白質(zhì)相互作用網(wǎng)絡(luò)上的關(guān)鍵蛋白質(zhì)識(shí)別只關(guān)注拓?fù)涮匦?蛋白質(zhì)相互作用數(shù)據(jù)中存在較高比例的假陽(yáng)性數(shù)據(jù)以及基于復(fù)合物信息的關(guān)鍵蛋白質(zhì)識(shí)別算法對(duì)節(jié)點(diǎn)的鄰域信息和復(fù)合物的挖掘?qū)﹃P(guān)鍵蛋白質(zhì)的識(shí)別影響效果考慮不夠全面等導(dǎo)致的識(shí)別準(zhǔn)確率和特異性不高的問題,提出一種基于復(fù)合物參與度和密度的關(guān)鍵蛋白質(zhì)預(yù)測(cè)算法PEC。首先融合GO注釋信息和邊聚集系數(shù)構(gòu)造加權(quán)PPI網(wǎng)絡(luò),克服假陽(yáng)性對(duì)實(shí)驗(yàn)結(jié)果的影響;基于蛋白質(zhì)相互作用的邊權(quán)重,構(gòu)造相似度矩陣,設(shè)計(jì)特征值間的最大本征差值來(lái)自動(dòng)確定劃分?jǐn)?shù)目K,同時(shí)根據(jù)加權(quán)網(wǎng)絡(luò)中的蛋白質(zhì)節(jié)點(diǎn)度來(lái)選取K個(gè)初始聚類中心,進(jìn)而利用譜聚類結(jié)合模糊C-means聚類算法實(shí)現(xiàn)復(fù)合物的挖掘,提高聚類的準(zhǔn)確率,降低數(shù)據(jù)的維數(shù);其次基于蛋白質(zhì)節(jié)點(diǎn)的復(fù)合物參與度以及節(jié)點(diǎn)鄰域子圖密度,設(shè)計(jì)出關(guān)鍵節(jié)點(diǎn)的關(guān)鍵性得分。在DIP和Krogan 2個(gè)數(shù)據(jù)集上,將PEC與DC、BC、CC、SC、IC、PeC、WDC、LIDC、LBCC和UC 10種經(jīng)典算法相比,實(shí)驗(yàn)結(jié)果表明,PEC算法能夠識(shí)別出更多的關(guān)鍵蛋白質(zhì),且聚類結(jié)果的準(zhǔn)確率和特異性較高。
注:因版權(quán)方要求,不能公開全文,如需全文,請(qǐng)咨詢雜志社。
計(jì)算機(jī)工程與科學(xué)雜志, 月刊,本刊重視學(xué)術(shù)導(dǎo)向,堅(jiān)持科學(xué)性、學(xué)術(shù)性、先進(jìn)性、創(chuàng)新性,刊載內(nèi)容涉及的欄目:算法研究、圖形與圖象、計(jì)算機(jī)網(wǎng)絡(luò)、神經(jīng)網(wǎng)絡(luò)、仿真技術(shù)研究、人工智能、研究與實(shí)現(xiàn)、試題選載與博士論文摘要等。于1973年經(jīng)新聞總署批準(zhǔn)的正規(guī)刊物。