摘要:社交網(wǎng)絡(luò)中識(shí)別用戶身份具有重要價(jià)值,它對(duì)社交網(wǎng)絡(luò)的分析與監(jiān)管、用戶行為的預(yù)測(cè)以及用戶之間交互過程的研究具有重要意義.該文針對(duì)社交網(wǎng)絡(luò)中的用戶身份進(jìn)行研究,將用戶身份分為組織用戶和個(gè)人用戶,并對(duì)這兩種用戶身份進(jìn)行具體定義和識(shí)別.該文研究問題屬于社交網(wǎng)絡(luò)用戶分析研究中的子研究問題,主要通過用戶在社交網(wǎng)絡(luò)中發(fā)表的文本內(nèi)容、多媒體內(nèi)容以及用戶時(shí)間序列內(nèi)容識(shí)別出該用戶的組織-個(gè)人身份,為社交網(wǎng)絡(luò)用戶身份的識(shí)別及進(jìn)一步研究提供借鑒和幫助.在識(shí)別過程中,通過對(duì)文本內(nèi)容中用戶的口語(yǔ)化水平、內(nèi)容(主題)復(fù)雜化水平、內(nèi)容規(guī)范化水平的度量以及多媒體內(nèi)容中用戶圖片特性和用戶時(shí)間序列內(nèi)容的分析,從不同角度提出5種機(jī)器可操作的用戶組織-個(gè)人身份識(shí)別方法,進(jìn)而識(shí)別出社交網(wǎng)絡(luò)中用戶是組織用戶還是個(gè)人用戶.最后,為了驗(yàn)證該文所提識(shí)別方法的可行性和有效性,該文選擇新浪微博數(shù)據(jù)進(jìn)行實(shí)驗(yàn),并通過概率模型識(shí)別方法進(jìn)行了對(duì)比分析.同時(shí),在驗(yàn)證過程中,使用多種指標(biāo)對(duì)實(shí)驗(yàn)結(jié)果進(jìn)行評(píng)價(jià).實(shí)驗(yàn)結(jié)果表明,該文識(shí)別方法能夠有效識(shí)別出用戶的組織-個(gè)人身份,其中內(nèi)容復(fù)雜特性識(shí)別方法、內(nèi)容規(guī)范化識(shí)別方法以及時(shí)間序列內(nèi)容識(shí)別方法的用戶身份識(shí)別準(zhǔn)確率超過80%.
注:因版權(quán)方要求,不能公開全文,如需全文,請(qǐng)咨詢雜志社
國(guó)際刊號(hào):2096-7586
國(guó)內(nèi)刊號(hào):42-1907/C