摘要:針對傳統(tǒng)的RNN算法存在梯度消失的缺陷,在面對海量新聞數(shù)據(jù),規(guī)模大且分類屬性多的情況下存在效率低的問題,該文應用了傳統(tǒng)的RNN模型改進后的LSTM神經網(wǎng)絡算法,加入了預訓練的word2vec模型。首先對新聞數(shù)據(jù)進行去除停用詞及標點、格式轉化、分詞等預處理;其次進行特征提取、分類模型構造;最后進行了分類模型訓練與測試。測試數(shù)據(jù)表明,在大數(shù)據(jù)量的情況下,使用LSTM算法具有較高的模型準確度和良好的擴展性。
注:因版權方要求,不能公開全文,如需全文,請咨詢雜志社。
梧州學院學報雜志, 雙月刊,本刊重視學術導向,堅持科學性、學術性、先進性、創(chuàng)新性,刊載內容涉及的欄目:經濟與管理、政治與法律、文化與藝術、教育與教學、計算機科學與技術、基礎理論、計算機科學與技術研究等。于1991年經新聞總署批準的正規(guī)刊物。