摘要:互聯(lián)網(wǎng)數(shù)據(jù)的爆炸式增長,使得研究熱點(diǎn)更多轉(zhuǎn)向Web內(nèi)容結(jié)構(gòu)化分析。如果將藏語知識(shí)以結(jié)構(gòu)化形式表示,那么將會(huì)有利于藏語知識(shí)的結(jié)構(gòu)化分析和深度挖掘。該文提出了一種優(yōu)化詞向量的GRU神經(jīng)網(wǎng)絡(luò)模型進(jìn)行藏語實(shí)體關(guān)系抽取的方法。在模型的訓(xùn)練中,加入了優(yōu)化的詞向量,在傳統(tǒng)的詞向量模型中結(jié)合藏語音節(jié)向量、音節(jié)位置向量、詞性向量等特征對(duì)詞向量進(jìn)一步優(yōu)化,并且選取了藏語詞匯特征和藏語句子特征。實(shí)驗(yàn)證明,通過使用改進(jìn)詞向量F1值達(dá)到了78.43%。
注:因版權(quán)方要求,不能公開全文,如需全文,請(qǐng)咨詢雜志社。
中文信息學(xué)報(bào)雜志, 月刊,本刊重視學(xué)術(shù)導(dǎo)向,堅(jiān)持科學(xué)性、學(xué)術(shù)性、先進(jìn)性、創(chuàng)新性,刊載內(nèi)容涉及的欄目:綜述、語言資源建設(shè)、機(jī)器翻譯、信息抽取與文本挖掘、情感分析與社會(huì)計(jì)算、自然語言理解與生成等。于1986年經(jīng)新聞總署批準(zhǔn)的正規(guī)刊物。