摘要:跨語言句子語義相似度計算旨在計算不同語言句子之間的語義相似程度。近年來,前人提出了基于神經(jīng)網(wǎng)絡(luò)的跨語言句子語義相似度模型,這些模型多數(shù)使用卷積神經(jīng)網(wǎng)絡(luò)來捕獲文本的局部語義信息,缺少對句子中遠(yuǎn)距離單詞之間語義相關(guān)信息的獲取。該文提出一種融合門控卷積神經(jīng)網(wǎng)絡(luò)和自注意力機(jī)制的神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu),用于獲取跨語言文本句子中的局部和全局語義相關(guān)關(guān)系,從而得到文本的綜合語義表示。在SemEval-2017多個數(shù)據(jù)集上的實驗結(jié)果表明,該文提出的模型能夠從多個方面捕捉句子間的語義相似性,結(jié)果優(yōu)于基準(zhǔn)方法中基于純神經(jīng)網(wǎng)絡(luò)的模型方法。
注:因版權(quán)方要求,不能公開全文,如需全文,請咨詢雜志社。
中文信息學(xué)報雜志, 月刊,本刊重視學(xué)術(shù)導(dǎo)向,堅持科學(xué)性、學(xué)術(shù)性、先進(jìn)性、創(chuàng)新性,刊載內(nèi)容涉及的欄目:綜述、語言資源建設(shè)、機(jī)器翻譯、信息抽取與文本挖掘、情感分析與社會計算、自然語言理解與生成等。于1986年經(jīng)新聞總署批準(zhǔn)的正規(guī)刊物。