摘要:跨語(yǔ)言信息檢索指以一種語(yǔ)言為檢索詞,檢索出用另一種或幾種語(yǔ)言描述的一種信息的檢索技術(shù),是信息檢索領(lǐng)域重要的研究方向之一。近年來(lái),跨語(yǔ)言詞向量為跨語(yǔ)言信息檢索提供了良好的詞向量表示,受到很多學(xué)者的關(guān)注。該文首先利用跨語(yǔ)言詞向量模型實(shí)現(xiàn)漢文查詢?cè)~到蒙古文查詢?cè)~的映射,其次提出串聯(lián)式查詢擴(kuò)展、串聯(lián)式查詢擴(kuò)展過(guò)濾、交叉驗(yàn)證篩選過(guò)濾三種查詢擴(kuò)展方法對(duì)候選蒙古文查詢?cè)~進(jìn)行篩選和排序,最后選取上下文相關(guān)的蒙古文查詢?cè)~。實(shí)驗(yàn)結(jié)果表明:在蒙漢跨語(yǔ)言信息檢索任務(wù)中引入交叉驗(yàn)證篩選方法對(duì)信息檢索結(jié)果有很大的提升。
注:因版權(quán)方要求,不能公開(kāi)全文,如需全文,請(qǐng)咨詢雜志社。
中文信息學(xué)報(bào)雜志, 月刊,本刊重視學(xué)術(shù)導(dǎo)向,堅(jiān)持科學(xué)性、學(xué)術(shù)性、先進(jìn)性、創(chuàng)新性,刊載內(nèi)容涉及的欄目:綜述、語(yǔ)言資源建設(shè)、機(jī)器翻譯、信息抽取與文本挖掘、情感分析與社會(huì)計(jì)算、自然語(yǔ)言理解與生成等。于1986年經(jīng)新聞總署批準(zhǔn)的正規(guī)刊物。