摘要:近年來,隨著XML數(shù)據(jù)的爆炸式增長,對(duì)XML關(guān)鍵字查詢技術(shù)的研究日益受到關(guān)注。數(shù)據(jù)編碼是關(guān)鍵字查詢的基礎(chǔ),目前主要有2種方式--基于路徑的編碼及區(qū)間編碼。區(qū)間編碼可更好地適應(yīng)對(duì)查詢中的XML數(shù)據(jù)進(jìn)行動(dòng)態(tài)的更新,因而具有更多的優(yōu)勢(shì)。本文研究基于區(qū)間編碼的關(guān)鍵字查詢問題,提出一種新的查詢算法。該算法首先根據(jù)預(yù)留的區(qū)間值建立索引,再根據(jù)最小范圍值對(duì)索引進(jìn)行選擇遍歷,減少了不必要的比較,達(dá)到了提高查詢效率的目的。研究發(fā)現(xiàn),預(yù)留空間的選擇對(duì)查詢效率有一定的影響。為此,本文設(shè)計(jì)一種基于節(jié)點(diǎn)自身進(jìn)行區(qū)間預(yù)留的編碼方式(Interval Reservation Based on Node, IRBN),為節(jié)點(diǎn)設(shè)置權(quán)值,并根據(jù)權(quán)值進(jìn)行區(qū)間值的設(shè)定,形成根據(jù)節(jié)點(diǎn)自身分配區(qū)間的較為均衡的編碼。實(shí)驗(yàn)表明,IRBN編碼是合理的,有較高的查詢效率。
注:因版權(quán)方要求,不能公開全文,如需全文,請(qǐng)咨詢雜志社。
計(jì)算機(jī)與現(xiàn)代化雜志, 月刊,本刊重視學(xué)術(shù)導(dǎo)向,堅(jiān)持科學(xué)性、學(xué)術(shù)性、先進(jìn)性、創(chuàng)新性,刊載內(nèi)容涉及的欄目:算法設(shè)計(jì)與分析、數(shù)據(jù)庫與數(shù)據(jù)挖掘、軟件工程、操作系統(tǒng)、人工智能、圖像處理、計(jì)算機(jī)仿真、計(jì)算機(jī)控制、網(wǎng)絡(luò)與通信、信息安全、電子商務(wù)、計(jì)算機(jī)輔助設(shè)計(jì)、計(jì)算機(jī)輔助教學(xué)、信息系統(tǒng)與ERP、中文信息技術(shù)、多媒體技術(shù)、農(nóng)村信息化技術(shù)、應(yīng)用與開發(fā)等等。于1985年經(jīng)新聞總署批準(zhǔn)的正規(guī)刊物。