摘要:數(shù)據(jù)庫系統(tǒng)經(jīng)過近50年的發(fā)展,雖然已經(jīng)普遍商用,但隨著大數(shù)據(jù)時代的到來,數(shù)據(jù)庫系統(tǒng)在2個方面面臨挑戰(zhàn).首先數(shù)據(jù)量持續(xù)增大期望單個查詢?nèi)蝿?wù)具有更快的處理速度;其次查詢負載的快速變化及其多樣性使得基于DBA經(jīng)驗的數(shù)據(jù)庫配置和查詢優(yōu)化偏好不能實時地調(diào)整為最佳運行時狀態(tài).而數(shù)據(jù)庫系統(tǒng)的性能優(yōu)化進入瓶頸期,優(yōu)化空間收窄,進一步優(yōu)化只能依托新的硬件加速器來實現(xiàn),傳統(tǒng)的數(shù)據(jù)庫系統(tǒng)不能夠有效利用現(xiàn)代的硬件加速器;數(shù)據(jù)庫系統(tǒng)具有成百個可調(diào)參數(shù),面對工作負載頻繁變化,大量繁瑣的參數(shù)配置已經(jīng)超出DBA的能力,這使得數(shù)據(jù)庫系統(tǒng)面對快速而又多樣性的變化缺乏實時響應(yīng)能力.當(dāng)下機器學(xué)習(xí)技術(shù)恰好同時符合這2個條件:應(yīng)用現(xiàn)代加速器以及從眾多參數(shù)調(diào)節(jié)經(jīng)驗中學(xué)習(xí).機器學(xué)習(xí)化數(shù)據(jù)庫系統(tǒng)將機器學(xué)習(xí)技術(shù)引入到數(shù)據(jù)庫系統(tǒng)設(shè)計中.一方面將順序掃描轉(zhuǎn)化為計算模型,從而能夠利用現(xiàn)代硬件加速平臺;另一方面將DBA的經(jīng)驗轉(zhuǎn)化為預(yù)測模型,從而使得數(shù)據(jù)庫系統(tǒng)更加智能地動態(tài)適應(yīng)工作負載的快速多樣性變化.將對機器學(xué)習(xí)化數(shù)據(jù)庫系統(tǒng)當(dāng)前的研究工作進行總結(jié)與歸納,主要包括存儲管理、查詢優(yōu)化的機器學(xué)習(xí)化研究以及自動化的數(shù)據(jù)庫管理系統(tǒng).在對已有技術(shù)分析的基礎(chǔ)上,指出了機器學(xué)習(xí)化數(shù)據(jù)庫系統(tǒng)的未來研究方向及可能面臨的問題與挑戰(zhàn).
注:因版權(quán)方要求,不能公開全文,如需全文,請咨詢雜志社