摘要:針對前饋神經(jīng)網(wǎng)絡(luò)難以處理時序數(shù)據(jù)的問題,提出將雙向循環(huán)神經(jīng)網(wǎng)絡(luò)(BiRNN)應(yīng)用在自動語音識別聲學(xué)建模中。首先,應(yīng)用梅爾頻率倒譜系數(shù)進行特征提取;其次,采用雙向循環(huán)神經(jīng)網(wǎng)絡(luò)作為聲學(xué)模型;最后,測試不同參數(shù)對系統(tǒng)性能的影響。在TIMIT數(shù)據(jù)集上的實驗結(jié)果表明,與基于卷積神經(jīng)網(wǎng)絡(luò)和深度神經(jīng)網(wǎng)絡(luò)的聲學(xué)模型相比,識別率分別提升了1.3%和4.0%,說明基于雙向循環(huán)神經(jīng)網(wǎng)絡(luò)的聲學(xué)模型具有更好的性能。
注:因版權(quán)方要求,不能公開全文,如需全文,請咨詢雜志社