吉林大学学报(理学版) ›› 2024, Vol. 62 ›› Issue (4): 943-950.
朵琳, 马建, 韦贵香, 唐剑
DUO Lin, MA Jian, WEI Guixiang, TANG Jian
摘要: 针对在复杂噪声环境下语音识别准确率低和鲁棒性差的问题, 提出一种基于增减残差Mel倒谱融合特征的语音识别方法. 该方法首先利用增减分量法筛选关键语音特征, 然后将其映射到Mel域-残差域空间坐标系中生成增减残差Mel倒谱系数, 最后将这些融合特征用于训练端到端模型. 实验结果表明, 该方法在不同噪声类型和信噪比条件下均显著提高了语音识别准确率及性能, 在-5 dB低信噪比条件下, 语音识别准确率达73.13%, 而在其他噪声条件下的平均语音识别准确率达88.67%, 充分证明了该方法的有效性和鲁棒性.
中图分类号: