吉林大学学报(理学版) ›› 2026, Vol. 64 ›› Issue (2): 403-0410.
付春雨, 刘均
FU Chunyu, LIU Jun
摘要: 针对多指标语音增强算法在训练过程中易受异常值干扰、 导致优化不稳定的问题, 提出一种基于多头注意力机制的自适应语音增强算法. 首先, 通过在判别网络中间层引入多头注意力结构, 增强模型对语音频谱局部特征和整体结构的联合建模能力, 并结合在线知识蒸馏策略实现多生成器之间的信息共享, 从而提升多指标条件下的协同优化效果. 其次, 为减少异常值对训练过程的影响, 将损失函数替换为对数均方误差形式, 以提升模型的稳定性和鲁棒性. 在公开语音数据集VoiceBank-DEMAND上的实验结果表明, 该方法在语音质
量、 背景噪声抑制和语音可懂度指标上均优于现有多指标语音增强模型. 因此, 引入注意力机制与稳定化损失函数能显著改善多指标语音增强算法的综合性能.
中图分类号: