吉林大学学报(工学版) ›› 2016, Vol. 46 ›› Issue (3): 917-922.doi: 10.13229/j.cnki.jdxbgxb201603036

• 论文 • 上一篇    下一篇

基于语音存在概率的噪声功率谱估计

赵彦平, 赵晓晖, 王波   

  1. 吉林大学 通信工程学院,长春 130012
  • 收稿日期:2013-07-17 出版日期:2016-06-20 发布日期:2016-06-20
  • 通讯作者: 赵晓晖(1957-),男,教授,博士生导师.研究方向:信号处理在通信中的应用.E-mail:xhzhao@jlu.edu.cn
  • 作者简介:赵彦平(1978),女,讲师,博士研究生.研究方向:语音信号处理.E-mail:zhaoyp@jlu.edu.cn
  • 基金资助:
    国家自然科学基金项目(61171079).

Noise power spectrum estimation based on speech presence probability

ZHAO Yan-ping, ZHAO Xiao-hui, WANG Bo   

  1. College of Communication Engineering, Jilin University, Changchun 130012, China
  • Received:2013-07-17 Online:2016-06-20 Published:2016-06-20

摘要: 在幅度平方谱模型下,利用语音和噪声信号的幅度平方谱服从指数分布,结合由后验信噪比不确定性决定的后验语音存在概率来更新噪声功率谱估计,很好地抑制了噪声且避免了语音信号失真。仿真实验结果表明:本文方法能够准确跟踪噪声功率谱、快速跟踪噪声功率谱变化,可以在一定程度上提高增强后语音信号的质量。

关键词: 信息处理技术, 语音增强, 噪声功率谱估计, 语音存在概率

Abstract: Using the magnitude-square spectrum model and the exponential probability densities of the magnitude-square spectrum of the clean speech and noise. The new method updates the noise power spectrum estimation using the posteriori speech presence probability by incorporating a posteriori signal to noise ratio uncertainty. It can suppress effectively the background noise without introducing speech distortion. The simulation results reveal that the new method is characterized by tracking noise power spectrum accurately and following quickly abrupt changes in the noise spectrum. The quality of enhanced speech signal is improved in a certain extent.following quickly abrupt changes in the noise spectrum. The quality of the enhanced speech signal is improved in a certain extent.

Key words: information processing, speech enhancement, noise power spectrum estimation, speech presence probability

中图分类号: 

  • TN912
[1] Lu Y, Loizou P C. Estimators of the magnitude-squared spectrum and methods for incorporating SNR uncertainty[J]. IEEE Transactions on Audio,Speech,and Language Processing,2011,19(5):1123-1137.
[2] 欧世峰,赵晓晖. 改进型先验信噪比估计语音增强算法[J]. 吉林大学学报:工学版,2009,39(3):787-791.
Ou Shi-feng, Zhao Xiao-hui. Modified priori SNR estimation for noisy speech enhancement[J]. Journal of Jilin University (Engineering and Technology Edition),2009,39(3):787-791.
[3] Martin R. Noise power spectral density estimation based on optimal smoothing and minimum statistics[J]. IEEE Transactions on Speech and Audio Processing,2001,9(5):504-512.
[4] Cohen I, Berdugo B. Noise estimation by minima controlled recursive averaging for robust speech enhancement[J]. IEEE Signal Processing Letters,2002,9(1):12-15.
[5] Cohen I. Noise spectrum estimation in adverse environments: improved minima controlled recursive averaging[J]. IEEE Transactions on Speech and Audio Processing,2003,11(5):466-475.
[6] Gerkmann T,Hendriks R C. Unbiased MMSE-based noise power estimation with low complexity and low tracking delay[J]. IEEE Transactions on Audio,Speech, and Language Processing,2012,20(4):1383-1392.
[7] Garofolo J S. DARPA TIMIT acoustic phonetic continuous speech database[J]. National Inst Standards Technol, 1988,15:29-50.
[8] Varga A, Steeneken H J M. Assessment for automatic speech recognition: II. NOISEX-92: a database and an experiment to study the effect of additive noise on speech recognition systems[J]. Speech Communication,1993,12(3):247-251.
[9] Faraji N, Hendriks R C. Noise power spectral density estimation for public address systems in noisy reverberant environments[C]∥International Workshop on Acoustic Signal Enhancement,Aachen,2012:61-64.
[10] Hu Y, Loizou P C. Evaluation of objective quality measures for speech enhancement[J]. IEEE Transactions on Audio, Speech, and Language Processing,2008,16(1): 229-238.
[1] 苏寒松,代志涛,刘高华,张倩芳. 结合吸收Markov链和流行排序的显著性区域检测[J]. 吉林大学学报(工学版), 2018, 48(6): 1887-1894.
[2] 徐岩,孙美双. 基于卷积神经网络的水下图像增强方法[J]. 吉林大学学报(工学版), 2018, 48(6): 1895-1903.
[3] 黄勇,杨德运,乔赛,慕振国. 高分辨合成孔径雷达图像的耦合传统恒虚警目标检测[J]. 吉林大学学报(工学版), 2018, 48(6): 1904-1909.
[4] 李居朋,张祖成,李墨羽,缪德芳. 基于Kalman滤波的电容屏触控轨迹平滑算法[J]. 吉林大学学报(工学版), 2018, 48(6): 1910-1916.
[5] 应欢,刘松华,唐博文,韩丽芳,周亮. 基于自适应释放策略的低开销确定性重放方法[J]. 吉林大学学报(工学版), 2018, 48(6): 1917-1924.
[6] 陆智俊,钟超,吴敬玉. 星载合成孔径雷达图像小特征的准确分割方法[J]. 吉林大学学报(工学版), 2018, 48(6): 1925-1930.
[7] 刘仲民,王阳,李战明,胡文瑾. 基于简单线性迭代聚类和快速最近邻区域合并的图像分割算法[J]. 吉林大学学报(工学版), 2018, 48(6): 1931-1937.
[8] 单泽彪,刘小松,史红伟,王春阳,石要武. 动态压缩感知波达方向跟踪算法[J]. 吉林大学学报(工学版), 2018, 48(6): 1938-1944.
[9] 姚海洋, 王海燕, 张之琛, 申晓红. 双Duffing振子逆向联合信号检测模型[J]. 吉林大学学报(工学版), 2018, 48(4): 1282-1290.
[10] 全薇, 郝晓明, 孙雅东, 柏葆华, 王禹亭. 基于实际眼结构的个性化投影式头盔物镜研制[J]. 吉林大学学报(工学版), 2018, 48(4): 1291-1297.
[11] 陈绵书, 苏越, 桑爱军, 李培鹏. 基于空间矢量模型的图像分类方法[J]. 吉林大学学报(工学版), 2018, 48(3): 943-951.
[12] 陈涛, 崔岳寒, 郭立民. 适用于单快拍的多重信号分类改进算法[J]. 吉林大学学报(工学版), 2018, 48(3): 952-956.
[13] 孟广伟, 李荣佳, 王欣, 周立明, 顾帅. 压电双材料界面裂纹的强度因子分析[J]. 吉林大学学报(工学版), 2018, 48(2): 500-506.
[14] 林金花, 王延杰, 孙宏海. 改进的自适应特征细分方法及其对Catmull-Clark曲面的实时绘制[J]. 吉林大学学报(工学版), 2018, 48(2): 625-632.
[15] 王柯, 刘富, 康冰, 霍彤彤, 周求湛. 基于沙蝎定位猎物的仿生震源定位方法[J]. 吉林大学学报(工学版), 2018, 48(2): 633-639.
Viewed
Full text


Abstract

Cited

  Shared   
  Discussed   
[1] 刘松山, 王庆年, 王伟华, 林鑫. 惯性质量对馈能悬架阻尼特性和幅频特性的影响[J]. 吉林大学学报(工学版), 2013, 43(03): 557 -563 .
[2] 初亮, 王彦波, 祁富伟, 张永生. 用于制动压力精确控制的进液阀控制方法[J]. 吉林大学学报(工学版), 2013, 43(03): 564 -570 .
[3] 李静, 王子涵, 余春贤, 韩佐悦, 孙博华. 硬件在环试验台整车状态跟随控制系统设计[J]. 吉林大学学报(工学版), 2013, 43(03): 577 -583 .
[4] 胡兴军, 李腾飞, 王靖宇, 杨博, 郭鹏, 廖磊. 尾板对重型载货汽车尾部流场的影响[J]. 吉林大学学报(工学版), 2013, 43(03): 595 -601 .
[5] 王同建, 陈晋市, 赵锋, 赵庆波, 刘昕晖, 袁华山. 全液压转向系统机液联合仿真及试验[J]. 吉林大学学报(工学版), 2013, 43(03): 607 -612 .
[6] 张春勤, 姜桂艳, 吴正言. 机动车出行者出发时间选择的影响因素[J]. 吉林大学学报(工学版), 2013, 43(03): 626 -632 .
[7] 马万经, 谢涵洲. 双停车线进口道主、预信号配时协调控制模型[J]. 吉林大学学报(工学版), 2013, 43(03): 633 -639 .
[8] 于德新, 仝倩, 杨兆升, 高鹏. 重大灾害条件下应急交通疏散时间预测模型[J]. 吉林大学学报(工学版), 2013, 43(03): 654 -658 .
[9] 肖赟, 雷俊卿, 张坤, 李忠三. 多级变幅疲劳荷载下预应力混凝土梁刚度退化[J]. 吉林大学学报(工学版), 2013, 43(03): 665 -670 .
[10] 肖锐, 邓宗才, 兰明章, 申臣良. 不掺硅粉的活性粉末混凝土配合比试验[J]. 吉林大学学报(工学版), 2013, 43(03): 671 -676 .