吉林大学学报(工学版) ›› 2012, Vol. 42 ›› Issue (01): 223-227.

• 论文 • 上一篇    下一篇

线谱频率参数的快速、低存储矢量量化

梁彦霞1,2, 杨家玮2, 李烨2, 聂敏1, 刘欣3   

  1. 1. 西安邮电学院 通信与信息工程学院,西安 710121;
    2. 西安电子科技大学 综合业务网国家重点实验室,西安 710071;
    3. 中兴通讯股份有限公司,西安 710065
  • 收稿日期:2010-06-02 出版日期:2012-01-01 发布日期:2012-01-01
  • 通讯作者: 杨家玮(1946-),男,教授,博士生导师.研究方向:无线、移动通信.E-mail:jwyang@xidian.edu.cn E-mail:jwyang@xidian.edu.cn
  • 作者简介:梁彦霞(1981-),女,博士研究生.研究方向:语音编码.E-mail:lx219@sohu.com
  • 基金资助:

    国家杰出青年科学基金(60725105);长江学者和创新团队发展计划项目(IRT0852);"863"国家高技术研究发展计划项目(2007AA01Z288);国家自然科学基金项目(61172071);ISN国家重点实验室专项基金项目(ISN02080001);高等学校创新引智计划项目(B08038).

Fast and low-storage vector quantizer of line spectral frequency coefficients

LIANG Yan-xia1,2, YANG Jia-wei2, LI Ye2, NIE Min1, LIU Xin3   

  1. 1. School of Communication and Information Engineering,Xi'an Institute of Post and Telecommunication,Xi'an 710121,China;
    2. State Key Laboratory of Integrated Service Networks, Xidian University, Xi'an 710071, China;
    3. ZTE Corporation,Xi'an 710065,China
  • Received:2010-06-02 Online:2012-01-01 Published:2012-01-01

摘要:

为降低码书的存储空间和搜索复杂度,更充分地利用线谱频率参数帧内和帧间的相关性,提出了一种快速、低存储的矢量量化器。将线谱频率参数去除平均值后进行一阶滑动平均预测,将残差进行三级矢量量化。在第二级量化时,将高维线谱频率参数矢量分裂成两个低维的部分,分别用不同的码书进行量化,降低了码书的存储空间和搜索复杂度。C语言仿真结果显示,在满足低速率编码的前提下,平均谱失真达到0.91 dB,2~4 dB的谱泄露为0.13%,无4 dB以上谱泄露,同时码书的存储空间和搜索复杂度均降低了31%以上。

关键词: 信息处理技术, 语音编码, 滑动平均预测, 矢量量化, 谱失真

Abstract:

A fast and low-storage vector quantizer was developed to quantize line spectral frequency (LSF) coefficients. It reduces the storage and searching complexity of codebooks by better use of the inter and intra frame correlations of LSF coefficients. After the average value was removed, LSF coefficients were predicted by a first order moving average predictor. Then the residual LSF coefficients were quantized by a three-stage vector quantizer. In the second stage, each high-dimensional LSF coefficient vector was slit into low-dimensional parts, which were quantized by different codebooks to reduce the storage and searching complexity of the codebooks. Simulation by C programming language demonstrates that the average spectral distortion is 0.91 dB, the percentage of outlier between 2 dB and 4 dB is 0.13% under the condition of low bit rate speech coding. Both storage and searching complexity of codebooks are reduced more than 31%.

Key words: information processing, speech coding, moving average predictor, vector quantization, spectral distortion

中图分类号: 

  • TN912.3


[1] Kondoz A M. Digital Speech Coding for Low Bit Rate Communication Systems
[M]. 2nd ed. Chichester: John Wiley & Sons, 2004:105-129.

[2] Chu Wai C. Speech Coding Algorithms: Foundation and Evolution of Standardized Coders
[M]. Chichester: John Wiley & Sons, 2003:184-222.

[3] 赵志杰, 陈贺新, 桑爱军. 三维矩阵可变分割彩色图像压缩编码
[J]. 吉林大学学报:工学版, 2009, 39(1):194-197. Zhao Zhi-jie, Chen He-xin, Sang Ai-jun. Color image compression based on variable matrix size three dimensional matrix wide DCT
[J]. Journal of Jilin University (Engineering and Technology Edition), 2009, 39(1):194-197.

[4] 鲍长春. 数字语音编码原理
[M]. 西安:西安电子科技大学出版社, 2007: 128-170.

[5] Han Da-han, Cui Hui-juan, Tang Kun. Multimode quantization of LP parameters in MBE-LPC-FE coder//IEEE International Conference: IEEE Press, 2002:19-22.

[6] Paliwal K K, Atal B S. Efficient vector quantization of LPC parameters at 24 bits/frame
[J]. IEEE Transactions on Speech and Audio Processing, 1993, 1(1):3-14.

[7] 李昌立, 吴善培. 数字语音——语音编码实用教程
[M]. 北京:人民邮电出版社, 2004: 184-207.

[8] Griffin D W, Lim J S. Multiband excitation vocoder
[J]. IEEE Transactions on Acoustics, Speech, and Signal Processing, 1988, 36(8): 1223-1235.

[9] 梁彦霞, 杨家玮, 李烨. 一种低速率多模MBE线性预测语音编解码器
[J]. 西安电子科技大学学报, 2010,37(3):417-422. Liang Yan-xia, Yang Jia-wei, Li Ye. Low rate multimode MBE vocoder with linear prediction coding
[J]. Journal of Xi'dian University,2010, 37(3):417-422.

[10] 李靓, 鲍长春, 白燕宁. 一种高效、低存储的线谱频率参数矢量量化器
[J]. 北京工业大学学报, 2005, 31(2):130-135. Li Jing, Bao Chang-chun, Bai Yan-ning. An efficient LSF parameters quantizer with low storage
[J]. Journal of Beijing University of Technology, 2005, 31(2):130-135.

[11] 李晔, 彭坦, 许明, 等. 带有帧间级间预测的线谱频率参数多级矢量量化技术
[J]. 清华大学学报:自然科学版, 2009, 49(7):965-967. Li Ye, Peng Tan, Xu Ming, et al. High efficiency MSVQ for prediction linear spectrum frequency parameters with inter-frame and inter-stage prediction
[J]. Journal of Tsinghua University(Science and Technology), 2009, 49(7):965-967.

[1] 苏寒松,代志涛,刘高华,张倩芳. 结合吸收Markov链和流行排序的显著性区域检测[J]. 吉林大学学报(工学版), 2018, 48(6): 1887-1894.
[2] 徐岩,孙美双. 基于卷积神经网络的水下图像增强方法[J]. 吉林大学学报(工学版), 2018, 48(6): 1895-1903.
[3] 黄勇,杨德运,乔赛,慕振国. 高分辨合成孔径雷达图像的耦合传统恒虚警目标检测[J]. 吉林大学学报(工学版), 2018, 48(6): 1904-1909.
[4] 李居朋,张祖成,李墨羽,缪德芳. 基于Kalman滤波的电容屏触控轨迹平滑算法[J]. 吉林大学学报(工学版), 2018, 48(6): 1910-1916.
[5] 应欢,刘松华,唐博文,韩丽芳,周亮. 基于自适应释放策略的低开销确定性重放方法[J]. 吉林大学学报(工学版), 2018, 48(6): 1917-1924.
[6] 陆智俊,钟超,吴敬玉. 星载合成孔径雷达图像小特征的准确分割方法[J]. 吉林大学学报(工学版), 2018, 48(6): 1925-1930.
[7] 刘仲民,王阳,李战明,胡文瑾. 基于简单线性迭代聚类和快速最近邻区域合并的图像分割算法[J]. 吉林大学学报(工学版), 2018, 48(6): 1931-1937.
[8] 单泽彪,刘小松,史红伟,王春阳,石要武. 动态压缩感知波达方向跟踪算法[J]. 吉林大学学报(工学版), 2018, 48(6): 1938-1944.
[9] 姚海洋, 王海燕, 张之琛, 申晓红. 双Duffing振子逆向联合信号检测模型[J]. 吉林大学学报(工学版), 2018, 48(4): 1282-1290.
[10] 全薇, 郝晓明, 孙雅东, 柏葆华, 王禹亭. 基于实际眼结构的个性化投影式头盔物镜研制[J]. 吉林大学学报(工学版), 2018, 48(4): 1291-1297.
[11] 陈绵书, 苏越, 桑爱军, 李培鹏. 基于空间矢量模型的图像分类方法[J]. 吉林大学学报(工学版), 2018, 48(3): 943-951.
[12] 陈涛, 崔岳寒, 郭立民. 适用于单快拍的多重信号分类改进算法[J]. 吉林大学学报(工学版), 2018, 48(3): 952-956.
[13] 孟广伟, 李荣佳, 王欣, 周立明, 顾帅. 压电双材料界面裂纹的强度因子分析[J]. 吉林大学学报(工学版), 2018, 48(2): 500-506.
[14] 林金花, 王延杰, 孙宏海. 改进的自适应特征细分方法及其对Catmull-Clark曲面的实时绘制[J]. 吉林大学学报(工学版), 2018, 48(2): 625-632.
[15] 王柯, 刘富, 康冰, 霍彤彤, 周求湛. 基于沙蝎定位猎物的仿生震源定位方法[J]. 吉林大学学报(工学版), 2018, 48(2): 633-639.
Viewed
Full text


Abstract

Cited

  Shared   
  Discussed   
No Suggested Reading articles found!