吉林大学学报(工学版) ›› 2013, Vol. 43 ›› Issue (02): 504-509.

• 论文 • 上一篇    下一篇

基于多核SVM-GMM的短语音说话人识别

林琳, 陈虹, 陈建, 金焕梅   

  1. 吉林大学 通信工程学院, 长春 130022
  • 收稿日期:2012-05-10 出版日期:2013-03-01 发布日期:2013-03-01
  • 通讯作者: 陈建(1977-),男,讲师,博士.研究方向:数字信号处理,阵列信号处理.E-mail:chenjian@jlu.edu.cn E-mail:chenjian@jlu.edu.cn
  • 作者简介:林琳(1979-),女,讲师,博士.研究方向:语音信号处理,模式识别.E-mail:lin_lin@jlu.edu.cn
  • 基金资助:

    吉林省科技发展计划项目(201101032);高等学校博士学科点专项科研基金项目(20090061120042).

Speaker recognition with short utterances based on multiple kernel SVM-GMM

LIN lin, CHEN Hong, CHEN Jian, JIN Huan-mei   

  1. College of Communication Engineering, Jilin University, Changchun 130022, China
  • Received:2012-05-10 Online:2013-03-01 Published:2013-03-01

摘要: 运用多个核函数的线性组合构造多核空间,在多核空间上设计了基于支持向量机的说话人分类器,实现短语音说话人识别。多核映射能够解决单核映射核函数及其参数选择的难题,增加说话人的可区分性,提高分类器的性能。算法中结合了高斯混合模型(GMM),并以GMM超向量作为说话人的最终特征参数进行仿真实验。实验表明,在短语音和两种噪声环境中,基于多核SVM-GMM的短语音说话人识别算法较SVM-GMM算法能得到更好的识别性能和鲁棒性。

关键词: 通信技术, 说话人识别, 短语音, 多核支持向量机, 高斯混合模型超向量

Abstract: A linear combination of several kernels is used to construct multiple kernel space. In multiple kernel space, Support Vector Machine (SVM) classifiers are designed to identify speakers with short utterances. Multiple kernel mapping can solve the problem of single kernel mapping, such as the selection of kernel function and parameters. Besides, multiple kernel mapping can increase discriminative power among different speakers and improve the performance of classifiers. In simulation experiment, Gaussian Mixture Model (GMM) was used to get GMM supervector as speakers' final feature parameters. Experiment results show that under the condition of short utterances and two noisy environments, the performance and robustness of the multiple SVM-GMM speaker recognition algorithm are better than that of SVM-GMM algorithm.

Key words: communication, speaker recognition, short utterances, multiple kernel SVM, Gaussian mixture model supervector

中图分类号: 

  • TN912.3
[1] Yang Yao-yuan, Chen Wei, Lu Yu-dong, et al. Research of speaker identification based on little training data//Proceeding of the 3rd International Conference on Machine Learning and Cybernetics, Shanghai, 2004.

[2] Jayanna H S, Mahadeva Prasanna S R. Multiple frame size and rate analysis for speaker recognition under limited data condition[J]. IET Signal Processing, 2009, 3(3): 189-204.

[3] Mak Man-Wai, Rao Wei. Utterance partitioning with acoustic vector resampling for GMM-SVM speaker verification[J]. Speech Communication, 2011, 53(1):119-130.

[4] Zien A, Ong C S. Multiclass multiple kernel learning//Proceedings of the 24th International Conference on Machine Learning. New York, USA: ACM, 2007.

[5] Tian Xi-lan, Gasso Gilles, Canu Stéphane. A multiple kernel framework for inductive semi-supervised SVM learning[J]. Neuro-computing, 2012, 90(1):46-58.

[6] Chen Zhen-yu, Li Jian-ping, Wei Li-wei, et al. Multiple-kernel SVM based multiple-task oriented data mining system for gene expression data analysis[J]. Expert Systems with Applications, 2011, 38(10): 12151-12159.

[7] Wu Zheng-peng, Zhang Xue-gong. Elastic multiple kernel learning[J]. Acta Automatica Sinica, 2011, 37(6):693-699.

[8] University of California Irvine. UCI Machine Learning Repository[EB/OL]. http://archive.ics. uci.edu/ml

[9] 吴玺宏.一个面向说话人识别的汉语语音数据库[EB/OL].http://nlpr-web.ia.ac.cn/english/irds/chi-nese/sinobiometricspdf/wuxihong.pdf

[10] Campbell W, Sturim D E, Reynolds D A. Support vector machines using GMM supervectors for speaker verification[J]. IEEE Signal Processing Letters, 2006, 13(5): 308-311.
[1] 周彦果,张海林,陈瑞瑞,周韬. 协作网络中采用双层博弈的资源分配方案[J]. 吉林大学学报(工学版), 2018, 48(6): 1879-1886.
[2] 孙晓颖, 扈泽正, 杨锦鹏. 基于分层贝叶斯网络的车辆发动机系统电磁脉冲敏感度评估[J]. 吉林大学学报(工学版), 2018, 48(4): 1254-1264.
[3] 董颖, 崔梦瑶, 吴昊, 王雨后. 基于能量预测的分簇可充电无线传感器网络充电调度[J]. 吉林大学学报(工学版), 2018, 48(4): 1265-1273.
[4] 牟宗磊, 宋萍, 翟亚宇, 陈晓笑. 分布式测试系统同步触发脉冲传输时延的高精度测量方法[J]. 吉林大学学报(工学版), 2018, 48(4): 1274-1281.
[5] 丁宁, 常玉春, 赵健博, 王超, 杨小天. 基于USB 3.0的高速CMOS图像传感器数据采集系统[J]. 吉林大学学报(工学版), 2018, 48(4): 1298-1304.
[6] 陈瑞瑞, 张海林. 三维毫米波通信系统的性能分析[J]. 吉林大学学报(工学版), 2018, 48(2): 605-609.
[7] 张超逸, 李金海, 阎跃鹏. 双门限唐检测改进算法[J]. 吉林大学学报(工学版), 2018, 48(2): 610-617.
[8] 关济实, 石要武, 邱建文, 单泽彪, 史红伟. α稳定分布特征指数估计算法[J]. 吉林大学学报(工学版), 2018, 48(2): 618-624.
[9] 李炜, 李亚洁. 基于离散事件触发通信机制的非均匀传输网络化控制系统故障调节与通信满意协同设计[J]. 吉林大学学报(工学版), 2018, 48(1): 245-258.
[10] 孙晓颖, 王震, 杨锦鹏, 扈泽正, 陈建. 基于贝叶斯网络的电子节气门电磁敏感度评估[J]. 吉林大学学报(工学版), 2018, 48(1): 281-289.
[11] 武伟, 王世刚, 赵岩, 韦健, 钟诚. 蜂窝式立体元图像阵列的生成[J]. 吉林大学学报(工学版), 2018, 48(1): 290-294.
[12] 袁建国, 张锡若, 邱飘玉, 王永, 庞宇, 林金朝. OFDM系统中利用循环前缀的非迭代相位噪声抑制算法[J]. 吉林大学学报(工学版), 2018, 48(1): 295-300.
[13] 王金鹏, 曹帆, 贺晓阳, 邹念育. 基于多址干扰和蜂窝间互扰分布的多载波系统联合接收方法[J]. 吉林大学学报(工学版), 2018, 48(1): 301-305.
[14] 石文孝, 孙浩然, 王少博. 无线Mesh网络信道分配与路由度量联合优化算法[J]. 吉林大学学报(工学版), 2017, 47(6): 1918-1925.
[15] 姜来为, 沙学军, 吴宣利, 张乃通. LTE-A异构网络中新的用户选择接入和资源分配联合方法[J]. 吉林大学学报(工学版), 2017, 47(6): 1926-1932.
Viewed
Full text


Abstract

Cited

  Shared   
  Discussed   
No Suggested Reading articles found!