吉林大学学报(工学版) ›› 2016, Vol. 46 ›› Issue (3): 870-875.doi: 10.13229/j.cnki.jdxbgxb201603029
申铉京1, 2, 翟玉杰1, 2, 卢禹彤3, 王玉1, 2, 4, 陈海鹏1, 2
SHEN Xuan-jing1, 2, ZHAI Yu-jie1, 2, LU Yu-tong3, WANG Yu1, 2, 4, CHEN Hai-peng1, 2
摘要: 现有说话人识别算法普遍受信道因素的干扰,为了提高算法的准确率,在特征级利用特征弯折算法对语音特征参数进行处理,在模型级利用因子分析技术对说话人混合高斯模型(GMM)进行信道处理。对端点进行检测后,利用特征弯折算法对语音特征参数梅尔倒谱系数(MFCC)进行处理,去除线性信道和背景噪声的影响,并建立说话人GMM。然后利用因子分析技术拟合说话人特征空间与信道空间的差异,去除信道因子的影响。最后提取高斯超向量并通过支持向量机(SVM)得到识别结果。实验结果证明了信道补偿算法与GMM-SVM相结合能获得更好的识别率,并能保证算法的鲁棒性。
中图分类号:
[1] Takiguchi T, Nakamura S, Shikano K. HMM-separation-based speech recognition for a distant moving speaker[J]. IEEE Transactions on Speech and Audio Processing,2001,9(2):127-140. [2] 吴迪,曹洁,王进花.基于自适应高斯混合模型与静动态听觉特征融合的说话人识别[J]. 光学精密工程,2013,21(6):1598-1604. Wu Di,Cao Jie,Wang Jin-hua. Speaker recognition based on adapted Gaussian mixture model and static and dynamic auditory feature fusion[J]. Optics and Precision Engineering,2013,21(6):1598-1604. [3] Johnson M, Sinha P. A compact model for speaker-adaptive training[J]. Powder Technology,2013,237(3):506-513. [4] Kinnunen T, Li H. An overview of text-independent speaker recognition:from features to supervectors[J]. Speech Communication,2010,52(1):12-40. [5] Kasuriya S,Wutiwiwatchai C,Achariyakulporn V,et al.Comparative study of continuous hidden Markov models (CHMM) and artificial neural network (ANN) on speaker identification system[J]. International Journal of Uncertainty, Fuzziness and Knowledge-Based Systems,2001,9(6):673-683. [6] Campbell W M, Sturim D E, Reynolds D A. Support vector machines using GMM supervectors for speaker verification[J]. Signal Processing Letters,2006,13(5):308-311. [7] Munteanu D P, Toma S A. Automatic speaker verification experiments using HMM[C]∥8th International Conference on Communications, Bucharest,Romanian,2010:107-110. [8] Badran E F M F, Selim H. Speaker recognition using artificial neural networks based on vowel phonemes[C]∥5th International Conference on Signal Processing, Beijing,China, 2000:796-802. [9] 张素敏,苏东林,王炜. 改进的基于决策树的说话人在线聚类[J]. 光学精密工程,2010,18(1):227-233. Zhang Su-min,Su Dong-lin,Wang Wei. Improved online speaker clustering based on decision tree[J]. Optics and Precision Engineering, 2010,18(1):227-233. [10] Ding I J, Yen C T. Enhancing GMM speaker identification by incorporating SVM speaker verification for intelligent web-based speech applications[J]. Multimedia Tools and Applications,2015,74(14):5131-5140. [11] Sen N, Patil H A, Mandal S K D, et al. Importance of Utterance Partitioning in SVM Classifier with GMM Supervectors for Text-Independent Speaker Verification[M]. Heidelberg:Springer International Publishing,2013:780-789. [12] 王玉,申铉京,陈海鹏,等. 多角度特征融合的视频人脸纹理表示及识别[J]. 吉林大学学报:工学版,2015,45(6):1954-1960. Wang Yu,Shen Xuan-jing,Chen Hai-peng,et al. Video-based face texture representation and recognitionwith fusion features from multi-view[J]. Journal of Jilin University(Engineering and Technology Edition), 2015,45(6):1954-1960. [13] Neff M, Kipp M, Albrecht I, et al. Gesture modeling and animation based on a probabilistic re-creation of speaker style[J]. Acm Transactions on Graphics,2008,27(1):329-339. [14] Chang C C, Lin C J. LIBSVM: a library for support vector machines[DB/OL].[2014-07-26].http:∥www.csie.ntu.edu.tw/~cjlin/papers/libsvm.pdf. |
[1] | 刘富,宗宇轩,康冰,张益萌,林彩霞,赵宏伟. 基于优化纹理特征的手背静脉识别系统[J]. 吉林大学学报(工学版), 2018, 48(6): 1844-1850. |
[2] | 王利民,刘洋,孙铭会,李美慧. 基于Markov blanket的无约束型K阶贝叶斯集成分类模型[J]. 吉林大学学报(工学版), 2018, 48(6): 1851-1858. |
[3] | 金顺福,王宝帅,郝闪闪,贾晓光,霍占强. 基于备用虚拟机同步休眠的云数据中心节能策略及性能[J]. 吉林大学学报(工学版), 2018, 48(6): 1859-1866. |
[4] | 赵东,孙明玉,朱金龙,于繁华,刘光洁,陈慧灵. 结合粒子群和单纯形的改进飞蛾优化算法[J]. 吉林大学学报(工学版), 2018, 48(6): 1867-1872. |
[5] | 刘恩泽,吴文福. 基于机器视觉的农作物表面多特征决策融合病变判断算法[J]. 吉林大学学报(工学版), 2018, 48(6): 1873-1878. |
[6] | 隗海林, 包翠竹, 李洪雪, 李明达. 基于最小二乘支持向量机的怠速时间预测[J]. 吉林大学学报(工学版), 2018, 48(5): 1360-1365. |
[7] | 欧阳丹彤, 范琪. 子句级别语境感知的开放信息抽取方法[J]. 吉林大学学报(工学版), 2018, 48(5): 1563-1570. |
[8] | 刘富, 兰旭腾, 侯涛, 康冰, 刘云, 林彩霞. 基于优化k-mer频率的宏基因组聚类方法[J]. 吉林大学学报(工学版), 2018, 48(5): 1593-1599. |
[9] | 桂春, 黄旺星. 基于改进的标签传播算法的网络聚类方法[J]. 吉林大学学报(工学版), 2018, 48(5): 1600-1605. |
[10] | 刘元宁, 刘帅, 朱晓冬, 陈一浩, 郑少阁, 沈椿壮. 基于高斯拉普拉斯算子与自适应优化伽柏滤波的虹膜识别[J]. 吉林大学学报(工学版), 2018, 48(5): 1606-1613. |
[11] | 车翔玖, 王利, 郭晓新. 基于多尺度特征融合的边界检测算法[J]. 吉林大学学报(工学版), 2018, 48(5): 1621-1628. |
[12] | 赵宏伟, 刘宇琦, 董立岩, 王玉, 刘陪. 智能交通混合动态路径优化算法[J]. 吉林大学学报(工学版), 2018, 48(4): 1214-1223. |
[13] | 黄辉, 冯西安, 魏燕, 许驰, 陈慧灵. 基于增强核极限学习机的专业选择智能系统[J]. 吉林大学学报(工学版), 2018, 48(4): 1224-1230. |
[14] | 傅文博, 张杰, 陈永乐. 物联网环境下抵抗路由欺骗攻击的网络拓扑发现算法[J]. 吉林大学学报(工学版), 2018, 48(4): 1231-1236. |
[15] | 曹洁, 苏哲, 李晓旭. 基于Corr-LDA模型的图像标注方法[J]. 吉林大学学报(工学版), 2018, 48(4): 1237-1243. |
|