基于改进GFCC特征参数的广播音频语种识别

Abstract

Abstract: To address the problem that features unrelated to language identification in broadcast audio have an impact on the language
identification results, an improved language identification method based on gamma frequency cepstrum coefficients with improved feature parameters is proposed. By extracting the energy spectral envelope of each frame, the speaker-related features are removed, filtered by a Gammatone filter banks, and then by the discrete cosine transform and cepstrum lifting to obtain the improved gamma frequency cepstrum feature parameters. The feature parameters extracted from broadcast audio signal were input into hidden Markov model for training and testing， and the language identification results were obtained. The results show that the proposed method can effectively improve the language identification accuracy for broadcast audio, which is better than the currently used gamma frequency cepstrum coefficient features and their derivatives.

Key words: broadcast audio language identificaition, energy spectrum envelope, cepstrum lifting, improved gamma frequency cepstrum coefficient

CLC Number:

TP391

SHAO Yubin, CHEN Liang, LONG Hua, DU Qingzhi. Broadcast Audio Language Identification Based on Improved GFCC Feature Parameters[J].Journal of Jilin University Science Edition, 2022, 60(2): 417-424.

[1]	ZHAO Pengcheng, GAO Shang, YU Hongmei. Spatial Crowdsourcing Task Assignment Based on Multi-agent Deep Reinforcement Learning [J]. Journal of Jilin University Science Edition, 2022, 60(2): 321-331.
[2]	WANG Zhe, LI Xin. Network Structure Representation Learning Based on Neighborhood Information [J]. Journal of Jilin University Science Edition, 2022, 60(2): 343-350.
[3]	REN Weijian, LIU Zeyu, HUO Fengcai, KANG Chaohai, REN Lu, ZHANG Yongfeng. An Improved Superpixel Segmentation Algorithm of Multi-spectral Remote Sensing Images [J]. Journal of Jilin University Science Edition, 2022, 60(2): 351-360.
[4]	YANG Yanan, ZHU Xiaodong, LIU Yuanning, ZHU Lin, DONG Lin. Iris Location Algorithm Based on Improved YoloV4 Network [J]. Journal of Jilin University Science Edition, 2022, 60(2): 369-380.
[5]	CAI Xuhang, ZHU Liucun, ZHANG Zhen, ZHANG Hengyan, ZHENG Xiaodong. Shadow Detection Algorithm Based on Multi-scale Super-pixel Fusion for Single RGB-D Images [J]. Journal of Jilin University Science Edition, 2022, 60(2): 392-400.
[6]	QI Miao, YAN Guangyou, XU Hui, SUN Hui. Facial Expression Recognition Based on Multi-scale Feature Selection Network [J]. Journal of Jilin University Science Edition, 2022, 60(2): 425-431.
[7]	WU Zukang, ZHU Xiaodong, LIU Yuanning, WANG Chaoqun, ZHOU Zhiyong. Iris Quality Evaluation Method Based on GA-SVM Model [J]. Journal of Jilin University Science Edition, 2022, 60(1): 89-0098.
[8]	WU Zukang, ZHU Xiaodong, LIU Yuanning, WANG Chaoqun, ZHOU Zhiyong. Iris Quality Evaluation Method Based on GA-SVM Model [J]. Journal of Jilin University Science Edition, 0, (): 89-0098.
[9]	XU Huaping, JIA Xiaoning. Image Denoising Algorithm Based on Affine Invariant Patch Similarity Measure [J]. Journal of Jilin University Science Edition, 2022, 60(1): 109-0118.
[10]	ZHANG Tianhang, LI Tingting, ZHANG Yonggang. Multi-hop Chinese Knowledge Question Answering Method Based on Knowledge Graph Embedding [J]. Journal of Jilin University Science Edition, 2022, 60(1): 119-0126.
[11]	SUI Zhen, ZHANG Tianxing, WU Tao, CHEN Huarui. Storage Optimization of Three-Dimensional Warehouse Based on Multi Population Space Mapping Genetic Algorithm [J]. Journal of Jilin University Science Edition, 2022, 60(1): 127-0134.
[12]	LIU Jun, GONG Zidong, WU Li. Local Linear Embedding Algorithm Based on Information Entropy Measurement [J]. Journal of Jilin University Science Edition, 2022, 60(1): 143-0149.
[13]	LIU Jun, YANG Jun, SONG Shanshan. Collaborative Filtering Recommendation Algorithm Based on Purchasing Intention of Users [J]. Journal of Jilin University Science Edition, 2021, 59(6): 1432-1438.
[14]	JIANG Bo, ZUO Wanli, WANG Ying. Causality Extraction Based on BERT [J]. Journal of Jilin University Science Edition, 2021, 59(6): 1439-1444.
[15]	LI Changming, ZHANG Hongchen, WANG Chao, LI Xiaoguang, LU Yang, QIAN Chaoyue. An Efficient Yinyang k-Means Clustering Algorithm [J]. Journal of Jilin University Science Edition, 2021, 59(6): 1455-1460.

Broadcast Audio Language Identification Based on Improved GFCC Feature Parameters

PDF (PC)

Like

Knowledge

Abstract

Cite this article

share this article

References

Related Articles 15

Metrics

Comments

Recommended 0