吉林大学学报(理学版) ›› 2021, Vol. 59 ›› Issue (4): 922-928.
杨光1, 贾焱鑫1, 陈翔1,2, 许舒源1
YANG Guang1, JIA Yanxin1, CHEN Xiang1,2, XU Shuyuan1
摘要: 针对基于正则表达式和传统机器学习的分类方法分别存在模式手工提取困难和性能瓶颈的问题, 提出一种基于深度学习的问题帖分类方法, 采用深度文本挖掘模型TextCNN和融合注意力机制的TextRNN构建分类模型. 实验结果表明, 基于深度学习的方法在多数问题目的类别上的分类性能优于已有基准方法, 且使用的Adam优化器优于SGD优化器, 使用Glove预训练的词向量优于使用随机生成的词向量. 该方法以提问目的对帖子进行分类, 可为分析Stack Overflow(SO)上的帖子讨论主题增加新维度.
中图分类号: