吉林大学学报(理学版) ›› 2023, Vol. 61 ›› Issue (4): 909-914.
韩开旭1, 袁淑芳2
HAN Kaixu1, YUAN Shufang2
摘要: 为提高短文本语义相似性度量准确性, 设计一种基于混合机器学习模型的短文本语义相似性度量算法. 先对短文本实施预处理, 基于混合机器学习模型构建短文本的字词向量模型, 对短文本进行特征扩展; 然后组合短文本的多样度量特征, 对多样度量特征进行维度规约; 最后通过构建一个集成学习模型, 计算语义相似性结果, 实现语义相似性的度量. 使用“Quora Question Pairs”比赛数据集测试该方法的性能, 测试结果表明, 该方法的准确性较高, 对数损失和度量均方差均较低, 说明该方法的相似性度量准确性较高.
中图分类号: