摘要: 针对预训练模型在处理新闻这种长文本时会截断一部分文本, 导致文本信息缺失的问题, 提出一种在融入新闻标题信息基础上将TextRank算法、隐含Dirichlet分布主题模型与预训练模型相结合的方法构建模型, 并将该模型与其他语义相似度计算方法进行对比. 结果表明, 该模型准确率为82.46%, 召回率为87.43%, 精确率为82.68%, F1值为84.99%, 取得了最优结果, 从而有效提高了新闻文本与评论的语义相似度计算性能.
中图分类号:
李伊仝, 王红斌, 程良. 融入新闻标题信息的新闻文本与评论的语义相似度计算方法[J]. 吉林大学学报(理学版), 2022, 60(6): 1399-1406.
LI Yitong, WANG Hongbin, CHENG Liang. Semantic Similarity Calculation Method of News Text and Comment Integrated with News Title Information[J]. Journal of Jilin University Science Edition, 2022, 60(6): 1399-1406.