吉林大学学报(信息科学版) ›› 2026, Vol. 44 ›› Issue (1): 160-166.
吕妍欣
LÜ Yanxin
摘要: 为解决信息量爆炸背景下思政案例文本篇幅长、 议题复杂、 冗余信息多导致的人工摘要效率低下问题, 以及现有纯抽取式模型忽略语句间逻辑关联、 纯生成式模型易偏离政策导向的缺陷, 提出一种聚类到句子算法 (CLUSTER2SENT: CLUSTER to SENTence)。 该算法通过提取与摘要相关的重要话语-对重要话语进行聚类分 析-为每个聚类生成摘要文本的 3 步流程实现思政案例摘要自动生成。 实验结果表明, CLUSTER2SENT 算法在 ROUGE-1 指标比纯抽取式对应模型高出 8 个百分点, 证实了该算法的有效性; 同时, 在构建摘要语料库时创建 节结构, 可显著提升模型性能。
中图分类号: