吉林大学学报(理学版) ›› 2025, Vol. 63 ›› Issue (2): 428-0436.
杨航, 张啸成, 张永刚
YANG Hang, ZHANG Xiaocheng, ZHANG Yonggang
摘要: 针对文档级关系抽取任务中的实体多提及问题和实体对噪音问题, 使用实体的类别信息, 提出一个基于实体类别信息的关系抽取模型(EUT模型), 该模型通过实体类别判断和类别对产生的关系类别先验两个子任务提高关系抽取结果. 实体类别判断任务对实体进行类型标记后, 再对实体所有提及进行类型分类, 使实体的多个提及产生更丰富且相近的特征表示. 关系类别先验任务使模型获得实体对的头尾类型所产生的关系分布先验, 通过实体对的类别降低错误实体对噪音. 为验证EUT模型的效果, 在两个文档级数据集DocRED和Re-DocRED上进行实验, 实验结果表明, 该模型有效利用了实体的类型信息, 与基础模型相比取得了更好的关系抽取效果, 表明实体的类别信息对文档级关系抽取有重要影响.
中图分类号: