吉林大学学报(理学版) ›› 2023, Vol. 61 ›› Issue (5): 1103-1111.
王红斌1,2,3, 杨何祯旻1,2,3, 王灿宇4
WANG Hongbin1,2,3, YANG Hezhenmin1,2,3, WANG Canyu4
摘要: 针对获取大规模的多跳问答训练数据集耗时耗力的问题, 提出一个基于对比学习思想的多跳问题生成模型. 模型分为生成阶段和对比学习打分阶段, 生成阶段通过执行推理图生成候选多跳问题, 对比学习打分阶段通过一个基于对比学习思想的无参考问题的候选问题打分模型对候选问题进行打分排序, 并选择最优的候选问题. 该模型在一定程度上缩小了无监督方法与人工标注方法的差距, 有效缓解了缺少多跳问答数据集的问题. 在数据集HotpotQA上的实验结果表明, 基于对比学习的多跳问题生成模型能有效扩充训练数据, 极大减少了人工标注数据的成本.
中图分类号: