[论文翻译]SAMSum语料库:面向抽象摘要的人类标注对话数据集
本文介绍了SAMSum语料库,这是一个包含抽象对话摘要的新数据集。我们通过测试多种模型并将其结果与新闻文章语料库的结果进行比较,探究了该数据集对自动摘要任务带来的挑战。研究表明,模型生成的对话摘要比新闻摘要获得更高的ROUGE分数——这与人类评估者的判断相反。这表明抽象对话摘要这一挑战性任务需要专用模型和非标准质量评估指标。据我们所知,本研究首次引入了经人工标注抽象摘要的高质量聊天对话语料库,可供研究社区用于进一步探索。