[论文翻译]ROUGE: 自动摘要评估工具包

ROUGE (Recall-Oriented Understudy for Gisting Evaluation) 是一套通过将待评估摘要与人工撰写的理想摘要进行对比，自动判定摘要质量的评测方法。该方法通过统计计算机生成摘要与人工参考摘要之间n元语法(n-gram)、词序列和词对等重叠单元的数量来实现评估。本文介绍了ROUGE摘要评估工具包中包含的四种评测指标：ROUGE-N、ROUGE-L、ROUGE-W和ROUGE-S及其评估方法。其中三项指标已应用于由美国国家标准技术研究院(NIST)主办的大规模摘要评测会议DUC 2004 (Document Understanding Conference)。