• [论文翻译]BERTSCORE:基于BERT的文本生成评估

    我们提出BERTSCORE,一种用于文本生成的自动评估指标。与常见指标类似,BERTSCORE会计算候选句中每个token与参考句中每个token的相似度分数。但不同于精确匹配,我们使用上下文嵌入来计算token相似度。我们基于363个机器翻译和图像描述系统的输出进行评估。相比现有指标,BERTSCORE与人类判断具有更高相关性,并提供更强的模型选择性能。最后,我们通过对抗性复述检测任务证明,相较于现有指标,BERTSCORE在面对挑战性样本时更具鲁棒性。
创作中心
开启你的AI千集创作之旅
发布首篇内容,开通创作中心 快来成为AI千集创作者吧~
公告

AI千集是一个专注于科研服务的智能平台
在这里您可以获得本平台自训练的
科研智能体
和小伙伴一起玩转AI,做自己的AI机器人
来AI千集,赋能智慧快人一步
扫一扫,快速获取解决方案与报价
立即咨询

千集助理
连接科研与大众知识的桥梁
让科学生活融入日常
登陆小程序
AI数字人随身守护
智慧管理更高效
生活品质悄然升级

千集助理