BERTSum模型 - 标签内容 | AI千集 — AI角色定制平台

[论文翻译]基于BERT的口语和书面指令摘要生成

语音摘要由于语言流的自发性、不流畅性以及其他书面文本中通常不存在的问题而成为一个难题。我们的工作首次将BERTSum模型应用于会话语言。我们针对从园艺、烹饪到软件配置和体育等各种主题的叙述性教学视频生成抽象摘要。为了丰富词汇量，我们采用迁移学习技术，在多个大型跨领域数据集（包含书面和口语英语）上对模型进行预训练。同时，我们对转录文本进行预处理，以恢复自动语音识别(ASR)系统输出中的句子分割和标点符号。通过ROUGE和Content-F1评分对How2和WikiHow数据集的结果进行评估。我们邀请人工评审员对从HowTo100M和YouTube精选数据集中随机选取的摘要进行评分。基于盲测评估，我们的模型在文本流畅性和实用性方面达到了接近人类内容创作者撰写摘要的水平。该模型在风格主题差异显著的WikiHow文章上表现优于当前SOTA（State-of-the-art）模型，同时在经典CNN/DailyMail数据集上未出现性能衰退。由于该模型在不同风格和领域间具有高度泛化能力，其在提升互联网内容可访问性与可发现性方面具有巨大潜力。我们设想将其集成到智能虚拟助手中，使其能够根据需求对书面和口语教学内容进行摘要生成。

由 shadow发布于 2025-05-17 13:36:03 BERTSum模型预训练模型阅读次数 1082