[论文翻译]多样化束搜索:从神经序列模型中解码多样化解决方案
神经序列模型被广泛用于建模时间序列数据。同样普遍的是使用束搜索 (beam search, BS) 作为近似推理算法,从这些模型中解码输出序列。BS 以贪心的从左到右方式探索搜索空间,仅保留前 \$\mathcal{B}\$ 个候选——导致生成的序列彼此之间仅有微小差异。生成几乎相同的序列列表不仅计算效率低下,而且通常无法捕捉复杂 AI 任务固有的模糊性。为解决这一问题,我们提出多样化束搜索 (Diverse Beam Search, DBS),通过优化多样性增强目标来解码多样化输出列表。我们发现,该方法通过控制搜索空间的探索与利用,能找到更优的 top-1 解决方案——这意味着 DBS 是一种更好的搜索算法。此外,与束搜索相比,这些性能提升仅需极少的计算或内存开销。为展示该方法的广泛适用性,我们使用标准量化指标和人工定性研究,在图像描述、机器翻译和视觉问题生成任务上呈现结果。进一步地,我们研究了随着图像复杂度变化,多样性在图像相关语言生成任务中的作用。结果表明,我们的方法在神经序列模型多样化解码方面始终优于 BS 和先前提出的技术。