[论文翻译]基于循环神经网络的序列预测计划采样方法
循环神经网络 (Recurrent Neural Networks) 可以通过训练在给定输入的情况下生成一系列 token,这在机器翻译和图像描述生成的最新成果中得到了印证。目前训练它们的方法主要是最大化序列中每个 token 在当前(循环)状态和前一 token 条件下的似然。在推理时,未知的前一 token 会被模型自身生成的 token 所替代。这种训练和推理之间的差异可能导致错误,并沿着生成的序列迅速累积。我们提出了一种课程学习 (curriculum learning) 策略,逐步将训练过程从完全依赖真实前一 token 的引导模式,过渡到主要使用模型生成 token 的低引导模式。在多个序列预测任务上的实验表明,这种方法带来了显著改进。此外,它在我们赢得 2015 年 MSCOCO 图像描述挑战赛的参赛方案中得到了成功应用。