[博客翻译]扩散模型的收敛速度提高了20倍
基于去噪的生成模型,如扩散模型和流模型,已经成为生成高维视觉数据的可扩展方法。近期研究开始探索将扩散模型作为表示学习工具,其隐藏状态能捕捉有意义的区分特征。我们发现,训练扩散模型的主要挑战在于学习高质量的内部表示。具体来说:当扩散模型得到另一个模型(如自监督视觉编码器)提供的高质量外部表示支持时,生成性能会有显著提升。
我们提出了一种简单的方法——表示对齐(REPA),它建立在最新的扩散变压器架构上。REPA将预训练的自监督视觉表...