重新思考通过规范化对称性扩散模型及其在分子图生成中的应用

许多化学和科学中的生成任务涉及对群对称性不变(例如,排列和旋转)的分布。一种常见的策略通过架构约束(例如,等变去噪器和不变先验)来强制执行不变性和等变性。在本文中,我们通过替代的规范化视角挑战了这一传统:首先将每个样本映射到具有规范姿态或顺序的轨道代表,在规范切片上训练一个不受约束(非等变)的扩散或流模型,最后在生成时间通过采样随机对称变换来恢复不变分布。基于形式商空间视角,我们的工作通过证明以下内容提供了规范扩散的全面理论:(i)规范生成模型相对于不变目标的正确性、通用性和优越的表达能力;(ii)规范化通过消除由群混合引起的扩散得分复杂性和减少流匹配中的条件方差来加速训练。然后,我们表明对齐先验和最优传输与规范化互补,进一步提高了训练效率。我们将该框架实例化为在 $S_n \times SE(3)$ 对称性下的分子图生成。通过利用基于几何谱的规范化和温和的位置编码,规范扩散在3D分子生成任务中显著优于等变基线,计算量相似甚至更少。此外,通过新颖的架构Canon,CanonFlow在具有挑战性的GEOM-DRUG数据集上实现了最先进的性能,并且这种优势在少量生成步骤中仍然很大。
评论
    公告

    AI千集是一个专注于科研服务的智能平台
    在这里您可以获得本平台自训练的
    科研智能体
    和小伙伴一起玩转AI,做自己的AI机器人
    来AI千集,赋能智慧快人一步
    扫一扫,快速获取解决方案与报价
    立即咨询

    积分排行