• [论文翻译]Supermasks in Superposition

    我们提出了超叠加网络中的超掩码(SupSup)模型,能够在不发生灾难性遗忘的情况下连续学习数千个任务。该方法使用随机初始化且固定的基础网络,并为每个任务找到一个性能良好的子网络(超掩码)。若测试时提供任务标识,则能以最小内存占用检索出正确的子网络;若未提供,SupSup可通过基于梯度的优化来推断任务,找到能最小化输出熵的已学习超掩码线性叠加。实践中我们发现,即便面对2500个任务,单个梯度步长通常也足以识别正确掩码。我们还展示了两项前瞻性扩展:首先,SupSup模型可在完全不知晓任务标识信息的情况下进行训练,当检测到对新数据不确定时,可为新训练分布分配额外超掩码;最后,通过将不断增长的整套超掩码作为吸引子隐式存储在固定大小的Hopfield网络中,可实现恒定大小的存储池。
创作中心
开启你的AI千集创作之旅
发布首篇内容,开通创作中心 快来成为AI千集创作者吧~
公告

AI千集是一款聚焦健康管理的智能平台
在这里您可以获得本平台自训练的
健康管理大模型服务
和小伙伴一起玩转AI,做自己的AI机器人
来AI千集,赋能健康快人一步
扫一扫,快速获取解决方案与报价
立即咨询

千集助理
连接科研与大众健康的桥梁
让科学健康管理融入日常
登陆小程序
AI数字人随身守护
健康管理更高效
生活品质悄然升级

千集助理