• [论文翻译]长短期记忆网络

    通过循环反向传播学习在长时间间隔内存储信息需要非常长的时间,主要原因是误差反向传播不足且会衰减。我们简要回顾了Hochreiter (1991)对该问题的分析,随后通过引入一种新颖、高效的基于梯度的方法——长短期记忆网络(LSTM)来解决这一问题。LSTM通过特殊单元中的恒定误差传送带强制保持恒定误差流,在不会造成损害的情况下截断梯度,从而能够学习跨越超过1000个离散时间步长的最小时间滞后。乘法门控单元学会打开和关闭对恒定误差流的访问。LSTM在空间和时间上都是局部的;其每个时间步和权重的计算复杂度为\$O(1)\$。我们在人工数据上的实验涉及局部、分布式、实值和带噪声的模式表示。与实时循环学习、时间反向传播、循环级联相关、Elman网络和神经序列分块相比,LSTM能够实现更多成功的运行,并且学习速度更快。LSTM还解决了以往循环网络算法从未解决过的复杂人工长时滞任务。
创作中心
开启你的AI千集创作之旅
发布首篇内容,开通创作中心 快来成为AI千集创作者吧~
公告

AI千集是一个二次元智能客服平台
在这里您可以获得本平台自训练的
客服大模型服务
和小伙伴一起玩转AI,做自己的AI机器人
来AI千集,订单转化快人一步
扫一扫,快速获取解决方案与报价
立即咨询

千集助理是连通AI学研和企业的桥梁
登陆小程序
获取AI数字人贴身服务
工作生活效率瞬间提升

千集助理