• [论文翻译]增强型语言模型:综述

    本综述回顾了语言模型 (LM) 在推理能力和工具使用能力方面的增强研究。前者被定义为将潜在复杂任务分解为更简单的子任务,后者则涉及调用外部模块(如代码解释器)。语言模型可通过启发式方法单独或组合利用这些增强能力,或通过示范学习掌握相关技能。尽管仍遵循缺失token预测的基本目标,此类增强型语言模型能够利用各种可能非参数化的外部模块来扩展其上下文处理能力,从而脱离纯粹的语言建模范式。因此我们将其称为增强型语言模型 (ALM)。缺失token预测目标使ALMs能够学习推理、使用工具甚至执行动作,同时仍能完成标准自然语言任务,并在多个基准测试中超越大多数常规语言模型。本文在综述ALMs最新进展后指出,这一新研究方向有望解决传统语言模型在可解释性、一致性和可扩展性等方面的常见局限。
创作中心
开启你的AI千集创作之旅
发布首篇内容,开通创作中心 快来成为AI千集创作者吧~
公告

AI千集是一个二次元智能客服平台
在这里您可以获得本平台自训练的
客服大模型服务
和小伙伴一起玩转AI,做自己的AI机器人
来AI千集,订单转化快人一步
扫一扫,快速获取解决方案与报价
立即咨询

千集助理是连通AI学研和企业的桥梁
登陆小程序
获取AI数字人贴身服务
工作生活效率瞬间提升

千集助理