[博客翻译]大型语言模型的涌现能力是一种幻觉 斯蒂芬·奥内斯科学3月24日,2024年08:00大型语言模型的涌现能力可能是个幻象在一项名为“超越模仿游戏基准”(Beyond the Imitation Game benchmark, 或 BIG-bench)的项目中,450位研究人员编纂了一份包含204项任务的列表,旨在测试大型语言模型(如ChatGPT聊天机器人)的能力。在大多数任务中,随着模型的规模扩大,性能通常会稳定提升——模型越大,表现越好... 由 openoker发布于 2024-03-25 12:30:11 大型语言模型涌现模型性能衡量方式加法能力 阅读次数 880