• [论文翻译]DeepSeek-R1:通过强化学习提升大语言模型的推理能力

    我们推出了第一代推理模型 DeepSeek-R1-Zero 和 DeepSeek-R1。DeepSeek-R1-Zero 是一个通过大规模强化学习 (RL) 训练的模型,没有监督微调 (SFT) 作为初步步骤,展示了卓越的推理能力。通过 RL,DeepSeek-R1-Zero 自然具备了众多强大且有趣的推理行为。然而,它也面临诸如可读性差和语言混合等挑战。为了解决这些问题并进一步提升推理性能,我们推出了 DeepSeek-R1,它在 RL 之前引入了多阶段训练和冷启动数据。DeepSeek-R1 在推理任务上的表现与 OpenAI-o1-1217 相当。为了支持研究社区,我们开源了 DeepSeek-R1-Zero、DeepSeek-R1 以及基于 Qwen 和 Llama 从 DeepSeek-R1 蒸馏出的六个密集模型 (1.5B, 7B, 8B, 14B, 32B, 70B)。
  • [智能分析]普通人如何避免陷入DeepSeek大模型的幻觉陷阱

    在当今数字化时代,人工智能(AI)技术的迅猛发展为我们的生活带来了诸多便利,尤其是大型语言模型(如DeepSeek)的应用。然而,这些模型在提供信息和生成内容的同时,也潜藏着“幻觉”现象的风险,即模型生成的信息可能并不准确或具有误导性。这种现象不仅影响了专业人士的决策,也可能对普通用户的日常生活产生负面影响。 随着AI技术的普及,普通人越来越多地依赖这些工具来获取信息、解决问题和进行创作。然而,由于缺乏对AI模型工作原理的深入理解,用户往往容易陷入模型生成内容的表象之中,忽视了其潜在的局限性和误导性。为了帮...
  • [智能分析]DeepSeek 开源周发布 DeepEP 和 DeepGEMM

    在人工智能技术快速发展的背景下,开源项目的推出为研究者和开发者提供了更为高效的工具和资源。2025年2月26日,DeepSeek 开源周迎来了其第二弹,推出了专为混合专家模型(MoE)和专家并行(EP)设计的开源通信库——DeepEP。该库旨在提升大规模 AI 模型的训练和推理效率,犹如为 MoE 模型构建了一条“数据高速公路”,使得多个“专家”之间的协作更加迅速和高效。 与此同时,DeepSeek 还宣布了第三弹的开源项目——DeepGEMM,进一步丰富了其开源生态系统。这些新工具的发布不仅为 AI 开发...
  • [智能分析]DeepSeek 宣布下周连发 5 个开源项目,这才是 Open AI!

    在人工智能领域,开源项目的迅速发展为技术创新和社区协作提供了强大的动力。最近,DeepSeek 宣布将在下周推出五个全新的开源项目,这一消息引起了广泛关注。作为一家致力于推动人工智能技术进步的公司,DeepSeek 的这一举措不仅展示了其在技术研发方面的雄心,也反映了开源社区在推动 AI 发展中的重要角色。 这些新项目的推出,标志着 DeepSeek 在开源生态系统中的进一步参与,旨在为开发者和研究人员提供更多工具和资源,以便他们能够更好地探索和实现人工智能的潜力。开源项目的透明性和可访问性使得技术的进步不...
创作中心
开启你的AI千集创作之旅
发布首篇内容,开通创作中心 快来成为AI千集创作者吧~
公告

AI千集是一个二次元智能客服平台
在这里您可以获得本平台自训练的
客服大模型服务
和小伙伴一起玩转AI,做自己的AI机器人
来AI千集,订单转化快人一步
扫一扫,快速获取解决方案与报价
立即咨询

千集助理是连通AI学研和企业的桥梁
登陆小程序
获取AI数字人贴身服务
工作生活效率瞬间提升

千集助理