DeepSeek - 标签内容 | AI千集 — AI角色定制平台

[论文翻译]DeepSeek-R1：通过强化学习提升大语言模型的推理能力

我们推出了第一代推理模型 DeepSeek-R1-Zero 和 DeepSeek-R1。DeepSeek-R1-Zero 是一个通过大规模强化学习 (RL) 训练的模型，没有监督微调 (SFT) 作为初步步骤，展示了卓越的推理能力。通过 RL，DeepSeek-R1-Zero 自然具备了众多强大且有趣的推理行为。然而，它也面临诸如可读性差和语言混合等挑战。为了解决这些问题并进一步提升推理性能，我们推出了 DeepSeek-R1，它在 RL 之前引入了多阶段训练和冷启动数据。DeepSeek-R1 在推理任务上的表现与 OpenAI-o1-1217 相当。为了支持研究社区，我们开源了 DeepSeek-R1-Zero、DeepSeek-R1 以及基于 Qwen 和 Llama 从 DeepSeek-R1 蒸馏出的六个密集模型 (1.5B, 7B, 8B, 14B, 32B, 70B)。

由 shadow发布于 2025-03-01 10:02:25 推理模型DeepSeek大语言模型阅读次数 1243
[智能分析]普通人如何避免陷入DeepSeek大模型的幻觉陷阱

在当今数字化时代，人工智能（AI）技术的迅猛发展为我们的生活带来了诸多便利，尤其是大型语言模型（如DeepSeek）的应用。然而，这些模型在提供信息和生成内容的同时，也潜藏着“幻觉”现象的风险，即模型生成的信息可能并不准确或具有误导性。这种现象不仅影响了专业人士的决策，也可能对普通用户的日常生活产生负面影响。随着AI技术的普及，普通人越来越多地依赖这些工具来获取信息、解决问题和进行创作。然而，由于缺乏对AI模型工作原理的深入理解，用户往往容易陷入模型生成内容的表象之中，忽视了其潜在的局限性和误导性。为了帮...

由 openoker发布于 2025-02-28 16:26:50 人工智能幻觉机制DeepSeek 阅读次数 2397
[智能分析]DeepSeek 开源周发布 DeepEP 和 DeepGEMM

在人工智能技术快速发展的背景下，开源项目的推出为研究者和开发者提供了更为高效的工具和资源。2025年2月26日，DeepSeek 开源周迎来了其第二弹，推出了专为混合专家模型（MoE）和专家并行（EP）设计的开源通信库——DeepEP。该库旨在提升大规模 AI 模型的训练和推理效率，犹如为 MoE 模型构建了一条“数据高速公路”，使得多个“专家”之间的协作更加迅速和高效。与此同时，DeepSeek 还宣布了第三弹的开源项目——DeepGEMM，进一步丰富了其开源生态系统。这些新工具的发布不仅为 AI 开发...

由 openoker发布于 2025-02-26 10:06:17 深度学习矩阵运算DeepSeek 阅读次数 1488
[智能分析]DeepSeek 宣布下周连发 5 个开源项目，这才是 Open AI！

在人工智能领域，开源项目的迅速发展为技术创新和社区协作提供了强大的动力。最近，DeepSeek 宣布将在下周推出五个全新的开源项目，这一消息引起了广泛关注。作为一家致力于推动人工智能技术进步的公司，DeepSeek 的这一举措不仅展示了其在技术研发方面的雄心，也反映了开源社区在推动 AI 发展中的重要角色。这些新项目的推出，标志着 DeepSeek 在开源生态系统中的进一步参与，旨在为开发者和研究人员提供更多工具和资源，以便他们能够更好地探索和实现人工智能的潜力。开源项目的透明性和可访问性使得技术的进步不...

由 openoker发布于 2025-02-22 17:24:55 开源项目人工智能DeepSeek 阅读次数 1426

[论文翻译]DeepSeek-R1：通过强化学习提升大语言模型的推理能力

[智能分析]普通人如何避免陷入DeepSeek大模型的幻觉陷阱

[智能分析]DeepSeek 开源周发布 DeepEP 和 DeepGEMM

[智能分析]DeepSeek 宣布下周连发 5 个开源项目，这才是 Open AI！

使用 LLaMA-Factory+AutoDL 微调 DeepSeek1.5B 笔记