推荐文章
- [论文翻译]利用大语言模型高效表示企业Web应用程序结构以服务于智能质量工程
- [论文翻译]DeepSeek-V3 技术报告
- [论文翻译]GLaM: 语言模型的有效扩展与专家混合 (Mixture-of-Experts)
- [论文翻译]rStar-Math:小型大语言模型可以通过自我进化的深度思考掌握数学推理
- [博客翻译]在不断变化的地形中寻找移动目标的路径
- [论文翻译]训练大语言模型 (Large Language Model) 以遵循人类反馈的指令
- [论文翻译]通过人类反馈增强强化学习
- [论文翻译]基于人类偏好的深度强化学习
- [论文翻译]LLAMA 2: 开源基础模型和微调聊天模型
- [论文翻译]从人类反馈中学习总结