推荐文章
- [论文翻译]Megatron-LM: 使用模型并行训练多十亿参数语言模型
- [博客翻译]关于机器人学与人工智能复杂性的常见误解
- [博客翻译]在不断变化的地形中寻找移动目标的路径
- [博客翻译]如何仅使用Nginx和纯bash跟踪网站分析
- [论文翻译]使用强化学习在开放式对话中进行动态规划
- [论文翻译]rStar-Math:小型大语言模型可以通过自我进化的深度思考掌握数学推理
- [论文翻译]LaMDA: 用于对话应用的大语言模型 (Large Language Model)
- [论文翻译]探索统一的文本到文本 Transformer (Text-to-Text Transformer) 的迁移学习极限
- [论文翻译]Flan系列:设计数据和方法以实现有效的指令微调
- [论文翻译]BLOOM: 一个 176B 参数的开放访问多语言大语言模型