推荐文章
- [论文翻译]Megatron-LM: 使用模型并行训练多十亿参数语言模型
- [论文翻译]神经语言模型的扩展定律 (Scaling Laws for Neural Language Models)
- [博客翻译]Nvidia Tensor核心编程
- [论文翻译]连接思维提示在大语言模型中激发推理能力
- [论文翻译]LaMDA: 用于对话应用的大语言模型 (Large Language Model)
- [博客翻译]《雷神之锤》的传送门实现
- [论文翻译]PaLM 2 技术报告
- [论文翻译]rStar-Math:小型大语言模型可以通过自我进化的深度思考掌握数学推理
- [论文翻译]从人类反馈中学习总结
- [博客翻译]关于机器人学与人工智能复杂性的常见误解