推荐文章
- [论文翻译]从人类反馈中学习摘要生成
- [论文翻译]通过人类反馈强化学习训练一个有用且无害的助手
- [论文翻译]Google 如何利用 AI 进行内部代码迁移?
- [论文翻译]LaMDA: 用于对话应用的大语言模型 (Large Language Model)
- [论文翻译]BLOOM: 一个 176B 参数的开放访问多语言大语言模型
- [论文翻译]通过人类反馈增强强化学习
- [论文翻译]Megatron-LM: 使用模型并行训练多十亿参数语言模型
- [博客翻译]《雷神之锤》的传送门实现
- [论文翻译]rStar-Math:小型大语言模型可以通过自我进化的深度思考掌握数学推理
- [博客翻译]DeepFace:Python的轻量级深度人脸识别库