推荐文章
- [论文翻译]使用强化学习在开放式对话中进行动态规划
- [论文翻译]连接思维提示在大语言模型中激发推理能力
- [博客翻译]B-Trees:比我想知道的还要多
- [博客翻译]如何仅使用Nginx和纯bash跟踪网站分析
- [博客翻译]在不断变化的地形中寻找移动目标的路径
- [论文翻译]训练大语言模型 (Large Language Model) 以遵循人类反馈的指令
- [论文翻译]rStar-Math:小型大语言模型可以通过自我进化的深度思考掌握数学推理
- [论文翻译]通过人类反馈增强强化学习
- [博客翻译]《雷神之锤》的传送门实现
- [论文翻译]神经语言模型的扩展定律 (Scaling Laws for Neural Language Models)