推荐文章
- [论文翻译]GPT-4 技术报告
- [论文翻译]训练大语言模型 (Large Language Model) 以遵循人类反馈的指令
- [论文翻译]rStar-Math:小型大语言模型可以通过自我进化的深度思考掌握数学推理
- [博客翻译]过时信息如何隐藏在LLM的生成概率中并导致逻辑不一致
- [论文翻译]DeepSeek-V3 技术报告
- [论文翻译]通过人类反馈强化学习训练一个有用且无害的助手
- [论文翻译]使用强化学习在开放式对话中进行动态规划
- [论文翻译]OPT: 开放预训练 Transformer 语言模型
- [论文翻译]低成本AI通用逼近器如何重塑市场效率
- [论文翻译]训练大语言模型 (Large Language Model) 以遵循人类反馈的指令