推荐文章
- [论文翻译]Flan系列:设计数据和方法以实现有效的指令微调
- [论文翻译]加速围棋的自我对弈学习
- [论文翻译]TB-Bench:用于从行车记录仪图像/视频中理解时空交通行为的训练和测试多模态 AI
- [论文翻译]训练大语言模型 (Large Language Model) 以遵循人类反馈的指令
- [论文翻译]连接思维提示在大语言模型中激发推理能力
- [论文翻译]Eliza: 一个 Web3 友好的 AI 智能体操作系统
- [论文翻译]GLaM: 语言模型的有效扩展与专家混合 (Mixture-of-Experts)
- [论文翻译]基于人类偏好的深度强化学习
- [论文翻译]红队测试语言模型以减少危害:方法、扩展行为与经验教训
- [博客翻译]沉思型大语言模型:焦虑是你所需要的全部吗?