推荐文章
- [论文翻译]探索统一的文本到文本 Transformer (Text-to-Text Transformer) 的迁移学习极限
- [论文翻译]神经语言模型的扩展定律 (Scaling Laws for Neural Language Models)
- [论文翻译]基于人类偏好的深度强化学习
- [论文翻译]训练大语言模型 (Large Language Model) 以遵循人类反馈的指令
- [论文翻译]通过人类反馈增强强化学习
- [博客翻译]过时信息如何隐藏在LLM的生成概率中并导致逻辑不一致
- [论文翻译]Mamba: 线性时间序列建模与选择性状态空间 (Selective State Spaces)
- [论文翻译]LaMDA: 用于对话应用的大语言模型 (Large Language Model)
- [论文翻译]GPT-4 技术报告
- [论文翻译]使用强化学习在开放式对话中进行动态规划