推荐文章
- [论文翻译]Mamba: 线性时间序列建模与选择性状态空间 (Selective State Spaces)
- [论文翻译]使用强化学习在开放式对话中进行动态规划
- [博客翻译]如何仅使用Nginx和纯bash跟踪网站分析
- [博客翻译]Dell L502X BIOS更新安装程序补丁
- [论文翻译]通过人类反馈强化学习训练一个有用且无害的助手
- [博客翻译]沉思型大语言模型:焦虑是你所需要的全部吗?
- [论文翻译]神经语言模型的扩展定律 (Scaling Laws for Neural Language Models)
- [论文翻译]训练大语言模型 (Large Language Model) 以遵循人类反馈的指令
- [论文翻译]OPT: 开放预训练 Transformer 语言模型
- [论文翻译]基于人类偏好的深度强化学习