推荐文章
- [论文翻译]通过人类反馈强化学习训练一个有用且无害的助手
- [论文翻译]LLAMA 2: 开源基础模型和微调聊天模型
- [博客翻译]沉思型大语言模型:焦虑是你所需要的全部吗?
- [论文翻译]从人类反馈中学习摘要生成
- [博客翻译]《雷神之锤》的传送门实现
- [论文翻译]Flan系列:设计数据和方法以实现有效的指令微调
- [论文翻译]神经语言模型的扩展定律 (Scaling Laws for Neural Language Models)
- [论文翻译]训练大语言模型 (Large Language Model) 以遵循人类反馈的指令
- [论文翻译]BLOOM: 一个 176B 参数的开放访问多语言大语言模型
- [博客翻译]B-Trees:比我想知道的还要多