推荐文章
- [论文翻译]通过生成式预训练提高语言理解能力
- [论文翻译]Megatron-LM: 使用模型并行训练多十亿参数语言模型
- [论文翻译]神经语言模型的扩展定律 (Scaling Laws for Neural Language Models)
- [论文翻译]GLaM: 语言模型的有效扩展与专家混合 (Mixture-of-Experts)
- [论文翻译]大语言模型是少样本学习者
- [论文翻译]rStar-Math:小型大语言模型可以通过自我进化的深度思考掌握数学推理
- [论文翻译]使用强化学习在开放式对话中进行动态规划
- [论文翻译]LLAMA 2: 开源基础模型和微调聊天模型
- [论文翻译]注意力就是你所需要的 (Attention Is All You Need)
- [论文翻译]训练大语言模型 (Large Language Model) 以遵循人类反馈的指令