推荐文章
- [论文翻译]GLaM: 语言模型的有效扩展与专家混合 (Mixture-of-Experts)
- [论文翻译]OPT: 开放预训练 Transformer 语言模型
- [论文翻译]加速围棋的自我对弈学习
- [论文翻译]通过生成式预训练提升语言理解能力
- [论文翻译]Megatron-LM: 使用模型并行训练多十亿参数语言模型
- [论文翻译]大语言模型是少样本学习者
- [博客翻译]关于机器人学与人工智能复杂性的常见误解
- [论文翻译]Flan系列:设计数据和方法以实现有效的指令微调
- [论文翻译]Mamba: 线性时间序列建模与选择性状态空间 (Selective State Spaces)
- [论文翻译]通过人类反馈增强强化学习