推荐文章
- [论文翻译]Flan系列:设计数据和方法以实现有效的指令微调
- [论文翻译]GLaM: 语言模型的有效扩展与专家混合 (Mixture-of-Experts)
- [论文翻译]语言模型是无监督多任务学习者
- [论文翻译]低成本AI通用逼近器如何重塑市场效率
- [论文翻译]PaLM 2 技术报告
- [论文翻译]通过人类反馈强化学习训练一个有用且无害的助手
- [论文翻译]神经语言模型的扩展定律 (Scaling Laws for Neural Language Models)
- [论文翻译]通过生成式预训练提升语言理解能力
- [论文翻译]rStar-Math:小型大语言模型可以通过自我进化的深度思考掌握数学推理
- [论文翻译]大语言模型是少样本学习者