推荐文章
- [论文翻译]评估训练于代码的大语言模型
- [论文翻译]连接思维提示在大语言模型中激发推理能力
- [论文翻译]Flan系列:设计数据和方法以实现有效的指令微调
- [论文翻译]从人类反馈中学习摘要生成
- [论文翻译]通过人类反馈强化学习训练一个有用且无害的助手
- [论文翻译]BLOOM: 一个 176B 参数的开放访问多语言大语言模型
- [论文翻译]rStar-Math:小型大语言模型可以通过自我进化的深度思考掌握数学推理
- [博客翻译]用C编写一个简单的池分配器
- [论文翻译]GLaM: 语言模型的有效扩展与专家混合 (Mixture-of-Experts)
- [论文翻译]Mamba: 线性时间序列建模与选择性状态空间 (Selective State Spaces)