推荐文章
- [论文翻译]通过生成式预训练提升语言理解能力
- [论文翻译]Flan系列:设计数据和方法以实现有效的指令微调
- [论文翻译]低成本AI通用逼近器如何重塑市场效率
- [博客翻译]《雷神之锤》的传送门实现
- [论文翻译]通过人类反馈增强强化学习
- [博客翻译]在不断变化的地形中寻找移动目标的路径
- [论文翻译]训练大语言模型 (Large Language Model) 以遵循人类反馈的指令
- [论文翻译]语言模型是无监督多任务学习者
- [论文翻译]Mamba: 线性时间序列建模与选择性状态空间 (Selective State Spaces)
- [论文翻译]rStar-Math:小型大语言模型可以通过自我进化的深度思考掌握数学推理