推荐文章
- [论文翻译]通过人类反馈强化学习训练一个有用且无害的助手
- [论文翻译]神经语言模型的扩展定律 (Scaling Laws for Neural Language Models)
- [博客翻译]沉思型大语言模型:焦虑是你所需要的全部吗?
- [论文翻译]通过人类反馈增强强化学习
- [论文翻译]rStar-Math:小型大语言模型可以通过自我进化的深度思考掌握数学推理
- [论文翻译]BLOOM: 一个 176B 参数的开放访问多语言大语言模型
- [博客翻译]iOS 18中的同态加密
- [论文翻译]Mamba: 线性时间序列建模与选择性状态空间 (Selective State Spaces)
- [博客翻译]科拉茨蚂蚁与科拉茨序列的相似性
- [论文翻译]大语言模型是少样本学习者