推荐文章
- [论文翻译]加速围棋的自我对弈学习
- [论文翻译]从人类反馈中学习摘要生成
- [论文翻译]神经语言模型的扩展定律 (Scaling Laws for Neural Language Models)
- [论文翻译]训练大语言模型 (Large Language Model) 以遵循人类反馈的指令
- [博客翻译]B-Trees:比我想知道的还要多
- [论文翻译]评估训练于代码的大语言模型
- [博客翻译]Dell L502X BIOS更新安装程序补丁
- [博客翻译]《雷神之锤》的传送门实现
- [论文翻译]rStar-Math:小型大语言模型可以通过自我进化的深度思考掌握数学推理
- [博客翻译]过时信息如何隐藏在LLM的生成概率中并导致逻辑不一致