推荐文章
- [博客翻译]《雷神之锤》的传送门实现
- [论文翻译]红队测试语言模型以减少危害:方法、扩展行为与经验教训
- [论文翻译]GLaM: 语言模型的有效扩展与专家混合 (Mixture-of-Experts)
- [论文翻译]基于人类偏好的深度强化学习
- [论文翻译]Megatron-LM: 使用模型并行训练多十亿参数语言模型
- [博客翻译]我对Kotlin的思考:4年后的展望
- [论文翻译]通过生成式预训练提升语言理解能力
- [博客翻译]沉思型大语言模型:焦虑是你所需要的全部吗?
- [论文翻译]神经语言模型的扩展定律 (Scaling Laws for Neural Language Models)
- [博客翻译]2024年的IP地址分配情况