推荐文章
- [论文翻译]DeepSeek-V3 技术报告
- [论文翻译]OPT: 开放预训练 Transformer 语言模型
- [博客翻译]《雷神之锤》的传送门实现
- [论文翻译]神经语言模型的扩展定律 (Scaling Laws for Neural Language Models)
- [博客翻译]沉思型大语言模型:焦虑是你所需要的全部吗?
- [博客翻译]iOS 18中的同态加密
- [论文翻译]红队测试语言模型以减少危害:方法、扩展行为与经验教训
- [论文翻译]探索统一的文本到文本 Transformer (Text-to-Text Transformer) 的迁移学习极限
- [论文翻译]GPT-4 技术报告
- [论文翻译]加速围棋的自我对弈学习