推荐文章
- [论文翻译]从人类反馈中学习总结
- [博客翻译]DeepFace:Python的轻量级深度人脸识别库
- [论文翻译]DeepSeek-V3 技术报告
- [博客翻译]在不断变化的地形中寻找移动目标的路径
- [论文翻译]连接思维提示在大语言模型中激发推理能力
- [论文翻译]探索统一的文本到文本 Transformer (Text-to-Text Transformer) 的迁移学习极限
- [论文翻译]GLaM: 语言模型的有效扩展与专家混合 (Mixture-of-Experts)
- [博客翻译]过时信息如何隐藏在LLM的生成概率中并导致逻辑不一致
- [论文翻译]通过生成式预训练提升语言理解能力
- [论文翻译]Mamba: 线性时间序列建模与选择性状态空间 (Selective State Spaces)