
推荐文章
- [论文翻译]从小时到分钟:无损加速超长序列生成至10万Token
- [论文翻译]Slamming: 在一张 GPU 上一天内训练一个语音语言模型
- [论文翻译]重新审视长尾分布下的对抗训练
- [论文翻译]智能体增强检索生成:智能体RAG综述
- [论文翻译]MonSter: 融合单目深度与立体视觉释放潜力
- [论文翻译]基于纯视觉的GUI智能体的OmniParser
- [论文翻译]DeepSeek-R1:通过强化学习提升大语言模型的推理能力
- [博客翻译]Show HN:Tangled-基于atproto构建的Git协作平台
- [论文翻译]olmOCR: 使用视觉语言模型解锁 PDF 中的数万亿 Token
- [论文翻译]Spark-TTS: 基于大语言模型的高效文本转语音模型,采用单流解耦语音Token