
推荐文章
- [论文翻译]HybridFlow: 灵活高效的 RLHF 框架
- [论文翻译]OpenRLHF: 一个易用、可扩展且高性能的 RLHF 框架
- [论文翻译]Pandora3D: 高质量3D形状与纹理生成的综合框架
- [论文翻译]A-MEM:面向大语言模型智能体的记忆系统
- [论文翻译]智能体增强检索生成:智能体RAG综述
- [论文翻译]PIKE-RAG: 专业化知识和推理增强生成
- [论文翻译]Spark-TTS: 基于大语言模型的高效文本转语音模型,采用单流解耦语音Token
- [论文翻译]DeepSeek-R1:通过强化学习提升大语言模型的推理能力
- [论文翻译]探索结果奖励在数学推理学习中的极限
- [论文翻译]AWQ:基于激活感知的权重量化技术,用于设备端大语言模型压缩与加速