
推荐文章
- [论文翻译]数学推理的自我奖励校正
- [智能分析]AI智能体的关键要素及应用前景
- [论文翻译]MA-BERT: 通过结合多属性知识在 Transformer 中学习表示
- [论文翻译]Search-R1: 通过强化学习训练大语言模型进行推理并利用搜索引擎
- [论文翻译]Slim attention: 无需损失精度,将上下文内存减半 —— $K.$ -cache 是 MHA 所需的全部
- [论文翻译]基于迁移的少样本学习中特征分布的利用
- [论文翻译]Data Formulator 2: 数据可视化的迭代创建,AI 在过程中转换数据
- [论文翻译]VGGT: 视觉几何基础 Transformer
- [智能分析]医疗行业中大模型微调方案
- [论文翻译]Fine-mixing: 缓解微调语言模型中的后门问题