
推荐文章
- [论文翻译]SAGA: 一种支持非强凸复合目标的快速增量梯度方法
- [论文翻译]Search-R1: 通过强化学习训练大语言模型进行推理并利用搜索引擎
- [论文翻译]Data Formulator 2: 数据可视化的迭代创建,AI 在过程中转换数据
- [智能分析]AI智能体的关键要素及应用前景
- [论文翻译]CrossWOZ: 一个大规模中文跨领域任务导向对话数据集
- [论文翻译]MaTVLM: 用于高效视觉语言建模的混合 Mamba-Transformer
- [论文翻译]Point-JEPA:一种用于点云自监督学习的联合嵌入预测架构
- [论文翻译]ERNIE-GEN:一种增强的多流预训练与微调框架用于自然语言生成
- [智能分析]医疗行业中大模型微调方案
- [论文翻译]MA-BERT: 通过结合多属性知识在 Transformer 中学习表示