
推荐文章
- [论文翻译]Point-JEPA:一种用于点云自监督学习的联合嵌入预测架构
- [论文翻译]MaskNet: 通过实例引导的掩码将特征乘法引入CTR排序模型
- [论文翻译]SAGA: 一种支持非强凸复合目标的快速增量梯度方法
- [论文翻译]MyGO 多重 CoT:通过双重思维链实现大语言模型自我反思的方法
- [论文翻译]VGGT: 视觉几何基础 Transformer
- [论文翻译]强化学习优于监督微调:以音频问答为例
- [论文翻译]MA-BERT: 通过结合多属性知识在 Transformer 中学习表示
- [论文翻译]全局与局部混合一致性累积学习用于长尾视觉识别
- [论文翻译]YOLOE: 实时视觉感知
- [论文翻译]Comet: 面向专家混合模型的细粒度计算-通信重叠