
推荐文章
- [论文翻译]GAP: 面向知识图谱到文本生成的图感知大语言模型框架
- [论文翻译]将视觉语言预训练
- [论文翻译]RTMDet: 实时目标检测器设计的实证研究
- [论文翻译]用于联合实体和关系抽取的分区过滤网络
- [论文翻译]基于Transformer的新型大规模多模态多任务学习网络
- [论文翻译]CFR-ICL: 基于迭代点击损失级联前向优化的交互式图像分割
- [论文翻译]结合 EfficientNet 和 Vision Transformer 进行视频深度伪造检测
- [论文翻译]理解图像检索重排序:基于图神经网络的视角
- [论文翻译]FACE: 快速、准确且上下文感知的音频标注与分类
- [论文翻译]SAMSum语料库:面向抽象摘要的人类标注对话数据集