
推荐文章
- [论文翻译]SPIdepth: 增强位姿信息的自监督单目深度估计
- [论文翻译]FMix: 提升混合样本数据增强效果
- [论文翻译]iColoriT: 利用Vision Transformer在交互式着色中将局部提示传播至正确区域
- [论文翻译]视觉空间推理
- [论文翻译]通过层次化关系和常识知识增强场景图生成
- [论文翻译]UNICOM: 面向图像检索的通用紧凑表征学习方法
- [论文翻译]基于生成式Transformer的人类疾病自然史学习
- [论文翻译]状态空间模型遇上Transformer:3D物体检测新范式
- [论文翻译]GME: 通过多模态LLMs改进通用多模态检索
- [论文翻译]MCTrack: 自动驾驶的统一3D多目标跟踪框架