
推荐文章
- [论文翻译]Far3D: 拓展环视3D物体检测的视野
- [论文翻译]CoCa: 对比式字幕生成器作为图文基础模型
- [论文翻译]BABEL: 身体、动作与行为英语标注库
- [论文翻译]基于高温精炼与背景抑制的细粒度视觉分类
- [论文翻译]DeepMAD: 深度卷积神经网络的数学架构设计
- [论文翻译]面向长尾视觉识别的全局与局部混合一致性累积学习
- [论文翻译]ClickDiff: 通过点击诱导语义接触图实现基于扩散模型的可控抓取生成
- [论文翻译]MAFiD: 基于移动平均的融合解码器用于表格和文本数据的问答
- [论文翻译]Layout Diffusion: 面向布局到图像生成的可控扩散模型
- [论文翻译]iColoriT: 利用Vision Transformer在交互式着色中将局部提示传播至正确区域