
推荐文章
- [论文翻译]CoCa: 对比式字幕生成器作为图文基础模型
- [论文翻译]Layout Diffusion: 面向布局到图像生成的可控扩散模型
- [论文翻译]UNICOM: 面向图像检索的通用紧凑表征学习方法
- [论文翻译]面向野外单目视频的鲁棒平滑3D多人姿态估计
- [论文翻译]SPIdepth: 增强位姿信息的自监督单目深度估计
- [论文翻译]iColoriT: 利用Vision Transformer在交互式着色中将局部提示传播至正确区域
- [论文翻译]通过层次化关系和常识知识增强场景图生成
- [论文翻译]上下文感知元学习
- [论文翻译]Mixing-Denoising 通用化占据网络
- [论文翻译]基于高温精炼与背景抑制的细粒度视觉分类