
推荐文章
- [论文翻译]CoCa: 对比式字幕生成器作为图文基础模型
- [论文翻译]面向长尾视觉识别的全局与局部混合一致性累积学习
- [论文翻译]视觉空间推理
- [论文翻译]小数据集上的文本到图像生成数据外推
- [论文翻译]用紧凑型Transformer (Compact Transformers) 逃离大数据范式
- [论文翻译]癌症研究人员人工智能指南
- [论文翻译]iColoriT: 利用Vision Transformer在交互式着色中将局部提示传播至正确区域
- [论文翻译]迈向精确状态估计:融合运动动力学的卡尔曼滤波在3D多目标跟踪中的应用
- [论文翻译]Layout Diffusion: 面向布局到图像生成的可控扩散模型
- [论文翻译]面向野外单目视频的鲁棒平滑3D多人姿态估计