
推荐文章
- [论文翻译]TFNet: 利用时序线索实现快速精准的激光雷达语义分割
- [论文翻译]MAFiD: 基于移动平均的融合解码器用于表格和文本数据的问答
- [论文翻译]HAMLET:一种基于分层多模态注意力机制的人类活动识别算法
- [论文翻译]视觉空间推理
- [论文翻译]Layout Diffusion: 面向布局到图像生成的可控扩散模型
- [论文翻译]CoCa: 对比式字幕生成器作为图文基础模型
- [论文翻译]Far3D: 拓展环视3D物体检测的视野
- [论文翻译]ClickDiff: 通过点击诱导语义接触图实现基于扩散模型的可控抓取生成
- [论文翻译]UNICOM: 面向图像检索的通用紧凑表征学习方法
- [论文翻译]视觉领域自适应中的自集成方法