
推荐文章
- [论文翻译]iColoriT: 利用Vision Transformer在交互式着色中将局部提示传播至正确区域
- [论文翻译]SPIdepth: 增强位姿信息的自监督单目深度估计
- [论文翻译]该方法通过构建教师-学生双网络架构实现:教师网络为无标注图像生成伪标签
- [博客翻译]让AI通过语言学习理解世界
- [论文翻译]输入扰动降低扩散模型的曝光偏差
- [论文翻译]GME: 通过多模态LLMs改进通用多模态检索
- [论文翻译]UniTraj: 可扩展车辆轨迹预测的统一框架
- [论文翻译]通过层次化关系和常识知识增强场景图生成
- [论文翻译]Layout Diffusion: 面向布局到图像生成的可控扩散模型
- [论文翻译]状态空间模型遇上Transformer:3D物体检测新范式