
                          推荐文章
                      
 - [论文翻译]GME: 通过多模态LLMs改进通用多模态检索
- [论文翻译]Far3D: 拓展环视3D物体检测的视野
- [论文翻译]CoCa: 对比式字幕生成器作为图文基础模型
- [论文翻译]视觉空间推理
- [论文翻译]iColoriT: 利用Vision Transformer在交互式着色中将局部提示传播至正确区域
- [论文翻译]扩展通用数据分析智能体 (Data-Analytic Agents)
- [论文翻译]SPIdepth: 增强位姿信息的自监督单目深度估计
- [博客翻译]合成孔径雷达自动对焦与校准技术解析
- [论文翻译]状态空间模型遇上Transformer:3D物体检测新范式
- [论文翻译]基于高温精炼与背景抑制的细粒度视觉分类