
推荐文章
- [论文翻译]CoCa: 对比式字幕生成器作为图文基础模型
- [论文翻译]SPIdepth: 增强位姿信息的自监督单目深度估计
- [论文翻译]迈向精确状态估计:融合运动动力学的卡尔曼滤波在3D多目标跟踪中的应用
- [论文翻译]扩展通用数据分析智能体 (Data-Analytic Agents)
- [论文翻译]GME: 通过多模态LLMs改进通用多模态检索
- [论文翻译]面向野外单目视频的鲁棒平滑3D多人姿态估计
- [论文翻译]用紧凑型Transformer (Compact Transformers) 逃离大数据范式
- [论文翻译]视觉空间推理
- [论文翻译]状态空间模型遇上Transformer:3D物体检测新范式
- [论文翻译]DeepMAD: 深度卷积神经网络的数学架构设计