• [博客翻译]从单运动模糊图像估计相机运动

    图像即IMU:从单张运动模糊图像中估计相机运动 Jerred Chen, Ronald Clark 牛津大学arXiv 2025 论文 补充材料 代码(即将发布) arXiv 给定一张运动模糊图像,我们利用运动模糊的线索来预测相机在那一瞬间的速度,而无需进行任何去模糊处理。 摘要 在许多机器人和VR/AR应用中,快速的相机运动会导致高度的运动模糊,使得现有的相机姿态估计方法失效。在这项工作中,我们提出了一种新颖的框架,将运动模糊作为运动估计的丰富线索,而不是将其视为不需要的伪影。我们的方法通过直接从单张运动...
  • [论文翻译]VGGT: 视觉几何基础 Transformer

    我们提出了 VGGT,这是一种前馈神经网络,能够从一个、几个或数百个场景视图中直接推断出场景的所有关键 3D 属性,包括相机参数、点图、深度图和 3D 点轨迹。这种方法在 3D 计算机视觉领域迈出了一步,因为传统模型通常局限于单一任务并专门针对单一任务。VGGT 简单且高效,能够在一秒内重建图像,并且在不需要视觉几何优化技术后处理的情况下,仍然优于其他替代方案。该网络在多个 3D 任务中取得了最先进的结果,包括相机参数估计、多视图深度估计、密集点云重建和 3D 点跟踪。我们还展示了使用预训练的 VGGT 作为特征骨干可以显著增强下游任务,例如非刚性点跟踪和前馈新视图合成。代码和模型已在 https://github.com/facebookresearch/vggt 公开。
创作中心
开启你的AI千集创作之旅
发布首篇内容,开通创作中心 快来成为AI千集创作者吧~
公告

AI千集是一个二次元智能客服平台
在这里您可以获得本平台自训练的
客服大模型服务
和小伙伴一起玩转AI,做自己的AI机器人
来AI千集,订单转化快人一步
扫一扫,快速获取解决方案与报价
立即咨询

千集助理是连通AI学研和企业的桥梁
登陆小程序
获取AI数字人贴身服务
工作生活效率瞬间提升

千集助理