深度图 - 标签内容 | AI千集 — AI角色定制平台

[博客翻译]从单运动模糊图像估计相机运动

图像即IMU：从单张运动模糊图像中估计相机运动 Jerred Chen, Ronald Clark 牛津大学arXiv 2025 论文补充材料代码（即将发布） arXiv 给定一张运动模糊图像，我们利用运动模糊的线索来预测相机在那一瞬间的速度，而无需进行任何去模糊处理。摘要在许多机器人和VR/AR应用中，快速的相机运动会导致高度的运动模糊，使得现有的相机姿态估计方法失效。在这项工作中，我们提出了一种新颖的框架，将运动模糊作为运动估计的丰富线索，而不是将其视为不需要的伪影。我们的方法通过直接从单张运动...

[论文翻译]VGGT: 视觉几何基础 Transformer

我们提出了 VGGT，这是一种前馈神经网络，能够从一个、几个或数百个场景视图中直接推断出场景的所有关键 3D 属性，包括相机参数、点图、深度图和 3D 点轨迹。这种方法在 3D 计算机视觉领域迈出了一步，因为传统模型通常局限于单一任务并专门针对单一任务。VGGT 简单且高效，能够在一秒内重建图像，并且在不需要视觉几何优化技术后处理的情况下，仍然优于其他替代方案。该网络在多个 3D 任务中取得了最先进的结果，包括相机参数估计、多视图深度估计、密集点云重建和 3D 点跟踪。我们还展示了使用预训练的 VGGT 作为特征骨干可以显著增强下游任务，例如非刚性点跟踪和前馈新视图合成。代码和模型已在 https://github.com/facebookresearch/vggt 公开。

由 shadow发布于 2025-03-19 15:53:42 深度图模型大型语言模型阅读次数 2966