[论文翻译]HandOS: 单阶段三维手部重建
现有手部重建方法主要遵循多阶段框架,包括检测、左右手分类和姿态估计。这种范式会导致冗余计算和误差累积。本文提出HandOS——一个端到端的三维手部重建框架。我们的核心思路是以冻结检测器为基础,融入辅助模块进行2D和3D关键点估计。通过这种方式,我们将姿态估计能力整合到检测框架中,同时消除了左右手分类作为先决条件的必要性。具体而言,我们提出交互式2D-3D解码器:2D关节语义来自检测线索,3D表征则从2D关节提升而来。此外,设计了分层注意力机制来同步建模2D关节、3D顶点和相机位移。最终在单阶段框架内实现了手部检测、2D姿态估计和3D网格重建的端到端集成,从而克服了上述多阶段缺陷。HandOS在公开基准测试中达到最先进性能,例如FreiHand数据集上5.0的PA-MPJPE,HInt-Ego4D数据集上64.6%的PCK@0.05。