[论文翻译]增强型自动编码器:面向6D物体检测的隐式3D姿态学习 摘要 我们提出了一种基于RGB的实时目标检测与6D姿态估计流程。其中创新的3D朝向估计算法基于改进版降噪自编码器(Denoising Autoencoder),该模型通过域随机化(Domain Randomization)技术在3D模型仿真视图上进行训练。 由 shadow发布于 2025-06-02 22:41:21 3D模型大模型机器视觉 阅读次数 293
[论文翻译]用于视频分割的测地距离直方图特征 摘要。本文提出了一种基于测地距离的特征,该特征通过编码全局信息来改进视频分割算法。该特征是强度与测地距离的联合直方图,其中测地距离通过超像素边界之间的最短路径计算得到。我们还引入了自适应投票权重和空间金字塔配置,将空间信息融入测地直方图特征,并证明这能进一步提升效果。该特征具有通用性,可作为多种算法的组成部分。实验中,我们通过将测地直方图特征集成到两个现有视频分割框架中进行测试。在两个数据集的3D视频分割基准测试中,该方法显著提升了性能。 由 shadow发布于 2025-05-25 16:10:04 经典算法3D模型数据集 阅读次数 314
[论文翻译]用于多层次3D零件实例分割的语义分割辅助实例特征融合 3D点云中识别3D部件实例对三维结构和场景理解至关重要。现有基于学习的方法大多采用语义分割和实例中心预测作为训练任务,但未能进一步挖掘形状语义与部件实例间的内在关联。本文提出一种新型3D部件实例分割方法:通过语义分割融合非局部实例特征(如中心预测),并以多层次跨层级方式优化融合机制;同时设计语义区域中心预测任务,利用其预测结果提升实例点聚类效果。在PartNet基准测试中,本方法以显著优势超越现有方案。实验还表明,我们的特征融合机制可迁移至其他方法,有效提升室内场景实例分割任务的性能。 由 shadow发布于 2025-05-13 10:17:28 私有大模型3D模型 阅读次数 376