[论文翻译]二维感知技术
二维感知技术的快速发展催生了能够精确检测现实图像中物体的系统。然而,这些系统仅基于二维数据进行预测,忽略了世界的三维结构。与此同时,三维形状预测的进展主要集中在合成基准测试和孤立物体上。我们整合了这两个领域的进展,提出了一种系统:既能检测现实图像中的物体,又能为每个检测到的物体生成反映完整三维形状的三角网格。该系统名为Mesh R-CNN,通过新增网格预测分支来扩展Mask R-CNN架构。该分支首先预测粗糙的体素表示(随后转化为网格),再通过作用于网格顶点和边的图卷积网络进行优化,最终输出具有可变拓扑结构的网格。我们在ShapeNet上验证了网格预测分支的性能,其单图像形状预测效果优于先前工作。随后将完整Mesh R-CNN系统部署于Pix3D数据集,实现了物体检测与三维形状预测的联合处理。