用于没有绿幕的人为遮罩，现有的工作要么需要获得昂贵的辅助输入，要么使用计算上昂贵的多个模型。因此，它们在实时应用程序中不可用。相比之下，我们提出了一种轻量级的分割目标分解网络（MODNet），该网络可以实时从单个输入图像处理人为分割。MODNet的设计受益于通过显式约束同时优化一系列相关的子目标。此外，由于无Trimap的方法在实践中通常会遇到域偏移问题，因此我们引入（1）基于子目标一致性的自监督策略以使MODNet适应实际数据，以及（2）一帧延迟将MODNet应用于视频人类抠像时，可以使结果平滑的技巧。

由 weilaiweiding发布于 2021-03-12 02:24:52 目标分割阅读次数 2933

[论文翻译]Mask R-CNN

我们提出概念上简单、灵活和通用的对象实例分割框架。我们的方法能够有效检测图像中的对象，同时生成每个实例的高质量分割掩膜。通过添加与现有的边界框识别分支平行的预测对象掩膜分支，这种被称作Mask R-CNN的方法拓展了Faster R-CNN的方法。Mask R-CNN易于训练，且仅稍微增加了Faster R-CNN的分支，运行帧率为5 fps。此外，Mask R-CNN还易于推广到其他任务中，例如，它能够使我们在同一个框架中预测人类的姿势。我们展示了COCO系列挑战的所有三个方向，包括实例分割、边界框对象检测以及人体关键点检测的最佳匹配结果。说实话，Mask R-CNN达成每项任务的效果确实胜过所有现有的单模型参赛作品，包括COCO 2016挑战获胜者的作品。我们希望，该简单有效的方法能够作为可靠的baseline，促进未来实例级识别研究的发展。相关代码即将公开。

由 gingo发布于 2021-01-27 07:03:46 深度学习目标分割物体检测阅读次数 2305

[论文翻译]MODNet：不用绿幕就能实现的实时精准人像抠图

[论文翻译]Mask R-CNN