• [论文翻译]MODNet:不用绿幕就能实现的实时精准人像抠图

    用于没有绿幕的人为遮罩,现有的工作要么需要获得昂贵的辅助输入,要么使用计算上昂贵的多个模型。因此,它们在实时应用程序中不可用。相比之下,我们提出了一种轻量级的分割目标分解网络(MODNet),该网络可以实时从单个输入图像处理人为分割。MODNet的设计受益于通过显式约束同时优化一系列相关的子目标。此外,由于无Trimap的方法在实践中通常会遇到域偏移问题,因此我们引入(1)基于子目标一致性的自监督策略以使MODNet适应实际数据,以及(2)一帧延迟将MODNet应用于视频人类抠像时,可以使结果平滑的技巧。
  • [论文翻译]Mask R-CNN

    我们提出概念上简单、灵活和通用的对象实例分割框架。我们的方法能够有效检测图像中的对象,同时生成每个实例的高质量分割掩膜。通过添加与现有的边界框识别分支平行的预测对象掩膜分支,这种被称作Mask R-CNN的方法拓展了Faster R-CNN的方法。Mask R-CNN易于训练,且仅稍微增加了Faster R-CNN的分支,运行帧率为5 fps。此外,Mask R-CNN还易于推广到其他任务中,例如,它能够使我们在同一个框架中预测人类的姿势。我们展示了COCO系列挑战的所有三个方向,包括实例分割、边界框对象检测以及人体关键点检测的最佳匹配结果。说实话,Mask R-CNN达成每项任务的效果确实胜过所有现有的单模型参赛作品,包括COCO 2016挑战获胜者的作品。我们希望,该简单有效的方法能够作为可靠的baseline,促进未来实例级识别研究的发展。相关代码即将公开。
公告

AI千集是一个人工智能信息平台。
它是由一群AI算法工程师搭建的。
希望能帮助从业者快速跟踪学术动态
希望能帮助初学者提高算法应用能力
来千集,跟上先行者的脚步
扫一扫,加入我们
公众号

题灵是连通AI学研和就业的桥梁
登陆小程序
获取千集AI课程和论文
挑战万道AI面试题

题灵

码涯是学习代码基础知识的开源书库
登陆小程序
一键开启免费学习代码编程之旅

码涯