computer vision - 标签内容 | AI千集 — AI角色定制平台

[博客翻译]分割漫画书框架

在学习计算机视觉课程的经典技术时，我偶然阅读了Max Halford关于从漫画书中提取画框的博文。他设计了一个颇为有趣的算法，采用Canny算子检测画框边界，填补空洞，并对连续区域拟合边界框。这一巧妙算法虽然效果显著，但亦有不足之处。例如，它无法处理任意非对齐多边形，且在负画框上无效，因为负画框没有自己的边界，而是由邻近画框的边界定义。鉴于对如SAM这类基础模型在分割领域的热议，我通过程序化生成合成的漫画书数据集，并对SAM进行微调，以便检测画框的角点。启发...

由 openoker发布于 2024-02-27 11:04:06 computer vision 阅读次数 2622