sd-webui-segment-anything 是一个为 AUTOMATIC1111 Stable Diffusion WebUI 设计的扩展插件。它的核心目标是将 Meta AI 的 Segment Anything Model (SAM) 和 IDEA Research 的 GroundingDINO 等先进的图像分割模型集成到 Stable Diffusion 的工作流中。
通过这个扩展,用户可以以前所未有的便捷和精度进行图像分割,从而极大地增强了 Stable Diffusion 和 ControlNet 的修复、语义分割、自动抠图等能力,并为创建 LoRA/LyCORIS 训练集提供了强大的工具。
项目地址:https://github.com/continue-revolution/sd-webui-segment-anything
点选分割 (SAM): 用户只需在图像上点击(左键为正点,右键为负点),SAM 模型就能立即生成高质量的分割蒙版。这通常被称为 "Remove/Fill Anything" 功能,可以轻松移除或替换图中的任何物体。
文本提示分割 (GroundingDINO + SAM): 用户可以通过输入文本描述(如 dog . person . car),让 GroundingDINO 自动检测出相关物体的边界框,然后由 SAM 生成精确的蒙版。这实现了 "指哪打哪" 的智能分割。
这是该扩展最强大的特性之一。生成的分割蒙版可以直接发送到 ControlNet 扩展中,用于:
增强修复: 将蒙版发送到 ControlNet Inpainting 模型,可以获得比传统修复模型更佳的效果,并且无需下载专门的修复模型。
增强语义分割: 将 SAM 的分割结果与 ControlNet 的语义分割预处理器(如 seg_ofade20k)结合,可以生成细节更丰富的语义分割图,从而更好地控制图像生成。
EditAnything: 支持生成随机分割图,可用于 EditAnything 项目,实现基于分割的创意编辑。
批量分割: 可以处理整个文件夹内的图片,自动为每张图片生成分割蒙版、原图与蒙版的混合图等,非常适合用于准备训练数据集。
按类别分割: 通过指定 ADE20K 或 COCO 数据集的类别 ID,可以批量提取特定物体(如所有"人"或"床")的蒙版,实现"Replace Anything"。
除了原始的 SAM 模型,扩展还支持其变体:
SAM-HQ: 提供更高分割质量的模型。
MobileSAM: 轻量级模型,适合资源受限的环境。
计划支持: Matting-Anything(精细化抠图)和 FastSAM(快速分割)等模型也在未来的支持计划中。
1、上传图片。
2、选择分割方式:
在 txt2img 或 img2img 中,一键将图片和蒙版发送到 ControlNet Inpainting 单元。
配置好提示词和其他参数后,即可开始生成。
1、在 AutoSAM 标签页中,选择预处理器(如语义分割模型 seg_ofade20k)。
2、点击预览,扩展会使用 SAM 增强原有的分割结果。
3、将增强后的分割图发送到 ControlNet Segmentation 单元,用于控制图像生成的结构。
1、安装扩展:在 WebUI 的 "Extensions" 标签中通过 URL 安装,或直接 git clone 到 extensions 文件夹。
2、下载模型:需要手动下载分割模型(如 SAM 的 sam_vit_h_4b8939.pth),并放置在 stable-diffusion-webui/models/sam/ 目录下。
3、自动安装依赖:GroundingDINO 和相关 ControlNet 注释器模型会在首次使用时自动下载。如果遇到 C++ 编译问题,可以在设置中启用 "Use local groundingdino to bypass C++ problem"。
ControlNet 设置:必须更新 ControlNet 扩展到最新版,并在其设置中勾选 "Allow other script to control this extension",否则无法联动。
GroundingDINO 安装:这是最常见的安装难点。如果自动安装失败,项目提供了使用本地修改版 GroundingDINO 的选项来绕过复杂的 C++ 环境配置。
WebUI 版本:需要保持 A1111 WebUI 和 Gradio 为较新的版本,以确保兼容性。
扩展冲突:如果安装此扩展后导致 ControlNet 报错,可能是扩展加载顺序问题,可以尝试调整扩展的加载顺序。
sd-webui-segment-anything 是一个功能强大且不断演进的工具,它巧妙地将前沿的视觉基础模型与流行的生成式 AI 应用结合在一起。它极大地降低了高质量图像分割的技术门槛,为艺术家、设计师和开发者打开了通往更精细、更可控的图像编辑与生成的大门。无论是进行创意设计、内容创作还是数据准备,这个扩展都是一个不可或缺的利器。
项目地址:https://github.com/continue-revolution/sd-webui-segment-anything