本文最后更新于 2024-08-14，

若内容或图片失效，请留言反馈。部分素材来自网络，若不小心影响到您的利益，请联系我删除。

本站只有Telegram群组为唯一交流群组，点击加入

文章内容有误？申请成为本站文章修订者或作者？向站长提出申请

本篇教程为第二篇——自动识别，主要介绍如何在comfyui中自动识别人体部位，以提高绘制蒙版的质量或者直接免去手绘蒙版。通常情况下基础篇工作流已经足够使用了，之后的教程更多的是进阶用法。

第一篇——基础篇：https://poiblog.com/archives/UGD2qaQ5

第三篇——肤色与修复（完结）：https://poiblog.com/archives/vyoYqOOY

终极版：https://poiblog.com/archives/aceWNvQG

问题回答

一些问题可能在接下来的教程里会得到解答，但在这里先统一回复一遍

1. 为什么我“去衣”后的肤色跟原肤色差异非常大？

答：

(1) 你的重绘蒙版跟提示词不符。比如你的蒙版区域只有局部人体，但在写提示词时使用了nude或者completely_nude，模型在采样时有几率会将肤色与衣着颜色混淆。解决方法：蒙版涂抹更全面或用更准确的提示词描述；
(2) 你选用的大模型和vae跟图像不契合。解决方法：选用能画出跟图像人物肤色相近颜色的大模型与vae 或添加肤色lora；
(3) 你的{遮罩混合颜色}选取的RGB颜色跟肤色差异过大；

2. 为什么我重绘后的姿态或构图跟原图差距过大？

答：

姿势相对复杂。
解决方法：
(a) 完善提示词，加入姿势与构图的提示词；
(b) 使用额外的controlnet模型，比如depth, normalbae, 但降低权重和结束时间，直到达到去衣和构图的平衡点；

3. 我第一次接触Stable Diffusion，直接用comfyui可以么？

答：

如果你对AI画图的原理感兴趣并且有足够的时间精力，可以跳过A1111的webui直接使用comfyui；如果你只是对AI画图最后的成果图感兴趣，建议先用A1111的webui入门和培养兴趣，并多接触各类模型与插件；
如果你的显存小于6G，那么恭喜你，你在本地运行基本只能靠comfyui或forge（forge目前缺少插件支持）；

自动识别工作流

本工作流建立在基础篇工作流的基础之上，请确保你已经理解基础篇工作流。在测试局部工作流时，可以先将其他工作流节点和组右键忽略。

1. 自动遮罩

我们先调用Segment Anything和GroundingDINO模型（通常使用1.25G的SAM模型和938M的G-DINO模型，如果你没有下载过对应模型，第一次运行Segment Anything会自动下载，耗时较长），如图输入图像和提示词（多个提示词用**.或&连接，如clothing**.hair，如果不想要就空着）
得到对应遮罩。

然后将该遮罩与你手绘的遮罩通过Masque节点的{合并遮罩}合并（操作为add）。

在{加载图像}中你也可以右键选择{在SAM检测中打开}而不是{在遮罩编辑器中打开}以手动绘制遮罩（左键选中需要的区域，右键选中不需要的区域再Detect），但此时默认使用的SAM模型比较低级，因此暂时不建议用这种方式绘制。

值得注意的是，在最开始{加载图像}时会默认生成一个错误的低分辨率遮罩（或许是bug），如果你不想要手绘，请右键{加载图像}选择{在遮罩编辑器中打开}再清除并保存。

（如果你确认不会再手绘遮罩，可以用inspire节点里的{加载图像}替代默认{加载图像}，这个不会错误生成遮罩，但其遮罩编辑器里的遮罩会直接覆盖到原图像上，影响后续的节点，因此也不适用于手绘遮罩。）

2. 人体区分

我们已经实现了自动获取遮罩，但如何实现遮罩内不同组分用颜色区分呢？

将缩放后的原图像输入到controlnet的Dense姿态预处理器，如图（右键转换分辨率为输入，使用{完美像素}分辨率）得到DensePose图像，图中色块即模型识别到的人体部位，并且自带颜色区分。

们也可以在预处理前将图像先经过Segment Anything识别（如body/girl/woman），以进一步提高DensePose识别人体的准确性。（DensePose预处理会先用yolo模型识别出人体再转化为DensePose图像，因此使用Segment Anything先过滤一遍，这一步在识别一些复杂图像时非常有效）建议跟第一步共享模型加载器。