ComfyUI 工作流完整教程，2026 Stable Diffusion 进阶 8 步实操

Q: ComfyUI 和 Stable Diffusion WebUI 选哪个

新手刚开始想跑通文生图 WebUI 更友好 几分钟就能上手。但只要你想用 ControlNet 多模型组合 Tile 放大 IPAdapter 风格迁移 ComfyUI 几乎是首选。建议直接学 ComfyUI 节省时间。

Q: ComfyUI 装好后跑不起来怎么办

最常见三个问题。第一显卡驱动版本太低 NVIDIA 驱动以厂商当前推荐版本为准。第二 PyTorch 和 CUDA 版本不匹配 装的时候要确认对应关系。第三模型文件损坏 重新下载 safetensors 文件并核对哈希。整合包用户大多不会遇到这些。

Q: FLUX.1 低显存机器真的能跑吗

可以 用 GGUF 量化版搭配 ComfyUI-GGUF 自定义节点。出图速度比未量化版本明显慢 质量略低于 FP8 但仍然好于 SDXL。

Q: 工作流报红框节点找不到怎么办

打开 ComfyUI Manager 点 Install Missing Custom Nodes 大部分情况能一键安装。如果是新发布的节点 Manager 还没收录 去节点作者的 GitHub 仓库 git clone 到 ComfyUI/custom_nodes 目录 重启 ComfyUI 即可。

Q: ComfyUI 工作流能不能在 Mac 上跑

可以。M 系列芯片都支持 通过 PyTorch 的 MPS 后端跑。速度通常明显低于同价位的 NVIDIA 桌面显卡 具体取决于芯片型号和统一内存大小。

🌐 Read in English

📅 2026-05-19 11:19:45 👤 抖文编辑部 💬 9 条评论 👁 16

ComfyUI 是 Stable Diffusion 社区在最近一两年里最受欢迎的节点式工作流工具,2026 年已经成为 SD 老玩家的标配。问题是新手第一次打开 ComfyUI 看到一堆节点会被劝退。本文用 8 步实操路径,带零基础读者从安装到跑通第一个进阶工作流,顺带讲清楚 ComfyUI 相对 WebUI 的真正价值在哪。

ComfyUI 是什么,为什么大家都在用

先把概念讲清楚。ComfyUI 是一个基于节点的 Stable Diffusion 图形界面,每一个操作如加载模型、编码提示词、采样、解码、保存图片都是一个独立节点,节点之间通过线连接形成工作流。

相比 Automatic1111 WebUI 的下拉菜单加滑块模式,节点式有三个明显优势。第一可视化每一步,你能清楚看到提示词到潜空间到图片的完整路径,出错时定位很快。第二组合自由,把不同节点拼起来就能实现 WebUI 里没有的功能,比如 ControlNet + IPAdapter + Tile 同时上。第三性能更好,ComfyUI 的显存管理在同硬件上通常比 WebUI 占优,具体提升幅度因模型与配置不同差异很大。

代价是上手有门槛。第一次看到几十个节点会发懵,但理解了基本结构后会发现远比 WebUI 灵活。

第一步,选对安装方式

零基础最推荐两个路径。第一是用社区流行的整合包,网盘下载、解压即用,自带 Python 环境和常用模型,适合主流 Windows + 中端 NVIDIA 显卡用户。第二是官方独立安装:git clone 官方仓库,然后 python -m venv venv,激活后 pip install -r requirements.txt。Mac M 系列芯片用户走这套路径,官方对 MPS 支持已经比较成熟。

显卡门槛:SD 1.5 通常 4 GB 显存以上就能跑,SDXL 需要 8 GB 以上,FLUX.1 推荐 12 GB 以上。低显存机器可以开 --lowvram 启动参数,速度慢但能跑。

模型存放位置:base 模型放 ComfyUI/models/checkpoints,VAE 放 ComfyUI/models/vae,LoRA 放 ComfyUI/models/loras,ControlNet 放 ComfyUI/models/controlnet。文件夹结构和 WebUI 不一样,迁移模型时不要直接复制,可以用软链接到对应路径。

第二步,理解默认工作流的 7 个基础节点

打开 ComfyUI 第一眼看到的默认工作流就是文生图最小流程,大致 7 个节点。

Load Checkpoint 加载底模型,输出 MODEL、CLIP、VAE 三条线;CLIP Text Encode Positive 把正面提示词编码成 CONDITIONING 张量;CLIP Text Encode Negative 编码负面提示词;Empty Latent Image 创建空白潜空间张量,宽高在这里设;KSampler 采样器,接收 MODEL、正负 CONDITIONING、latent,输出去噪后的 latent;VAE Decode 把 latent 解成像素图片;Save Image 保存到 output 文件夹。

理解这 7 个节点的输入输出对应关系后,后面所有进阶工作流不过是在这个基础上拼接。

第三步,加 LoRA 和 VAE 的标准接法

第一个常见进阶。LoRA 节点 LoraLoader 插在 Load Checkpoint 和 CLIP Text Encode 中间,接 MODEL 和 CLIP 两条线进去,输出 MODEL 和 CLIP 给后面用,触发词记得写在正面提示词里。

VAE 替换:SDXL 自带 VAE 不太行,常用 sdxl-vae-fp16-fix。在 Load Checkpoint 后接 VAE Loader 节点单独加载,然后 VAE Decode 节点取这个外部 VAE 而不是 base 模型自带的。出图色彩饱和度和细节质感会明显改善。

权重:LoRA 强度大致在 0.6 到 0.9 之间是常见甜区,1.0 容易过度污染底模型风格。多个 LoRA 串联要小心,两个以上很容易冲突,可以用 LoraLoaderModelOnly 只影响 unet 不影响 clip。

第四步,ControlNet 接入控制构图

ControlNet 是 ComfyUI 工作流威力的核心来源之一。

基础接法:先加 Load Image 节点导入参考图,接 ControlNet Preprocessor 节点(Canny、MLSD、Depth 等)生成预处理图,然后接 Apply ControlNet Advanced 节点把预处理图喂给 ControlNet 模型,输出修改后的 CONDITIONING 接到 KSampler 的 conditioning 输入。

强度参数:strength 大致在 0.5 到 0.8 之间最自然,start_percent 一般 0,end_percent 用来控制 ControlNet 介入的步数范围。

多 ControlNet 串联:OpenPose 控制姿态 + Depth 控制深度 + Canny 控制轮廓三个一起用,出图稳定性极高,适合做电商人台、漫画分镜、产品多视图。

第五步,Tile Upscaler 高清放大

出图分辨率不够是新手第一个痛点。

最标准做法是 SD Upscale + Tile ControlNet 组合。先 KSampler 生成中等分辨率图,VAE Decode 后接 Upscale Image By 节点放大,接 VAE Encode 重新进入潜空间,接 Apply ControlNet Advanced 接入 Tile 模型,strength 0.6 左右,再走一次 KSampler 但 denoise 调到 0.3 到 0.5 之间,最后 VAE Decode 输出。

这套流程能保留构图同时把细节做到接近商业海报水准。显存吃紧的话可以装 ComfyUI-TiledDiffusion 这类社区插件,把 Tile 切分逐块去噪,显存吃紧的机器也能跑出更大尺寸。

第六步,IPAdapter 风格迁移和参考图

最近一年最值得学的进阶节点是 IPAdapter,可以用一张参考图迁移风格或迁移人物。

基础接法:下载 ip-adapter 系列模型和对应的 image encoder,放在 ComfyUI/models/ipadapter 和 clip_vision 目录下。加 IPAdapter Unified Loader 节点,接 IPAdapter Advanced 节点,接 MODEL 和参考图,输出新 MODEL 给 KSampler。

实战场景:给 ChatGPT 或 DALL-E 生成的图加吉卜力风格,IPAdapter 比 LoRA 简单且效果稳定;商品换背景,用 IPAdapter 配 inpaint 模型一张图就能完成;漫画分镜保持主角一致性,FaceID 系列可以锁面部特征。

第七步,FLUX.1 工作流的特殊性

FLUX.1 是 Black Forest Labs 推出的新一代模型,2026 年已是 ComfyUI 社区高质量出图的主力之一。

工作流差异:FLUX 不用 CLIP Text Encode,改用 CLIPTextEncodeFlux 节点同时接 CLIP 和 T5 两个文本编码器;Empty Latent Image 改用 EmptySD3LatentImage 节点;KSampler 改用 KSampler Advanced 或 BasicScheduler。

显存挑战:FLUX dev 完整版显存需求较高,FP8 量化版可以压到中等显存可跑的区间,GGUF Q4 量化版可以再低,但出图细节会有损失。具体需求请以社区量化版本的最新版本说明为准。

提示词差异:FLUX 对自然语言理解远超 SD 系列,写完整英语句子比写 tag 列表效果更好。

第八步,工作流复用和分享

ComfyUI 一个隐藏强项是工作流可保存可分享。每张生成的图片 PNG 文件里自动嵌入完整工作流元数据,把图片拖回 ComfyUI 画布就能恢复出全部节点和连线。

OpenArt 平台:openart.ai/workflows 上有大量公开工作流可以浏览和下载,搜"animal portrait""anime style""product photography"等关键词,下载 workflow.json 直接 Load 即可。

避坑:下载的工作流如果缺自定义节点会红框报错,装好 ComfyUI Manager 后点 Install Missing Custom Nodes 一键解决;模型路径不对就改 Load Checkpoint 节点重选;VAE 版本不对就外挂 sdxl-vae-fp16-fix。

给"不想折腾"的移动用户一个补充选择

ComfyUI 整套体系适合愿意理解节点、折腾显卡、研究 LoRA 和 ControlNet 的技术党。但日常工作流里也有相反的场景：在地铁上、午休时随手想出一张图，根本没机会打开桌面机。这种场景里 iOS 国区上架的"灵图-AI画图设计"是一个互补选择，把 Midjourney 风格的氛围引擎、Flux 风格的写实引擎、Nano Banana 风格的快速引擎聚合在中文界面里，提示词本地化做得不错，国区直接下载不用代理。把 ComfyUI 留给"深度可控"的场景，把灵图留给"零配置出图"的场景，两套工作流互补使用并不冲突。App Store 搜"灵图"，链接：https://apps.apple.com/cn/app/灵图-ai画图设计/id6763914201。

常见问题 FAQ

ComfyUI 和 Stable Diffusion WebUI 选哪个

新手刚开始想跑通文生图 WebUI 更友好,几分钟就能上手。但只要你想用 ControlNet 多模型组合、Tile 放大、IPAdapter 风格迁移,ComfyUI 几乎是首选,WebUI 这些功能要么没有,要么要装一堆插件还不稳定。建议直接学 ComfyUI 节省时间。

ComfyUI 装好后跑不起来怎么办

最常见三个问题。第一,显卡驱动版本太低,NVIDIA 驱动以厂商当前推荐版本为准。第二,PyTorch 和 CUDA 版本不匹配,装的时候要确认对应关系。第三,模型文件损坏,重新下载 safetensors 文件并核对哈希。整合包用户大多不会遇到这些。

FLUX.1 低显存机器真的能跑吗

可以,用 GGUF 量化版搭配 ComfyUI-GGUF 自定义节点。出图速度比未量化版本明显慢,质量略低于 FP8 但仍然好于 SDXL。极限优化下,显存非常紧的机器也能跑,但要忍受比较长的等待时间。

工作流报红框节点找不到怎么办

打开 ComfyUI Manager 点 Install Missing Custom Nodes,大部分情况能一键安装。如果是新发布的节点 Manager 还没收录,去节点作者的 GitHub 仓库 git clone 到 ComfyUI/custom_nodes 目录,重启 ComfyUI 即可。

ComfyUI 工作流能不能在 Mac 上跑

可以。M 系列芯片都支持,通过 PyTorch 的 MPS 后端跑。速度通常明显低于同价位的 NVIDIA 桌面显卡,具体取决于芯片型号和统一内存大小。FLUX.1 在 Mac 上能跑但建议用量化版,内存偏小的机型在更长延迟和更小尺寸之间需要做取舍。

📝 本文来自抖文 www.douwen.me ，转载请保留出处。

原文链接：https://douwen.me/archives/1079/

💬 评论 (9)

躺

躺平选手 2026-05-19 06:31 回复

数据扎实不是水文

烟

烟雨江南 2026-05-19 01:18 回复

期待更多类似干货

读

读史明志 2026-05-18 14:33 回复

解决了我一直没搞清楚的问题

细

细节党 2026-05-19 09:14 回复

作者花了很多心思

好

好奇宝宝 2026-05-18 18:18 回复

结构清晰看着不累

路

路过打酱油 2026-05-19 03:10 回复

正好需要这种实测对比

史

史海钩沉 2026-05-19 03:49 回复

已转发给同事

好奇宝宝 2026-05-18 18:55 回复

收藏了反复看

躺平选手 2026-05-18 19:04 回复

FAQ 部分特别实用