ComfyUI 是一个开源的、基于节点/图形化界面(Node/Graph/Flowchart) 的视觉 AI 引擎和应用。它主要用于设计和执行高级的 Stable Diffusion 以及其他多种 AI 模型的工作流,而无需编写任何代码。
项目地址:https://github.com/comfyanonymous/ComfyUI
用户通过拖放不同的节点(如加载模型、输入提示词、设置参数、生成图像等)并连接它们来构建复杂的工作流。这使得实现诸如高清修复、局部重绘、多 ControlNet 控制等高级功能变得直观和灵活。
ComfyUI 支持极其广泛的 AI 模型,远不止于基础的 Stable Diffusion。
图像模型:SD1.5, SDXL, SD3/3.5, Stable Cascade, Flux, PixArt 等。
图像编辑模型:Flux Kontext, Omnigen 等。
视频模型:Stable Video Diffusion, Mochi, Hunyuan Video 等。
音频模型:Stable Audio, ACE Step 等。
3D模型:Hunyuan3D 等。
异步队列系统:可以连续提交多个任务。
智能执行:只重新执行工作流中发生更改的部分,大大提升了生成速度。
智能内存管理:通过“显存卸载”技术,可以在仅有 1GB VRAM 的显卡上运行大型模型。
完全离线工作:核心程序永远不会自动下载任何内容,保证了隐私和控制权。
保存/加载工作流:可以将整个复杂管线保存为 .json 文件或直接嵌入到生成的 PNG/WebP/FLAC 文件中。加载这些文件可以完全复现生成结果(包括种子数)。
完整的生态支持:支持 LoRA、Embeddings、Hypernetworks、ControlNet、T2I-Adapter、模型融合等主流技术和扩展。
支持 Windows, Linux, macOS。
支持 NVIDIA, AMD, Intel, Apple Silicon, Ascend 等多种硬件加速方案。
ComfyUI 提供了多种安装方式以适应不同用户的需求:
最简单的方式,从官网下载安装包,适用于 Windows 和 macOS。
链接:https://www.comfy.org/download
Windows 便携版:
直接下载压缩包,解压即可运行,无需安装。适合追求最新功能和便携性的用户。
下载链接在项目的 Releases 页面。
通过 Git 克隆代码库,并使用 Python 包管理器(pip)安装依赖。这种方式最灵活,支持所有操作系统和 GPU 类型,适合开发者或有经验的用户。
ComfyUI 的开发非常活跃,其项目分为三个主要部分,遵循一个协调的发布流程:
ComfyUI Core:核心引擎,大约每周发布一个稳定版本。
ComfyUI Desktop:桌面应用程序,基于最新的稳定核心版本构建。
ComfyUI Frontend:用户界面,其更新会定期合并到核心库中。
AI 艺术家和爱好者:希望突破传统 UI 的限制,创建复杂、定制化图像和视频的用户。
研究人员和开发者:需要可视化地实验不同 AI 模型和管线,或将其集成到其他项目中。
对效率和可控性有要求的用户:看重工作流的可复现性、低显存占用和高速生成。
ComfyUI 不仅仅是一个 Stable Diffusion 的图形界面,它是一个功能全面、高度模块化的视觉 AI 工作流引擎。它通过降低使用高级 AI 技术的门槛,同时提供了无与伦比的灵活性和控制力,已经成为许多专业用户和爱好者的首选工具。如果你不满足于简单的文生图,希望深入探索 AI 生成内容的无限可能,ComfyUI 是一个非常值得投入时间学习的强大平台。
提示:项目提供了丰富的 示例工作流,你可以直接导入并学习其构建思路,这是快速上手的最佳途径。