## 概述

MultiGPU CFG Split 节点可以让同一台电脑中的多张 GPU 一起参与扩散采样。实际提速会因工作流而不同，但在常见工作流中，已经测到最高约 1.95 倍的加速效果。

## 关键细节

不支持混用不同型号的 GPU，已安装的 GPU 必须是同类型，例如 2 张 5090，或 2 张 5080。

ComfyUI 在启动时会自动检测系统中已安装的多张 GPU。

## 支持的 GPU

任何使用 Ampere 及以上架构、并且由两张相同 GPU 组成的配置都可以，例如 2 x 3090 或 2 x RTX6000 Pro。

## 支持的模型

* LTX-2.3  
* WAN 2.2  
* FLUX.2 Klein - Base Versions  
* Z-Image  
* Stable Diffusion 3.5 Large  
* Hunyuan Video  
* Qwen-Image-Edit-2511  
* Hunyuan-3D-v2.1  
* SDXL

## 输入

| 参数 | 描述 | 数据类型 | 必填 | 范围 |
| --- | --- | --- | --- | --- |
| `model` | 在开始采样前，先准备为 MultiGPU CFG 拆分使用的模型。 | MODEL | 是 | 不适用 |
| `max_gpus` | 允许用于拆分负载的相同 GPU 的最大数量。通常设为系统中已安装且型号一致的 GPU 数量。 | INT | 是 | 最小值：1<br>步长：1<br>默认值：2 |

## 输出

| 输出名称 | 描述 | 数据类型 |
| --- | --- | --- |
| `MODEL` | 已为 MultiGPU CFG 拆分准备好的模型，可直接用于加速采样。 | MODEL |

## 节点位置与工作流说明

![image1.png](./asset/image1.png)  
`max_gpus` 应设置为系统中已安装的相同 GPU 的最大数量。

**节点放置位置：** MultiGPU CFG Split 需要放在模型加载节点与采样节点之间。如果模型加载节点的模型输出还连接了其他节点，那么在进入采样节点之前，MultiGPU CFG Split 应作为这条链路中的最后一个节点。

![image2.png](./asset/image2.png)

**工作流要求：** 这个节点是在 CFG 这一层拆分扩散流程，因此工作流中的 CFG 必须大于 1。对于必须使用 CFG = 1 的 distilled 工作流，使用 MultiGPU CFG Split 在多张 GPU 上运行时通常不会带来明显提速。

## 如何确认多 GPU 正在工作

运行启用 MultiGPU CFG Split 的工作流时，可以打开 Windows 任务管理器，并切换到“性能”分类。  
![image3.webp](./asset/image3.webp)  
![image4.png](./asset/image4.webp)                                                                                                                                 
当工作流中的采样器正在运行时，你应该能看到两张已安装的 GPU 都有活动。

## 示例多 GPU 工作流（Wan 2.2 FP8）

[示例工作流（Wan 2.2 FP8）](https://raw.githubusercontent.com/Comfy-Org/embedded-docs/refs/heads/main/comfyui_embedded_docs/docs/MultiGPU_WorkUnits/asset/video_wan2_2_14B_t2v_mGPU.json)

> 本文档由 AI 生成。如果您发现任何错误或有改进建议，欢迎贡献！ [在 GitHub 上编辑](https://github.com/Comfy-Org/embedded-docs/blob/main/comfyui_embedded_docs/docs/MultiGPU_WorkUnits/zh.md)

---
**Source fingerprint (SHA-256):** `7293ee785e29aea9a1a70a10444b99e89fb23c866505628ec57c209a2b8aaee0`
