Wan22FunControlToVideo 节点使用 Wan 视频模型架构，为视频生成准备条件化（conditioning）和潜在空间（latent）表示。该节点处理正向和负向条件化输入，以及可选的参考图像和控制视频，为视频合成创建必要的潜在空间表示。节点处理空间缩放和时间维度，以生成适用于视频模型的条件化数据。

## 输入

| 参数 | 描述 | 数据类型 | 是否必填 | 范围 |
| --- | --- | --- | --- | --- |
| `正面提示词` | 用于引导视频生成的正向条件化输入 | CONDITIONING | 是 | - |
| `负面提示词` | 用于引导视频生成的负向条件化输入 | CONDITIONING | 是 | - |
| `VAE` | 用于将图像编码到潜在空间的 VAE 模型 | VAE | 是 | - |
| `宽度` | 输出视频宽度（像素）（默认值：832，步长：16） | INT | 是 | 16 至 MAX_RESOLUTION |
| `高度` | 输出视频高度（像素）（默认值：480，步长：16） | INT | 是 | 16 至 MAX_RESOLUTION |
| `长度` | 视频序列中的帧数（默认值：81，步长：4） | INT | 是 | 1 至 MAX_RESOLUTION |
| `批次大小` | 要生成的视频序列数量（默认值：1） | INT | 是 | 1 至 4096 |
| `参考图像` | 用于提供视觉引导的可选参考图像 | IMAGE | 否 | - |
| `控制视频` | 用于引导生成过程的可选控制视频 | IMAGE | 否 | - |

**注意：** `length` 参数以 4 帧为块进行处理，节点会自动处理潜在空间的时间缩放。当提供 `ref_image` 时，它会通过参考潜在变量影响条件化。当提供 `control_video` 时，它会直接影响条件化中使用的拼接潜在表示。`start_image` 参数未作为此节点架构的输入公开，但在执行逻辑中被引用。

## 输出

| 输出名称 | 描述 | 数据类型 |
| --- | --- | --- |
| `负向提示` | 修改后的正向条件化，包含视频特定的潜在数据，包括拼接潜在变量、遮罩和可选的参考潜在变量 | CONDITIONING |
| `潜变量` | 修改后的负向条件化，包含视频特定的潜在数据，包括拼接潜在变量、遮罩和可选的参考潜在变量 | CONDITIONING |
| `latent` | 空的潜在张量，具有适合视频生成的适当维度，基于批次大小、潜在通道数以及空间/时间缩放 | LATENT |

> 本文档由 AI 生成。如果您发现任何错误或有改进建议，欢迎贡献！ [在 GitHub 上编辑](https://github.com/Comfy-Org/embedded-docs/blob/main/comfyui_embedded_docs/docs/Wan22FunControlToVideo/zh.md)

---
**Source fingerprint (SHA-256):** `8b24058f06aa9f779371a402c41cffc95d13ad0131d23d1438067d77755c73e2`
