WanImageToVideo 节点为视频生成任务准备条件化（conditioning）和潜在空间（latent）表示。它会为视频生成创建一个空的潜在空间，并可选择性地结合起始图像和 CLIP 视觉输出，以引导视频生成过程。该节点会根据提供的图像和视觉数据修改正向和负向条件化输入。

## 输入

| 参数 | 描述 | 数据类型 | 是否必填 | 范围 |
| --- | --- | --- | --- | --- |
| `正面` | 用于引导生成过程的正向条件化输入 | CONDITIONING | 是 | - |
| `负面` | 用于引导生成过程的负向条件化输入 | CONDITIONING | 是 | - |
| `vae` | 用于将图像编码到潜在空间的 VAE 模型 | VAE | 是 | - |
| `宽度` | 输出视频的宽度（默认值：832，步长：16） | INT | 是 | 16 至 MAX_RESOLUTION |
| `高度` | 输出视频的高度（默认值：480，步长：16） | INT | 是 | 16 至 MAX_RESOLUTION |
| `长度` | 视频的帧数（默认值：81，步长：4） | INT | 是 | 1 至 MAX_RESOLUTION |
| `批量大小` | 每批生成的视频数量（默认值：1） | INT | 是 | 1 至 4096 |
| `clip视觉输出` | 可选的 CLIP 视觉输出，用于额外的条件化 | CLIP_VISION_OUTPUT | 否 | - |
| `开始图像` | 可选的起始图像，用于初始化视频生成 | IMAGE | 否 | - |

**注意：** 当提供了 `start_image` 时，节点会对图像序列进行编码，并对条件化输入应用掩码。当提供了 `clip_vision_output` 参数时，它会向正向和负向输入添加基于视觉的条件化信息。

## 输出

| 输出名称 | 描述 | 数据类型 |
| --- | --- | --- |
| `负面` | 已整合图像和视觉数据的修改后正向条件化 | CONDITIONING |
| `潜在` | 已整合图像和视觉数据的修改后负向条件化 | CONDITIONING |
| `latent` | 可用于视频生成的空潜在空间张量 | LATENT |

> 本文档由 AI 生成。如果您发现任何错误或有改进建议，欢迎贡献！ [在 GitHub 上编辑](https://github.com/Comfy-Org/embedded-docs/blob/main/comfyui_embedded_docs/docs/WanImageToVideo/zh.md)

---
**Source fingerprint (SHA-256):** `e9f4350c43e48351523c04d82675c24f868df7b2109530c32b8e752a3ab61e8b`