此文档由 AI 生成。如发现任何错误或有改进建议，欢迎随时贡献！[在 GitHub 上编辑](https://github.com/Comfy-Org/embedded-docs/blob/main/comfyui_embedded_docs/docs/HunyuanImageToVideo/en.md)

HunyuanImageToVideo 节点使用 Hunyuan 视频模型将图像转换为视频潜在表示。它接收条件化输入和可选的起始图像，生成可供视频生成模型进一步处理的视频潜在变量。该节点支持不同的引导类型，用于控制起始图像对视频生成过程的影响。

## 输入

| 参数 | 描述 | 数据类型 | 是否必填 | 范围 |
| --- | --- | --- | --- | --- |
| `正向` | 用于引导视频生成的正面条件化输入 | CONDITIONING | 是 | - |
| `vae` | 用于将图像编码到潜在空间的 VAE 模型 | VAE | 是 | - |
| `宽度` | 输出视频的宽度（像素）（默认值：848，步长：16） | INT | 是 | 16 至 MAX_RESOLUTION |
| `高度` | 输出视频的高度（像素）（默认值：480，步长：16） | INT | 是 | 16 至 MAX_RESOLUTION |
| `长度` | 输出视频的帧数（默认值：53，步长：4） | INT | 是 | 1 至 MAX_RESOLUTION |
| `批量大小` | 同时生成的视频数量（默认值：1） | INT | 是 | 1 至 4096 |
| `指导类型` | 将起始图像融入视频生成的方法（默认值："v1 (concat)"） | COMBO | 是 | "v1 (concat)"<br>"v2 (replace)"<br>"custom" |
| `起始图像` | 用于初始化视频生成的可选起始图像 | IMAGE | 否 | - |

**注意：** 当提供 `start_image` 时，节点会根据所选的 `guidance_type` 使用不同的引导方法：

- "v1 (concat)"：将图像潜在变量与视频潜在变量拼接，并应用遮罩将图像融合到视频中
- "v2 (replace)"：用图像潜在变量替换初始视频帧，并应用噪声遮罩
- "custom"：将图像用作引导的参考潜在变量

## 输出

| 输出名称 | 描述 | 数据类型 |
| --- | --- | --- |
| `Latent` | 当提供 start_image 时，应用了图像引导的修改后正面条件化输入 | CONDITIONING |
| `latent` | 可供视频生成模型进一步处理的视频潜在表示 | LATENT |

> 本文档由 AI 生成。如果您发现任何错误或有改进建议，欢迎贡献！ [在 GitHub 上编辑](https://github.com/Comfy-Org/embedded-docs/blob/main/comfyui_embedded_docs/docs/HunyuanImageToVideo/zh.md)

---
**Source fingerprint (SHA-256):** `e55e935b7955b28b04014359c544a230c51ee91e21170be1ae4f50705d3e7bba`