HunyuanVideo15ImageToVideo 节点基于 HunyuanVideo 1.5 模型，为视频生成准备条件嵌入和潜在空间数据。它会为视频序列创建一个初始潜在表示，并可选择性地集成起始图像或 CLIP 视觉输出，以引导生成过程。

## 输入

| 参数 | 描述 | 数据类型 | 是否必填 | 范围 |
| --- | --- | --- | --- | --- |
| `正面条件` | 正向条件提示，描述视频应包含的内容。 | CONDITIONING | 是 | - |
| `负面条件` | 负向条件提示，描述视频应避免的内容。 | CONDITIONING | 是 | - |
| `vae` | 用于将起始图像编码到潜在空间的 VAE（变分自编码器）模型。 | VAE | 是 | - |
| `宽度` | 输出视频帧的宽度（像素）。必须能被 16 整除。（默认值：848） | INT | 否 | 16 到 MAX_RESOLUTION |
| `高度` | 输出视频帧的高度（像素）。必须能被 16 整除。（默认值：480） | INT | 否 | 16 到 MAX_RESOLUTION |
| `帧数` | 视频序列的总帧数。必须是 4 的倍数。（默认值：33） | INT | 否 | 1 到 MAX_RESOLUTION |
| `批次大小` | 单批次生成的视频序列数量。（默认值：1） | INT | 否 | 1 到 4096 |
| `图像` | 可选的起始图像，用于初始化视频生成。如果提供，它将被编码并用于约束前几帧。仅使用图像的前 `帧数` 帧。 | IMAGE | 否 | - |
| `CLIP视觉输出` | 可选的 CLIP 视觉嵌入，为生成过程提供额外的视觉条件。 | CLIP_VISION_OUTPUT | 否 | - |

**注意：** 当提供了 `start_image` 时，它会使用双线性插值自动调整大小，以匹配指定的 `width` 和 `height`。将使用图像批次的前 `length` 帧。然后，编码后的图像会作为 `concat_latent_image` 连同对应的 `concat_mask` 添加到 `positive` 和 `negative` 条件中。对于起始图像覆盖的帧，掩码设置为 0.0；对于剩余帧，掩码设置为 1.0。

## 输出

| 输出名称 | 描述 | 数据类型 |
| --- | --- | --- |
| `负面条件` | 修改后的正向条件，现在可能包含编码后的起始图像或 CLIP 视觉输出。 | CONDITIONING |
| `latent` | 修改后的负向条件，现在可能包含编码后的起始图像或 CLIP 视觉输出。 | CONDITIONING |
| `latent` | 一个空的潜在张量，其维度已根据指定的批次大小、视频长度、宽度和高度进行配置。 | LATENT |

> 本文档由 AI 生成。如果您发现任何错误或有改进建议，欢迎贡献！ [在 GitHub 上编辑](https://github.com/Comfy-Org/embedded-docs/blob/main/comfyui_embedded_docs/docs/HunyuanVideo15ImageToVideo/zh.md)

---
**Source fingerprint (SHA-256):** `2f41bbb080672683fb1755be575f08c79ca03e324df66953eb40631581197d47`
