Kandinsky5ImageToVideo 节点用于准备 Kandinsky 模型视频生成所需的 conditioning 和潜在空间数据。它会创建一个空的视频潜在张量，并可选择对起始图像进行编码，以引导生成视频的初始帧，同时相应地修改正向和负向 conditioning。

## 输入

| 参数 | 描述 | 数据类型 | 是否必填 | 范围 |
| --- | --- | --- | --- | --- |
| `正面条件` | 引导视频生成的正向 conditioning 提示。 | CONDITIONING | 是 | 不适用 |
| `负面条件` | 引导视频生成避开特定概念的正向 conditioning 提示。 | CONDITIONING | 是 | 不适用 |
| `vae` | 用于将可选的起始图像编码到潜在空间的 VAE 模型。 | VAE | 是 | 不适用 |
| `宽度` | 输出视频的宽度（像素），默认值：768。 | INT | 否 | 16 至 8192（步长 16） |
| `高度  ` | 输出视频的高度（像素），默认值：512。 | INT | 否 | 16 至 8192（步长 16） |
| `时长` | 视频的帧数，默认值：121。 | INT | 否 | 1 至 8192（步长 4） |
| `批次大小` | 同时生成的视频序列数量，默认值：1。 | INT | 否 | 1 至 4096 |
| `初始图象` | 可选的起始图像。如果提供，该图像将被编码，并用于替换模型输出潜在变量中的噪声起始部分。 | IMAGE | 否 | 不适用 |

**注意：** 当提供了 `start_image` 时，它会自动通过双线性插值调整大小，以匹配指定的 `width` 和 `height`。图像批次中的前 `length` 帧将用于编码。编码后的潜在变量随后会被注入到 `positive` 和 `negative` conditioning 中，以引导视频的初始外观。

## 输出

| 输出名称 | 描述 | 数据类型 |
| --- | --- | --- |
| `负面条件` | 修改后的正向 conditioning，可能已更新编码后的起始图像数据。 | CONDITIONING |
| `Latent` | 修改后的负向 conditioning，可能已更新编码后的起始图像数据。 | CONDITIONING |
| `条件Latent` | 一个填充为零的空视频潜在张量，其形状符合指定的尺寸。 | LATENT |
| `cond_latent` | 所提供的起始图像的干净、编码后的潜在表示。内部使用此数据来替换生成视频潜在变量中带噪声的起始部分。 | LATENT |

> 本文档由 AI 生成。如果您发现任何错误或有改进建议，欢迎贡献！ [在 GitHub 上编辑](https://github.com/Comfy-Org/embedded-docs/blob/main/comfyui_embedded_docs/docs/Kandinsky5ImageToVideo/zh.md)

---
**Source fingerprint (SHA-256):** `19d3b60be18f5adcd659563329988bce2511a1b27b33fd0ab3a9d93e265557f2`
