CosmosImageToVideoLatent 节点从输入图像创建视频潜在表示。它会生成一个空白视频潜在表示，并可选择将起始和/或结束图像编码到视频序列的起始和/或结束帧中。当提供图像时，它还会创建相应的噪声掩码，以指示在生成过程中应保留潜在表示的哪些部分。

## 输入

| 参数 | 描述 | 数据类型 | 是否必填 | 范围 |
| --- | --- | --- | --- | --- |
| `vae` | 用于将图像编码到潜在空间的 VAE 模型 | VAE | 是 | - |
| `宽度` | 输出视频的宽度（像素），默认值：1280 | INT | 是 | 16 至 MAX_RESOLUTION |
| `高度` | 输出视频的高度（像素），默认值：704 | INT | 是 | 16 至 MAX_RESOLUTION |
| `长度` | 视频序列中的帧数，默认值：121 | INT | 是 | 1 至 MAX_RESOLUTION |
| `批量大小` | 要生成的潜在批次数量，默认值：1 | INT | 是 | 1 至 4096 |
| `开始图像` | 可选，编码到视频序列起始位置的图像 | IMAGE | 否 | - |
| `结束图像` | 可选，编码到视频序列结束位置的图像 | IMAGE | 否 | - |

**注意：** 当既不提供 `start_image` 也不提供 `end_image` 时，节点会返回一个空白潜在表示，不带任何噪声掩码。当提供任一图像时，潜在表示的相应部分会被编码并相应地添加掩码。

## 输出

| 输出名称 | 描述 | 数据类型 |
| --- | --- | --- |
| `latent` | 生成的视频潜在表示，包含可选的编码图像及相应的噪声掩码 | LATENT |

> 本文档由 AI 生成。如果您发现任何错误或有改进建议，欢迎贡献！ [在 GitHub 上编辑](https://github.com/Comfy-Org/embedded-docs/blob/main/comfyui_embedded_docs/docs/CosmosImageToVideoLatent/zh.md)

---
**Source fingerprint (SHA-256):** `31ce4dc577c672e0b3dc0bfb6644b2ef7ab737f6c4ee5e0677973b6a4efdd66d`
