WanPhantomSubjectToVideo 节点通过处理条件化输入和可选的参考图像来生成视频内容。它会为视频生成创建潜在表示，并在提供输入图像时融入其中的视觉引导。该节点为视频模型准备带有时间维度拼接的条件化数据，并输出修改后的条件化数据以及生成的潜在视频数据。

## 输入

| 参数 | 描述 | 数据类型 | 是否必填 | 范围 |
| --- | --- | --- | --- | --- |
| `正面提示词` | 用于引导视频生成的正面条件化输入 | CONDITIONING | 是 | - |
| `负面提示词` | 用于避免特定特征的负面条件化输入 | CONDITIONING | 是 | - |
| `VAE` | 用于在提供图像时进行编码的 VAE 模型 | VAE | 是 | - |
| `宽度` | 输出视频的宽度（像素，默认值：832，必须能被 16 整除） | INT | 是 | 16 至 MAX_RESOLUTION |
| `高度` | 输出视频的高度（像素，默认值：480，必须能被 16 整除） | INT | 是 | 16 至 MAX_RESOLUTION |
| `长度` | 生成视频的帧数（默认值：81，必须能被 4 整除） | INT | 是 | 1 至 MAX_RESOLUTION |
| `批次大小` | 同时生成的视频数量（默认值：1） | INT | 是 | 1 至 4096 |
| `图像` | 用于时间维度条件化的可选参考图像 | IMAGE | 否 | - |

**注意：** 当提供 `images` 时，它们会自动放大以匹配指定的 `width` 和 `height`，并且仅使用前 `length` 帧进行处理。

## 输出

| 输出名称 | 描述 | 数据类型 |
| --- | --- | --- |
| `负面文本` | 当提供图像时，经过时间维度拼接修改后的正面条件化数据 | CONDITIONING |
| `负面图像文本` | 当提供图像时，经过时间维度拼接修改后的负面条件化数据 | CONDITIONING |
| `潜变量` | 当提供图像时，使用零值时间维度拼接的负面条件化数据 | CONDITIONING |
| `latent` | 生成的具有指定尺寸和长度的潜在视频表示 | LATENT |

> 本文档由 AI 生成。如果您发现任何错误或有改进建议，欢迎贡献！ [在 GitHub 上编辑](https://github.com/Comfy-Org/embedded-docs/blob/main/comfyui_embedded_docs/docs/WanPhantomSubjectToVideo/zh.md)

---
**Source fingerprint (SHA-256):** `2e3e8277dca9e998220fc5939c2cc72fdc15e80cc4b95daa33f5b92e2270dd73`