WanSoundImageToVideoExtend 节点通过生成额外帧来扩展已有的视频潜在表示，可选的引导方式包括音频、参考图像和控制视频。它接收一个起始视频潜在表示，并利用提供的条件提示和音频线索影响新内容，从而生成更长的视频序列。

## 输入

| 参数 | 描述 | 数据类型 | 是否必填 | 范围 |
| --- | --- | --- | --- | --- |
| `正面提示词` | 正向条件提示，用于引导视频应包含的内容 | CONDITIONING | 是 | - |
| `负面提示词` | 负向条件提示，用于指定视频应避免的内容 | CONDITIONING | 是 | - |
| `VAE` | 用于编码和解码视频帧的变分自编码器 | VAE | 是 | - |
| `长度` | 要生成的视频序列总帧数（默认值：77，步长：4） | INT | 是 | 1 至 MAX_RESOLUTION |
| `视频潜变量` | 作为扩展起点的初始视频潜在表示 | LATENT | 是 | - |
| `音频编码器输出` | 可选的音频嵌入，可根据声音特征影响视频生成 | AUDIOENCODEROUTPUT | 否 | - |
| `参考图像` | 可选的参考图像，为视频生成提供视觉引导 | IMAGE | 否 | - |
| `控制视频` | 可选的控制视频，可引导生成视频的运动和风格 | IMAGE | 否 | - |

## 输出

| 输出名称 | 描述 | 数据类型 |
| --- | --- | --- |
| `负面提示词` | 已应用视频上下文的处理后的正向条件 | CONDITIONING |
| `潜变量` | 已应用视频上下文的处理后的负向条件 | CONDITIONING |
| `latent` | 生成的视频潜在表示，包含扩展后的视频序列 | LATENT |

> 本文档由 AI 生成。如果您发现任何错误或有改进建议，欢迎贡献！ [在 GitHub 上编辑](https://github.com/Comfy-Org/embedded-docs/blob/main/comfyui_embedded_docs/docs/WanSoundImageToVideoExtend/zh.md)

---
**Source fingerprint (SHA-256):** `fc9aee5d51e96b864da7d75f592f07691be8b970346998b209b3ad8a72308ecb`