Wan 文生视频节点根据文本描述生成视频内容。它利用 AI 模型从提示词创建视频，支持多种视频尺寸、时长以及可选的音频输入。该节点可在需要时自动生成音频，并提供提示词增强和添加水印的选项。

## 输入

| 参数 | 描述 | 数据类型 | 是否必填 | 取值范围 |
| --- | --- | --- | --- | --- |
| `模型` | 使用的模型（默认值："wan2.6-t2v"） | COMBO | 是 | "wan2.5-t2v-preview"<br>"wan2.6-t2v" |
| `提示词` | 描述元素和视觉特征的提示词。支持中文和英文（默认值：""） | STRING | 是 | - |
| `负面提示词` | 描述需要避免内容的负面提示词（默认值：""） | STRING | 否 | - |
| `尺寸` | 视频分辨率和宽高比（默认值："720p: 1:1 (960x960)"） | COMBO | 否 | "480p: 1:1 (624x624)"<br>"480p: 16:9 (832x480)"<br>"480p: 9:16 (480x832)"<br>"720p: 1:1 (960x960)"<br>"720p: 16:9 (1280x720)"<br>"720p: 9:16 (720x1280)"<br>"720p: 4:3 (1088x832)"<br>"720p: 3:4 (832x1088)"<br>"1080p: 1:1 (1440x1440)"<br>"1080p: 16:9 (1920x1080)"<br>"1080p: 9:16 (1080x1920)"<br>"1080p: 4:3 (1632x1248)"<br>"1080p: 3:4 (1248x1632)" |
| `时长` | 视频时长（秒）。15秒时长仅适用于 Wan 2.6 模型（默认值：5） | INT | 否 | 5-15（步长为5） |
| `音频` | 音频必须包含清晰响亮的人声，无多余噪音或背景音乐 | AUDIO | 否 | - |
| `随机种` | 用于生成的随机种子（默认值：0） | INT | 否 | 0-2147483647 |
| `生成音频` | 如果未提供音频输入，则自动生成音频（默认值：False） | BOOLEAN | 否 | - |
| `优化提示词` | 是否使用 AI 辅助增强提示词（默认值：True） | BOOLEAN | 否 | - |
| `水印` | 是否在结果中添加 AI 生成水印（默认值：False） | BOOLEAN | 否 | - |
| `镜头类型` | 指定生成视频的镜头类型，即视频是单一连续镜头还是包含剪辑的多镜头。此参数仅在 prompt_extend 为 True 时生效（默认值："single"） | COMBO | 否 | "single"<br>"multi" |

**注意：** Wan 2.6 模型不支持 480p 分辨率。15秒时长仅由 Wan 2.6 模型支持。提供音频输入时，其时长必须在 3.0 到 29.0 秒之间，且包含清晰人声，无背景噪音或音乐。

## 输出

| 输出名称 | 描述 | 数据类型 |
| --- | --- | --- |
| `output` | 根据输入参数生成的视频 | VIDEO |

> 本文档由 AI 生成。如果您发现任何错误或有改进建议，欢迎贡献！ [在 GitHub 上编辑](https://github.com/Comfy-Org/embedded-docs/blob/main/comfyui_embedded_docs/docs/WanTextToVideoApi/zh.md)

---
**Source fingerprint (SHA-256):** `e978f384365060a6d71899e4e2e22b2c6f4268fb0da988c8902e4876d8597a96`