Wan 图像转视频节点可根据单张输入图像和文本提示词生成视频。该节点将提供的图像作为第一帧，并基于描述创建视频序列，支持分辨率、时长、音频及其他高级设置选项。

## 输入

| 参数 | 描述 | 数据类型 | 是否必填 | 取值范围 |
| --- | --- | --- | --- | --- |
| `模型` | 使用的模型（默认值："wan2.6-i2v"） | COMBO | 是 | "wan2.5-i2v-preview"<br>"wan2.6-i2v" |
| `图像` | 作为视频生成第一帧的输入图像。必须恰好提供一张图像。 | IMAGE | 是 | - |
| `提示词` | 描述画面元素和视觉特征的提示词。支持英文和中文（默认值：空）。 | STRING | 是 | - |
| `负面提示词` | 描述需避免内容的负面提示词（默认值：空）。 | STRING | 否 | - |
| `分辨率` | 视频分辨率质量（默认值："720P"）。Wan 2.6 模型不支持 480P。 | COMBO | 否 | "480P"<br>"720P"<br>"1080P" |
| `时长` | 生成视频的时长（秒）。仅 Wan 2.6 模型支持 15 秒时长（默认值：5）。 | INT | 否 | 5-15（步长：5） |
| `音频` | 音频必须包含清晰响亮的人声，无多余噪音或背景音乐。提供时，音频时长需在 3.0 至 29.0 秒之间。 | AUDIO | 否 | - |
| `种子` | 用于生成的随机种子（默认值：0）。 | INT | 否 | 0-2147483647 |
| `生成音频` | 若未提供音频输入，则自动生成音频（默认值：False）。 | BOOLEAN | 否 | - |
| `优化提示词` | 是否借助 AI 辅助增强提示词（默认值：True）。 | BOOLEAN | 否 | - |
| `水印` | 是否在结果中添加 AI 生成水印（默认值：False）。 | BOOLEAN | 否 | - |
| `镜头类型` | 指定生成视频的镜头类型，即视频是单一连续镜头还是包含切换的多镜头。此参数仅在 prompt_extend 为 True 时生效（默认值："single"）。 | COMBO | 否 | "single"<br>"multi" |

**约束条件：**

- 视频生成必须恰好提供一张输入图像。
- Wan 2.6 模型（`wan2.6-i2v`）不支持 480P 分辨率。
- 仅 Wan 2.6 模型（`wan2.6-i2v`）支持 15 秒时长。
- 提供音频时，其时长必须在 3.0 至 29.0 秒之间。

## 输出

| 输出名称 | 描述 | 数据类型 |
| --- | --- | --- |
| `output` | 基于输入图像和提示词生成的视频。 | VIDEO |

> 本文档由 AI 生成。如果您发现任何错误或有改进建议，欢迎贡献！ [在 GitHub 上编辑](https://github.com/Comfy-Org/embedded-docs/blob/main/comfyui_embedded_docs/docs/WanImageToVideoApi/zh.md)

---
**Source fingerprint (SHA-256):** `ad4947dbb9c12ebb97ace99cd447431ba6db88a3b74239099fcbea501cff71f0`