# Wan 文字轉影片 API 節點

Wan 文字轉影片節點可根據文字描述生成影片內容。它使用 AI 模型從提示詞建立影片，並支援多種影片尺寸、時長以及可選的音訊輸入。該節點可在需要時自動生成音訊，並提供提示詞增強和浮水印選項。

## 輸入

| 參數 | 說明 | 資料類型 | 必填 | 範圍 |
| --- | --- | --- | --- | --- |
| `模型` | 要使用的模型（預設值："wan2.6-t2v"） | COMBO | 是 | "wan2.5-t2v-preview"<br>"wan2.6-t2v" |
| `提示詞` | 描述元素和視覺特徵的提示詞。支援英文和中文（預設值：""） | STRING | 是 | - |
| `負向提示詞` | 描述應避免內容的負面提示詞（預設值：""） | STRING | 否 | - |
| `尺寸` | 影片解析度和長寬比（預設值："720p: 1:1 (960x960)"） | COMBO | 否 | "480p: 1:1 (624x624)"<br>"480p: 16:9 (832x480)"<br>"480p: 9:16 (480x832)"<br>"720p: 1:1 (960x960)"<br>"720p: 16:9 (1280x720)"<br>"720p: 9:16 (720x1280)"<br>"720p: 4:3 (1088x832)"<br>"720p: 3:4 (832x1088)"<br>"1080p: 1:1 (1440x1440)"<br>"1080p: 16:9 (1920x1080)"<br>"1080p: 9:16 (1080x1920)"<br>"1080p: 4:3 (1632x1248)"<br>"1080p: 3:4 (1248x1632)" |
| `持續時間` | 影片時長（秒）。15 秒時長僅適用於 Wan 2.6 模型（預設值：5） | INT | 否 | 5-15（以 5 為步進） |
| `音訊` | 音訊必須包含清晰響亮的語音，無雜音或背景音樂 | AUDIO | 否 | - |
| `種子值` | 用於生成的種子值（預設值：0） | INT | 否 | 0-2147483647 |
| `生成音訊` | 若未提供音訊輸入，則自動生成音訊（預設值：False） | BOOLEAN | 否 | - |
| `提示詞擴展` | 是否使用 AI 輔助增強提示詞（預設值：True） | BOOLEAN | 否 | - |
| `浮水印` | 是否在結果中添加 AI 生成浮水印（預設值：False） | BOOLEAN | 否 | - |
| `鏡頭類型` | 指定生成影片的鏡頭類型，即影片是單一連續鏡頭還是包含剪輯的多個鏡頭。此參數僅在 prompt_extend 為 True 時生效（預設值："single"） | COMBO | 否 | "single"<br>"multi" |

**注意：** Wan 2.6 模型不支援 480p 解析度。15 秒時長僅由 Wan 2.6 模型支援。提供音訊輸入時，其時長必須在 3.0 到 29.0 秒之間，且包含清晰的語音，無背景噪音或音樂。

## 輸出

| 輸出名稱 | 說明 | 資料類型 |
| --- | --- | --- |
| `output` | 根據輸入參數生成的影片 | VIDEO |

> 本文檔由 AI 生成。如果您發現任何錯誤或有改進建議，歡迎貢獻！ [在 GitHub 上編輯](https://github.com/Comfy-Org/embedded-docs/blob/main/comfyui_embedded_docs/docs/WanTextToVideoApi/zh-TW.md)

---
**Source fingerprint (SHA-256):** `e978f384365060a6d71899e4e2e22b2c6f4268fb0da988c8902e4876d8597a96`