گره «متن به ویدیوی Wan» محتوای ویدیویی را بر اساس توضیحات متنی تولید می‌کند. این گره با استفاده از مدل‌های هوش مصنوعی، از روی راهنماها (prompts) ویدیو می‌سازد و از اندازه‌ها، مدت‌زمان‌ها و ورودی‌های صوتی اختیاری مختلف پشتیبانی می‌کند. در صورت نیاز، این گره می‌تواند به‌طور خودکار صدا تولید کند و گزینه‌هایی برای بهبود راهنما و درج واترمارک ارائه می‌دهد.

## ورودی‌ها

| پارامتر | توضیحات | نوع داده | ضروری | محدوده |
| --- | --- | --- | --- | --- |
| `مدل` | مدل مورد استفاده (پیش‌فرض: "wan2.6-t2v") | COMBO | بله | "wan2.5-t2v-preview"<br>"wan2.6-t2v" |
| `پرامپت` | راهنمای توصیف‌کننده عناصر و ویژگی‌های بصری. از زبان‌های انگلیسی و چینی پشتیبانی می‌کند (پیش‌فرض: "") | STRING | بله | - |
| `پرامپت منفی` | راهنمای منفی توصیف‌کننده مواردی که باید از آنها اجتناب شود (پیش‌فرض: "") | STRING | خیر | - |
| `اندازه` | وضوح تصویر و نسبت ابعاد ویدیو (پیش‌فرض: "720p: 1:1 (960x960)") | COMBO | خیر | "480p: 1:1 (624x624)"<br>"480p: 16:9 (832x480)"<br>"480p: 9:16 (480x832)"<br>"720p: 1:1 (960x960)"<br>"720p: 16:9 (1280x720)"<br>"720p: 9:16 (720x1280)"<br>"720p: 4:3 (1088x832)"<br>"720p: 3:4 (832x1088)"<br>"1080p: 1:1 (1440x1440)"<br>"1080p: 16:9 (1920x1080)"<br>"1080p: 9:16 (1080x1920)"<br>"1080p: 4:3 (1632x1248)"<br>"1080p: 3:4 (1248x1632)" |
| `مدت زمان` | مدت‌زمان ویدیو بر حسب ثانیه. مدت‌زمان ۱۵ ثانیه فقط برای مدل Wan 2.6 در دسترس است (پیش‌فرض: ۵) | INT | خیر | 5-15 (در گام‌های ۵) |
| `صدا` | صدا باید حاوی صدای واضح و بلند، بدون نویز اضافی یا موسیقی پس‌زمینه باشد | AUDIO | خیر | - |
| `بذر` | دانه (seed) مورد استفاده برای تولید (پیش‌فرض: ۰) | INT | خیر | 0-2147483647 |
| `تولید صدا` | اگر ورودی صوتی ارائه نشود، به‌طور خودکار صدا تولید شود (پیش‌فرض: False) | BOOLEAN | خیر | - |
| `افزایش پرامپت` | آیا راهنما با کمک هوش مصنوعی بهبود یابد (پیش‌فرض: True) | BOOLEAN | خیر | - |
| `واترمارک` | آیا واترمارک تولیدشده توسط هوش مصنوعی به نتیجه اضافه شود (پیش‌فرض: False) | BOOLEAN | خیر | - |
| `نوع برداشت` | نوع نما را برای ویدیوی تولیدشده مشخص می‌کند، یعنی اینکه ویدیو یک نمای پیوسته است یا چند نما با برش. این پارامتر فقط زمانی اعمال می‌شود که prompt_extend برابر True باشد (پیش‌فرض: "single") | COMBO | خیر | "single"<br>"multi" |

**توجه:** مدل Wan 2.6 از وضوح‌های 480p پشتیبانی نمی‌کند. مدت‌زمان ۱۵ ثانیه فقط توسط مدل Wan 2.6 پشتیبانی می‌شود. هنگام ارائه ورودی صوتی، مدت‌زمان آن باید بین ۳.۰ تا ۲۹.۰ ثانیه باشد و حاوی صدای واضح بدون نویز پس‌زمینه یا موسیقی باشد.

## خروجی‌ها

| نام خروجی | توضیحات | نوع داده |
| --- | --- | --- |
| `output` | ویدیوی تولیدشده بر اساس پارامترهای ورودی | VIDEO |

> این مستند با هوش مصنوعی تهیه شده است. اگر خطایی دیدید یا پیشنهادی برای بهبود دارید، خوشحال می‌شویم مشارکت کنید! [ویرایش در GitHub](https://github.com/Comfy-Org/embedded-docs/blob/main/comfyui_embedded_docs/docs/WanTextToVideoApi/fa.md)

---
**Source fingerprint (SHA-256):** `e978f384365060a6d71899e4e2e22b2c6f4268fb0da988c8902e4876d8597a96`