گره WanDancerVideo داده‌های شرطی‌سازی (conditioning) و یک تنسور لاتنت خالی برای تولید ویدئو با مدل WanDancer آماده می‌کند. این گره شرطی‌سازی مثبت و منفی را با ورودی‌های اختیاری مانند تصویر شروع، ماسک، بردارهای嵌入 CLIP Vision و ویژگی‌های صوتی ترکیب می‌کند تا ویدئوی تولیدشده را کنترل کند.

## ورودی‌ها

| پارامتر | توضیحات | نوع داده | ضروری | محدوده |
| --- | --- | --- | --- | --- |
| `مثبت` | شرطی‌سازی مثبت برای هدایت تولید ویدئو. | CONDITIONING | بله |  |
| `منفی` | شرطی‌سازی منفی برای هدایت تولید ویدئو. | CONDITIONING | بله |  |
| `vae` | VAE مورد استفاده برای کدگذاری تصویر شروع به فضای لاتنت. | VAE | بله |  |
| `عرض` | عرض ویدئوی تولیدشده بر حسب پیکسل (پیش‌فرض: 480). | INT | بله | 16 تا MAX_RESOLUTION (گام: 16) |
| `ارتفاع` | ارتفاع ویدئوی تولیدشده بر حسب پیکسل (پیش‌فرض: 832). | INT | بله | 16 تا MAX_RESOLUTION (گام: 16) |
| `طول` | تعداد فریم‌های ویدئوی تولیدشده. برای WanDancer باید 149 باقی بماند (پیش‌فرض: 149). | INT | بله | 1 تا MAX_RESOLUTION (گام: 4) |
| `خروجی بینایی clip` | بردارهای嵌入 CLIP Vision برای فریم اول. | CLIP_VISION_OUTPUT | خیر |  |
| `خروجی مرجع بینایی clip` | بردارهای嵌入 CLIP Vision برای تصویر مرجع. | CLIP_VISION_OUTPUT | خیر |  |
| `تصویر شروع` | تصویر(های) اولیه برای کدگذاری. می‌تواند هر تعداد فریم، تا حداکثر `طول` مشخص‌شده باشد. | IMAGE | خیر |  |
| `ماسک` | ماسک شرطی‌سازی تصویر برای تصویر(های) شروع. نواحی سفید حفظ می‌شوند، نواحی سیاه تولید می‌شوند. برای تولیدات موضعی استفاده می‌شود. | MASK | خیر |  |
| `خروجی رمزگذار صوتی` | خروجی از یک کدگذار صوتی که ویژگی‌های صوتی، fps و مقیاس تزریق را برای تولید شرطی‌شده با صدا فراهم می‌کند. | AUDIO_ENCODER_OUTPUT | خیر |  |

**نکته درباره محدودیت‌های پارامتر:**
- ورودی‌های `start_image` و `mask` اختیاری هستند اما می‌توانند با هم استفاده شوند. وقتی `start_image` ارائه می‌شود، کدگذاری شده و با لاتنت ادغام می‌شود. اگر `mask` نیز ارائه شود، مشخص می‌کند کدام بخش‌های تصویر شروع حفظ شوند (سفید) و کدام بخش‌ها بازتولید شوند (سیاه). اگر `mask` ارائه نشود، کل ناحیه تصویر شروع به‌عنوان راهنمای شرطی‌سازی استفاده می‌شود.
- ورودی‌های `clip_vision_output` و `clip_vision_output_ref` اختیاری هستند و می‌توانند با هم برای ارائه زمینه بصری برای فریم اول و یک تصویر مرجع استفاده شوند.
- ورودی `audio_encoder_output` اختیاری است و ویژگی‌های صوتی را برای تولید شرطی‌شده با صدا فراهم می‌کند.

## خروجی‌ها

| نام خروجی | توضیحات | نوع داده |
| --- | --- | --- |
| `مثبت` | شرطی‌سازی مثبت به‌همراه داده‌های اضافی (لاتنت الحاقی، CLIP Vision، صدا) پیوست‌شده. | CONDITIONING |
| `منفی` | شرطی‌سازی منفی به‌همراه داده‌های اضافی (لاتنت الحاقی، CLIP Vision، صدا) پیوست‌شده. | CONDITIONING |
| `latent` | یک تنسور لاتنت خالی با ابعاد منطبق با طول، ارتفاع و عرض ویدئوی مشخص‌شده. | LATENT |

> این مستند با هوش مصنوعی تهیه شده است. اگر خطایی دیدید یا پیشنهادی برای بهبود دارید، خوشحال می‌شویم مشارکت کنید! [ویرایش در GitHub](https://github.com/Comfy-Org/embedded-docs/blob/main/comfyui_embedded_docs/docs/WanDancerVideo/fa.md)

---
**Source fingerprint (SHA-256):** `7ab1b4662eb8d780295ea3a3e3139c64d81e03a979a293a481f82deaf1fc2f7e`
