### مرور کلی

گره WanAnimateToVideo با ترکیب چندین ورودی شرطی‌سازی شامل مراجع حالت (پوز)، حالات چهره و عناصر پس‌زمینه، محتوای ویدئویی تولید می‌کند. این گره ورودی‌های ویدئویی مختلف را پردازش کرده و دنباله‌های انیمیشن منسجمی ایجاد می‌کند و در عین حال پیوستگی زمانی بین فریم‌ها را حفظ می‌نماید. این گره عملیات فضای نهان را مدیریت کرده و می‌تواند با ادامه دادن الگوهای حرکتی، ویدئوهای موجود را گسترش دهد.

## ورودی‌ها

| پارامتر | توضیحات | نوع داده | اجباری | محدوده |
| --- | --- | --- | --- | --- |
| `مثبت` | شرطی‌سازی مثبت برای هدایت تولید به سمت محتوای دلخواه | CONDITIONING | بله | - |
| `منفی` | شرطی‌سازی منفی برای دور کردن تولید از محتوای ناخواسته | CONDITIONING | بله | - |
| `vae` | مدل VAE مورد استفاده برای رمزگذاری و رمزگشایی داده‌های تصویری | VAE | بله | - |
| `عرض` | عرض ویدئوی خروجی بر حسب پیکسل (پیش‌فرض: 832، گام: 16) | INT | بله | 16 تا MAX_RESOLUTION |
| `ارتفاع` | ارتفاع ویدئوی خروجی بر حسب پیکسل (پیش‌فرض: 480، گام: 16) | INT | بله | 16 تا MAX_RESOLUTION |
| `طول` | تعداد فریم‌های تولیدی (پیش‌فرض: 77، گام: 4) | INT | بله | 1 تا MAX_RESOLUTION |
| `اندازه دسته` | تعداد ویدئوهای تولید همزمان (پیش‌فرض: 1) | INT | بله | 1 تا 4096 |
| `خروجی clip vision` | خروجی اختیاری مدل بینایی CLIP برای شرطی‌سازی اضافی | CLIP_VISION_OUTPUT | خیر | - |
| `تصویر مرجع` | تصویر مرجع به‌عنوان نقطه شروع تولید | IMAGE | خیر | - |
| `ویدیوی چهره` | ورودی ویدئویی ارائه‌دهنده راهنمایی حالت چهره | IMAGE | خیر | - |
| `ویدیوی ژست` | ورودی ویدئویی ارائه‌دهنده راهنمایی حالت و حرکت | IMAGE | خیر | - |
| `حداکثر فریم‌های ادامه حرکت` | حداکثر تعداد فریم برای ادامه حرکت قبلی (پیش‌فرض: 5، گام: 4) | INT | بله | 1 تا MAX_RESOLUTION |
| `ویدیوی پس‌زمینه` | ویدئوی پس‌زمینه برای ترکیب با محتوای تولیدشده | IMAGE | خیر | - |
| `ماسک کاراکتر` | ماسک تعریف‌کننده نواحی کاراکتر برای پردازش انتخابی | MASK | خیر | - |
| `ادامه حرکت` | دنباله حرکت قبلی برای ادامه به‌منظور حفظ پیوستگی زمانی | IMAGE | خیر | - |
| `افست فریم ویدیو` | میزان جستجوی فریم در تمام ویدئوهای ورودی. برای تولید ویدئوهای طولانی‌تر به صورت تکه‌ای استفاده می‌شود. برای گسترش یک ویدئو، به خروجی video_frame_offset گره قبلی متصل شود. (پیش‌فرض: 0، گام: 1) | INT | بله | 0 تا MAX_RESOLUTION |

**محدودیت‌های پارامتر:**

- هنگامی که `pose_video` ارائه می‌شود، اگر منطق `trim_to_pose_video` فعال باشد (در حال حاضر در کد منبع روی `False` تنظیم شده است)، طول خروجی برای مطابقت با مدت زمان ویدئوی حالت تنظیم خواهد شد
- `face_video` هنگام پردازش به‌طور خودکار به وضوح 512x512 تغییر اندازه داده شده و به محدوده 1.0- تا 1.0 نرمال می‌شود
- فریم‌های `continue_motion` توسط پارامتر `continue_motion_max_frames` محدود می‌شوند؛ فقط آخرین فریم‌های `continue_motion_max_frames` از ورودی استفاده می‌شوند
- ویدئوهای ورودی (`face_video`، `pose_video`، `background_video`، `character_mask`) قبل از پردازش با `video_frame_offset` جابجا می‌شوند؛ اگر جابجایی از طول ویدئو بیشتر شود، ورودی نادیده گرفته می‌شود
- اگر `character_mask` فقط یک فریم داشته باشد، در تمام فریم‌ها تکرار می‌شود
- هنگامی که `clip_vision_output` ارائه می‌شود، هم بر روی شرطی‌سازی مثبت و هم منفی اعمال می‌گردد
- اگر `reference_image` ارائه نشود، یک تصویر سیاه (همه صفر) به‌عنوان مرجع پیش‌فرض استفاده می‌شود
- اگر `continue_motion` ارائه نشود، فریم‌های اولیه با نویز خاکستری (شدت 0.5) پر می‌شوند

## خروجی‌ها

| نام خروجی | توضیحات | نوع داده |
| --- | --- | --- |
| `مثبت` | شرطی‌سازی مثبت اصلاح‌شده با زمینه ویدئویی اضافی شامل خروجی بینایی CLIP، نهان ویدئوی حالت، پیکسل‌های ویدئوی چهره، تصویر نهان الحاق‌شده و ماسک الحاق‌شده | CONDITIONING |
| `منفی` | شرطی‌سازی منفی اصلاح‌شده با زمینه ویدئویی اضافی شامل خروجی بینایی CLIP، نهان ویدئوی حالت، پیکسل‌های ویدئوی چهره (معکوس)، تصویر نهان الحاق‌شده و ماسک الحاق‌شده | CONDITIONING |
| `latent` | محتوای ویدئویی تولیدشده در قالب فضای نهان با شکل [batch_size, 16, latent_length + trim_latent, latent_height, latent_width] | LATENT |
| `trim_latent` | اطلاعات پیرایش فضای نهان که تعداد فریم‌های نهان را برای پیرایش از ابتدا نشان می‌دهد (مربوط به فریم‌های نهان تصویر مرجع است) | INT |
| `trim_image` | اطلاعات پیرایش فضای تصویر برای فریم‌های حرکت مرجع، که تعداد فریم‌های تصویر را برای پیرایش از ابتدا نشان می‌دهد | INT |
| `افست فریم ویدیو` | جابجایی فریم به‌روز شده برای ادامه تولید ویدئو به صورت تکه‌ای، که به‌صورت جابجایی قبلی به‌علاوه طول تولیدشده محاسبه می‌شود | INT |

> این مستند با هوش مصنوعی تهیه شده است. اگر خطایی دیدید یا پیشنهادی برای بهبود دارید، خوشحال می‌شویم مشارکت کنید! [ویرایش در GitHub](https://github.com/Comfy-Org/embedded-docs/blob/main/comfyui_embedded_docs/docs/WanAnimateToVideo/fa.md)

---
**Source fingerprint (SHA-256):** `c2ca90f4963f629d51cdd7f4bdb67e01c32ce5ca7d916b1f992ccd220f57566c`