## مرور کلی

این گره برای پشتیبانی از مدل کنترل وان فان (Wan Fun Control) شرکت علی‌بابا جهت تولید ویدئو اضافه شده است و پس از [این کامیت](https://github.com/comfyanonymous/ComfyUI/commit/3661c833bcc41b788a7c9f0e7bc48524f8ee5f82) به مجموعه افزوده شد.

- **هدف:** آماده‌سازی اطلاعات شرطی‌سازی مورد نیاز برای تولید ویدئو با استفاده از مدل Wan 2.1 Fun Control.

گره WanFunControlToVideo یک افزونه ComfyUI است که برای پشتیبانی از مدل‌های Wan Fun Control جهت تولید ویدئو طراحی شده و هدف آن استفاده از کنترل WanFun برای ساخت ویدئو می‌باشد.

این گره به عنوان نقطه آماده‌سازی اطلاعات شرطی‌سازی ضروری عمل کرده و نقطه مرکزی فضای نهفته (latent space) را مقداردهی اولیه می‌کند و فرآیند تولید ویدئو را با استفاده از مدل Wan 2.1 Fun هدایت می‌نماید. نام گره به وضوح عملکرد آن را نشان می‌دهد: ورودی‌های مختلف را دریافت کرده و به قالبی مناسب برای کنترل تولید ویدئو در چارچوب WanFun تبدیل می‌کند.

موقعیت این گره در سلسله‌مراتب گره‌های ComfyUI نشان‌دهنده عملکرد آن در مراحل اولیه خط تولید ویدئو است که بر دستکاری سیگنال‌های شرطی‌سازی قبل از نمونه‌برداری یا رمزگشایی فریم‌های ویدئو تمرکز دارد.

## ورودی‌ها

| نام پارامتر | توضیحات | الزامی | نوع داده | مقدار پیش‌فرض |
| --- | --- | --- | --- | --- |
| positive | داده شرطی‌سازی مثبت استاندارد ComfyUI که معمولاً از گره "CLIP Text Encode" دریافت می‌شود. پرامپت مثبت محتوا، موضوع و سبک هنری مورد نظر کاربر برای ویدئوی تولید شده را توصیف می‌کند. | بله | CONDITIONING | نامشخص |
| negative | داده شرطی‌سازی منفی استاندارد ComfyUI که معمولاً توسط گره "CLIP Text Encode" تولید می‌شود. پرامپت منفی عناصر، سبک‌ها یا مصنوعاتی را مشخص می‌کند که کاربر تمایل به اجتناب از آنها در ویدئوی تولید شده دارد. | بله | CONDITIONING | نامشخص |
| vae | نیازمند مدل VAE (خودرمزنگار تغییراتی) سازگار با خانواده مدل‌های Wan 2.1 Fun است که برای رمزگذاری و رمزگشایی داده‌های تصویر/ویدئو استفاده می‌شود. | بله | VAE | نامشخص |
| width | عرض مورد نظر فریم‌های ویدئوی خروجی بر حسب پیکسل، با مقدار پیش‌فرض 832، حداقل مقدار 16، حداکثر مقدار تعیین شده توسط nodes.MAX_RESOLUTION و گام 16. | بله | INT | 832 |
| height | ارتفاع مورد نظر فریم‌های ویدئوی خروجی بر حسب پیکسل، با مقدار پیش‌فرض 480، حداقل مقدار 16، حداکثر مقدار تعیین شده توسط nodes.MAX_RESOLUTION و گام 16. | بله | INT | 480 |
| length | تعداد کل فریم‌های ویدئوی تولید شده، با مقدار پیش‌فرض 81، حداقل مقدار 1، حداکثر مقدار تعیین شده توسط nodes.MAX_RESOLUTION و گام 4. | بله | INT | 81 |
| batch_size | تعداد ویدئوهای تولید شده در یک دسته، با مقدار پیش‌فرض 1، حداقل مقدار 1 و حداکثر مقدار 4096. | بله | INT | 1 |
| clip_vision_output | (اختیاری) ویژگی‌های بصری استخراج شده توسط مدل بینایی CLIP که امکان هدایت سبک و محتوای بصری را فراهم می‌کند. | خیر | CLIP_VISION_OUTPUT | None |
| start_image | (اختیاری) یک تصویر اولیه که بر شروع ویدئوی تولید شده تأثیر می‌گذارد. | خیر | IMAGE | None |
| control_video | (اختیاری) به کاربران امکان می‌دهد یک ویدئوی مرجع ControlNet پیش‌پردازش شده ارائه دهند که حرکت و ساختار احتمالی ویدئوی تولید شده را هدایت می‌کند. | خیر | IMAGE | None |

## خروجی‌ها

| نام پارامتر | توضیحات | نوع داده |
| --- | --- | --- |
| positive | داده شرطی‌سازی مثبت بهبود یافته شامل start_image و control_video رمزگذاری شده را ارائه می‌دهد. | CONDITIONING |
| negative | داده شرطی‌سازی منفی بهبود یافته که حاوی concat_latent_image مشابه است را ارائه می‌دهد. | CONDITIONING |
| latent | یک دیکشنری حاوی تنسور نهفته خالی با کلید "samples". | LATENT |

> این مستند با هوش مصنوعی تهیه شده است. اگر خطایی دیدید یا پیشنهادی برای بهبود دارید، خوشحال می‌شویم مشارکت کنید! [ویرایش در GitHub](https://github.com/Comfy-Org/embedded-docs/blob/main/comfyui_embedded_docs/docs/WanFunControlToVideo/fa.md)