### **WanHuMoImageToVideo**

گره WanHuMoImageToVideo با تولید نمایش‌های نهفته (latent) برای فریم‌های ویدیو، تصاویر را به دنباله‌های ویدیویی تبدیل می‌کند. این گره ورودی‌های شرطی‌سازی (conditioning) را پردازش می‌کند و می‌تواند از تصاویر مرجع و جاسازی‌های صوتی (audio embeddings) برای تأثیرگذاری بر تولید ویدیو استفاده کند. خروجی این گره، داده‌های شرطی‌سازی اصلاح‌شده و نمایش‌های نهفته مناسب برای سنتز ویدیو است.

## **ورودی‌ها**

| پارامتر | توضیحات | نوع داده | ضروری | محدوده |
| --- | --- | --- | --- | --- |
| `مثبت` | ورودی شرطی‌سازی مثبت که تولید ویدیو را به سمت محتوای دلخواه هدایت می‌کند | CONDITIONING | بله | - |
| `منفی` | ورودی شرطی‌سازی منفی که تولید ویدیو را از محتوای ناخواسته دور می‌کند | CONDITIONING | بله | - |
| `vae` | مدل VAE مورد استفاده برای رمزگذاری تصاویر مرجع به فضای نهفته | VAE | بله | - |
| `عرض` | عرض فریم‌های ویدیوی خروجی بر حسب پیکسل (پیش‌فرض: 832، باید بر 16 بخش‌پذیر باشد) | INT | بله | 16 تا MAX\_RESOLUTION |
| `ارتفاع` | ارتفاع فریم‌های ویدیوی خروجی بر حسب پیکسل (پیش‌فرض: 480، باید بر 16 بخش‌پذیر باشد) | INT | بله | 16 تا MAX\_RESOLUTION |
| `طول` | تعداد فریم‌ها در دنباله ویدیوی تولید شده (پیش‌فرض: 97، باید به گونه‌ای باشد که (length - 1) بر 4 بخش‌پذیر باشد) | INT | بله | 1 تا MAX\_RESOLUTION |
| `اندازه دسته` | تعداد دنباله‌های ویدیویی که به طور همزمان تولید می‌شوند (پیش‌فرض: 1) | INT | بله | 1 تا 4096 |
| `خروجی رمزگذار صوتی` | داده‌های رمزگذاری شده صوتی اختیاری که می‌توانند بر اساس محتوای صوتی بر تولید ویدیو تأثیر بگذارند | AUDIOENCODEROUTPUT | خیر | - |
| `تصویر مرجع` | تصویر مرجع اختیاری که برای هدایت سبک و محتوای تولید ویدیو استفاده می‌شود | IMAGE | خیر | - |

**توجه:** هنگامی که یک تصویر مرجع ارائه می‌شود، رمزگذاری شده و به هر دو شرطی‌سازی مثبت و منفی اضافه می‌شود. هنگامی که خروجی رمزگذار صوتی ارائه می‌شود، پردازش شده و در داده‌های شرطی‌سازی ادغام می‌گردد. اگر هیچکدام ارائه نشود، تنسورهای placeholder پر از صفر برای هر دو نمایش نهفته مرجع و جاسازی‌های صوتی استفاده می‌شوند.

## **خروجی‌ها**

| نام خروجی | توضیحات | نوع داده |
| --- | --- | --- |
| `مثبت` | شرطی‌سازی مثبت اصلاح‌شده با تصویر مرجع و/یا جاسازی‌های صوتی ادغام‌شده | CONDITIONING |
| `منفی` | شرطی‌سازی منفی اصلاح‌شده با تصویر مرجع و/یا جاسازی‌های صوتی ادغام‌شده | CONDITIONING |
| `latent` | نمایش نهفته تولید شده حاوی داده‌های دنباله ویدیو | LATENT |

> این مستند با هوش مصنوعی تهیه شده است. اگر خطایی دیدید یا پیشنهادی برای بهبود دارید، خوشحال می‌شویم مشارکت کنید! [ویرایش در GitHub](https://github.com/Comfy-Org/embedded-docs/blob/main/comfyui_embedded_docs/docs/WanHuMoImageToVideo/fa.md)

---
**Source fingerprint (SHA-256):** `6301671d04748ce80c561a65df80c7ca146b91bcce8851872df40211af29fd39`