گره HunyuanVideo15ImageToVideo داده‌های شرطی (conditioning) و فضای نهفته (latent space) را برای تولید ویدئو بر اساس مدل HunyuanVideo 1.5 آماده می‌کند. این گره یک نمایش نهفته اولیه برای یک دنباله ویدئویی ایجاد می‌کند و می‌تواند به‌صورت اختیاری یک تصویر شروع یا خروجی CLIP vision را برای هدایت فرآیند تولید ادغام کند.

## ورودی‌ها

| پارامتر | توضیحات | نوع داده | الزامی | محدوده |
| --- | --- | --- | --- | --- |
| `مثبت` | پرامپت‌های شرطی مثبت که محتوای مورد نظر ویدئو را توصیف می‌کنند. | CONDITIONING | بله | - |
| `منفی` | پرامپت‌های شرطی منفی که محتوای نامطلوب ویدئو را توصیف می‌کنند. | CONDITIONING | بله | - |
| `vae` | مدل VAE (خودرمزگذار متغیر) که برای رمزگذاری تصویر شروع به فضای نهفته استفاده می‌شود. | VAE | بله | - |
| `عرض` | عرض فریم‌های ویدئوی خروجی بر حسب پیکسل. باید بر 16 بخش‌پذیر باشد. (پیش‌فرض: 848) | INT | خیر | 16 تا MAX_RESOLUTION |
| `ارتفاع` | ارتفاع فریم‌های ویدئوی خروجی بر حسب پیکسل. باید بر 16 بخش‌پذیر باشد. (پیش‌فرض: 480) | INT | خیر | 16 تا MAX_RESOLUTION |
| `طول` | تعداد کل فریم‌های دنباله ویدئو. باید مضربی از 4 باشد. (پیش‌فرض: 33) | INT | خیر | 1 تا MAX_RESOLUTION |
| `اندازه دسته` | تعداد دنباله‌های ویدئویی که در یک دسته تولید می‌شوند. (پیش‌فرض: 1) | INT | خیر | 1 تا 4096 |
| `تصویر شروع` | یک تصویر شروع اختیاری برای مقداردهی اولیه تولید ویدئو. در صورت ارائه، رمزگذاری شده و برای شرطی‌سازی فریم‌های اولیه استفاده می‌شود. تنها تعداد `طول` فریم اول تصویر استفاده می‌شود. | IMAGE | خیر | - |
| `خروجی clip vision` | بردارهای تعبیه‌شده (embeddings) اختیاری CLIP vision برای ارائه شرطی‌سازی بصری اضافی برای تولید. | CLIP_VISION_OUTPUT | خیر | - |

**نکته:** هنگامی که `start_image` ارائه می‌شود، به‌طور خودکار با استفاده از درون‌یابی دوخطی (bilinear interpolation) به اندازه `width` و `height` مشخص‌شده تغییر اندازه می‌دهد. تعداد `length` فریم اول از دسته تصاویر استفاده می‌شود. سپس تصویر رمزگذاری‌شده به هر دو شرط `positive` و `negative` به‌عنوان یک `concat_latent_image` با یک `concat_mask` متناظر اضافه می‌شود. ماسک برای فریم‌های تحت پوشش تصویر شروع روی 0.0 و برای فریم‌های باقی‌مانده روی 1.0 تنظیم می‌شود.

## خروجی‌ها

| نام خروجی | توضیحات | نوع داده |
| --- | --- | --- |
| `مثبت` | شرطی‌سازی مثبت اصلاح‌شده که اکنون ممکن است شامل تصویر شروع رمزگذاری‌شده یا خروجی CLIP vision باشد. | CONDITIONING |
| `منفی` | شرطی‌سازی منفی اصلاح‌شده که اکنون ممکن است شامل تصویر شروع رمزگذاری‌شده یا خروجی CLIP vision باشد. | CONDITIONING |
| `latent` | یک تنسور نهفته خالی با ابعاد پیکربندی‌شده برای اندازه دسته، طول ویدئو، عرض و ارتفاع مشخص‌شده. | LATENT |

> این مستند با هوش مصنوعی تهیه شده است. اگر خطایی دیدید یا پیشنهادی برای بهبود دارید، خوشحال می‌شویم مشارکت کنید! [ویرایش در GitHub](https://github.com/Comfy-Org/embedded-docs/blob/main/comfyui_embedded_docs/docs/HunyuanVideo15ImageToVideo/fa.md)

---
**Source fingerprint (SHA-256):** `2f41bbb080672683fb1755be575f08c79ca03e324df66953eb40631581197d47`