# ترجمة وثيقة عقدة WanSoundImageToVideo

تقوم عقدة WanSoundImageToVideo بإنشاء محتوى فيديو من الصور مع إمكانية التكييف الصوتي الاختياري. تستخدم هذه العقدة مطالبات التكييف الإيجابية والسلبية مع نموذج VAE لإنشاء تمثيلات كامنة للفيديو، ويمكنها دمج الصور المرجعية، الترميز الصوتي، فيديوهات التحكم، ومراجع الحركة لتوجيه عملية توليد الفيديو.

## المدخلات

| المعامل | الوصف | نوع البيانات | إلزامي | النطاق |
| --- | --- | --- | --- | --- |
| `النص الإيجابي` | مطالبات التكييف الإيجابية التي توجه المحتوى الذي يجب أن يظهر في الفيديو المُنشأ | CONDITIONING | نعم | - |
| `النص السلبي` | مطالبات التكييف السلبية التي تحدد المحتوى الذي يجب تجنبه في الفيديو المُنشأ | CONDITIONING | نعم | - |
| `VAE` | نموذج VAE المستخدم لترميز وفك تشفير التمثيلات الكامنة للفيديو | VAE | نعم | - |
| `العرض` | عرض الفيديو الناتج بالبكسل (الافتراضي: 832، يجب أن يكون قابلاً للقسمة على 16) | INT | نعم | 16 إلى MAX_RESOLUTION |
| `الارتفاع` | ارتفاع الفيديو الناتج بالبكسل (الافتراضي: 480، يجب أن يكون قابلاً للقسمة على 16) | INT | نعم | 16 إلى MAX_RESOLUTION |
| `الطول` | عدد الإطارات في الفيديو المُنشأ (الافتراضي: 77، يجب أن يكون قابلاً للقسمة على 4) | INT | نعم | 1 إلى MAX_RESOLUTION |
| `حجم الدُفعة` | عدد مقاطع الفيديو التي سيتم إنشاؤها في وقت واحد (الافتراضي: 1) | INT | نعم | 1 إلى 4096 |
| `مخرج مشفر الصوت` | ترميز صوتي اختياري يمكنه التأثير على توليد الفيديو بناءً على خصائص الصوت | AUDIOENCODEROUTPUT | لا | - |
| `الصورة المرجعية` | صورة مرجعية اختيارية توفر توجيهاً بصرياً لمحتوى الفيديو | IMAGE | لا | - |
| `الفيديو المتحكم به` | فيديو تحكم اختياري يوجه الحركة والبنية الهيكلية للفيديو المُنشأ | IMAGE | لا | - |
| `الحركة المرجعية` | مرجع حركة اختياري يوفر توجيهاً لأنماط الحركة في الفيديو | IMAGE | لا | - |

## المخرجات

| اسم المخرج | الوصف | نوع البيانات |
| --- | --- | --- |
| `النص السلبي` | التكييف الإيجابي المُعالج الذي تم تعديله لتوليد الفيديو | CONDITIONING |
| `الكامن` | التكييف السلبي المُعالج الذي تم تعديله لتوليد الفيديو | CONDITIONING |
| `latent` | تمثيل الفيديو المُنشأ في الفضاء الكامن والذي يمكن فك تشفيره إلى إطارات الفيديو النهائية | LATENT |

> تم إنشاء هذه الوثيقة بواسطة الذكاء الاصطناعي. إذا وجدت أي أخطاء أو لديك اقتراحات للتحسين، فلا تتردد في المساهمة! [تحرير على GitHub](https://github.com/Comfy-Org/embedded-docs/blob/main/comfyui_embedded_docs/docs/WanSoundImageToVideo/ar.md)

---
**Source fingerprint (SHA-256):** `f80f82b8671294a14ecfecf91bc13febae0c91c5efa438467a4413d52dc82d3f`