# ترجمة وثيقة عقدة WanInfiniteTalkToVideo

تقوم عقدة WanInfiniteTalkToVideo بتوليد تسلسلات فيديو من المدخلات الصوتية. تستخدم نموذج انتشار فيديو، معتمدًا على السمات الصوتية المستخرجة من متحدث واحد أو اثنين، لإنتاج تمثيل كامن لفيديو وجه متحدث. يمكن للعقدة توليد تسلسل جديد أو تمديد تسلسل موجود باستخدام الإطارات السابقة لسياق الحركة.

## المدخلات

| المعامل | الوصف | نوع البيانات | إلزامي | النطاق |
| --- | --- | --- | --- | --- |
| `الوضع` | وضع الإدخال الصوتي. يستخدم `"single_speaker"` مدخلاً صوتيًا واحدًا. يتيح `"two_speakers"` إدخالات لمتحدث ثانٍ والأقنعة المقابلة. | COMBO | نعم | `"single_speaker"`<br>`"two_speakers"` |
| `النموذج` | نموذج انتشار الفيديو الأساسي. | MODEL | نعم | - |
| `تصحيح النموذج` | تصحيح النموذج الذي يحتوي على طبقات الإسقاط الصوتي. | MODELPATCH | نعم | - |
| `إيجابي` | التكييف الإيجابي لتوجيه التوليد. | CONDITIONING | نعم | - |
| `سلبي` | التكييف السلبي لتوجيه التوليد. | CONDITIONING | نعم | - |
| `vae` | التشفير التلقائي المتغير المستخدم لتشفير الصور من وإلى الفضاء الكامن. | VAE | نعم | - |
| `العرض` | عرض الفيديو الناتج بالبكسل. يجب أن يكون قابلاً للقسمة على 16. (الافتراضي: 832) | INT | لا | 16 - MAX_RESOLUTION |
| `الارتفاع` | ارتفاع الفيديو الناتج بالبكسل. يجب أن يكون قابلاً للقسمة على 16. (الافتراضي: 480) | INT | لا | 16 - MAX_RESOLUTION |
| `الطول` | عدد الإطارات المراد توليدها. (الافتراضي: 81) | INT | لا | 1 - MAX_RESOLUTION |
| `مخرجات clip للرؤية` | مخرجات رؤية CLIP اختيارية لتكييف إضافي. | CLIPVISIONOUTPUT | لا | - |
| `صورة البداية` | صورة بداية اختيارية لتهيئة تسلسل الفيديو. | IMAGE | لا | - |
| `مخرجات ترميز الصوت ١` | مخرجات المشفر الصوتي الأساسي التي تحتوي على سمات المتحدث الأول. | AUDIOENCODEROUTPUT | نعم | - |
| `عدد إطارات الحركة` | عدد الإطارات السابقة المستخدمة كسياق حركة عند تمديد تسلسل. (الافتراضي: 9) | INT | لا | 1 - 33 |
| `مقياس الصوت` | عامل قياس يُطبق على التكييف الصوتي. (الافتراضي: 1.0) | FLOAT | لا | -10.0 - 10.0 |
| `الإطارات السابقة` | إطارات فيديو سابقة اختيارية للتمديد منها. | IMAGE | لا | - |
| `audio_encoder_output_2` | مخرجات المشفر الصوتي الثاني. مطلوبة عندما يكون الوضع مضبوطًا على `"two_speakers"`. | AUDIOENCODEROUTPUT | لا | - |
| `mask_1` | قناع المتحدث الأول، مطلوب في حالة استخدام مدخلين صوتيين. | MASK | لا | - |
| `mask_2` | قناع المتحدث الثاني، مطلوب في حالة استخدام مدخلين صوتيين. | MASK | لا | - |

**قيود المعاملات:**

* عندما يكون الوضع مضبوطًا على `"two_speakers"`، تصبح المعاملات `audio_encoder_output_2` و `mask_1` و `mask_2` إلزامية.
* إذا تم توفير `audio_encoder_output_2`، يجب أيضًا توفير كل من `mask_1` و `mask_2`.
* إذا تم توفير `mask_1` و `mask_2`، يجب أيضًا توفير `audio_encoder_output_2`.
* إذا تم توفير `previous_frames`، يجب أن يحتوي على عدد إطارات لا يقل عن العدد المحدد في `motion_frame_count`.

## المخرجات

| اسم المخرج | الوصف | نوع البيانات |
| --- | --- | --- |
| `إيجابي` | النموذج المُصحّح مع تطبيق التكييف الصوتي. | MODEL |
| `سلبي` | التكييف الإيجابي، وربما تم تعديله بسياق إضافي (مثل صورة البداية، رؤية CLIP). | CONDITIONING |
| `الفضاء الكامن` | التكييف السلبي، وربما تم تعديله بسياق إضافي. | CONDITIONING |
| `قص الصورة` | تسلسل الفيديو المُولّد في الفضاء الكامن. | LATENT |
| `trim_image` | عدد الإطارات من بداية سياق الحركة التي يجب قصها عند تمديد تسلسل. | INT |

> تم إنشاء هذه الوثيقة بواسطة الذكاء الاصطناعي. إذا وجدت أي أخطاء أو لديك اقتراحات للتحسين، فلا تتردد في المساهمة! [تحرير على GitHub](https://github.com/Comfy-Org/embedded-docs/blob/main/comfyui_embedded_docs/docs/WanInfiniteTalkToVideo/ar.md)

---
**Source fingerprint (SHA-256):** `6bb976da5cac0b61edb7d4c9d206c7c7ea9ffc0e982034c23c7f2e891e972888`
