گره LTXVConcatAVLatent، یک نمایش نهفته ویدئویی و یک نمایش نهفته صوتی را در یک خروجی نهفته تکی و به‌هم‌پیوسته ترکیب می‌کند. این گره، تنسورهای `samples` را از هر دو ورودی و در صورت وجود، تنسورهای `noise_mask` آن‌ها را نیز ادغام کرده و برای پردازش بیشتر در یک خط لوله تولید ویدئو آماده می‌سازد.

## ورودی‌ها

| پارامتر | توضیحات | نوع داده | ضروری | محدوده |
| --- | --- | --- | --- | --- |
| `لاتنت ویدیو` | نمایش نهفته داده‌های ویدئویی. | LATENT | بله |  |
| `لاتنت صدا` | نمایش نهفته داده‌های صوتی. | LATENT | بله |  |

**نکته:** تنسورهای `samples` از ورودی‌های `video_latent` و `audio_latent` به‌هم متصل می‌شوند. اگر هر یک از ورودی‌ها حاوی `noise_mask` باشد، از آن استفاده می‌شود؛ در صورت عدم وجود، یک ماسک از مقادیر یک (با همان شکل تنسور `samples` متناظر) برای آن ایجاد می‌گردد. سپس ماسک‌های حاصل نیز به‌هم متصل می‌شوند.

## خروجی‌ها

| نام خروجی | توضیحات | نوع داده |
| --- | --- | --- |
| `latent` | یک دیکشنری نهفته تکی شامل `samples` به‌هم‌پیوسته و در صورت وجود، `noise_mask` به‌هم‌پیوسته از ورودی‌های ویدئو و صدا. | LATENT |

> این مستند با هوش مصنوعی تهیه شده است. اگر خطایی دیدید یا پیشنهادی برای بهبود دارید، خوشحال می‌شویم مشارکت کنید! [ویرایش در GitHub](https://github.com/Comfy-Org/embedded-docs/blob/main/comfyui_embedded_docs/docs/LTXVConcatAVLatent/fa.md)

---
**Source fingerprint (SHA-256):** `322d6870f110fb1ef8b472cb49649cc9fff7865f4c7a83fbfd536f1fdfd694f8`
