LTXVSeparateAVLatent 节点接收一个组合的音频-视频潜在表示，并将其拆分为两个独立的部分：一个用于视频，一个用于音频。它会分离样本，如果存在噪声掩码，也会从输入潜在表示中分离出来，从而创建两个新的潜在对象。

## 输入

| 参数 | 描述 | 数据类型 | 是否必填 | 范围 |
| --- | --- | --- | --- | --- |
| `音视频潜空间` | 待分离的组合音频-视频潜在表示。 | LATENT | 是 | 不适用 |

**注意：** 输入潜在表示的 `samples` 张量在第一维度（批次维度）上应至少包含两个元素。第一个元素用于视频潜在表示，第二个元素用于音频潜在表示。如果存在 `noise_mask`，则会以相同方式拆分。

## 输出

| 输出名称 | 描述 | 数据类型 |
| --- | --- | --- |
| `audio_latent` | 包含分离后视频数据的潜在表示。 | LATENT |
| `audio_latent` | 包含分离后音频数据的潜在表示。 | LATENT |

> 本文档由 AI 生成。如果您发现任何错误或有改进建议，欢迎贡献！ [在 GitHub 上编辑](https://github.com/Comfy-Org/embedded-docs/blob/main/comfyui_embedded_docs/docs/LTXVSeparateAVLatent/zh.md)

---
**Source fingerprint (SHA-256):** `55bce5d768e7fe13f885cc32d34ecdac5cdcbb667b03743004866ea4b6d58d46`