以下が翻訳結果です。

LTXVConcatAVLatentノードは、ビデオ潜在表現とオーディオ潜在表現を結合し、単一の連結された潜在出力を生成します。両方の入力からの`samples`テンソルをマージし、存在する場合はそれらの`noise_mask`テンソルも同様にマージして、ビデオ生成パイプラインでのさらなる処理に備えます。

## 入力

| パラメータ | 説明 | データ型 | 必須 | 範囲 |
| --- | --- | --- | --- | --- |
| `video_latent` | ビデオデータの潜在表現です。 | LATENT | はい |  |
| `audio_latent` | オーディオデータの潜在表現です。 | LATENT | はい |  |

**注記:** `video_latent`と`audio_latent`の入力からの`samples`テンソルは連結されます。いずれかの入力に`noise_mask`が含まれている場合はそれが使用され、一方が欠けている場合は、対応する`samples`と同じ形状の1のマスクが作成されます。結果として得られるマスクも同様に連結されます。

## 出力

| 出力名 | 説明 | データ型 |
| --- | --- | --- |
| `latent` | ビデオとオーディオの入力から連結された`samples`と、該当する場合は連結された`noise_mask`を含む単一の潜在辞書です。 | LATENT |

> このドキュメントは AI によって生成されました。エラーを見つけた場合や改善のご提案がある場合は、ぜひ貢献してください！ [GitHub で編集](https://github.com/Comfy-Org/embedded-docs/blob/main/comfyui_embedded_docs/docs/LTXVConcatAVLatent/ja.md)

---
**Source fingerprint (SHA-256):** `322d6870f110fb1ef8b472cb49649cc9fff7865f4c7a83fbfd536f1fdfd694f8`
