以下は、ご指定の翻訳ルールに従って英語ドキュメントを日本語に翻訳したものです。

---

Kling Avatar 2.0 ノードは、1枚の参照写真と音声ファイルから、放送スタイルのデジタルヒューマンビデオを生成します。オプションのテキストプロンプトを使用して、アバターの動作、感情、カメラの動きを定義し、トーキングアバタービデオを作成します。

## 入力

| パラメータ | 説明 | データ型 | 必須 | 範囲 |
| --- | --- | --- | --- | --- |
| `image` | アバターの参照画像。幅と高さは少なくとも300px以上である必要があります。アスペクト比は1:2.5から2.5:1の間である必要があります。 | IMAGE | はい | - |
| `sound_file` | 音声入力。長さは2秒以上300秒以下である必要があります。 | AUDIO | はい | - |
| `mode` | 使用する生成モード。 | COMBO | はい | `"std"`<br>`"pro"` |
| `prompt` | アバターの動作、感情、カメラの動きを定義するオプションのプロンプト。（デフォルト：空文字列） | STRING | いいえ | - |
| `seed` | シードはノードを再実行するかどうかを制御します。結果はシードに関係なく非決定的です。（デフォルト：0） | INT | はい | 0 から 2147483647 |

**注記：** `image` と `sound_file` の入力には特定の検証要件があります。画像は少なくとも300x300ピクセルで、アスペクト比が1:2.5から2.5:1の間である必要があります。音声ファイルは2秒以上300秒以下である必要があります。

## 出力

| 出力名 | 説明 | データ型 |
| --- | --- | --- |
| `output` | 生成されたデジタルヒューマンビデオ。 | VIDEO |

> このドキュメントは AI によって生成されました。エラーを見つけた場合や改善のご提案がある場合は、ぜひ貢献してください！ [GitHub で編集](https://github.com/Comfy-Org/embedded-docs/blob/main/comfyui_embedded_docs/docs/KlingAvatarNode/ja.md)

---
**Source fingerprint (SHA-256):** `85793d3820a89ef98bb54cb930486847d4fd64cce5470ba34574ec319f8ea8c6`