ElevenLabs文本转语音节点使用ElevenLabs API将书面文本转换为语音音频。它允许您选择特定语音并微调稳定性、速度和风格等各种语音特性，以生成自定义音频输出。

## 输入

| 参数 | 描述 | 数据类型 | 是否必需 | 范围 |
| --- | --- | --- | --- | --- |
| `voice` | 用于语音合成的语音。从语音选择器或即时语音克隆连接。 | CUSTOM | 是 | 不适用 |
| `text` | 要转换为语音的文本。 | STRING | 是 | 不适用 |
| `stability` | 语音稳定性。较低的值提供更广泛的情感范围，较高的值产生更一致但可能单调的语音（默认值：0.5）。 | FLOAT | 否 | 0.0 - 1.0 |
| `apply_text_normalization` | 文本规范化模式。"auto"让系统决定，"on"始终应用规范化，"off"跳过规范化。 | COMBO | 否 | `"auto"`<br>`"on"`<br>`"off"` |
| `model` | 用于文本转语音的模型。选择模型后会显示其特定参数。 | DYNAMICCOMBO | 否 | `"eleven_multilingual_v2"`<br>`"eleven_v3"` |
| `language_code` | ISO-639-1或ISO-639-3语言代码（例如"en"、"es"、"fra"）。留空以自动检测（默认值：""）。 | STRING | 否 | 不适用 |
| `seed` | 用于可复现性的种子（不保证确定性）（默认值：1）。 | INT | 否 | 0 - 2147483647 |
| `output_format` | 音频输出格式。 | COMBO | 否 | `"mp3_44100_192"`<br>`"opus_48000_192"` |

**模型特定参数：**
当`model`参数设置为`"eleven_multilingual_v2"`时，以下额外参数可用：

* `speed`：语速。1.0为正常，<1.0为较慢，>1.0为较快（默认值：1.0，范围：0.7 - 1.3）。
* `similarity_boost`：相似度增强。较高的值使语音更接近原始语音（默认值：0.75，范围：0.0 - 1.0）。
* `use_speaker_boost`：增强与原始说话人语音的相似度（默认值：False）。
* `style`：风格夸张程度。较高的值增加风格表现力，但可能降低稳定性（默认值：0.0，范围：0.0 - 0.2）。

当`model`参数设置为`"eleven_v3"`时，以下额外参数可用：

* `speed`：语速。1.0为正常，<1.0为较慢，>1.0为较快（默认值：1.0，范围：0.7 - 1.3）。
* `similarity_boost`：相似度增强。较高的值使语音更接近原始语音（默认值：0.75，范围：0.0 - 1.0）。

## 输出

| 输出名称 | 描述 | 数据类型 |
| --- | --- | --- |
| `audio` | 文本转语音转换生成的音频。 | AUDIO |

> 本文档由 AI 生成。如果您发现任何错误或有改进建议，欢迎贡献！ [在 GitHub 上编辑](https://github.com/Comfy-Org/embedded-docs/blob/main/comfyui_embedded_docs/docs/ElevenLabsTextToSpeech/zh.md)

---
**Source fingerprint (SHA-256):** `d11d4ffa2d1f11dfd5ce378d9496cd9788d2197bf7f4135092ecefb287f3c2f7`
