TextEncodeAceStepAudio 节点通过将标签和歌词合并为词元（tokens）来处理音频条件化的文本输入，然后使用可调节的歌词强度进行编码。该节点接收一个 CLIP 模型以及文本描述和歌词，将它们一起词元化，并生成适用于音频生成任务的条件化数据。该节点通过一个强度参数来控制歌词对最终输出的影响，从而实现对歌词影响力的精细调节。

## 输入

| 参数 | 描述 | 数据类型 | 是否必填 | 范围 |
| --- | --- | --- | --- | --- |
| `clip` | 用于词元化和编码的 CLIP 模型 | CLIP | 是 | - |
| `标签` | 用于音频条件化的文本标签或描述（支持多行输入和动态提示） | STRING | 是 | - |
| `歌词` | 用于音频条件化的歌词文本（支持多行输入和动态提示） | STRING | 是 | - |
| `歌词强度` | 控制歌词对条件化输出影响的强度（默认值：1.0，步长：0.01） | FLOAT | 否 | 0.0 - 10.0 |

## 输出

| 输出名称 | 描述 | 数据类型 |
| --- | --- | --- |
| `conditioning` | 编码后的条件化数据，包含已应用歌词强度的处理文本词元 | CONDITIONING |

> 本文档由 AI 生成。如果您发现任何错误或有改进建议，欢迎贡献！ [在 GitHub 上编辑](https://github.com/Comfy-Org/embedded-docs/blob/main/comfyui_embedded_docs/docs/TextEncodeAceStepAudio/zh.md)

---
**Source fingerprint (SHA-256):** `89600133d8b0edaa36958530dacffe812675b595b0d77db702bb7709567cd83d`
