TextEncodeAceStepAudio1.5 节点用于准备文本和音频相关元数据，以供 AceStepAudio 1.5 模型使用。它接收描述性标签、歌词和音乐参数，然后利用 CLIP 模型将其转换为适用于音频生成的 conditioning 格式。

## 输入

| 参数 | 描述 | 数据类型 | 是否必填 | 范围 |
| --- | --- | --- | --- | --- |
| `clip` | 用于对输入文本进行分词和编码的 CLIP 模型。 | CLIP | 是 | 不适用 |
| `tags` | 音频的描述性标签，例如流派、情绪或乐器。支持多行输入和动态提示。 | STRING | 是 | 不适用 |
| `lyrics` | 音频轨道的歌词。支持多行输入和动态提示。 | STRING | 是 | 不适用 |
| `seed` | 用于可重复生成的随机种子值。具有 control_after_generate 控件。默认值：0。 | INT | 否 | 0 到 18446744073709551615 |
| `bpm` | 生成音频的每分钟节拍数 (BPM)。默认值：120。 | INT | 否 | 10 到 300 |
| `duration` | 音频的期望时长（秒）。默认值：120.0。 | FLOAT | 否 | 0.0 到 2000.0 |
| `timesignature` | 音乐拍号。 | COMBO | 否 | `"2"`<br>`"3"`<br>`"4"`<br>`"6"` |
| `language` | 输入文本的语言。默认值："en"。 | COMBO | 否 | `"ar"`<br>`"az"`<br>`"bg"`<br>`"bn"`<br>`"ca"`<br>`"cs"`<br>`"da"`<br>`"de"`<br>`"el"`<br>`"en"`<br>`"es"`<br>`"fa"`<br>`"fi"`<br>`"fr"`<br>`"he"`<br>`"hi"`<br>`"hr"`<br>`"ht"`<br>`"hu"`<br>`"id"`<br>`"is"`<br>`"it"`<br>`"ja"`<br>`"ko"`<br>`"la"`<br>`"lt"`<br>`"ms"`<br>`"ne"`<br>`"nl"`<br>`"no"`<br>`"pa"`<br>`"pl"`<br>`"pt"`<br>`"ro"`<br>`"ru"`<br>`"sa"`<br>`"sk"`<br>`"sr"`<br>`"sv"`<br>`"sw"`<br>`"ta"`<br>`"te"`<br>`"th"`<br>`"tl"`<br>`"tr"`<br>`"uk"`<br>`"ur"`<br>`"vi"`<br>`"yue"`<br>`"zh"`<br>`"unknown"` |
| `keyscale` | 音乐调性和音阶（大调或小调）。 | COMBO | 否 | `"C major"`<br>`"C minor"`<br>`"C# major"`<br>`"C# minor"`<br>`"Db major"`<br>`"Db minor"`<br>`"D major"`<br>`"D minor"`<br>`"D# major"`<br>`"D# minor"`<br>`"Eb major"`<br>`"Eb minor"`<br>`"E major"`<br>`"E minor"`<br>`"F major"`<br>`"F minor"`<br>`"F# major"`<br>`"F# minor"`<br>`"Gb major"`<br>`"Gb minor"`<br>`"G major"`<br>`"G minor"`<br>`"G# major"`<br>`"G# minor"`<br>`"Ab major"`<br>`"Ab minor"`<br>`"A major"`<br>`"A minor"`<br>`"A# major"`<br>`"A# minor"`<br>`"Bb major"`<br>`"Bb minor"`<br>`"B major"`<br>`"B minor"` |
| `generate_audio_codes` | 启用生成音频编码的 LLM。此过程可能较慢，但会提高生成音频的质量。如果您为模型提供音频参考，请关闭此选项。默认值：True。 | BOOLEAN | 否 | 不适用 |
| `cfg_scale` | 无分类器引导比例。值越高，输出越严格遵循提示。默认值：2.0。 | FLOAT | 否 | 0.0 到 100.0 |
| `temperature` | 采样温度。值越低，输出越具有确定性。默认值：0.85。 | FLOAT | 否 | 0.0 到 2.0 |
| `top_p` | 核采样概率 (top-p)。默认值：0.9。 | FLOAT | 否 | 0.0 到 2000.0 |
| `top_k` | 要考虑的最高概率 token 数量 (top-k)。默认值：0。 | INT | 否 | 0 到 100 |
| `min_p` | token 采样的最小概率阈值 (min-p)。默认值：0.000。 | FLOAT | 否 | 0.0 到 1.0 |

## 输出

| 输出名称 | 描述 | 数据类型 |
| --- | --- | --- |
| `CONDITIONING` | conditioning 数据，包含为 AceStepAudio 1.5 模型编码的文本和音频参数。 | CONDITIONING |

> 本文档由 AI 生成。如果您发现任何错误或有改进建议，欢迎贡献！ [在 GitHub 上编辑](https://github.com/Comfy-Org/embedded-docs/blob/main/comfyui_embedded_docs/docs/TextEncodeAceStepAudio1.5/zh.md)

---
**Source fingerprint (SHA-256):** `df70a55024812d8c77a3b618cbff6d3148a3f3f5fc4d17dd3c4282ce7f3cbc2c`
