此文档由 AI 生成。如发现任何错误或有改进建议，欢迎随时贡献！[在 GitHub 上编辑](https://github.com/Comfy-Org/embedded-docs/blob/main/comfyui_embedded_docs/docs/StabilityAudioToAudio/en.md)

根据文本指令将现有音频样本转换为新的高质量作品。此节点接收输入音频文件，并基于您的文本提示对其进行修改，以创建新的音频内容。

## 输入

| 参数 | 描述 | 数据类型 | 是否必填 | 取值范围 |
| --- | --- | --- | --- | --- |
| `模型` | 用于音频转换的 AI 模型 | COMBO | 是 | "stable-audio-2.5"<br> |
| `提示词` | 描述如何转换音频的文本指令（默认：空） | STRING | 是 |  |
| `音频` | 音频时长必须在 6 到 190 秒之间 | AUDIO | 是 |  |
| `时长` | 控制生成音频的时长（以秒为单位）（默认：190） | INT | 否 | 1-190 |
| `随机种` | 用于生成的随机种子（默认：0） | INT | 否 | 0-4294967294 |
| `步数` | 控制采样步数（默认：8） | INT | 否 | 4-8 |
| `强度` | 该参数控制输入音频对生成音频的影响程度（默认：1.0） | FLOAT | 否 | 0.01-1.0 |

**注意：** 输入音频的时长必须在 6 到 190 秒之间。

## 输出

| 输出名称 | 描述 | 数据类型 |
| --- | --- | --- |
| `音频` | 基于输入音频和文本提示生成的转换后音频 | AUDIO |

> 本文档由 AI 生成。如果您发现任何错误或有改进建议，欢迎贡献！ [在 GitHub 上编辑](https://github.com/Comfy-Org/embedded-docs/blob/main/comfyui_embedded_docs/docs/StabilityAudioToAudio/zh.md)

---
**Source fingerprint (SHA-256):** `d63ee2585be1ec1a21da72656ecea37f051a56595b15637013e515eb298fc4dc`
