## 概述

此节点处理音频输入以提取可用于指导视频生成模型的特征。它分析音频以检测节奏、节拍及其他音乐特征，然后将这些信息打包成适合调节视频模型的格式，从而使生成的视频能够与音频同步。

## 输入

| 参数 | 描述 | 数据类型 | 是否必填 | 范围 |
| --- | --- | --- | --- | --- |
| `音频` | 待分析和编码的音频输入。 | AUDIO | 是 | - |
| `视频帧` | 目标视频的帧数。用于计算同步所需的帧率（默认值：149）。 | INT | 是 | 最小值：1，最大值：268435456（MAX_RESOLUTION），步长：4 |
| `音频注入比例` | 音频特征注入视频模型时的缩放比例（默认值：1.0）。 | FLOAT | 是 | 最小值：0.0，最大值：10.0，步长：0.01 |

## 输出

| 输出名称 | 描述 | 数据类型 |
| --- | --- | --- |
| `fps字符串` | 一个字典，包含处理后的音频特征、计算出的帧率（fps）以及音频注入缩放比例。此输出用于调节视频生成模型。 | AUDIO_ENCODER_OUTPUT |
| `fps_string` | 基于音频长度和视频帧数计算出的帧率（fps）的文本描述。此字符串旨在用于视频模型的提示词中。 | STRING |

> 本文档由 AI 生成。如果您发现任何错误或有改进建议，欢迎贡献！ [在 GitHub 上编辑](https://github.com/Comfy-Org/embedded-docs/blob/main/comfyui_embedded_docs/docs/WanDancerEncodeAudio/zh.md)

---
**Source fingerprint (SHA-256):** `ef230c92b23a04369708041b2e5d03c1b2928edf746dc43020bae777f9f0b589`
