## نمای کلی

این گره یک ورودی صوتی را پردازش می‌کند تا ویژگی‌هایی را استخراج کند که می‌توان از آنها برای هدایت یک مدل تولید ویدیو استفاده کرد. این گره صدا را برای تشخیص تمپو، ضرب‌آهنگ و سایر ویژگی‌های موسیقایی تحلیل می‌کند و سپس این اطلاعات را در قالبی مناسب برای شرطی‌سازی مدل ویدیو بسته‌بندی می‌کند و امکان همگام‌سازی ویدیوی تولید شده با صدا را فراهم می‌سازد.

## ورودی‌ها

| پارامتر | توضیحات | نوع داده | الزامی | محدوده |
| --- | --- | --- | --- | --- |
| `audio` | ورودی صوتی که باید تحلیل و رمزگذاری شود. | AUDIO | بله | - |
| `video_frames` | تعداد فریم‌های ویدیوی هدف. برای محاسبه نرخ فریم جهت همگام‌سازی استفاده می‌شود (پیش‌فرض: ۱۴۹). | INT | بله | حداقل: ۱، حداکثر: ۲۶۸۴۳۵۴۵۶ (MAX_RESOLUTION)، گام: ۴ |
| `audio_inject_scale` | مقیاس ویژگی‌های صوتی هنگام تزریق به مدل ویدیو (پیش‌فرض: ۱.۰). | FLOAT | بله | حداقل: ۰.۰، حداکثر: ۱۰.۰، گام: ۰.۰۱ |

## خروجی‌ها

| نام خروجی | توضیحات | نوع داده |
| --- | --- | --- |
| `audio_encoder_output` | یک دیکشنری شامل ویژگی‌های پردازش‌شده صوتی، نرخ فریم محاسبه‌شده (fps) و مقیاس تزریق صدا. این خروجی برای شرطی‌سازی مدل تولید ویدیو استفاده می‌شود. | AUDIO_ENCODER_OUTPUT |
| `fps_string` | یک رشته متنی که نرخ فریم محاسبه‌شده (fps) را بر اساس طول صدا و تعداد فریم‌های ویدیو توصیف می‌کند. این رشته برای استفاده در پرامپت مدل ویدیو در نظر گرفته شده است. | STRING |

> این مستند با هوش مصنوعی تهیه شده است. اگر خطایی دیدید یا پیشنهادی برای بهبود دارید، خوشحال می‌شویم مشارکت کنید! [ویرایش در GitHub](https://github.com/Comfy-Org/embedded-docs/blob/main/comfyui_embedded_docs/docs/WanDancerEncodeAudio/fa.md)

---
**Source fingerprint (SHA-256):** `ef230c92b23a04369708041b2e5d03c1b2928edf746dc43020bae777f9f0b589`
