### گره هماهنگ‌سازی صدا با ویدیو Kling Lip Sync

گره هماهنگ‌سازی صدا با ویدیو Kling، حرکات دهان را در یک فایل ویدیویی با محتوای صوتی یک فایل صوتی هماهنگ می‌کند. این گره الگوهای صوتی را در فایل صوتی تحلیل کرده و حرکات صورت را در ویدیو تنظیم می‌کند تا هماهنگ‌سازی لب‌ها به صورت واقع‌گرایانه انجام شود. این فرآیند به یک ویدیوی حاوی چهره مشخص و یک فایل صوتی با صدای قابل تشخیص نیاز دارد.

## ورودی‌ها

| پارامتر | توضیحات | نوع داده | الزامی | محدوده |
| --- | --- | --- | --- | --- |
| `video` | فایل ویدیویی حاوی چهره برای هماهنگ‌سازی لب‌ها | VIDEO | بله | - |
| `audio` | فایل صوتی حاوی صدا برای هماهنگ‌سازی با ویدیو | AUDIO | بله | - |
| `voice_language` | زبان صدای موجود در فایل صوتی (پیش‌فرض: "en") | COMBO | بله | `"en"`<br>`"zh"`<br>`"es"`<br>`"fr"`<br>`"de"`<br>`"it"`<br>`"pt"`<br>`"pl"`<br>`"tr"`<br>`"ru"`<br>`"nl"`<br>`"cs"`<br>`"ar"`<br>`"ja"`<br>`"hu"`<br>`"ko"` |

**محدودیت‌های مهم:**

- فایل صوتی نباید بزرگتر از 5 مگابایت باشد
- فایل ویدیویی نباید بزرگتر از 100 مگابایت باشد
- ابعاد ویدیو باید بین 720 پیکسل و 1920 پیکسل در ارتفاع/عرض باشد
- مدت زمان ویدیو باید بین 2 ثانیه و 10 ثانیه باشد
- فایل صوتی باید حاوی صدای قابل تشخیص باشد
- ویدیو باید حاوی یک چهره مشخص باشد

## خروجی‌ها

| نام خروجی | توضیحات | نوع داده |
| --- | --- | --- |
| `output` | ویدیوی پردازش‌شده با حرکات دهان هماهنگ‌شده | VIDEO |
| `video_id` | شناسه یکتای ویدیوی پردازش‌شده | STRING |
| `duration` | مدت زمان ویدیوی پردازش‌شده | STRING |

> این مستند با هوش مصنوعی تهیه شده است. اگر خطایی دیدید یا پیشنهادی برای بهبود دارید، خوشحال می‌شویم مشارکت کنید! [ویرایش در GitHub](https://github.com/Comfy-Org/embedded-docs/blob/main/comfyui_embedded_docs/docs/KlingLipSyncAudioToVideoNode/fa.md)

---
**Source fingerprint (SHA-256):** `92b8a7a4f9508632155a5f69707ffc4a14f2f44c04e4d01bf46476a972465592`
