# Kling 唇形同步音频转视频节点

此节点可将视频文件中的嘴部动作与音频文件中的音频内容同步。该节点会分析音频中的语音模式，并调整视频中的面部动作，以创建逼真的唇形同步效果。此过程需要包含清晰面部的视频以及包含清晰可辨语音的音频文件。

## 输入

| 参数 | 描述 | 数据类型 | 是否必需 | 范围 |
| --- | --- | --- | --- | --- |
| `视频` | 包含待同步嘴部动作面部的视频文件 | VIDEO | 是 | - |
| `音频` | 包含待与视频同步语音的音频文件 | AUDIO | 是 | - |
| `语音语言` | 音频文件中语音的语言（默认值："en"） | COMBO | 是 | `"en"`<br>`"zh"`<br>`"es"`<br>`"fr"`<br>`"de"`<br>`"it"`<br>`"pt"`<br>`"pl"`<br>`"tr"`<br>`"ru"`<br>`"nl"`<br>`"cs"`<br>`"ar"`<br>`"ja"`<br>`"hu"`<br>`"ko"` |

**重要限制条件：**

- 音频文件大小不应超过 5MB
- 视频文件大小不应超过 100MB
- 视频尺寸的高/宽应在 720px 至 1920px 之间
- 视频时长应在 2 秒至 10 秒之间
- 音频必须包含清晰可辨的语音
- 视频必须包含清晰的面部

## 输出

| 输出名称 | 描述 | 数据类型 |
| --- | --- | --- |
| `视频ID` | 经过唇形同步嘴部动作处理后的视频 | VIDEO |
| `时长` | 处理后的视频的唯一标识符 | STRING |
| `duration` | 处理后的视频时长 | STRING |

> 本文档由 AI 生成。如果您发现任何错误或有改进建议，欢迎贡献！ [在 GitHub 上编辑](https://github.com/Comfy-Org/embedded-docs/blob/main/comfyui_embedded_docs/docs/KlingLipSyncAudioToVideoNode/zh.md)

---
**Source fingerprint (SHA-256):** `92b8a7a4f9508632155a5f69707ffc4a14f2f44c04e4d01bf46476a972465592`
