Вот перевод документации на русский язык:

Узел WanDancerVideo подготавливает данные conditioning и пустой латентный тензор для генерации видео с помощью модели WanDancer. Он объединяет позитивный и негативный conditioning с опциональными входными данными, такими как начальное изображение, маска, эмбеддинги CLIP vision и аудиохарактеристики, для управления генерируемым видео.

## Входные параметры

| Параметр | Описание | Тип данных | Обязательный | Диапазон |
| --- | --- | --- | --- | --- |
| `позитивный` | Позитивный conditioning для направления генерации видео. | CONDITIONING | Да |  |
| `негативный` | Негативный conditioning для направления генерации видео. | CONDITIONING | Да |  |
| `vae` | VAE, используемый для кодирования начального изображения в латентное пространство. | VAE | Да |  |
| `ширина` | Ширина генерируемого видео в пикселях (по умолчанию: 480). | INT | Да | от 16 до MAX_RESOLUTION (шаг: 16) |
| `высота` | Высота генерируемого видео в пикселях (по умолчанию: 832). | INT | Да | от 16 до MAX_RESOLUTION (шаг: 16) |
| `длина` | Количество кадров в генерируемом видео. Должно оставаться 149 для WanDancer (по умолчанию: 149). | INT | Да | от 1 до MAX_RESOLUTION (шаг: 4) |
| `clip_vision_output` | Эмбеддинги CLIP vision для первого кадра. | CLIP_VISION_OUTPUT | Нет |  |
| `clip_vision_output_ref` | Эмбеддинги CLIP vision для референсного изображения. | CLIP_VISION_OUTPUT | Нет |  |
| `начальное изображение` | Начальное изображение(я) для кодирования. Может быть любым количеством кадров, вплоть до указанного `длина`. | IMAGE | Нет |  |
| `маска` | Маска conditioning изображения для начального изображения(ий). Белые области сохраняются, черные области генерируются. Используется для локальной генерации. | MASK | Нет |  |
| `audio_encoder_output` | Выходные данные аудиоэнкодера, предоставляющие аудиохарактеристики, fps и масштаб инъекции для генерации с аудио-условием. | AUDIO_ENCODER_OUTPUT | Нет |  |

**Примечание об ограничениях параметров:**
- Входные данные `start_image` и `mask` являются опциональными, но могут использоваться вместе. Когда `start_image` предоставлен, он кодируется и объединяется с латентным представлением. Если также предоставлен `mask`, он управляет тем, какие части начального изображения сохраняются (белые), а какие регенерируются (черные). Если `mask` не предоставлен, вся область начального изображения используется как направляющая conditioning.
- Входные данные `clip_vision_output` и `clip_vision_output_ref` являются опциональными и могут использоваться вместе для предоставления визуального контекста для первого кадра и референсного изображения.
- Входные данные `audio_encoder_output` являются опциональными и предоставляют аудиохарактеристики для генерации с аудио-условием.

## Выходные параметры

| Имя выхода | Описание | Тип данных |
| --- | --- | --- |
| `позитивный` | Позитивный conditioning с присоединенными дополнительными данными (concat latent, CLIP vision, аудио). | CONDITIONING |
| `негативный` | Негативный conditioning с присоединенными дополнительными данными (concat latent, CLIP vision, аудио). | CONDITIONING |
| `latent` | Пустой латентный тензор с размерами, соответствующими указанной длине, высоте и ширине видео. | LATENT |

> Эта документация была создана с помощью ИИ. Если вы обнаружите ошибки или у вас есть предложения по улучшению, пожалуйста, внесите свой вклад! [Редактировать на GitHub](https://github.com/Comfy-Org/embedded-docs/blob/main/comfyui_embedded_docs/docs/WanDancerVideo/ru.md)

---
**Source fingerprint (SHA-256):** `7ab1b4662eb8d780295ea3a3e3139c64d81e03a979a293a481f82deaf1fc2f7e`
