Вот перевод документации на русский язык:

Узел HunyuanVideo15ImageToVideo подготавливает данные conditioning и латентного пространства для генерации видео на основе модели HunyuanVideo 1.5. Он создает начальное латентное представление для видеопоследовательности и может опционально интегрировать начальное изображение или выходные данные CLIP vision для управления процессом генерации.

## Входные параметры

| Параметр | Описание | Тип данных | Обязательный | Диапазон |
| --- | --- | --- | --- | --- |
| `positive` | Положительные подсказки conditioning, описывающие, что должно содержаться в видео. | CONDITIONING | Да | - |
| `negative` | Отрицательные подсказки conditioning, описывающие, чего следует избегать в видео. | CONDITIONING | Да | - |
| `vae` | Модель VAE (вариационного автоэнкодера), используемая для кодирования начального изображения в латентное пространство. | VAE | Да | - |
| `width` | Ширина выходных видеокадров в пикселях. Должна делиться на 16. (по умолчанию: 848) | INT | Нет | от 16 до MAX_RESOLUTION |
| `height` | Высота выходных видеокадров в пикселях. Должна делиться на 16. (по умолчанию: 480) | INT | Нет | от 16 до MAX_RESOLUTION |
| `length` | Общее количество кадров в видеопоследовательности. Должно быть кратно 4. (по умолчанию: 33) | INT | Нет | от 1 до MAX_RESOLUTION |
| `batch_size` | Количество видеопоследовательностей для генерации в одном пакете. (по умолчанию: 1) | INT | Нет | от 1 до 4096 |
| `start_image` | Необязательное начальное изображение для инициализации генерации видео. Если указано, оно кодируется и используется для управления первыми кадрами. Используются только первые `length` кадров изображения. | IMAGE | Нет | - |
| `clip_vision_output` | Необязательные эмбеддинги CLIP vision для обеспечения дополнительного визуального управления генерацией. | CLIP_VISION_OUTPUT | Нет | - |

**Примечание:** При указании `start_image` оно автоматически масштабируется до заданных значений `width` и `height` с помощью билинейной интерполяции. Используются первые `length` кадров пакета изображений. Затем закодированное изображение добавляется как к `positive`, так и к `negative` conditioning в виде `concat_latent_image` с соответствующим `concat_mask`. Маска устанавливается в 0.0 для кадров, охваченных начальным изображением, и в 1.0 для остальных кадров.

## Выходные параметры

| Имя выхода | Описание | Тип данных |
| --- | --- | --- |
| `positive` | Модифицированное положительное conditioning, которое теперь может включать закодированное начальное изображение или выходные данные CLIP vision. | CONDITIONING |
| `negative` | Модифицированное отрицательное conditioning, которое теперь может включать закодированное начальное изображение или выходные данные CLIP vision. | CONDITIONING |
| `latent` | Пустой латентный тензор с размерами, настроенными под указанные размер пакета, длину видео, ширину и высоту. | LATENT |

> Эта документация была создана с помощью ИИ. Если вы обнаружите ошибки или у вас есть предложения по улучшению, пожалуйста, внесите свой вклад! [Редактировать на GitHub](https://github.com/Comfy-Org/embedded-docs/blob/main/comfyui_embedded_docs/docs/HunyuanVideo15ImageToVideo/ru.md)

---
**Source fingerprint (SHA-256):** `2f41bbb080672683fb1755be575f08c79ca03e324df66953eb40631581197d47`