Узел `TextEncodeHunyuanVideo_ImageToVideo` создает данные кондиционирования для генерации видео путем объединения текстовых подсказок с эмбеддингами изображений. Он использует модель CLIP для обработки как текстового ввода, так и визуальной информации из вывода CLIP vision, после чего генерирует токены, объединяющие эти два источника в соответствии с заданным параметром чередования изображений.

## Входные параметры

| Параметр | Описание | Тип данных | Обязательный | Диапазон |
| --- | --- | --- | --- | --- |
| `clip` | Модель CLIP, используемая для токенизации и кодирования | CLIP | Да | - |
| `выход clip_vision` | Визуальные эмбеддинги из модели CLIP vision, обеспечивающие контекст изображения | CLIP_VISION_OUTPUT | Да | - |
| `подсказка` | Текстовое описание для управления генерацией видео, поддерживает многострочный ввод и динамические подсказки | STRING | Да | - |
| `перемежение изображения` | Определяет степень влияния изображения по сравнению с текстовой подсказкой. Чем выше значение, тем больше влияние текстовой подсказки. (по умолчанию: 2) | INT | Да | 1-512 |

## Выходные параметры

| Имя выхода | Описание | Тип данных |
| --- | --- | --- |
| `CONDITIONING` | Данные кондиционирования, объединяющие информацию из текста и изображения для генерации видео | CONDITIONING |

> Эта документация была создана с помощью ИИ. Если вы обнаружите ошибки или у вас есть предложения по улучшению, пожалуйста, внесите свой вклад! [Редактировать на GitHub](https://github.com/Comfy-Org/embedded-docs/blob/main/comfyui_embedded_docs/docs/TextEncodeHunyuanVideo_ImageToVideo/ru.md)

---
**Source fingerprint (SHA-256):** `ee748bd1fb1733593eb4cb1187c5cc279171163cfbc389f039378d0e366fc231`