Вот перевод документации на русский язык:

Узел `CLIP Vision Encode` — это узел кодирования изображений в ComfyUI, используемый для преобразования входных изображений в векторы визуальных признаков с помощью модели CLIP Vision. Данный узел является важным связующим звеном между пониманием изображений и текста и широко применяется в различных рабочих процессах генерации и обработки AI-изображений.

**Функциональность узла**

- **Извлечение признаков изображения**: Преобразует входные изображения в многомерные векторы признаков
- **Мультимодальное связывание**: Обеспечивает основу для совместной обработки изображений и текста
- **Условная генерация**: Предоставляет визуальные условия для генерации на основе изображений

## Входы

| Имя параметра | Описание | Тип данных |
| --- | --- | --- |
| `clip_vision` | Модель CLIP vision, обычно загружается через узел CLIPVisionLoader | CLIP_VISION |
| `изображение` | Входное изображение для кодирования | IMAGE |
| `обрезка` | Метод обрезки изображения: center (обрезка по центру), none (без обрезки) | Выпадающий список |

## Выходы

| Имя выхода | Описание | Тип данных |
| --- | --- | --- |
| CLIP_VISION_OUTPUT | Закодированные визуальные признаки | CLIP_VISION_OUTPUT |

Этот выходной объект содержит:

- `last_hidden_state`: Последнее скрытое состояние
- `image_embeds`: Вектор внедрения изображения
- `penultimate_hidden_states`: Предпоследнее скрытое состояние
- `mm_projected`: Результат мультимодальной проекции (при наличии)

> Эта документация была создана с помощью ИИ. Если вы обнаружите ошибки или у вас есть предложения по улучшению, пожалуйста, внесите свой вклад! [Редактировать на GitHub](https://github.com/Comfy-Org/embedded-docs/blob/main/comfyui_embedded_docs/docs/CLIPVisionEncode/ru.md)