# Узел SAM3 Detect

## Обзор

Узел SAM3 Detect выполняет детекцию и сегментацию на основе открытого словаря с использованием текстовых описаний, ограничивающих рамок или точечных подсказок. Он может идентифицировать и сегментировать объекты на изображении на основе того, что вы описываете текстом, где вы рисуете рамки или где вы указываете точки.

## Входные параметры

| Параметр | Описание | Тип данных | Обязательный | Диапазон |
| --- | --- | --- | --- | --- |
| `model` | Модель SAM3 для детекции и сегментации | MODEL | Да | - |
| `изображение` | Входное изображение для обработки | IMAGE | Да | - |
| `condition` | Текстовое условие от CLIPTextEncode. Требуется при использовании текстовых подсказок для детекции | CONDITIONING | Нет | - |
| `границы` | Ограничивающие рамки для сегментации. Может быть одной рамкой (применяется ко всем кадрам), списком рамок (применяется ко всем кадрам) или списком списков (рамки для каждого кадра). При подаче без текстового условия узел выполняет сегментацию внутри каждой рамки | BOUNDING_BOX | Нет | - |
| `положительные_координаты` | Положительные точечные подсказки в формате JSON `[{"x": int, "y": int}, ...]` с использованием пиксельных координат. Это точки, которые вы хотите включить в сегментацию | STRING | Нет | - |
| `отрицательные_координаты` | Отрицательные точечные подсказки в формате JSON `[{"x": int, "y": int}, ...]` с использованием пиксельных координат. Это точки, которые вы хотите исключить из сегментации | STRING | Нет | - |
| `порог` | Порог уверенности для текстовой детекции. Сохраняются только детекции с оценками выше этого значения (по умолчанию: 0.5) | FLOAT | Нет | от 0.0 до 1.0 |
| `итерации_уточнения` | Количество проходов уточнения декодера SAM. Более высокие значения могут улучшить качество масок. Установите 0 для использования сырых масок детектора без уточнения (по умолчанию: 2) | INT | Нет | от 0 до 5 |
| `отдельные_маски` | При включении выводит отдельные маски для каждого обнаруженного объекта вместо объединения их в одну маску (по умолчанию: False) | BOOLEAN | Нет | True/False |

### Ограничения и примечания к параметрам

- **Текстовые подсказки**: Для использования текстовой детекции необходимо подать входной параметр `conditioning`. При подаче текстового условия узел выполняет детекцию на основе текста на изображении.
- **Подсказки рамками**: Когда `bboxes` подаются без текстового условия, узел сегментирует область внутри каждой ограничивающей рамки.
- **Точечные подсказки**: Когда подаются `positive_coords` или `negative_coords`, узел использует точечную сегментацию. Точки автоматически масштабируются под внутреннее разрешение модели.
- **Несколько типов подсказок**: Можно комбинировать различные типы подсказок. Например, можно подать как текстовое условие, так и ограничивающие рамки, чтобы ограничить текстовую детекцию определенными областями.
- **Пакетная обработка**: Узел поддерживает пакетную обработку изображений. При обработке нескольких кадров ограничивающие рамки могут подаваться для каждого кадра с использованием формата списка списков.
- **Формат JSON для точек**: Координаты точек должны подаваться в виде корректных JSON-строк в формате `[{"x": 100, "y": 200}, {"x": 150, "y": 250}]`.

## Выходные параметры

| Имя выхода | Описание | Тип данных |
| --- | --- | --- |
| `masks` | Маски сегментации. Когда `отдельные_маски` имеет значение False (по умолчанию), возвращает одну объединенную маску на кадр. При значении True возвращает отдельные маски для каждого обнаруженного объекта | MASK |
| `границы` | Обнаруженные ограничивающие рамки с координатами и оценками уверенности. Каждая рамка включает значения `x`, `y`, `width`, `height` и `score` | BOUNDING_BOX |

> Эта документация была создана с помощью ИИ. Если вы обнаружите ошибки или у вас есть предложения по улучшению, пожалуйста, внесите свой вклад! [Редактировать на GitHub](https://github.com/Comfy-Org/embedded-docs/blob/main/comfyui_embedded_docs/docs/SAM3_Detect/ru.md)

---
**Source fingerprint (SHA-256):** `d073bda7eca934f3c64e1be740f5fb5249d27046a8be5902ea5d2245d5f679ea`