# SAM3 检测节点

## 概述

SAM3 检测节点使用文本描述、边界框或点提示执行开放词汇检测和分割。它可以根据您在文本中描述的内容、绘制框的位置或点击点的位置来识别和分割图像中的对象。

## 输入

| 参数 | 描述 | 数据类型 | 是否必需 | 范围 |
| --- | --- | --- | --- | --- |
| `model` | 用于检测和分割的 SAM3 模型 | MODEL | 是 | - |
| `图像` | 要处理的输入图像 | IMAGE | 是 | - |
| `条件` | 来自 CLIPTextEncode 的文本条件。使用文本提示进行检测时需要 | CONDITIONING | 否 | - |
| `边界框` | 要分割的边界框。可以是单个框（应用于所有帧）、框列表（应用于所有帧）或列表的列表（逐帧框）。当未提供文本条件时，节点在每个框内进行分割 | BOUNDING_BOX | 否 | - |
| `正向坐标` | 正点提示，JSON 格式 `[{"x": int, "y": int}, ...]`，使用像素坐标。这些是您希望包含在分割中的点 | STRING | 否 | - |
| `负向坐标` | 负点提示，JSON 格式 `[{"x": int, "y": int}, ...]`，使用像素坐标。这些是您希望从分割中排除的点 | STRING | 否 | - |
| `阈值` | 基于文本检测的置信度阈值。仅保留得分高于此值的检测结果（默认值：0.5） | FLOAT | 否 | 0.0 到 1.0 |
| `细化迭代次数` | SAM 解码器优化迭代次数。较高的值可以改善遮罩质量。设置为 0 以使用原始检测器遮罩而不进行优化（默认值：2） | INT | 否 | 0 到 5 |
| `单独 mask` | 启用后，为每个检测到的对象输出单独的遮罩，而不是将它们合并为单个遮罩（默认值：False） | BOOLEAN | 否 | True/False |

### 参数约束和说明

- **文本提示**：要使用基于文本的检测，您必须提供 `conditioning` 输入。当提供文本条件时，节点在图像上运行文本引导的检测。
- **框提示**：当提供 `bboxes` 但未提供文本条件时，节点在每个边界框内进行分割。
- **点提示**：当提供 `positive_coords` 或 `negative_coords` 时，节点使用基于点的分割。点会自动缩放到模型的内部分辨率。
- **多种提示类型**：您可以组合不同的提示类型。例如，您可以同时提供文本条件和边界框，以将文本检测限制在特定区域。
- **批量处理**：节点支持批量图像。处理多个帧时，可以使用列表的列表格式为每个帧提供边界框。
- **点的 JSON 格式**：点坐标必须作为有效的 JSON 字符串提供，格式为 `[{"x": 100, "y": 200}, {"x": 150, "y": 250}]`。

## 输出

| 输出名称 | 描述 | 数据类型 |
| --- | --- | --- |
| `边界框` | 分割遮罩。当 `单独 mask` 为 False（默认值）时，返回每个帧的单个合并遮罩。当为 True 时，返回每个检测到的对象的单独遮罩 | MASK |
| `边界框` | 检测到的边界框，包含坐标和置信度得分。每个框包括 `x`、`y`、`width`、`height` 和 `score` 值 | BOUNDING_BOX |

> 本文档由 AI 生成。如果您发现任何错误或有改进建议，欢迎贡献！ [在 GitHub 上编辑](https://github.com/Comfy-Org/embedded-docs/blob/main/comfyui_embedded_docs/docs/SAM3_Detect/zh.md)

---
**Source fingerprint (SHA-256):** `d073bda7eca934f3c64e1be740f5fb5249d27046a8be5902ea5d2245d5f679ea`
