# گره تشخیص SAM3

## نمای کلی

گره تشخیص SAM3 عملیات تشخیص و بخش‌بندی واژگان باز را با استفاده از توضیحات متنی، جعبه‌های محدودکننده یا نشانه‌های نقطه‌ای انجام می‌دهد. این گره می‌تواند اشیاء موجود در یک تصویر را بر اساس آنچه در متن توصیف می‌کنید، جایی که جعبه می‌کشید یا جایی که روی نقاط کلیک می‌کنید، شناسایی و بخش‌بندی کند.

## ورودی‌ها

| پارامتر | توضیحات | نوع داده | ضروری | محدوده |
| --- | --- | --- | --- | --- |
| `مدل` | مدل SAM3 برای استفاده در تشخیص و بخش‌بندی | MODEL | بله | - |
| `تصویر` | تصویر ورودی برای پردازش | IMAGE | بله | - |
| `شرط‌گذاری` | شرط‌گذاری متنی از CLIPTextEncode. هنگام استفاده از نشانه‌های متنی برای تشخیص ضروری است | CONDITIONING | خیر | - |
| `جعبه‌های مرزی` | جعبه‌های محدودکننده برای بخش‌بندی درون آن‌ها. می‌تواند یک جعبه واحد (اعمال شده به همه فریم‌ها)، لیستی از جعبه‌ها (اعمال شده به همه فریم‌ها) یا لیستی از لیست‌ها (جعبه‌های هر فریم) باشد. وقتی بدون شرط‌گذاری متنی ارائه شود، گره داخل هر جعبه را بخش‌بندی می‌کند | BOUNDING_BOX | خیر | - |
| `مختصات مثبت` | نشانه‌های نقطه مثبت با فرمت JSON `[{"x": int, "y": int}, ...]` با استفاده از مختصات پیکسلی. این نقاطی هستند که می‌خواهید در بخش‌بندی گنجانده شوند | STRING | خیر | - |
| `مختصات منفی` | نشانه‌های نقطه منفی با فرمت JSON `[{"x": int, "y": int}, ...]` با استفاده از مختصات پیکسلی. این نقاطی هستند که می‌خواهید از بخش‌بندی حذف شوند | STRING | خیر | - |
| `آستانه` | آستانه اطمینان برای تشخیص‌های مبتنی بر متن. فقط تشخیص‌هایی با امتیاز بالاتر از این مقدار نگه داشته می‌شوند (پیش‌فرض: 0.5) | FLOAT | خیر | 0.0 تا 1.0 |
| `تعداد تکرار پالایش` | تعداد مراحل اصلاح رمزگشای SAM. مقادیر بالاتر می‌تواند کیفیت ماسک را بهبود بخشد. برای استفاده از ماسک‌های خام تشخیص‌دهنده بدون اصلاح، روی 0 تنظیم کنید (پیش‌فرض: 2) | INT | خیر | 0 تا 5 |
| `ماسک‌های جداگانه` | وقتی فعال باشد، به جای ترکیب آن‌ها در یک ماسک واحد، ماسک‌های جداگانه برای هر شیء تشخیص داده شده خروجی می‌دهد (پیش‌فرض: False) | BOOLEAN | خیر | True/False |

### محدودیت‌ها و نکات پارامترها

- **نشانه‌های متنی**: برای استفاده از تشخیص مبتنی بر متن، باید ورودی `conditioning` را ارائه دهید. وقتی شرط‌گذاری متنی ارائه شود، گره تشخیص هدایت‌شده با متن را روی تصویر اجرا می‌کند.
- **نشانه‌های جعبه‌ای**: وقتی `bboxes` بدون شرط‌گذاری متنی ارائه شود، گره ناحیه داخل هر جعبه محدودکننده را بخش‌بندی می‌کند.
- **نشانه‌های نقطه‌ای**: وقتی `positive_coords` یا `negative_coords` ارائه شود، گره از بخش‌بندی مبتنی بر نقطه استفاده می‌کند. نقاط به‌طور خودکار به وضوح داخلی مدل مقیاس‌دهی می‌شوند.
- **انواع چندگانه نشانه**: می‌توانید انواع مختلف نشانه را ترکیب کنید. به عنوان مثال، می‌توانید هم شرط‌گذاری متنی و هم جعبه‌های محدودکننده را ارائه دهید تا تشخیص متن را به نواحی خاصی محدود کنید.
- **پردازش دسته‌ای**: گره از تصاویر دسته‌ای پشتیبانی می‌کند. هنگام پردازش چندین فریم، جعبه‌های محدودکننده می‌توانند به صورت هر فریم با استفاده از فرمت لیستی از لیست‌ها ارائه شوند.
- **فرمت JSON برای نقاط**: مختصات نقاط باید به عنوان رشته‌های JSON معتبر در فرمت `[{"x": 100, "y": 200}, {"x": 150, "y": 250}]` ارائه شوند.

## خروجی‌ها

| نام خروجی | توضیحات | نوع داده |
| --- | --- | --- |
| `masks` | ماسک‌های بخش‌بندی. وقتی `ماسک‌های جداگانه` False باشد (پیش‌فرض)، یک ماسک ترکیبی واحد به ازای هر فریم برمی‌گرداند. وقتی True باشد، ماسک‌های جداگانه برای هر شیء تشخیص داده شده برمی‌گرداند | MASK |
| `جعبه‌های مرزی` | جعبه‌های محدودکننده تشخیص داده شده با مختصات و امتیازات اطمینان. هر جعبه شامل مقادیر `x`، `y`، `width`، `height` و `score` است | BOUNDING_BOX |

> این مستند با هوش مصنوعی تهیه شده است. اگر خطایی دیدید یا پیشنهادی برای بهبود دارید، خوشحال می‌شویم مشارکت کنید! [ویرایش در GitHub](https://github.com/Comfy-Org/embedded-docs/blob/main/comfyui_embedded_docs/docs/SAM3_Detect/fa.md)

---
**Source fingerprint (SHA-256):** `d073bda7eca934f3c64e1be740f5fb5249d27046a8be5902ea5d2245d5f679ea`