أنت خبير في الترجمة التقنية متخصص في توثيق عُقد ComfyUI من الإنجليزية إلى العربية.

## قواعد الترجمة

1. **المحتوى الذي يجب عدم ترجمته:**
   - أسماء المعاملات بين علامات الاقتباس الخلفية: `image`, `seed`, `model`
   - أنواع البيانات بالأحرف الكبيرة: IMAGE, STRING, INT, FLOAT, MODEL, CONDITIONING, إلخ
   - القيم في عمود Range: الأرقام، "auto"، أسماء الخيارات
   - الكود، مسارات الملفات

2. **المحتوى الذي يجب ترجمته:**
   - عناوين الأقسام: ## نظرة عامة, ## المدخلات, ## المخرجات
   - جميع النصوص الوصفية والتوضيحية
   - أوصاف المعاملات

3. **جودة الترجمة:**
   - استخدام اللغة العربية الفصحى المعاصرة
   - الحفاظ على نبرة احترافية ولكن سهلة الفهم
   - ضمان الدقة التقنية
   - استخدام المصطلحات التقنية العربية القياسية

4. **التنسيق:**
   - الحفاظ على جميع تنسيقات Markdown
   - الحفاظ على بنية الجداول
   - عدم إضافة أي ملاحظة أو رابط في بداية الوثيقة (سيتم إضافتها تلقائيًا)

الرجاء ترجمة الوثيقة التالية إلى العربية، دون تضمين الملاحظة الأولية للوثيقة:

تقوم عقدة ElevenLabs لتحويل الكلام إلى نص بنسخ الملفات الصوتية إلى نص. تستخدم واجهة برمجة تطبيقات ElevenLabs لتحويل الكلمات المنطوقة إلى نص مكتوب، وتدعم ميزات مثل الكشف التلقائي عن اللغة، وتحديد المتحدثين المختلفين، ووضع علامات على الأصوات غير الكلامية مثل الموسيقى أو الضحك.

## المدخلات

| المعامل | الوصف | نوع البيانات | إلزامي | النطاق |
| --- | --- | --- | --- | --- |
| `الصوت` | الصوت المراد نسخه. | AUDIO | نعم | - |
| `النموذج` | النموذج المستخدم للنسخ. يؤدي اختيار هذا النموذج إلى إظهار معاملات إضافية. | COMBO | نعم | `"scribe_v2"` |
| `tag_audio_events` | إضافة تعليقات توضيحية للأصوات مثل (ضحك)، (موسيقى)، إلخ في النص المنسوخ. يظهر هذا المعامل عند تحديد نموذج `"scribe_v2"`. (الافتراضي: False) | BOOLEAN | لا | - |
| `diarize` | إضافة تعليقات توضيحية لتحديد المتحدث. يظهر هذا المعامل عند تحديد نموذج `"scribe_v2"`. (الافتراضي: False) | BOOLEAN | لا | - |
| `diarization_threshold` | حساسية فصل المتحدثين. القيم الأقل أكثر حساسية لتغيرات المتحدث. يظهر هذا المعامل عند تحديد نموذج `"scribe_v2"` وتفعيل `diarize`. (الافتراضي: 0.22) | FLOAT | لا | 0.1 - 0.4 |
| `temperature` | التحكم في العشوائية. القيمة 0.0 تستخدم الإعداد الافتراضي للنموذج. القيم الأعلى تزيد العشوائية. يظهر هذا المعامل عند تحديد نموذج `"scribe_v2"`. (الافتراضي: 0.0) | FLOAT | لا | 0.0 - 2.0 |
| `timestamps_granularity` | دقة التوقيت لكلمات النص المنسوخ. يظهر هذا المعامل عند تحديد نموذج `"scribe_v2"`. (الافتراضي: "word") | COMBO | لا | `"word"`<br>`"character"`<br>`"none"` |
| `رمز اللغة` | رمز اللغة وفقًا لمعيار ISO-639-1 أو ISO-639-3 (مثل 'en'، 'es'، 'fra'). اتركه فارغًا للكشف التلقائي. (الافتراضي: "") | STRING | لا | - |
| `عدد المتحدثين` | الحد الأقصى لعدد المتحدثين المتوقعين. اضبط على 0 للكشف التلقائي. (الافتراضي: 0) | INT | لا | 0 - 32 |
| `البذرة` | البذرة لإمكانية إعادة الإنتاج (لا يُضمن الحتمية). (الافتراضي: 1) | INT | لا | 0 - 2147483647 |

**ملاحظة:** لا يمكن تعيين معامل `num_speakers` إلى قيمة أكبر من 0 عند تفعيل خيار `diarize`. يجب إما تعطيل `diarize` أو تعيين `num_speakers` إلى 0.

## المخرجات

| اسم المخرج | الوصف | نوع البيانات |
| --- | --- | --- |
| `رمز اللغة` | النص المنسوخ من الصوت. | STRING |
| `كلمات بصيغة JSON` | رمز اللغة المكتشفة للصوت. | STRING |
| `words_json` | سلسلة نصية بتنسيق JSON تحتوي على معلومات مفصلة على مستوى الكلمة، بما في ذلك الطوابع الزمنية وتسميات المتحدثين إذا تم تفعيلها. | STRING |

> تم إنشاء هذه الوثيقة بواسطة الذكاء الاصطناعي. إذا وجدت أي أخطاء أو لديك اقتراحات للتحسين، فلا تتردد في المساهمة! [تحرير على GitHub](https://github.com/Comfy-Org/embedded-docs/blob/main/comfyui_embedded_docs/docs/ElevenLabsSpeechToText/ar.md)

---
**Source fingerprint (SHA-256):** `aca2ac04d7280ef2b604f7c8d29ad7fea1e7abcfc38beabb64ba6b268a8cade1`
