التكوين

Q: How do I improve my YOLO model's performance during training?

حسّن الأداء عن طريق ضبط المعلمات الفائقة مثل حجم الدفعة، ومعدل التعلم، والزخم، واضمحلال الوزن. اضبط إعدادات زيادة البيانات، وحدد المحسن المناسب، واستخدم تقنيات مثل التوقف المبكر أو الدقة المختلطة. للحصول على التفاصيل، راجع دليل التدريب.

Q: How do I set the learning rate for training a YOLO model?

معدل التعلم (lr0) أمر بالغ الأهمية؛ ابدأ بـ 0.01 لـ SGD أو 0.001 لمُحسِّن Adam. راقب المقاييس واضبطها حسب الحاجة. استخدم جدولة معدل تعلم جيب التمام (cos_lr) أو الإحماء (warmup_epochs، warmup_momentum). التفاصيل موجودة في دليل التدريب.

Q: What are the default inference settings for YOLO models?

تتضمن الإعدادات الافتراضية ما يلي: للحصول على نظرة عامة كاملة، راجع إعدادات التوقع ودليل التوقع.

Q: Why use mixed precision training with YOLO models?

يقلل التدريب بالدقة المختلطة (amp=True) من استخدام الذاكرة ويسرع التدريب باستخدام FP16 و FP32. إنه مفيد لوحدات معالجة الرسوميات (GPUs) الحديثة، مما يسمح بنماذج أكبر وحسابات أسرع دون فقدان كبير في الدقة. تعرف على المزيد في دليل التدريب.

تلعب إعدادات YOLO والمعلمات الفائقة دورًا حاسمًا في أداء النموذج وسرعته و دقته. يمكن أن تؤثر هذه الإعدادات على سلوك النموذج في مراحل مختلفة، بما في ذلك التدريب والتحقق من الصحة والتنبؤ.

شاهد: إتقان Ultralytics YOLO: التكوين

تستخدم أوامر Ultralytics بناء الجملة التالي:

مثال

CLIPython

yolo TASK MODE ARGS

from ultralytics import YOLO

# Load a YOLO model from a pretrained weights file
model = YOLO("yolo26n.pt")

# Run the model in MODE using custom ARGS
MODE = "predict"
ARGS = {"source": "image.jpg", "imgsz": 640}
getattr(model, MODE)(**ARGS)

حيث:

TASK (اختياري) هو واحد من (detect, segment, classify, pose, obb)
MODE (مطلوب) هو واحد من (train, التحقق, التنبؤ, تصدير, تتبع, قياس الأداء)
ARGS (اختياري) هي arg=value أزواج مثل imgsz=640 التي تتجاوز الإعدادات الافتراضية.

افتراضي ARG يتم تحديد القيم في هذه الصفحة وتأتي من cfg/default.yaml ملف.

المهام

يمكن لنماذج Ultralytics YOLO أداء مجموعة متنوعة من مهام الرؤية الحاسوبية، بما في ذلك:

الكشف: الكشف عن الكائنات يحدد ويضع الكائنات داخل صورة أو مقطع فيديو.
التقسيم: تقسيم المثيلات يقسم صورة أو مقطع فيديو إلى مناطق تتوافق مع كائنات أو فئات مختلفة.
تصنيف: تصنيف الصور يتنبأ بتصنيف فئة صورة مُدخلة.
الوضعية: تقدير الوضعية يحدد الكائنات ويقدر نقاطها الرئيسية في صورة أو مقطع فيديو.
OBB: صناديق الإحاطة الموجهة تستخدم صناديق إحاطة مُدَوَّرة، وهي مناسبة للصور الطبية أو صور الأقمار الصناعية.

الوسيطة	افتراضي	الوصف
`task`	`'detect'`	يحدد مهمة YOLO: `detect` لـ اكتشاف الكائنات, `segment` للتجزئة، `classify` للتصنيف، `pose` لتقدير الوضعية، و `obb` للمربعات المحيطة الموجهة. تم تصميم كل مهمة لمخرجات ومشاكل محددة في تحليل الصور والفيديو.

دليل المهام

الأوضاع

تعمل نماذج Ultralytics YOLO في أوضاع مختلفة، تم تصميم كل منها لمرحلة معينة من دورة حياة النموذج:

تدريب: تدريب نموذج YOLO على مجموعة بيانات مخصصة.
Val: تحقق من صحة نموذج YOLO مدرب.
توقع: استخدم نموذج YOLO مُدرَّبًا لعمل تنبؤات على صور أو مقاطع فيديو جديدة.
تصدير: تصدير نموذج YOLO للنشر.
تتبع: تتبع الكائنات في الوقت الفعلي باستخدام نموذج YOLO.
قياس الأداء: قم بقياس سرعة ودقة صادرات YOLO ‏(ONNX و TensorRT وما إلى ذلك).

الوسيطة	افتراضي	الوصف
`mode`	`'train'`	يحدد وضع تشغيل نموذج YOLO: `train` لتدريب النموذج، `val` للتحقق من الصحة، `predict` للاستدلال (inference)، `export` للتحويل إلى تنسيقات النشر، `track` لتتبع الكائنات، و `benchmark` لتقييم الأداء. يدعم كل وضع مراحل مختلفة، من التطوير إلى النشر.

دليل الأوضاع

إعدادات التدريب

تتضمن إعدادات التدريب لنماذج YOLO المعلمات الفائقة والتكوينات التي تؤثر على أداء النموذج وسرعته و دقته. تتضمن الإعدادات الرئيسية حجم الدفعة و معدل التعلم والزخم واضمحلال الوزن. يؤثر اختيار المحسن و دالة الخسارة وتكوين مجموعة البيانات أيضًا على التدريب. يعد الضبط والتجريب أمرًا بالغ الأهمية لتحقيق الأداء الأمثل. لمزيد من التفاصيل، راجع دالة نقطة الدخول Ultralytics.

الوسيطة	النوع	افتراضي	الوصف
`model`	`str`	`None`	يحدد ملف النموذج للتدريب. يقبل مسارًا إما إلى `.pt` نموذج مُدرَّب مسبقًا أو إلى `.yaml` ملف تكوين. ضروري لتحديد بنية النموذج أو تهيئة الأوزان.
`data`	`str`	`None`	مسار إلى ملف تكوين مجموعة البيانات (مثل, `coco8.yaml`). يحتوي هذا الملف على معلمات خاصة بمجموعة البيانات، بما في ذلك مسارات إلى التدريب و بيانات التحققوأسماء الفئات وعدد الفئات.
`epochs`	`int`	`100`	العدد الإجمالي لحقب التدريب. تمثل كل حقبة تمريرة كاملة على مجموعة البيانات بأكملها. يمكن أن يؤثر تعديل هذه القيمة على مدة التدريب وأداء النموذج.
`time`	`float`	`None`	الحد الأقصى لوقت التدريب بالساعات. إذا تم تعيينه، فإنه يتجاوز `epochs` مما يسمح بإيقاف التدريب تلقائيًا بعد المدة المحددة. مفيد لسيناريوهات التدريب المقيدة بالوقت.
`patience`	`int`	`100`	عدد الحقب التي يجب الانتظار خلالها دون تحسن في مقاييس التحقق قبل الإيقاف المبكر للتدريب. يساعد على منع التحميل الزائد عن طريق إيقاف التدريب عندما يستقر الأداء.
`batch`	`int` أو `float`	`16`	حجم الدفعة، مع ثلاثة أوضاع: يتم تعيينه كعدد صحيح (مثل, `batch=16`)، الوضع التلقائي لاستخدام ذاكرة GPU بنسبة 60٪ (`batch=-1`)، أو الوضع التلقائي مع تحديد جزء الاستخدام (`batch=0.70`).
`imgsz`	`int`	`640`	حجم الصورة المستهدف للتدريب. يتم تغيير حجم الصور إلى مربعات بأضلاع تساوي القيمة المحددة (إذا `rect=False`)، مع الحفاظ على نسبة العرض إلى الارتفاع لنماذج YOLO ولكن ليس RT-DETR. يؤثر على النموذج الدقة والتعقيد الحسابي.
`save`	`bool`	`True`	يتيح حفظ نقاط التحقق من التدريب وأوزان النموذج النهائية. مفيد لاستئناف التدريب أو نشر النموذج.
`save_period`	`int`	`-1`	تكرار حفظ نقاط التحقق من النموذج، المحدد بالحقبة. القيمة -1 تعطل هذه الميزة. مفيد لحفظ النماذج المؤقتة أثناء جلسات التدريب الطويلة.
`cache`	`bool`	`False`	يتيح تخزين صور مجموعة البيانات مؤقتًا في الذاكرة (`True`/`ram`)، على القرص (`disk`)، أو تعطيله (`False`). يحسن سرعة التدريب عن طريق تقليل عمليات الإدخال/الإخراج على القرص على حساب زيادة استخدام الذاكرة.
`device`	`int` أو `str` أو `list`	`None`	يحدد الجهاز (الأجهزة) الحسابية للتدريب: وحدة معالجة رسومات واحدة (GPU) (`device=0`)، وحدات معالجة رسومات متعددة (GPU) (`device=[0,1]`)، وحدة معالجة مركزية (CPU) (`device=cpu`)، MPS لـ Apple silicon (`device=mps`، وحدة معالجة الشبكة العصبية Huawei Ascend (`device=npu` أو `device=npu:0`)، أو الاختيار التلقائي لوحدة معالجة الرسومات (GPU) الأكثر خمولاً (`device=-1`) أو وحدات معالجة الرسومات (GPU) المتعددة غير المستخدمة (`device=[-1,-1]`)
`workers`	`int`	`8`	عدد سلاسل العمل لتحميل البيانات (لكل `RANK` إذا كان التدريب متعدد وحدات معالجة الرسوميات). يؤثر على سرعة معالجة البيانات الأولية وتغذيتها في النموذج، وهو مفيد بشكل خاص في إعدادات وحدات معالجة الرسوميات المتعددة.
`project`	`str`	`None`	اسم دليل المشروع حيث يتم حفظ مخرجات التدريب. يسمح بتخزين منظم للتجارب المختلفة.
`name`	`str`	`None`	اسم تشغيل التدريب. يستخدم لإنشاء دليل فرعي داخل مجلد المشروع، حيث يتم تخزين سجلات ومخرجات التدريب.
`exist_ok`	`bool`	`False`	إذا كانت القيمة True، يسمح بالكتابة فوق دليل مشروع/اسم موجود. مفيد للتجريب التكراري دون الحاجة إلى مسح المخرجات السابقة يدويًا.
`pretrained`	`bool` أو `str`	`True`	يحدد ما إذا كان سيتم بدء التدريب باستخدام الأوزان المُدرَّبة مسبقًا. يمكن أن تكون قيمة منطقية أو مسارًا نصيًا للأوزان المراد تحميلها. `pretrained=False` يتم تدريب النموذج باستخدام أوزان تم تهيئتها عشوائياً مع الحفاظ على بنية النموذج.
`optimizer`	`str`	`'auto'`	اختيار المحسن للتدريب. تشمل الخيارات `SGD`, `MuSGD`, `Adam`, `Adamax`, `AdamW`, `NAdam`, `RAdam`, `RMSProp`، أو `auto` للاختيار التلقائي بناءً على تكوين النموذج. يؤثر على سرعة واستقرار التقارب.
`seed`	`int`	`0`	يحدد البذرة العشوائية للتدريب، مما يضمن إمكانية تكرار النتائج عبر عمليات التشغيل بنفس التكوينات.
`deterministic`	`bool`	`True`	يفرض استخدام الخوارزمية الحتمية، مما يضمن إمكانية التكرار ولكنه قد يؤثر على الأداء والسرعة بسبب القيود المفروضة على الخوارزميات غير الحتمية.
`verbose`	`bool`	`True`	يتيح الإخراج المفصل أثناء التدريب، مع عرض أشرطة التقدم، ومقاييس كل حقبة، ومعلومات تدريب إضافية في وحدة التحكم.
`single_cls`	`bool`	`False`	يعامل جميع الفئات في مجموعات البيانات متعددة الفئات كفئة واحدة أثناء التدريب. مفيد لمهام التصنيف الثنائي أو عند التركيز على وجود الكائن بدلاً من التصنيف.
`classes`	`list[int]`	`None`	يحدد قائمة بمعرفات الفئات المراد التدريب عليها. مفيد لتصفية والتركيز فقط على فئات معينة أثناء التدريب.
`rect`	`bool`	`False`	تمكين الحد الأدنى لاستراتيجية الحشو - يتم حشو الصور في دفعة بشكل ضئيل للوصول إلى حجم مشترك، مع كون الجانب الأطول مساويًا لـ `imgsz`. يمكن أن يحسن الكفاءة والسرعة ولكنه قد يؤثر على دقة النموذج.
`multi_scale`	`float`	`0.0`	تباين عشوائي `imgsz` كل دفعة بواسطة +/- `multi_scale` (على سبيل المثال `0.25` -> `0.75x` إلى `1.25x`)، مع تقريبها إلى مضاعفات خطوة النموذج؛ `0.0` يعطل التدريب متعدد المقاييس.
`cos_lr`	`bool`	`False`	يستخدم جدولة معدل التعلم لجيب التمام، وضبط معدل التعلم باتباع منحنى جيب التمام عبر الحقب. يساعد في إدارة معدل التعلم لتحسين التقارب.
`close_mosaic`	`int`	`10`	يعطل زيادة البيانات الفسيفسائية في آخر N حقبة لتثبيت التدريب قبل الانتهاء. يؤدي التعيين إلى 0 إلى تعطيل هذه الميزة.
`resume`	`bool`	`False`	يستأنف التدريب من آخر نقطة تفتيش محفوظة. يقوم تلقائيًا بتحميل أوزان النموذج وحالة المُحسِّن وعدد الحقب، ومتابعة التدريب بسلاسة.
`amp`	`bool`	`True`	يتيح التدريب التلقائي بالدقة المختلطة (AMP)، مما يقلل من استخدام الذاكرة وربما يسرع التدريب مع الحد الأدنى من التأثير على الدقة.
`fraction`	`float`	`1.0`	يحدد جزء مجموعة البيانات المراد استخدامه للتدريب. يسمح بالتدريب على مجموعة فرعية من مجموعة البيانات الكاملة، وهو مفيد للتجارب أو عندما تكون الموارد محدودة.
`profile`	`bool`	`False`	يتيح تحديد سرعات ONNX و TensorRT أثناء التدريب، وهو أمر مفيد لتحسين نشر النموذج.
`freeze`	`int` أو `list`	`None`	يقوم بتجميد أول N طبقة من النموذج أو طبقات محددة بواسطة الفهرس، مما يقلل من عدد المعلمات القابلة للتدريب. مفيد للضبط الدقيق أو التعلم بالنقل.
`lr0`	`float`	`0.01`	معدل التعلم الأولي (على سبيل المثال `SGD=1E-2`, `Adam=1E-3`). يعد تعديل هذه القيمة أمرًا بالغ الأهمية لعملية التحسين، مما يؤثر على مدى سرعة تحديث أوزان النموذج.
`lrf`	`float`	`0.01`	معدل التعلم النهائي كجزء من المعدل الأولي =`lr0 * lrf`)، ويستخدم بالاشتراك مع المجدولات لضبط معدل التعلم بمرور الوقت.
`momentum`	`float`	`0.937`	عامل الزخم لـ SGD أو beta1 لمحسنات Adam، مما يؤثر على دمج التدرجات السابقة في التحديث الحالي.
`weight_decay`	`float`	`0.0005`	مصطلح تسوية L2، لمعاقبة الأوزان الكبيرة لمنع التجاوز.
`warmup_epochs`	`float`	`3.0`	عدد الحقب لتهيئة معدل التعلم، وزيادة معدل التعلم تدريجيًا من قيمة منخفضة إلى معدل التعلم الأولي لتحقيق الاستقرار في التدريب في وقت مبكر.
`warmup_momentum`	`float`	`0.8`	الزخم الأولي لمرحلة الإحماء، والتعديل التدريجي للزخم المحدد خلال فترة الإحماء.
`warmup_bias_lr`	`float`	`0.1`	معدل التعلم لمعلمات التحيز خلال مرحلة الإحماء، مما يساعد على استقرار تدريب النموذج في الحقب الأولية.
`box`	`float`	`7.5`	وزن مكون خسارة الصندوق في دالة الخسارة، مما يؤثر على مقدار التركيز الذي يتم وضعه على التنبؤ بدقة بإحداثيات المربع المحيط.
`cls`	`float`	`0.5`	وزن خسارة التصنيف في دالة الخسارة الكلية، مما يؤثر على أهمية التنبؤ الصحيح بالفئة بالنسبة إلى المكونات الأخرى.
`cls_pw`	`float`	`0.0`	القدرة على ترجيح الفئات لمعالجة عدم توازن الفئات باستخدام تردد الفئة العكسي. `0.0` تعطيل ترجيح الفئات، `1.0` يطبق ترجيح التردد العكسي الكامل. القيم بين 0 و1 توفر ترجيحًا جزئيًا.
`dfl`	`float`	`1.5`	وزن خسارة التوزيع البؤري، المستخدم في إصدارات YOLO معينة للتصنيف الدقيق.
`pose`	`float`	`12.0`	وزن خسارة الوضعية في النماذج المدربة على تقدير الوضعية، مما يؤثر على التأكيد على التنبؤ الدقيق بالنقاط الرئيسية للوضعية.
`kobj`	`float`	`1.0`	وزن خسارة موضوعية النقاط الرئيسية في نماذج تقدير الوضعية، وموازنة الثقة في الكشف مع دقة الوضعية.
`rle`	`float`	`1.0`	وزن خسارة تقدير الاحتمالية اللوغاريتمية المتبقية في نماذج تقدير الوضعية، مما يؤثر على دقة تحديد نقاط المفتاح.
`angle`	`float`	`1.0`	وزن خسارة الزاوية في نماذج obb، مما يؤثر على دقة تنبؤات زاوية الصناديق المحيطة الموجهة.
`nbs`	`int`	`64`	حجم الدفعة الاسمية لتطبيع الخسارة.
`overlap_mask`	`bool`	`True`	يحدد ما إذا كان يجب دمج أقنعة الكائنات في قناع واحد للتدريب، أو الاحتفاظ بها منفصلة لكل كائن. في حالة التداخل، يتم وضع القناع الأصغر فوق القناع الأكبر أثناء الدمج.
`mask_ratio`	`int`	`4`	نسبة أخذ العينات السفلية لأقنعة التجزئة، مما يؤثر على دقة الأقنعة المستخدمة أثناء التدريب.
`dropout`	`float`	`0.0`	معدل التسرب للتسوية في مهام التصنيف، ومنع التجاوز عن طريق حذف الوحدات عشوائيًا أثناء التدريب.
`val`	`bool`	`True`	يتيح التحقق من الصحة أثناء التدريب، مما يسمح بالتقييم الدوري لأداء النموذج على مجموعة بيانات منفصلة.
`plots`	`bool`	`True`	يقوم بإنشاء وحفظ مخططات لمقاييس التدريب والتحقق من الصحة، بالإضافة إلى أمثلة التنبؤ، مما يوفر رؤى مرئية حول أداء النموذج وتقدم التعلم.
`compile`	`bool` أو `str`	`False`	يتيح PyTorch 2.x `torch.compile` تجميع الرسم البياني مع `backend='inductor'`. يقبل `True` → `"default"`, `False` → يعطل، أو وضع سلسلة مثل `"default"`, `"reduce-overhead"`, `"max-autotune-no-cudagraphs"`. يعود إلى الوضع الحريص مع تحذير إذا كان غير مدعوم.
`max_det`	`int`	`300`	يحدد الحد الأقصى لعدد الكائنات التي يتم الاحتفاظ بها خلال مرحلة التحقق من صحة التدريب.

ملاحظة حول إعدادات حجم الدفعة

في batch توفر الوسيطة ثلاثة خيارات للتكوين:

حجم الدفعة الثابت: حدد عدد الصور لكل دفعة باستخدام عدد صحيح (على سبيل المثال، batch=16).
الوضع التلقائي (ذاكرة GPU بنسبة 60٪): استخدم batch=-1 للتعديل التلقائي لاستخدام ما يقرب من 60% من ذاكرة CUDA.
الوضع التلقائي مع جزء الاستخدام: حدد جزءًا (على سبيل المثال، batch=0.70) للتعديل بناءً على استخدام معين لذاكرة وحدة معالجة الرسومات (GPU).

دليل التدريب

إعدادات التوقع

تتضمن إعدادات التوقع لنماذج YOLO المعلمات الفائقة والتكوينات التي تؤثر على الأداء والسرعة و الدقة أثناء الاستدلال. تتضمن الإعدادات الرئيسية عتبة الثقة، وعتبة Non-Maximum Suppression (NMS)، وعدد الفئات. يؤثر حجم بيانات الإدخال وتنسيقها والميزات التكميلية مثل الأقنعة أيضًا على التوقعات. يعد ضبط هذه الإعدادات أمرًا ضروريًا لتحقيق الأداء الأمثل.

وسيطات الاستدلال:

الوسيطة	النوع	افتراضي	الوصف
`source`	`str` أو `int` أو `None`	`None`	يحدد مصدر البيانات للاستدلال. يمكن أن يكون مسار صورة أو ملف فيديو أو دليل أو عنوان URL أو معرّف جهاز للبث المباشر. إذا تم تجاهله، يتم تسجيل تحذير ويعود النموذج إلى استخدام الموارد التجريبية المدمجة (`ultralytics/assets`، أو رابط عرض تجريبي لملف OBB). يدعم مجموعة واسعة من التنسيقات والمصادر، مما يتيح مرونة في الاستخدام عبر أنواع مختلفة من المدخلات.
`conf`	`float`	`0.25`	يحدد الحد الأدنى لعتبة الثقة للكشف. سيتم تجاهل الكائنات التي يتم الكشف عنها بثقة أقل من هذه العتبة. يمكن أن تساعد تعديلات هذه القيمة في تقليل النتائج الإيجابية الكاذبة.
`iou`	`float`	`0.7`	تقاطع على اتحاد (IoU) كحد أقصى لـ Non-Maximum Suppression (NMS). تؤدي القيم الأقل إلى عدد أقل من عمليات detect عن طريق إزالة المربعات المتداخلة، وهو أمر مفيد لتقليل التكرارات.
`imgsz`	`int` أو `tuple`	`640`	يحدد حجم الصورة للاستدلال. يمكن أن يكون عددًا صحيحًا واحدًا `640` لتغيير الحجم المربع أو صف (ارتفاع، عرض). يمكن أن يؤدي تغيير الحجم المناسب إلى تحسين الكشف الدقة وسرعة المعالجة.
`rect`	`bool`	`True`	إذا تم تمكينه، فإنه يضيف حدًا أدنى من المساحات إلى الجانب الأقصر من الصورة حتى يكون قابلاً للقسمة على الخطوة لتحسين سرعة الاستدلال. إذا تم تعطيله، فإنه يضيف مساحة إلى الصورة لتصبح مربعة أثناء الاستدلال.
`half`	`bool`	`False`	يتيح الاستدلال بنصف الدقة (FP16)، مما قد يؤدي إلى تسريع استدلال النموذج على وحدات معالجة الرسومات المدعومة مع الحد الأدنى من التأثير على الدقة.
`device`	`str`	`None`	يحدد الجهاز الخاص بالاستدلال (على سبيل المثال، `cpu`, `cuda:0`, `0`, `npu` أو `npu:0`). يسمح للمستخدمين بالاختيار بين CPU، أو GPU محدد، أو وحدة معالجة الشبكة العصبية Huawei Ascend، أو أجهزة حوسبة أخرى لتنفيذ النموذج.
`batch`	`int`	`1`	يحدد حجم الدُفعة للاستدلال (يعمل فقط عندما يكون المصدر هو دليل، ملف فيديو، أو `.txt` ملف). يمكن أن يوفر حجم الدفعة الأكبر إنتاجية أعلى، مما يقلل إجمالي الوقت المطلوب للاستدلال.
`max_det`	`int`	`300`	الحد الأقصى لعدد عمليات detect المسموح بها لكل صورة. يحد من العدد الإجمالي للكائنات التي يمكن للنموذج detectها في استدلال واحد، مما يمنع الإخراجات المفرطة في المشاهد الكثيفة.
`vid_stride`	`int`	`1`	تباعد الإطارات لمدخلات الفيديو. يسمح بتخطي الإطارات في مقاطع الفيديو لتسريع المعالجة على حساب الدقة الزمنية. تعالج القيمة 1 كل إطار، بينما تتخطى القيم الأعلى الإطارات.
`stream_buffer`	`bool`	`False`	يحدد ما إذا كان سيتم وضع الإطارات الواردة في قائمة الانتظار لتدفقات الفيديو. إذا `False`، يتم إسقاط الإطارات القديمة لاستيعاب الإطارات الجديدة (محسن للتطبيقات في الوقت الفعلي). إذا `True`، يقوم بوضع الإطارات الجديدة في قائمة انتظار في المخزن المؤقت، مما يضمن عدم تخطي أي إطارات، ولكنه سيسبب زمن انتقال إذا كان FPS للاستدلال أقل من FPS للبث.
`visualize`	`bool`	`False`	يقوم بتنشيط تصور ميزات النموذج أثناء الاستدلال، مما يوفر نظرة ثاقبة لما يراه النموذج. مفيد لتصحيح الأخطاء وتفسير النموذج.
`augment`	`bool`	`False`	يتيح زيادة وقت الاختبار (TTA) للتنبؤات، مما قد يحسن قوة الكشف على حساب سرعة الاستدلال.
`agnostic_nms`	`bool`	`False`	يتيح إخفاء غير أقصى (NMS) غير مرتبط بالفئة، والذي يدمج المربعات المتداخلة من فئات مختلفة. مفيد في سيناريوهات الكشف متعدد الفئات حيث يكون تداخل الفئات شائعًا. بالنسبة للنماذج الشاملة (YOLO26، YOLOv10)، يمنع هذا فقط ظهور نفس الكشف مع علامات فئات متعددة (IoU.0 مكررات) ولا يقوم بإخفاء IoU بين المربعات المتميزة.
`classes`	`list[int]`	`None`	يقوم بتصفية التنبؤات إلى مجموعة من معرفات الفئات. سيتم إرجاع عمليات الكشف التي تنتمي إلى الفئات المحددة فقط. مفيد للتركيز على الكائنات ذات الصلة في مهام الكشف متعدد الفئات.
`retina_masks`	`bool`	`False`	إرجاع أقنعة تجزئة عالية الدقة. الأقنعة التي تم إرجاعها (`masks.data`) ستطابق حجم الصورة الأصلي إذا تم تمكينها. إذا تم تعطيلها، فسيكون لها حجم الصورة المستخدم أثناء الاستدلال.
`embed`	`list[int]`	`None`	يحدد الطبقات التي سيتم استخراج متجهات الميزات أو التضمينات منها. مفيد للمهام اللاحقة مثل التجميع أو البحث عن التشابه.
`project`	`str`	`None`	اسم دليل المشروع حيث يتم حفظ مخرجات التنبؤ إذا `save` تم تمكينه.
`name`	`str`	`None`	اسم تشغيل التنبؤ. يستخدم لإنشاء دليل فرعي داخل مجلد المشروع، حيث يتم تخزين مخرجات التنبؤ إذا `save` تم تمكينه.
`stream`	`bool`	`False`	تمكين المعالجة الفعالة للذاكرة لمقاطع الفيديو الطويلة أو الصور العديدة عن طريق إرجاع مولد لكائنات النتائج بدلاً من تحميل جميع الإطارات في الذاكرة مرة واحدة.
`verbose`	`bool`	`True`	يتحكم فيما إذا كان سيتم عرض سجلات الاستدلال التفصيلية في الجهاز الطرفي، مما يوفر ملاحظات في الوقت الفعلي حول عملية التنبؤ.
`compile`	`bool` أو `str`	`False`	يتيح PyTorch 2.x `torch.compile` تجميع الرسم البياني مع `backend='inductor'`. يقبل `True` → `"default"`, `False` → يعطل، أو وضع سلسلة مثل `"default"`, `"reduce-overhead"`, `"max-autotune-no-cudagraphs"`. يعود إلى الوضع الحريص مع تحذير إذا كان غير مدعوم.
`end2end`	`bool`	`None`	يتجاوز الوضع من طرف إلى طرف في YOLO التي تدعم الاستدلال NMS(YOLO26، YOLOv10). تعيينه على `False` يتيح لك تشغيل التنبؤ باستخدام NMS التقليدي، بالإضافة إلى السماح لك بالاستفادة من `iou` الوسيط. راجع الـ دليل الكشف الشامل للحصول على التفاصيل.

وسيطات التصور:

الوسيطة	النوع	افتراضي	الوصف
`show`	`bool`	`False`	إذا `True`، يعرض الصور أو مقاطع الفيديو المشروحة في نافذة. مفيد للحصول على تعليقات مرئية فورية أثناء التطوير أو الاختبار.
`save`	`bool`	`False or True`	يتيح حفظ الصور أو مقاطع الفيديو المشروحة في ملفات. مفيد للتوثيق أو إجراء المزيد من التحليلات أو مشاركة النتائج. يتم تعيينه افتراضيًا على True عند استخدام CLI و False عند استخدامه في Python.
`save_frames`	`bool`	`False`	عند معالجة مقاطع الفيديو، يتم حفظ الإطارات الفردية كصور. مفيد لاستخراج إطارات معينة أو لتحليل تفصيلي للإطار تلو الآخر.
`save_txt`	`bool`	`False`	يحفظ نتائج الكشف في ملف نصي، باتباع التنسيق `[class] [x_center] [y_center] [width] [height] [confidence]`. مفيد للتكامل مع أدوات التحليل الأخرى.
`save_conf`	`bool`	`False`	يتضمن قيم الثقة في الملفات النصية المحفوظة. يعزز التفاصيل المتاحة للمعالجة والتحليل اللاحقين.
`save_crop`	`bool`	`False`	يحفظ الصور المقصوصة للكائنات التي تم الكشف عنها. مفيد لزيادة حجم البيانات، والتحليل، أو إنشاء مجموعات بيانات مركزة لكائنات معينة.
`show_labels`	`bool`	`True`	يعرض تسميات لكل كائن يتم الكشف عنه في الناتج المرئي. يوفر فهمًا فوريًا للكائنات التي تم الكشف عنها.
`show_conf`	`bool`	`True`	يعرض قيمة الثقة لكل كائن يتم الكشف عنه بجانب التسمية. يعطي نظرة ثاقبة حول يقين النموذج لكل كائن تم الكشف عنه.
`show_boxes`	`bool`	`True`	يرسم مربعات إحاطة حول الكائنات التي تم الكشف عنها. ضروري للتحديد المرئي وموقع الكائنات في الصور أو إطارات الفيديو.
`line_width`	`int or None`	`None`	يحدد عرض خطوط مربعات الإحاطة. إذا `None`، يتم تعديل عرض الخط تلقائيًا بناءً على حجم الصورة. يوفر تخصيصًا مرئيًا للوضوح.

دليل التوقع

إعدادات التحقق

تتضمن إعدادات التحقق من صحة نماذج YOLO معلمات فائقة وتكوينات لتقييم الأداء على مجموعة بيانات التحقق من الصحة. تؤثر هذه الإعدادات على الأداء والسرعة و الدقة. تتضمن الإعدادات الشائعة حجم الدفعة وتكرار التحقق من الصحة ومقاييس الأداء. يؤثر حجم وتكوين مجموعة بيانات التحقق من الصحة، جنبًا إلى جنب مع المهمة المحددة، أيضًا على العملية.

الوسيطة	النوع	افتراضي	الوصف
`data`	`str`	`None`	يحدد المسار إلى ملف تكوين مجموعة البيانات (على سبيل المثال، `coco8.yaml`). يجب أن يتضمن هذا الملف مسار بيانات التحقق.
`imgsz`	`int`	`640`	يحدد حجم الصور المدخلة. يتم تغيير حجم جميع الصور إلى هذا البعد قبل المعالجة. قد تؤدي الأحجام الأكبر إلى تحسين الدقة للأجسام الصغيرة ولكنها تزيد من وقت الحساب.
`batch`	`int`	`16`	يحدد عدد الصور لكل دفعة. القيم الأعلى تستخدم ذاكرة GPU بكفاءة أكبر ولكنها تتطلب المزيد من VRAM. اضبط بناءً على موارد الأجهزة المتاحة.
`save_json`	`bool`	`False`	إذا `True`، يحفظ النتائج في ملف JSON لمزيد من التحليل أو التكامل مع الأدوات الأخرى أو الإرسال إلى خوادم التقييم مثل COCO.
`conf`	`float`	`0.001`	يحدد الحد الأدنى لعتبة الثقة للكشف. القيم الأقل تزيد من الاسترجاع ولكن قد تدخل المزيد من الإيجابيات الخاطئة. يستخدم أثناء التحقق لحساب منحنيات الدقة والاسترجاع.
`iou`	`float`	`0.7`	يحدد عتبة تقاطع الاتحاد لـ منع القمع الأقصى. يتحكم في إزالة الاكتشافات المكررة.
`max_det`	`int`	`300`	يحد من الحد الأقصى لعدد الاكتشافات لكل صورة. مفيد في المشاهد المزدحمة لمنع الاكتشافات المفرطة وإدارة الموارد الحسابية.
`half`	`bool`	`False`	يتيح حساب نصف الدقة (FP16)، مما يقلل من استخدام الذاكرة ويزيد السرعة المحتملة مع الحد الأدنى من التأثير على الدقة.
`device`	`str`	`None`	يحدد الجهاز للتحقق (`cpu`, `cuda:0`, `npu`, `npu:0`، إلخ). عندما `None`، يختار تلقائيًا أفضل جهاز متاح. يمكن تحديد عدة أجهزة CUDA بفصلها بفواصل.
`dnn`	`bool`	`False`	إذا `True`، يستخدم OpenCV وحدة DNN للاستدلال بنموذج ONNX، مما يوفر بديلاً لـ PyTorch طرق الاستدلال.
`plots`	`bool`	`True`	عند الضبط على `True`، يقوم بإنشاء وحفظ مخططات للتنبؤات مقابل الحقائق الأساسية، ومصفوفات الالتباس، ومنحنيات PR للتقييم البصري لأداء النموذج.
`classes`	`list[int]`	`None`	يحدد قائمة بمعرفات الفئات المراد تقييمها. مفيد لتصفية والتركيز فقط على فئات معينة أثناء التقييم.
`rect`	`bool`	`True`	إذا `True`، يستخدم الاستدلال المستطيل للتقسيم على دفعات، مما يقلل من الحشو ويزيد السرعة والكفاءة المحتملة عن طريق معالجة الصور في نسبة العرض إلى الارتفاع الأصلية.
`split`	`str`	`'val'`	يحدد تقسيم مجموعة البيانات المراد استخدامها للتحقق (`val`, `test`، أو `train`). يسمح بالمرونة في اختيار جزء البيانات لتقييم الأداء.
`project`	`str`	`None`	اسم دليل المشروع حيث يتم حفظ مخرجات التحقق. يساعد في تنظيم النتائج من التجارب أو النماذج المختلفة.
`name`	`str`	`None`	اسم تشغيل التحقق. يُستخدم لإنشاء دليل فرعي داخل مجلد المشروع، حيث يتم تخزين سجلات ومخرجات التحقق.
`verbose`	`bool`	`True`	إذا `True`، يعرض معلومات مفصلة أثناء عملية التحقق، بما في ذلك مقاييس لكل فئة، وتقدم الدُفعات، ومعلومات تصحيح الأخطاء إضافية.
`save_txt`	`bool`	`False`	إذا `True`، لحفظ نتائج الكشف في ملفات نصية، مع ملف واحد لكل صورة، وهو أمر مفيد لمزيد من التحليل أو المعالجة اللاحقة المخصصة أو التكامل مع الأنظمة الأخرى.
`save_conf`	`bool`	`False`	إذا `True`، يتضمن قيم الثقة في ملفات النصوص المحفوظة عندما `save_txt` ممكن، مما يوفر إخراجًا أكثر تفصيلاً للتحليل والتصفية.
`workers`	`int`	`8`	عدد سلاسل العمليات العاملة لتحميل البيانات. القيم الأعلى يمكن أن تسرع معالجة البيانات ولكن قد تزيد من استخدام وحدة المعالجة المركزية CPU. الضبط على 0 يستخدم السلسلة الرئيسية، والتي يمكن أن تكون أكثر استقرارًا في بعض البيئات.
`augment`	`bool`	`False`	تمكين زيادة وقت الاختبار (TTA) أثناء التحقق، مما قد يحسن دقة الكشف على حساب سرعة الاستدلال عن طريق تشغيل الاستدلال على إصدارات محولة من الإدخال.
`agnostic_nms`	`bool`	`False`	يتيح إخفاء غير أقصى غير مرتبط بالفئة، والذي يدمج المربعات المتداخلة بغض النظر عن الفئة المتوقعة لها. مفيد للتطبيقات التي تركز على الحالات. بالنسبة للنماذج الشاملة (YOLO26، YOLOv10)، يمنع هذا فقط ظهور نفس الكشف مع علامات فئات متعددة (تكراراتIoU.IoU) ولا يقوم بإخفاء IoU بين المربعات المتميزة.
`single_cls`	`bool`	`False`	يعامل جميع الفئات كفئة واحدة أثناء التحقق من الصحة. مفيد لتقييم أداء النموذج في مهام الكشف الثنائية أو عندما لا تكون الفروق بين الفئات مهمة.
`visualize`	`bool`	`False`	تصور الحقائق الأرضية، والإيجابيات الحقيقية، والسلبيات الكاذبة، والإيجابيات الكاذبة لكل صورة. مفيد لتصحيح الأخطاء وتفسير النموذج.
`compile`	`bool` أو `str`	`False`	يتيح PyTorch 2.x `torch.compile` تجميع الرسم البياني مع `backend='inductor'`. يقبل `True` → `"default"`, `False` → يعطل، أو وضع سلسلة مثل `"default"`, `"reduce-overhead"`, `"max-autotune-no-cudagraphs"`. يعود إلى الوضع الحريص مع تحذير إذا كان غير مدعوم.
`end2end`	`bool`	`None`	يتجاوز الوضع من طرف إلى طرف في YOLO التي تدعم الاستدلال NMS(YOLO26، YOLOv10). تعيينه على `False` يتيح لك إجراء التحقق باستخدام NMS التقليدي، بالإضافة إلى السماح لك باستخدام `iou` وسيطة.

يعد الضبط الدقيق والتجريب أمرًا بالغ الأهمية لضمان الأداء الأمثل واكتشاف ومنع التجاوز في التدريب (overfitting) .

دليل Val

إعدادات التصدير

تتضمن إعدادات تصدير نماذج YOLO تكوينات لحفظ النموذج أو تصديره لاستخدامه في بيئات مختلفة. تؤثر هذه الإعدادات على الأداء والحجم والتوافق. تتضمن الإعدادات الرئيسية تنسيق الملف المصدَّر (مثل ONNX أو TensorFlow SavedModel) والجهاز المستهدف (مثل CPU أو GPU) وميزات مثل الأقنعة. تؤثر مهمة النموذج وقيود بيئة الوجهة أيضًا على عملية التصدير.

الوسيطة	النوع	افتراضي	الوصف
`format`	`str`	`'torchscript'`	التنسيق المستهدف للنموذج المصدر، مثل `'onnx'`, `'torchscript'`, `'engine'` (TensorRT) أو غيرها. تتيح كل صيغة التوافق مع مختلف بيئات النشر.
`imgsz`	`int` أو `tuple`	`640`	حجم الصورة المطلوب لإدخال النموذج. يمكن أن يكون عددًا صحيحًا للصور المربعة (مثل، `640` لـ 640 × 640) أو صف. `(height, width)` لأبعاد محددة.
`keras`	`bool`	`False`	يتيح التصدير إلى تنسيق Keras لـ TensorFlow SavedModel، مما يوفر توافقًا مع TensorFlow serving و APIs.
`optimize`	`bool`	`False`	يطبق تحسينًا للأجهزة المحمولة عند التصدير إلى TorchScript، مما قد يقلل من حجم النموذج ويحسن أداء الاستدلال. غير متوافق مع تنسيق NCNN أو أجهزة CUDA.
`half`	`bool`	`False`	يتيح تفعيل FP16 (نصف الدقة) للقياس الكمي، مما يقلل من حجم النموذج وربما يسرع الاستدلال على الأجهزة المدعومة. غير متوافق مع القياس الكمي INT8 أو التصدير لوحدات المعالجة المركزية (CPU) فقط. متاح فقط لبعض التنسيقات، على سبيل المثال ONNX (انظر أدناه).
`int8`	`bool`	`False`	يقوم بتنشيط تكميم INT8، مما يزيد من ضغط النموذج وتسريع الاستدلال مع الحد الأدنى من فقدان الدقة، في المقام الأول للأجهزة الطرفية. عند استخدامه مع TensorRT، فإنه ينفذ التكميم بعد التدريب (PTQ).
`dynamic`	`bool`	`False`	يسمح بأحجام إدخال ديناميكية لعمليات تصدير TorchScript و ONNX و OpenVINO و TensorRT و CoreML، مما يعزز المرونة في التعامل مع أبعاد الصور المتغيرة. يتم تعيينه تلقائيًا على `True` عند استخدام TensorRT مع INT8.
`simplify`	`bool`	`True`	يبسط الرسم البياني للنموذج لصادرات ONNX مع `onnxslim`، مما قد يحسن الأداء والتوافق مع محركات الاستدلال.
`opset`	`int`	`None`	يحدد إصدار ONNX opset للتوافق مع مختلف المحللات اللغوية ONNX وأوقات التشغيل. إذا لم يتم تعيينه، فسيتم استخدام أحدث إصدار مدعوم.
`workspace`	`float` أو `None`	`None`	يحدد الحد الأقصى لحجم مساحة العمل بوحدة الجيغابايت (GiB) لـ TensorRT تحسينات، موازنة استخدام الذاكرة والأداء. استخدم `None` للتخصيص التلقائي بواسطة TensorRT حتى الحد الأقصى للجهاز.
`nms`	`bool`	`False`	يضيف خاصية منع التداخل (NMS) إلى النموذج المُصدَّر عند دعمها (انظر صيغ التصدير)، مما يحسن كفاءة المعالجة اللاحقة للكشف. غير متوفر للنماذج الشاملة.
`batch`	`int`	`1`	يحدد حجم الدُفعة الاستنتاجية لنموذج التصدير أو الحد الأقصى لعدد الصور التي سيعالجها النموذج المُصدَّر في وقت واحد في `predict` الوضع. بالنسبة إلى عمليات تصدير Edge TPU، يتم تعيين هذا تلقائيًا إلى 1.
`device`	`str`	`None`	يحدد الجهاز للتصدير: GPU (`device=0`)، وحدة معالجة مركزية (CPU) (`device=cpu`)، MPS لـ Apple silicon (`device=mps`، وحدة معالجة الشبكة العصبية Huawei Ascend (`device=npu` أو `device=npu:0`، أو DLA لـ NVIDIA Jetson (`device=dla:0` أو `device=dla:1`). تستخدم TensorRT وحدة معالجة الرسومات GPU تلقائيًا في عمليات التصدير.
`data`	`str`	`'coco8.yaml'`	مسار إلى مجموعة البيانات ملف التكوين، الضروري لمعايرة التكميم INT8. إذا لم يتم تحديده مع تمكين INT8، `coco8.yaml` سيتم استخدامه كخيار احتياطي للمعايرة.
`fraction`	`float`	`1.0`	يحدد جزء مجموعة البيانات المراد استخدامها لمعايرة القياس الكمي INT8. يسمح بالمعايرة على مجموعة فرعية من مجموعة البيانات الكاملة، وهو أمر مفيد للتجارب أو عندما تكون الموارد محدودة. إذا لم يتم تحديده مع تمكين INT8، فسيتم استخدام مجموعة البيانات الكاملة.
`end2end`	`bool`	`None`	يتجاوز الوضع من طرف إلى طرف في YOLO التي تدعم الاستدلال NMS(YOLO26، YOLOv10). تعيينه على `False` يتيح لك تصدير هذه النماذج لتكون متوافقة مع مسار المعالجة اللاحقة التقليدي NMS. انظر دليل الكشف الشامل للحصول على التفاصيل.

يضمن التكوين المدروس تحسين النموذج المُصدَّر لحالة استخدامه وعمله بفعالية في البيئة المستهدفة.

دليل التصدير

إعدادات الحلول

توفر إعدادات تكوين حلول Ultralytics مرونة لتخصيص النماذج لمهام مثل عد الكائنات وإنشاء الخرائط الحرارية وتتبع التمرين وتحليل البيانات وتتبع المنطقة وإدارة قائمة الانتظار والعد المستند إلى المنطقة. تتيح هذه الخيارات إجراء تعديلات سهلة للحصول على نتائج دقيقة ومفيدة مصممة خصيصًا لتلبية الاحتياجات المحددة.

الوسيطة	النوع	افتراضي	الوصف
`model`	`str`	`None`	مسار إلى ملف نموذج Ultralytics YOLO.
`region`	`list`	`'[(20, 400), (1260, 400)]'`	قائمة النقاط التي تحدد منطقة العد.
`show_in`	`bool`	`True`	Flag للتحكم فيما إذا كان سيتم عرض عدد الأسماك الداخلة في بث الفيديو.
`show_out`	`bool`	`True`	Flag للتحكم فيما إذا كان سيتم عرض عدد الأسماك الخارجة في بث الفيديو.
`analytics_type`	`str`	`'line'`	نوع الرسم البياني، على سبيل المثال، `line`, `bar`, `area`، أو `pie`.
`colormap`	`int`	`cv2.COLORMAP_DEEPGREEN`	مخطط الألوان المراد استخدامه للخريطة الحرارية.
`json_file`	`str`	`None`	مسار ملف JSON الذي يحتوي على جميع بيانات إحداثيات مواقف السيارات.
`up_angle`	`float`	`145.0`	عتبة الزاوية لوضعية 'الأعلى'.
`kpts`	`list[int]`	`'[6, 8, 10]'`	قائمة بثلاثة مؤشرات للنقاط الرئيسية تُستخدم لمراقبة التمارين الرياضية. تتوافق هذه النقاط الرئيسية مع مفاصل الجسم أو أجزائه، مثل الأكتاف والمرفقين والمعصمين، لتمارين مثل الضغط والسحب والقرفصاء وتمارين البطن.
`down_angle`	`int`	`90`	عتبة الزاوية لوضعية 'الأسفل'.
`blur_ratio`	`float`	`0.5`	يضبط النسبة المئوية لشدة التمويه، بقيم في النطاق `0.1 - 1.0`.
`crop_dir`	`str`	`'cropped-detections'`	اسم الدليل لتخزين الاكتشافات التي تم اقتصاصها.
`records`	`int`	`5`	إجمالي عدد الاكتشافات لتشغيل بريد إلكتروني مع نظام إنذار أمني.
`vision_point`	`tuple[int, int]`	`(20, 20)`	النقطة التي ستتتبع فيها الرؤية الكائنات وترسم مسارات باستخدام VisionEye Solution.
`source`	`str`	`None`	مسار إلى المصدر المدخل (فيديو، RTSP، إلخ). يُستخدم فقط مع واجهة سطر الأوامر (CLI) الخاصة بالحلول.
`figsize`	`tuple[int, int]`	`(12.8, 7.2)`	حجم الشكل لمخططات التحليلات مثل الخرائط الحرارية أو الرسوم البيانية.
`fps`	`float`	`30.0`	الإطارات في الثانية المستخدمة لحسابات السرعة.
`max_hist`	`int`	`5`	الحد الأقصى للنقاط التاريخية التي يتم trackها لكل كائن لحسابات السرعة/الاتجاه.
`meter_per_pixel`	`float`	`0.05`	عامل القياس المستخدم لتحويل مسافة البكسل إلى وحدات العالم الحقيقي.
`max_speed`	`int`	`120`	الحد الأقصى للسرعة في التراكبات المرئية (يستخدم في التنبيهات).
`data`	`str`	`'images'`	مسار إلى دليل الصور المستخدم للبحث عن التشابه.

دليل الحلول

إعدادات الزيادة

تعتبر تقنيات زيادة البيانات ضرورية لتحسين قوة وأداء نموذج YOLO من خلال إدخال تغييرات على بيانات التدريب، مما يساعد النموذج على التعميم بشكل أفضل على البيانات غير المرئية. يوضح الجدول التالي الغرض من كل وسيطة زيادة وتأثيرها:

الوسيطة	النوع	افتراضي	المهام المدعومة	النطاق	الوصف
`hsv_h`	`float`	`0.015`	`detect`, `segment`, `pose`, `obb`, `classify`	`0.0 - 1.0`	يضبط لون الصورة بجزء من عجلة الألوان، مما يدخل تباينًا في الألوان. يساعد النموذج على التعميم عبر ظروف الإضاءة المختلفة.
`hsv_s`	`float`	`0.7`	`detect`, `segment`, `pose`, `obb`, `classify`	`0.0 - 1.0`	يغير تشبع الصورة بجزء، مما يؤثر على كثافة الألوان. مفيد لمحاكاة الظروف البيئية المختلفة.
`hsv_v`	`float`	`0.4`	`detect`, `segment`, `pose`, `obb`, `classify`	`0.0 - 1.0`	يعدل قيمة (سطوع) الصورة بجزء، مما يساعد النموذج على الأداء الجيد في ظل ظروف الإضاءة المختلفة.
`degrees`	`float`	`0.0`	`detect`, `segment`, `pose`, `obb`	`0.0 - 180`	يدور الصورة عشوائيًا ضمن نطاق الدرجات المحدد، مما يحسن قدرة النموذج على التعرف على الكائنات في اتجاهات مختلفة.
`translate`	`float`	`0.1`	`detect`, `segment`, `pose`, `obb`	`0.0 - 1.0`	يترجم الصورة أفقيًا وعموديًا بجزء من حجم الصورة، مما يساعد في تعلم اكتشاف الكائنات المرئية جزئيًا.
`scale`	`float`	`0.5`	`detect`, `segment`, `pose`, `obb`, `classify`	`0 - 1`	يقوم بتوسيع الصورة بمعامل كسب، مما يحاكي الكائنات على مسافات مختلفة من الكاميرا.
`shear`	`float`	`0.0`	`detect`, `segment`, `pose`, `obb`	`-180 - +180`	يقص الصورة بدرجة محددة، مما يحاكي تأثير رؤية الكائنات من زوايا مختلفة.
`perspective`	`float`	`0.0`	`detect`, `segment`, `pose`, `obb`	`0.0 - 0.001`	يطبق تحويلًا منظوريًا عشوائيًا على الصورة، مما يعزز قدرة النموذج على فهم الكائنات في الفضاء ثلاثي الأبعاد.
`flipud`	`float`	`0.0`	`detect`, `segment`, `pose`, `obb`, `classify`	`0.0 - 1.0`	يقلب الصورة رأسًا على عقب بالاحتمالية المحددة، مما يزيد من تباين البيانات دون التأثير على خصائص الكائن.
`fliplr`	`float`	`0.5`	`detect`, `segment`, `pose`, `obb`, `classify`	`0.0 - 1.0`	يقلب الصورة من اليسار إلى اليمين بالاحتمالية المحددة، وهو أمر مفيد لتعلم الكائنات المتماثلة وزيادة تنوع مجموعة البيانات.
`bgr`	`float`	`0.0`	`detect`, `segment`, `pose`, `obb`	`0.0 - 1.0`	يقلب قنوات الصورة من RGB إلى BGR بالاحتمالية المحددة، وهو أمر مفيد لزيادة القوة في مواجهة ترتيب القنوات غير الصحيح.
`mosaic`	`float`	`1.0`	`detect`, `segment`, `pose`, `obb`	`0.0 - 1.0`	يدمج أربع صور تدريبية في صورة واحدة، مما يحاكي تركيبات المشاهد المختلفة وتفاعلات الكائنات. فعال للغاية لفهم المشهد المعقد.
`mixup`	`float`	`0.0`	`detect`, `segment`, `pose`, `obb`	`0.0 - 1.0`	يمزج صورتين وتسمياتهما، مما يخلق صورة مركبة. يعزز قدرة النموذج على التعميم من خلال إدخال ضوضاء التسمية والتباين البصري.
`cutmix`	`float`	`0.0`	`detect`, `segment`, `pose`, `obb`	`0.0 - 1.0`	يجمع أجزاء من صورتين، مما يخلق مزيجًا جزئيًا مع الحفاظ على مناطق متميزة. يعزز قوة النموذج عن طريق إنشاء سيناريوهات انسداد.
`copy_paste`	`float`	`0.0`	`segment`	`0.0 - 1.0`	نسخ ولصق الكائنات عبر الصور لزيادة مثيلات الكائن.
`copy_paste_mode`	`str`	`flip`	`segment`	-	يحدد ال `copy-paste` الإستراتيجية المراد استخدامها. تتضمن الخيارات `'flip'` و `'mixup'`.
`auto_augment`	`str`	`randaugment`	`classify`	-	يطبق سياسة زيادة محددة مسبقًا (`'randaugment'`, `'autoaugment'`، أو `'augmix'`) لتحسين أداء النموذج من خلال التنوع البصري.
`erasing`	`float`	`0.4`	`classify`	`0.0 - 1.0`	يمحو عشوائيًا مناطق من الصورة أثناء التدريب لتشجيع النموذج على التركيز على الميزات الأقل وضوحًا.
`augmentations`	`list`	``	`detect`, `segment`, `pose`, `obb`	-	تحويلات Albumentations مخصصة لزيادة البيانات المتقدمة (واجهة برمجة تطبيقات python فقط). يقبل قائمة بكائنات التحويل لتلبية احتياجات الزيادة المتخصصة.

اضبط هذه الإعدادات لتلبية متطلبات مجموعة البيانات والمهمة. يمكن أن يساعدك التجريب بقيم مختلفة في إيجاد استراتيجية التوسيع الأمثل لتحقيق أفضل أداء للنموذج.

دليل الزيادة

إعدادات التسجيل ونقاط التفتيش والرسم

يُعد التسجيل، ونقاط التحقق، والرسم البياني، وإدارة الملفات أمورًا مهمة عند تدريب نموذج YOLO:

تسجيل: تتبع تقدم النموذج وتشخيص المشكلات باستخدام مكتبات مثل TensorBoard أو عن طريق الكتابة إلى ملف.
نقاط التحقق: احفظ النموذج على فترات منتظمة لاستئناف التدريب أو التجربة بتكوينات مختلفة.
الرسم: تصور الأداء والتقدم المحرز في التدريب باستخدام مكتبات مثل matplotlib أو TensorBoard.
إدارة الملفات: تنظيم الملفات التي تم إنشاؤها أثناء التدريب، مثل نقاط التفتيش وملفات السجل والمخططات، لسهولة الوصول إليها وتحليلها.

تساعد الإدارة الفعالة لهذه الجوانب على track التقدم وتسهل عملية تصحيح الأخطاء والتحسين.

الوسيطة	افتراضي	الوصف
`project`	`'runs'`	يحدد الدليل الجذر لحفظ عمليات التدريب. يتم حفظ كل عملية تشغيل في دليل فرعي منفصل.
`name`	`'exp'`	يحدد اسم التجربة. إذا لم يتم تحديده، يزيد YOLO هذا الاسم لكل تشغيل (على سبيل المثال، `exp`, `exp-2`) لتجنب الكتابة فوقها.
`exist_ok`	`False`	يحدد ما إذا كان سيتم استبدال دليل تجربة موجود. `True` يسمح بالكتابة فوق؛ `False` يمنع ذلك.
`plots`	`True`	يتحكم في إنشاء وحفظ مخططات التدريب والتحقق. اضبط على `True` لإنشاء مخططات مثل منحنيات الخسارة، الدقة-الاسترجاع المنحنيات، وعينة من التنبؤات للتتبع البصري للأداء.
`save`	`True`	تمكين حفظ نقاط تفتيش التدريب وأوزان النموذج النهائية. تم التعيين إلى `True` لحفظ حالات النموذج بشكل دوري، مما يسمح باستئناف التدريب أو نشر النموذج.

ملف التكوين المخصص

قم بتحميل ملف YAML محفوظ لإعادة استخدام مجموعة كاملة من المعلمات دون إدخالها مباشرةً. cfg الحجة تتجاوز القيم الموجودة في default.yaml، في حين أن الحجج الإضافية التي يتم تمريرها جنبًا إلى جنب لا تزال لها الأسبقية.

الوسيطة	افتراضي	الوصف
`cfg`	`None`	مسار ملف YAML تُستبدل قيمه `default.yaml` المدخلات. انظر تجاوز ملف التكوين الافتراضي للاطلاع على CLI عملي CLI .

الأسئلة الشائعة

كيف يمكنني تحسين أداء نموذج YOLO الخاص بي أثناء التدريب؟

حسّن الأداء عن طريق ضبط المعلمات الفائقة مثل حجم الدفعة، معدل التعلم، الزخم، واضمحلال الوزن. اضبط إعدادات زيادة البيانات، وحدد المحسن المناسب، واستخدم تقنيات مثل التوقف المبكر أو الدقة المختلطة. للحصول على التفاصيل، راجع دليل التدريب.

ما هي المعلمات الفائقة الرئيسية لدقة نموذج YOLO؟

تتضمن المعلمات الفائقة الرئيسية التي تؤثر على الدقة ما يلي:

حجم الدفعة (batch): يمكن للأحجام الأكبر أن تثبت التدريب ولكنها تحتاج إلى مزيد من الذاكرة.
معدل التعلم (lr0): المعدلات الأصغر توفر تعديلات دقيقة ولكن تقاربًا أبطأ.
الزخم (Momentum) (momentum): يسرّع متجهات التدرج، ويخفف من التذبذبات.
حجم الصورة (Image Size) (imgsz): الأحجام الأكبر تحسن الدقة ولكنها تزيد من العبء الحسابي.

اضبط هذه بناءً على مجموعة البيانات والأجهزة الخاصة بك. تعرف على المزيد في إعدادات التدريب.

كيف يمكنني ضبط معدل التعلم لتدريب نموذج YOLO؟

معدل التعلم (The learning rate) (lr0) أمر بالغ الأهمية؛ ابدأ بـ 0.01 لـ SGD أو 0.001 لـ محسن Adam. راقب المقاييس واضبطها حسب الحاجة. استخدم جدولة معدل تعلم جيب التمام (cosine learning rate schedulers) (cos_lr) أو الإحماء (warmup_epochs, warmup_momentum). التفاصيل موجودة في دليل التدريب.

ما هي إعدادات الاستدلال الافتراضية لنماذج YOLO؟

تتضمن الإعدادات الافتراضية ما يلي:

عتبة الثقة (Confidence Threshold) (conf=0.25): الحد الأدنى للثقة للكشف.
عتبة IoU (iou=0.7): لـ تثبيط غير الأقصى (NMS).
حجم الصورة (Image Size) (imgsz=640): يقوم بتغيير حجم الصور المدخلة.
الجهاز (Device) (device=None): يحدد CPU، GPU، Apple MPS أو Huawei Ascend NPU (npu).

للحصول على نظرة عامة كاملة، راجع إعدادات التوقع (Predict Settings) و دليل التوقع (Predict Guide).

لماذا نستخدم التدريب بالدقة المختلطة مع نماذج YOLO؟

الدقة المختلطة تدريب (amp=True) يقلل من استخدام الذاكرة ويسرع التدريب باستخدام FP16 و FP32. إنه مفيد لوحدات معالجة الرسومات الحديثة (GPUs)، مما يسمح بنماذج أكبر وحسابات أسرع دون فقدان كبير في الدقة. تعرف على المزيد في دليل التدريب.

📅 تم الإنشاء قبل 2 أعوام ✏️ تم التحديث قبل 8 أيام