انتقل إلى المحتوى

مقاييس الأداء الغوص العميق

مقدمة

Performance metrics are key tools to evaluate the accuracy and efficiency of object detection models. They shed light on how effectively a model can identify and localize objects within images. Additionally, they help in understanding the model's handling of false positives and false negatives. These insights are crucial for evaluating and enhancing the model's performance. In this guide, we will explore various performance metrics associated with YOLO11, their significance, and how to interpret them.



شاهد: Ultralytics YOLO11 Performance Metrics | MAP, F1 Score, دقة, IoU & Accuracy

مقاييس اكتشاف الكائنات

Let's start by discussing some metrics that are not only important to YOLO11 but are broadly applicable across different object detection models.

  • Intersection over Union (IoU): IoU is a measure that quantifies the overlap between a predicted bounding box and a ground truth bounding box. It plays a fundamental role in evaluating the accuracy of object localization.

  • متوسط الدقة (AP): تحسب AP المنطقة الواقعة أسفل منحنى الاستدعاء الدقيق ، مما يوفر قيمة واحدة تلخص دقة النموذج وأداء الاستدعاء.

  • متوسط الدقة المتوسط (mAP): يوسع mAP مفهوم AP عن طريق حساب متوسط قيم AP عبر فئات كائنات متعددة. هذا مفيد في سيناريوهات الكشف عن الكائنات متعددة الفئات لتوفير تقييم شامل لأداء النموذج.

  • الدقة والتذكير: تحدد الدقة نسبة الإيجابيات الحقيقية بين جميع التنبؤات الإيجابية ، وتقيم قدرة النموذج على تجنب الإيجابيات الخاطئة. من ناحية أخرى ، يحسب Recall نسبة الإيجابيات الحقيقية بين جميع الإيجابيات الفعلية ، ويقيس قدرة النموذج على اكتشاف جميع مثيلات الفصل.

  • درجة F1: درجة F1 هي الوسيلة التوافقية للدقة والاستدعاء ، مما يوفر تقييما متوازنا لأداء النموذج مع مراعاة كل من الإيجابيات الخاطئة والسلبيات الخاطئة.

How to Calculate Metrics for YOLO11 Model

Now, we can explore YOLO11's Validation mode that can be used to compute the above discussed evaluation metrics.

استخدام وضع التحقق من الصحة بسيط. بمجرد أن يكون لديك نموذج مدرب ، يمكنك استدعاء الدالة model.val(). ستقوم هذه الوظيفة بعد ذلك بمعالجة مجموعة بيانات التحقق من الصحة وإرجاع مجموعة متنوعة من مقاييس الأداء. ولكن ماذا تعني هذه المقاييس؟ وكيف يجب أن تفسرها؟

تفسير المخرجات

دعنا نحلل ناتج الدالة model.val() ونفهم كل جزء من المخرجات.

مقاييس الفصل

أحد أقسام المخرجات هو التقسيم الطبقي لمقاييس الأداء. هذه المعلومات الدقيقة مفيدة عندما تحاول فهم مدى جودة أداء النموذج لكل فئة محددة ، خاصة في مجموعات البيانات ذات النطاق المتنوع من فئات الكائنات. لكل فئة في مجموعة البيانات يتم توفير ما يلي:

  • الفئة: يشير هذا إلى اسم فئة الكائن ، مثل "شخص" أو "سيارة" أو "".

  • الصور: يخبرك هذا المقياس بعدد الصور في مجموعة التحقق من الصحة التي تحتوي على فئة الكائن.

  • المثيلات: يوفر هذا عدد المرات التي تظهر فيها الفئة عبر جميع الصور في مجموعة التحقق من الصحة.

  • Box(P, R, mAP50, mAP50-95): يوفر هذا المقياس رؤى حول أداء النموذج في اكتشاف الكائنات:

    • P (الدقة): دقة الكائنات المكتشفة ، مع الإشارة إلى عدد الاكتشافات الصحيحة.

    • R (استدعاء): قدرة النموذج على تحديد جميع مثيلات الكائنات في الصور.

    • mAP50: متوسط الدقة المحسوبة عند تقاطع فوق عتبة الاتحاد (IoU) 0.50. إنه مقياس لدقة النموذج بالنظر إلى الاكتشافات "السهلة" فقط.

    • mAP50-95: متوسط متوسط الدقة المتوسط المحسوب عند عتبات مختلفة لإنترنت الأشياء ، تتراوح من 0.50 إلى 0.95. إنه يعطي رؤية شاملة لأداء النموذج عبر مستويات مختلفة من صعوبة الكشف.

مقاييس السرعة

يمكن أن تكون سرعة الاستدلال حاسمة مثل الدقة ، خاصة في سيناريوهات اكتشاف الكائنات في الوقت الفعلي. يقسم هذا القسم الوقت المستغرق لمراحل مختلفة من عملية التحقق ، من المعالجة المسبقة إلى المعالجة اللاحقة.

تقييم مقاييس كوكو

بالنسبة للمستخدمين الذين يقومون بالتحقق من صحة مجموعة بيانات COCO، يتم حساب مقاييس إضافية باستخدام البرنامج النصي لتقييم COCO. توفر هذه المقاييس رؤى حول الدقة والاستدعاء عند عتبات إنترنت الأشياء المختلفة وللكائنات ذات الأحجام المختلفة.

المخرجات المرئية

تنتج الدالة model.val() ، بصرف النظر عن إنتاج مقاييس رقمية ، مخرجات مرئية يمكن أن توفر فهما أكثر سهولة لأداء النموذج. فيما يلي تفصيل للمخرجات المرئية التي يمكنك توقعها:

  • منحنى درجة F1 (F1_curve.png): This curve represents the F1 score across various thresholds. Interpreting this curve can offer insights into the model's balance between false positives and false negatives over different thresholds.

  • منحنى الاستدعاء الدقيق (PR_curve.png): An integral visualization for any classification problem, this curve showcases the trade-offs between precision and recall at varied thresholds. It becomes especially significant when dealing with imbalanced classes.

  • منحنى الدقة (P_curve.png)تمثيل بياني لقيم الدقة عند عتبات مختلفة.: يساعد هذا المنحنى في فهم كيفية تغير الدقة مع تغير العتبة.

  • منحنى الاستدعاء (R_curve.png)في المقابل ، يوضح هذا الرسم البياني كيف تتغير قيم الاستدعاء عبر عتبات مختلفة.:

  • Confusion Matrix (confusion_matrix.png)توفر مصفوفة الارتباك عرضا مفصلا للنتائج ، وتعرض أعداد الإيجابيات الحقيقية والسلبيات الحقيقية والإيجابيات الخاطئة والسلبيات الخاطئة لكل فئة.:

  • مصفوفة الارتباك الطبيعية (confusion_matrix_normalized.png)هذا التصور هو نسخة طبيعية من مصفوفة الارتباك.: وهو يمثل البيانات بنسب بدلا من الأعداد الأولية. يسهل هذا التنسيق مقارنة الأداء عبر الفئات.

  • تسميات دفعة التحقق من الصحة (val_batchX_labels.jpg)تصور هذه الصور تسميات الحقيقة الأساسية لدفعات مميزة من مجموعة بيانات التحقق من الصحة.: أنها توفر صورة واضحة عن ماهية الكائنات ومواقع كل منها وفقا لمجموعة البيانات.

  • تنبؤات دفعة التحقق من الصحة (val_batchX_pred.jpg): Contrasting the label images, these visuals display the predictions made by the YOLO11 model for the respective batches. By comparing these to the label images, you can easily assess how well the model detects and classifies objects visually.

تخزين النتائج

للرجوع إليها في المستقبل ، يتم حفظ النتائج في دليل ، يسمى عادة runs / detect / val.

اختيار المقاييس الصحيحة

غالبا ما يعتمد اختيار المقاييس الصحيحة للتقييم على التطبيق المحدد.

  • خريطة: مناسبة لتقييم واسع لأداء النموذج.

  • آيو: ضروري عندما يكون تحديد موقع الكائن بدقة أمرا بالغ الأهمية.

  • دقة: مهم عند تقليل الاكتشافات الخاطئة إلى حد الأولوية.

  • استذكر: حيوي عندما يكون من المهم اكتشاف كل مثيل لكائن.

  • درجة F1: مفيد عند الحاجة إلى التوازن بين الدقة والتذكر.

بالنسبة للتطبيقات في الوقت الفعلي ، تعد مقاييس السرعة مثل FPS (إطارات في الثانية) وزمن الوصول أمرا بالغ الأهمية لضمان النتائج في الوقت المناسب.

تفسير النتائج

من المهم فهم المقاييس. إليك ما قد توحي به بعض الدرجات المنخفضة التي تمت ملاحظتها بشكل شائع:

  • انخفاض mAP: يشير إلى أن النموذج قد يحتاج إلى تحسينات عامة.

  • انخفاض IoU: قد يكافح النموذج لتحديد الأشياء بدقة. يمكن أن تساعد طرق الصندوق المحيط المختلفة.

  • دقة منخفضة: قد يكتشف النموذج عددا كبيرا جدا من الكائنات غير الموجودة. قد يؤدي تعديل عتبات الثقة إلى تقليل ذلك.

  • Low Recall: The model could be missing real objects. Improving feature extraction or using more data might help.

  • درجة F1 غير متوازنة: هناك تباين بين الدقة والتذكر.

  • نقطة وصول خاصة بالفصل: يمكن أن تسلط الدرجات المنخفضة هنا الضوء على الفئات التي يكافح معها النموذج.

دراسات الحالة

يمكن أن تساعد الأمثلة الواقعية في توضيح كيفية عمل هذه المقاييس في الممارسة العملية.

الحالة 1

  • الموقف: mAP و F1 Score دون المستوى الأمثل ، ولكن في حين أن الاستدعاء جيد ، فإن الدقة ليست كذلك.

  • التفسير والعمل: قد يكون هناك الكثير من الاكتشافات غير الصحيحة. يمكن أن يؤدي تشديد عتبات الثقة إلى تقليل هذه العتبات ، على الرغم من أنه قد يقلل أيضا بشكل طفيف من الاستدعاء.

الحالة 2

  • الموقف: mAP والاستدعاء مقبولان ، لكن IoU غير موجود.

  • التفسير والعمل: يكتشف النموذج الكائنات جيدا ولكنه قد لا يقوم بتوطينها بدقة. قد يساعد تحسين تنبؤات المربع المحيط.

الحالة 3

  • موقف: تحتوي بعض الفئات على نقطة وصول أقل بكثير من غيرها ، حتى مع وجود mAP شامل لائق.

  • التفسير والعمل: قد تكون هذه الفئات أكثر صعوبة بالنسبة للنموذج. قد يكون استخدام المزيد من البيانات لهذه الفئات أو تعديل أوزان الفصل أثناء التدريب مفيدا.

الاتصال والتعاون

Tapping into a community of enthusiasts and experts can amplify your journey with YOLO11. Here are some avenues that can facilitate learning, troubleshooting, and networking.

الانخراط مع المجتمع الأوسع

  • GitHub Issues: The YOLO11 repository on GitHub has an Issues tab where you can ask questions, report bugs, and suggest new features. The community and maintainers are active here, and it's a great place to get help with specific problems.

  • Ultralytics خادم الفتنة: Ultralytics يحتوي على خادم Discord حيث يمكنك التفاعل مع المستخدمين الآخرين والمطورين.

الوثائق الرسمية والموارد:

  • Ultralytics YOLO11 Docs: The official documentation provides a comprehensive overview of YOLO11, along with guides on installation, usage, and troubleshooting.

Using these resources will not only guide you through any challenges but also keep you updated with the latest trends and best practices in the YOLO11 community.

استنتاج

In this guide, we've taken a close look at the essential performance metrics for YOLO11. These metrics are key to understanding how well a model is performing and are vital for anyone aiming to fine-tune their models. They offer the necessary insights for improvements and to make sure the model works effectively in real-life situations.

Remember, the YOLO11 and Ultralytics community is an invaluable asset. Engaging with fellow developers and experts can open doors to insights and solutions not found in standard documentation. As you journey through object detection, keep the spirit of learning alive, experiment with new strategies, and share your findings. By doing so, you contribute to the community's collective wisdom and ensure its growth.

اكتشاف الأشياء السعيدة!

الأسئلة المتداولة

What is the significance of Mean Average Precision (mAP) in evaluating YOLO11 model performance?

Mean Average Precision (mAP) is crucial for evaluating YOLO11 models as it provides a single metric encapsulating precision and recall across multiple classes. mAP@0.50 measures precision at an IoU threshold of 0.50, focusing on the model's ability to detect objects correctly. mAP@0.50:0.95 averages precision across a range of IoU thresholds, offering a comprehensive assessment of detection performance. High mAP scores indicate that the model effectively balances precision and recall, essential for applications like autonomous driving and surveillance.

How do I interpret the Intersection over Union (IoU) value for YOLO11 object detection?

يقيس التقاطع على الاتحاد (IoU) التداخل بين المربعات الحدودية المتوقعة والحقيقة الأرضية. تتراوح قيم IoU من 0 إلى 1، حيث تشير القيم الأعلى إلى دقة توطين أفضل. تعني قيمة 1.0 وحدة تقاطع على الاتحاد (IoU) محاذاة مثالية. عادةً ما يتم استخدام عتبة IoU التي تبلغ 0.50 لتحديد الإيجابيات الحقيقية في مقاييس مثل mAP. تشير قيم IoU المنخفضة إلى أن النموذج يواجه صعوبة في تحديد موقع الكائن بدقة، وهو ما يمكن تحسينه عن طريق تحسين انحدار الصندوق المحدود أو زيادة دقة التعليق التوضيحي.

Why is the F1 Score important for evaluating YOLO11 models in object detection?

The F1 Score is important for evaluating YOLO11 models because it provides a harmonic mean of precision and recall, balancing both false positives and false negatives. It is particularly valuable when dealing with imbalanced datasets or applications where either precision or recall alone is insufficient. A high F1 Score indicates that the model effectively detects objects while minimizing both missed detections and false alarms, making it suitable for critical applications like security systems and medical imaging.

What are the key advantages of using Ultralytics YOLO11 for real-time object detection?

Ultralytics YOLO11 offers multiple advantages for real-time object detection:

  • السرعة والكفاءة: مُحسَّن للاستدلال عالي السرعة، ومناسب للتطبيقات التي تتطلب زمن استجابة منخفض.
  • دقة عالية: خوارزمية متقدمة تضمن الحصول على درجات عالية من الدقة والدقة في الاسترجاع.
  • المرونة: يدعم مهام مختلفة بما في ذلك اكتشاف الكائنات وتجزئتها وتصنيفها.
  • سهولة الاستخدام: واجهات سهلة الاستخدام، ووثائق شاملة، وتكامل سلس مع منصات مثل Ultralytics HUB(HUB Quickstart).

This makes YOLO11 ideal for diverse applications from autonomous vehicles to smart city solutions.

How can validation metrics from YOLO11 help improve model performance?

Validation metrics from YOLO11 like precision, recall, mAP, and IoU help diagnose and improve model performance by providing insights into different aspects of detection:

  • الدقة: تساعد في تحديد الإيجابيات الخاطئة وتقليلها إلى الحد الأدنى.
  • استرجاع: يضمن اكتشاف جميع الكائنات ذات الصلة.
  • mAP: يقدم لمحة عامة عن الأداء، ويوجه التحسينات العامة.
  • IoU: يساعد على ضبط دقة تحديد موقع الجسم بدقة.

من خلال تحليل هذه المقاييس، يمكن استهداف نقاط ضعف محددة، مثل تعديل عتبات الثقة لتحسين الدقة أو جمع بيانات أكثر تنوعًا لتحسين الاستدعاء. للحصول على شرح مفصّل لهذه المقاييس وكيفية تفسيرها، راجع مقاييس اكتشاف الكائنات.


📅 Created 11 months ago ✏️ Updated 12 days ago

التعليقات