انتقل إلى المحتوى

مقاييس الأداء الغوص العميق

مقدمة

مقاييس الأداء هي أدوات رئيسية لتقييم دقة وكفاءة نماذج الكشف عن الكائنات. لقد سلطوا الضوء على مدى فعالية النموذج في تحديد الكائنات وتوطينها داخل الصور. بالإضافة إلى ذلك ، فهي تساعد في فهم تعامل النموذج مع الإيجابيات الخاطئة والسلبيات الخاطئة. هذه الأفكار ضرورية لتقييم أداء النموذج وتحسينه. في هذا الدليل ، سوف نستكشف مقاييس الأداء المختلفة المرتبطة ب YOLOv8وأهميتها وكيفية تفسيرها.



شاهد: Ultralytics YOLOv8 مقاييس الأداء | MAP ، درجة F1 ، الدقة ، IoU والدقة

مقاييس اكتشاف الكائنات

لنبدأ بمناقشة بعض المقاييس التي ليست مهمة فقط ل YOLOv8 ولكنها قابلة للتطبيق على نطاق واسع عبر نماذج مختلفة للكشف عن الكائنات.

  • التقاطع عبر الاتحاد (IoU): IoU هو مقياس يحدد التداخل بين المربع المحيط المتوقع والمربع المحيط بالحقيقة الأرضية. يلعب دورا أساسيا في تقييم دقة توطين الكائنات.

  • متوسط الدقة (AP): تحسب AP المنطقة الواقعة أسفل منحنى الاستدعاء الدقيق ، مما يوفر قيمة واحدة تلخص دقة النموذج وأداء الاستدعاء.

  • متوسط الدقة المتوسط (mAP): يوسع mAP مفهوم AP عن طريق حساب متوسط قيم AP عبر فئات كائنات متعددة. هذا مفيد في سيناريوهات الكشف عن الكائنات متعددة الفئات لتوفير تقييم شامل لأداء النموذج.

  • الدقة والتذكير: تحدد الدقة نسبة الإيجابيات الحقيقية بين جميع التنبؤات الإيجابية ، وتقيم قدرة النموذج على تجنب الإيجابيات الخاطئة. من ناحية أخرى ، يحسب Recall نسبة الإيجابيات الحقيقية بين جميع الإيجابيات الفعلية ، ويقيس قدرة النموذج على اكتشاف جميع مثيلات الفصل.

  • درجة F1: درجة F1 هي الوسيلة التوافقية للدقة والاستدعاء ، مما يوفر تقييما متوازنا لأداء النموذج مع مراعاة كل من الإيجابيات الخاطئة والسلبيات الخاطئة.

كيفية حساب مقاييس YOLOv8 نموذج

الآن ، يمكننا استكشاف YOLOv8وضع التحقق من الصحة الذي يمكن استخدامه لحساب مقاييس التقييم التي تمت مناقشتها أعلاه.

استخدام وضع التحقق من الصحة بسيط. بمجرد أن يكون لديك نموذج مدرب ، يمكنك استدعاء الدالة model.val(). ستقوم هذه الوظيفة بعد ذلك بمعالجة مجموعة بيانات التحقق من الصحة وإرجاع مجموعة متنوعة من مقاييس الأداء. ولكن ماذا تعني هذه المقاييس؟ وكيف يجب أن تفسرها؟

تفسير المخرجات

دعنا نحلل ناتج الدالة model.val() ونفهم كل جزء من المخرجات.

مقاييس الفصل

أحد أقسام المخرجات هو التقسيم الطبقي لمقاييس الأداء. هذه المعلومات الدقيقة مفيدة عندما تحاول فهم مدى جودة أداء النموذج لكل فئة محددة ، خاصة في مجموعات البيانات ذات النطاق المتنوع من فئات الكائنات. لكل فئة في مجموعة البيانات يتم توفير ما يلي:

  • الفئة: يشير هذا إلى اسم فئة الكائن ، مثل "شخص" أو "سيارة" أو "".

  • الصور: يخبرك هذا المقياس بعدد الصور في مجموعة التحقق من الصحة التي تحتوي على فئة الكائن.

  • المثيلات: يوفر هذا عدد المرات التي تظهر فيها الفئة عبر جميع الصور في مجموعة التحقق من الصحة.

  • Box(P, R, mAP50, mAP50-95): يوفر هذا المقياس رؤى حول أداء النموذج في اكتشاف الكائنات:

    • P (الدقة): دقة الكائنات المكتشفة ، مع الإشارة إلى عدد الاكتشافات الصحيحة.

    • R (استدعاء): قدرة النموذج على تحديد جميع مثيلات الكائنات في الصور.

    • mAP50: متوسط الدقة المحسوبة عند تقاطع فوق عتبة الاتحاد (IoU) 0.50. إنه مقياس لدقة النموذج بالنظر إلى الاكتشافات "السهلة" فقط.

    • mAP50-95: متوسط متوسط الدقة المتوسط المحسوب عند عتبات مختلفة لإنترنت الأشياء ، تتراوح من 0.50 إلى 0.95. إنه يعطي رؤية شاملة لأداء النموذج عبر مستويات مختلفة من صعوبة الكشف.

مقاييس السرعة

يمكن أن تكون سرعة الاستدلال حاسمة مثل الدقة ، خاصة في سيناريوهات اكتشاف الكائنات في الوقت الفعلي. يقسم هذا القسم الوقت المستغرق لمراحل مختلفة من عملية التحقق ، من المعالجة المسبقة إلى المعالجة اللاحقة.

تقييم مقاييس كوكو

بالنسبة للمستخدمين الذين يقومون بالتحقق من صحة مجموعة بيانات COCO، يتم حساب مقاييس إضافية باستخدام البرنامج النصي لتقييم COCO. توفر هذه المقاييس رؤى حول الدقة والاستدعاء عند عتبات إنترنت الأشياء المختلفة وللكائنات ذات الأحجام المختلفة.

المخرجات المرئية

تنتج الدالة model.val() ، بصرف النظر عن إنتاج مقاييس رقمية ، مخرجات مرئية يمكن أن توفر فهما أكثر سهولة لأداء النموذج. فيما يلي تفصيل للمخرجات المرئية التي يمكنك توقعها:

  • منحنى درجة F1 (F1_curve.png)يمثل هذا المنحنى درجة F1 عبر عتبات مختلفة.: يمكن أن يقدم تفسير هذا المنحنى نظرة ثاقبة لتوازن النموذج بين الإيجابيات الخاطئة والسلبيات الخاطئة على عتبات مختلفة.

  • منحنى الاستدعاء الدقيق (PR_curve.png)تصور متكامل لأي مشكلة تصنيف ، يعرض هذا المنحنى المفاضلات بين الدقة والاستدعاء عند عتبات مختلفة.: يصبح مهما بشكل خاص عند التعامل مع الطبقات غير المتوازنة.

  • منحنى الدقة (P_curve.png)تمثيل بياني لقيم الدقة عند عتبات مختلفة.: يساعد هذا المنحنى في فهم كيفية تغير الدقة مع تغير العتبة.

  • منحنى الاستدعاء (R_curve.png)في المقابل ، يوضح هذا الرسم البياني كيف تتغير قيم الاستدعاء عبر عتبات مختلفة.:

  • مصفوفة الارتباك (confusion_matrix.png)توفر مصفوفة الارتباك عرضا مفصلا للنتائج ، وتعرض أعداد الإيجابيات الحقيقية والسلبيات الحقيقية والإيجابيات الخاطئة والسلبيات الخاطئة لكل فئة.:

  • مصفوفة الارتباك الطبيعية (confusion_matrix_normalized.png)هذا التصور هو نسخة طبيعية من مصفوفة الارتباك.: وهو يمثل البيانات بنسب بدلا من الأعداد الأولية. يسهل هذا التنسيق مقارنة الأداء عبر الفئات.

  • تسميات دفعة التحقق من الصحة (val_batchX_labels.jpg)تصور هذه الصور تسميات الحقيقة الأساسية لدفعات مميزة من مجموعة بيانات التحقق من الصحة.: أنها توفر صورة واضحة عن ماهية الكائنات ومواقع كل منها وفقا لمجموعة البيانات.

  • تنبؤات دفعة التحقق من الصحة (val_batchX_pred.jpg)على النقيض من صور التسمية ، تعرض هذه المرئيات التنبؤات التي أدلى بها YOLOv8 نموذج للدفعات المعنية. من خلال مقارنتها بصور التسمية ، يمكنك بسهولة تقييم مدى جودة اكتشاف النموذج للكائنات وتصنيفها بصريا.

تخزين النتائج

للرجوع إليها في المستقبل ، يتم حفظ النتائج في دليل ، يسمى عادة runs / detect / val.

اختيار المقاييس الصحيحة

غالبا ما يعتمد اختيار المقاييس الصحيحة للتقييم على التطبيق المحدد.

  • خريطة: مناسبة لتقييم واسع لأداء النموذج.

  • آيو: ضروري عندما يكون تحديد موقع الكائن بدقة أمرا بالغ الأهمية.

  • دقة: مهم عند تقليل الاكتشافات الخاطئة إلى حد الأولوية.

  • استذكر: حيوي عندما يكون من المهم اكتشاف كل مثيل لكائن.

  • درجة F1: مفيد عند الحاجة إلى التوازن بين الدقة والتذكر.

بالنسبة للتطبيقات في الوقت الفعلي ، تعد مقاييس السرعة مثل FPS (إطارات في الثانية) وزمن الوصول أمرا بالغ الأهمية لضمان النتائج في الوقت المناسب.

تفسير النتائج

من المهم فهم المقاييس. إليك ما قد توحي به بعض الدرجات المنخفضة التي تمت ملاحظتها بشكل شائع:

  • انخفاض mAP: يشير إلى أن النموذج قد يحتاج إلى تحسينات عامة.

  • انخفاض IoU: قد يكافح النموذج لتحديد الأشياء بدقة. يمكن أن تساعد طرق الصندوق المحيط المختلفة.

  • دقة منخفضة: قد يكتشف النموذج عددا كبيرا جدا من الكائنات غير الموجودة. قد يؤدي تعديل عتبات الثقة إلى تقليل ذلك.

  • استدعاء منخفض: قد يفتقد النموذج إلى أشياء حقيقية. قد يساعد تحسين استخراج الميزات أو استخدام المزيد من البيانات.

  • درجة F1 غير متوازنة: هناك تباين بين الدقة والتذكر.

  • نقطة وصول خاصة بالفصل: يمكن أن تسلط الدرجات المنخفضة هنا الضوء على الفئات التي يكافح معها النموذج.

دراسات الحالة

يمكن أن تساعد الأمثلة الواقعية في توضيح كيفية عمل هذه المقاييس في الممارسة العملية.

الحالة 1

  • الموقف: mAP و F1 Score دون المستوى الأمثل ، ولكن في حين أن الاستدعاء جيد ، فإن الدقة ليست كذلك.

  • التفسير والعمل: قد يكون هناك الكثير من الاكتشافات غير الصحيحة. يمكن أن يؤدي تشديد عتبات الثقة إلى تقليل هذه العتبات ، على الرغم من أنه قد يقلل أيضا بشكل طفيف من الاستدعاء.

الحالة 2

  • الموقف: mAP والاستدعاء مقبولان ، لكن IoU غير موجود.

  • التفسير والعمل: يكتشف النموذج الكائنات جيدا ولكنه قد لا يقوم بتوطينها بدقة. قد يساعد تحسين تنبؤات المربع المحيط.

الحالة 3

  • موقف: تحتوي بعض الفئات على نقطة وصول أقل بكثير من غيرها ، حتى مع وجود mAP شامل لائق.

  • التفسير والعمل: قد تكون هذه الفئات أكثر صعوبة بالنسبة للنموذج. قد يكون استخدام المزيد من البيانات لهذه الفئات أو تعديل أوزان الفصل أثناء التدريب مفيدا.

الاتصال والتعاون

يمكن أن يؤدي الاستفادة من مجتمع المتحمسين والخبراء إلى تضخيم رحلتك مع YOLOv8. فيما يلي بعض السبل التي يمكن أن تسهل التعلم واستكشاف الأخطاء وإصلاحها والشبكات.

الانخراط مع المجتمع الأوسع

  • مشكلات جيثب: ال YOLOv8 يحتوي المستودع على GitHub على علامة تبويب المشكلات حيث يمكنك طرح الأسئلة والإبلاغ عن الأخطاء واقتراح ميزات جديدة. ينشط المجتمع والمشرفون هنا ، وهو مكان رائع للحصول على المساعدة في مشاكل محددة.

  • Ultralytics خادم الفتنة: Ultralytics يحتوي على خادم Discord حيث يمكنك التفاعل مع المستخدمين الآخرين والمطورين.

الوثائق الرسمية والموارد:

  • Ultralytics YOLOv8 المستندات: توفر الوثائق الرسمية نظرة عامة شاملة على YOLOv8، إلى جانب أدلة حول التثبيت والاستخدام واستكشاف الأخطاء وإصلاحها.

لن يؤدي استخدام هذه الموارد إلى إرشادك خلال أي تحديات فحسب ، بل سيبقيك أيضا على اطلاع بأحدث الاتجاهات وأفضل الممارسات في YOLOv8 مجتمع.

استنتاج

في هذا الدليل ، ألقينا نظرة فاحصة على مقاييس الأداء الأساسية ل YOLOv8. تعد هذه المقاييس أساسية لفهم مدى جودة أداء النموذج وهي حيوية لأي شخص يهدف إلى ضبط نماذجه. أنها توفر الأفكار اللازمة للتحسينات وللتأكد من أن النموذج يعمل بفعالية في مواقف الحياة الحقيقية.

تذكر أن YOLOv8 و Ultralytics المجتمع هو أحد الأصول التي لا تقدر بثمن. يمكن أن يؤدي التعامل مع الزملاء المطورين والخبراء إلى فتح الأبواب أمام الرؤى والحلول غير الموجودة في الوثائق القياسية. أثناء رحلتك عبر اكتشاف الأشياء ، حافظ على روح التعلم حية ، وجرب استراتيجيات جديدة ، وشارك نتائجك. من خلال القيام بذلك ، فإنك تساهم في الحكمة الجماعية للمجتمع وتضمن نموه.

اكتشاف الأشياء السعيدة!

الأسئلة المتداولة

ما أهمية متوسط الدقة المتوسطة (mAP) في تقييم أداء النموذج YOLOv8 ؟

يعد متوسط متوسط الدقة (mAP) أمرًا بالغ الأهمية لتقييم نماذج YOLOv8 لأنه يوفر مقياسًا واحدًا يجمع بين الدقة والاستدعاء عبر فئات متعددة. mAP@0.50 يقيس الدقة عند عتبة وحدة قياس IoU تبلغ 0.50، مع التركيز على قدرة النموذج على اكتشاف الأشياء بشكل صحيح. mAP@0.50:0.95 متوسط الدقة عبر مجموعة من عتبات وحدة قياس IoU، مما يوفر تقييمًا شاملاً لأداء الكشف. تشير درجات mAP المرتفعة إلى أن النموذج يوازن بشكل فعال بين الدقة والاستدعاء، وهو أمر ضروري لتطبيقات مثل القيادة الذاتية والمراقبة.

كيف يمكنني تفسير قيمة التقاطع على الاتحاد (IoU) للكشف عن الكائنات YOLOv8 ؟

يقيس التقاطع على الاتحاد (IoU) التداخل بين المربعات الحدودية المتوقعة والحقيقة الأرضية. تتراوح قيم IoU من 0 إلى 1، حيث تشير القيم الأعلى إلى دقة توطين أفضل. تعني قيمة 1.0 وحدة تقاطع على الاتحاد (IoU) محاذاة مثالية. عادةً ما يتم استخدام عتبة IoU التي تبلغ 0.50 لتحديد الإيجابيات الحقيقية في مقاييس مثل mAP. تشير قيم IoU المنخفضة إلى أن النموذج يواجه صعوبة في تحديد موقع الكائن بدقة، وهو ما يمكن تحسينه عن طريق تحسين انحدار الصندوق المحدود أو زيادة دقة التعليق التوضيحي.

لماذا تعتبر درجة F1 مهمة لتقييم نماذج YOLOv8 في اكتشاف الأجسام؟

تعتبر النتيجة F1 مهمة لتقييم نماذج YOLOv8 لأنها توفر متوسطًا متناسقًا للدقة والاستدعاء، وتوازن بين كل من النتائج الإيجابية الخاطئة والسلبيات الخاطئة. وهي ذات قيمة خاصة عند التعامل مع مجموعات البيانات غير المتوازنة أو التطبيقات التي تكون فيها الدقة أو الاستدعاء وحدهما غير كافيين. تشير درجة F1 المرتفعة إلى أن النموذج يكتشف الأجسام بفعالية مع تقليل كل من الاكتشافات الفائتة والإنذارات الخاطئة، مما يجعله مناسبًا للتطبيقات المهمة مثل أنظمة الأمان والتصوير الطبي.

ما هي المزايا الرئيسية لاستخدام Ultralytics YOLOv8 للكشف عن الأجسام في الوقت الحقيقي؟

Ultralytics YOLOv8 مزايا متعددة للكشف عن الأجسام في الوقت الحقيقي:

  • السرعة والكفاءة: مُحسَّن للاستدلال عالي السرعة، ومناسب للتطبيقات التي تتطلب زمن استجابة منخفض.
  • دقة عالية: خوارزمية متقدمة تضمن الحصول على درجات عالية من الدقة والدقة في الاسترجاع.
  • المرونة: يدعم مهام مختلفة بما في ذلك اكتشاف الكائنات وتجزئتها وتصنيفها.
  • سهولة الاستخدام: واجهات سهلة الاستخدام، ووثائق شاملة، وتكامل سلس مع منصات مثل Ultralytics HUB(HUB Quickstart).

وهذا يجعل YOLOv8 مثاليًا للتطبيقات المتنوعة من السيارات ذاتية القيادة إلى حلول المدن الذكية.

كيف يمكن أن تساعد مقاييس التحقق من الصحة من YOLOv8 في تحسين أداء النموذج؟

تساعد مقاييس التحقق من الصحة من YOLOv8 مثل الدقة والاستدعاء و mAP و IoU في تشخيص أداء النموذج وتحسينه من خلال توفير رؤى حول جوانب مختلفة من الكشف:

  • الدقة: تساعد في تحديد الإيجابيات الخاطئة وتقليلها إلى الحد الأدنى.
  • استرجاع: يضمن اكتشاف جميع الكائنات ذات الصلة.
  • mAP: يقدم لمحة عامة عن الأداء، ويوجه التحسينات العامة.
  • IoU: يساعد على ضبط دقة تحديد موقع الجسم بدقة.

من خلال تحليل هذه المقاييس، يمكن استهداف نقاط ضعف محددة، مثل تعديل عتبات الثقة لتحسين الدقة أو جمع بيانات أكثر تنوعًا لتحسين الاستدعاء. للحصول على شرح مفصّل لهذه المقاييس وكيفية تفسيرها، راجع مقاييس اكتشاف الكائنات.



تم الإنشاء 2023-11-12-2023، تم التحديث 2024-07-05
المؤلفون: جلين-جوتشر (7)، رضوان منور (1)، أبيرامي فينا (1)

التعليقات