تخطي إلى المحتوى

YOLOv5 ضد EfficientDet: مقارنة تقنية تفصيلية

تقدم هذه الصفحة مقارنة فنية شاملة بين نموذجين مؤثرين في اكتشاف الكائنات: Ultralytics YOLOv5 و EfficientDet من Google. في حين أن كلا النموذجين مصمم لتحقيق أداء عالٍ، إلا أنهما ينبعان من فلسفات بحث وتصميمات معمارية مختلفة. سوف نتعمق في الاختلافات الرئيسية بينهما في الهندسة المعمارية ومقاييس الأداء وحالات الاستخدام المثالية لمساعدتك في اختيار أفضل نموذج لمشاريع رؤية الكمبيوتر الخاصة بك.

Ultralytics YOLOv5: النموذج متعدد الاستخدامات وواسع الانتشار

المؤلف: جلين جوتشر
المنظمة: Ultralytics
التاريخ: 2020-06-26
GitHub: https://github.com/ultralytics/yolov5
المستندات: https://docs.ultralytics.com/models/yolov5/

إن Ultralytics YOLOv5 عبارة عن كاشف للأجسام بمرحلة واحدة سرعان ما أصبح معيارًا صناعيًا نظرًا لتوازنه الاستثنائي بين السرعة والدقة وسهولة الاستخدام. تم بناءه بالكامل في PyTorch، وتتميز بنيته بـ عمود فقري CSPDarknet53، وعنق PANet لتجميع الميزات الفعال، و رأس كشف فعال يعتمد على المرساة. يتميز YOLOv5 بقابلية عالية للتوسع، حيث يقدم مجموعة من النماذج من nano (n) إلى extra-large (x)، مما يسمح للمطورين بتحديد المقايضة المثالية لمتطلباتهم الحسابية ومتطلبات الأداء المحددة.

نقاط القوة

  • سرعة استثنائية: تم تحسين YOLOv5 بشكل كبير للاستدلال السريع، مما يجعله خيارًا مفضلًا لـ التطبيقات في الوقت الفعلي حيث يكون زمن الانتقال المنخفض أمرًا بالغ الأهمية، كما هو الحال في المراقبة بالفيديو.
  • سهولة الاستخدام: إحدى المزايا الرئيسية هي تجربة المستخدم المبسطة. بفضل واجهة برمجة تطبيقات Python بسيطة و CLI، و وثائق شاملة، وسير عمل تدريبي مباشر، تقلل YOLOv5 بشكل كبير من حاجز الدخول لاكتشاف الكائنات المخصص.
  • نظام بيئي مُدار بشكل جيد: يتم دعم YOLOv5 من خلال نظام Ultralytics البيئي القوي، والذي يتضمن التطوير النشط، ومجتمع كبير ومفيد، والتحديثات المتكررة، والأدوات القوية مثل Ultralytics HUB لتدريب وإدارة النماذج بدون تعليمات برمجية.
  • كفاءة التدريب: تم تصميم النموذج لتدريب فعال، ويستفيد من الأوزان المدربة مسبقًا المتاحة بسهولة على مجموعات البيانات مثل COCO وأوقات التقارب الأسرع. كما أن لديه متطلبات ذاكرة أقل أثناء التدريب والاستدلال مقارنة بالبنى الأكثر تعقيدًا مثل المحولات.
  • تعدد الاستخدامات: بالإضافة إلى اكتشاف الأجسام، يدعم YOLOv5 مهامًا مثل تجزئة المثيلات و تصنيف الصور، مما يوفر حلاً مرنًا ضمن إطار عمل واحد.

نقاط الضعف

  • في حين أن نماذج EfficientDet الأكبر حجمًا عالية الدقة، إلا أنها يمكن أن تحقق في بعض الأحيان درجات mAP أعلى في المعايير الأكاديمية، خاصة عند اكتشاف الأجسام الصغيرة جدًا.
  • قد يتطلب اعتمادها على مربعات الارتساء المحددة مسبقًا ضبطًا لمجموعات البيانات ذات الأشكال والأحجام غير التقليدية للكائنات لتحقيق الأداء الأمثل.

حالات الاستخدام المثالية

تعرف على المزيد حول YOLOv5

EfficientDet: بنية قابلة للتطوير وفعالة

المؤلفون: مينغشينغ تان، رومينغ بانغ، و كيوك ف. لي
المنظمة: Google
التاريخ: 2019-11-20
Arxiv: https://arxiv.org/abs/1911.09070
GitHub: https://github.com/google/automl/tree/master/efficientdet
المستندات: https://github.com/google/automl/tree/master/efficientdet#readme

قدم EfficientDet، الذي تم تطويره بواسطة فريق Google Brain، عائلة من كاشفات الكائنات القابلة للتطوير والفعالة. تشمل الابتكارات الأساسية استخدام EfficientNet عالي الكفاءة كخلفية، وشبكة هرم الميزات ثنائية الاتجاه (BiFPN) لدمج الميزات متعددة المقاييس بسرعة، وطريقة توسيع نطاق مركبة. تعمل هذه الطريقة على توسيع نطاق عمق النموذج وعرضه ودقته بشكل موحد، مما يسمح بإنشاء مجموعة من النماذج (D0-D7) المحسّنة لميزانيات حسابية مختلفة.

نقاط القوة

  • دقة وكفاءة عاليتان: تُعرف نماذج EfficientDet بتحقيق دقة متطورة مع عدد أقل من المعلمات و FLOPs مقارنة بالنماذج الأخرى في وقت إصدارها.
  • قابلية التوسع: يوفر أسلوب التحجيم المركب مسارًا واضحًا لتوسيع النموذج أو تقليصه، مما يجعله قابلاً للتكيف مع مختلف قيود الأجهزة من الأجهزة المحمولة إلى الخوادم السحابية.
  • دمج الميزات الفعال: يتيح BiFPN دمجًا أكثر ثراءً للميزات من خلال دمج اتصالات ثنائية الاتجاه ومرجحة، مما يساهم في دقته العالية.

نقاط الضعف

  • سرعة استدلال أبطأ: على الرغم من كفاءة المعلمات، فإن EfficientDet أبطأ بشكل عام من YOLOv5، خاصة في سيناريوهات النشر الواقعية. وهذا يجعلها أقل ملاءمة للتطبيقات التي تتطلب أداءً في الوقت الفعلي.
  • التعقيد: البنية الأساسية، وخاصةً BiFPN، أكثر تعقيدًا من التصميم المباشر لـ YOLOv5. وهذا قد يجعل فهمها وتخصيصها وتصحيح أخطائها أكثر صعوبة بالنسبة للمطورين.
  • نظام بيئي أقل تكاملاً: على الرغم من دعم Google، فإن مستودع مفتوح المصدر ليس نشطًا أو سهل الاستخدام مثل نظام Ultralytics البيئي. يفتقر إلى الوثائق الشاملة والبرامج التعليمية والأدوات المتكاملة التي تبسط دورة حياة MLOps.

حالات الاستخدام المثالية

  • تحليل غير متصل بالإنترنت للصور عالية الدقة حيث تكون الدقة القصوى ذات أهمية قصوى.
  • تحليل الصور الطبية للكشف عن الحالات الشاذة الطفيفة.
  • مراقبة جودة عالية الدقة في التصنيع حيث يمكن إجراء الاستدلال على شكل دفعات.
  • البحث الأكاديمي والقياس المعياري حيث يكون الدقة هو المقياس الأساسي.

تعرف على المزيد حول EfficientDet

الأداء والمعايير: نظرة وجهاً لوجه

غالبًا ما يرجع الاختيار بين YOLOv5 و EfficientDet إلى المفاضلة بين السرعة والدقة. يقدم الجدول والتحليل التاليان مقارنة واضحة لأدائهما على مجموعة بيانات COCO val2017.

النموذج الحجم
(بالبكسل)
mAPval
50-95
السرعة
وحدة المعالجة المركزية CPU ONNX
(بالمللي ثانية)
السرعة
T4 TensorRT10
(بالمللي ثانية)
المعلمات
(M)
FLOPs
(B)
YOLOv5n 640 28.0 73.6 1.12 2.6 7.7
YOLOv5s 640 37.4 120.7 1.92 9.1 24.0
YOLOv5m 640 45.4 233.9 4.03 25.1 64.2
YOLOv5l 640 49.0 408.4 6.61 53.2 135.0
YOLOv5x 640 50.7 763.2 11.89 97.2 246.4
EfficientDet-d0 640 34.6 10.2 3.92 3.9 2.54
EfficientDet-d1 640 40.5 13.5 7.31 6.6 6.1
EfficientDet-d2 640 43.0 17.7 10.92 8.1 11.0
EfficientDet-d3 640 47.5 28.0 19.59 12.0 24.9
EfficientDet-d4 640 49.7 42.8 33.55 20.7 55.2
EfficientDet-d5 640 51.5 72.5 67.86 33.7 130.0
EfficientDet-d6 640 52.6 92.8 89.29 51.9 226.0
EfficientDet-d7 640 53.7 122.0 128.07 51.9 325.0

يوضح الجدول بوضوح أولويات التصميم المختلفة للنموذجين. تحقق نماذج EfficientDet، وخاصةً المتغيرات الأكبر مثل D7، أعلى درجة mAP تبلغ 53.7. كما أنها تُظهر كفاءة عالية من حيث التكلفة الحسابية، حيث أن EfficientDet-d0 لديها أقل عدد من عمليات الفاصلة العائمة في الثانية FLOPs. ومع ذلك، عندما يتعلق الأمر بالنشر للتطبيقات في الوقت الفعلي، فإن سرعة الاستدلال هي الأهم. هنا، تُظهر Ultralytics YOLOv5 ميزة حاسمة، خاصةً على أجهزة وحدة معالجة الرسوميات GPU. يحقق نموذج YOLOv5n وقت استدلال سريع جدًا يبلغ 1.12 مللي ثانية على وحدة معالجة الرسوميات T4 مع TensorRT، مما يجعله أسرع بأكثر من 3 مرات من أخف نموذج EfficientDet. علاوة على ذلك، فإن نماذج YOLOv5 خفيفة الوزن للغاية، حيث أن YOLOv5n لديها فقط 2.6 مليون معلمة، مما يجعلها مثالية للنشر على الأجهزة الطرفية ذات الموارد المحدودة. هذا التوازن في الأداء بين السرعة والدقة وحجم النموذج الصغير يجعل YOLOv5 خيارًا عمليًا للغاية لمجموعة واسعة من بيئات الإنتاج.

الخلاصة: أي نموذج يجب أن تختاره؟

يعتبر كل من EfficientDet و Ultralytics YOLOv5 من نماذج الكشف عن الأجسام القوية، لكنهما يلبيان أولويات مختلفة. يتفوق EfficientDet عندما تكون الدقة القصوى هي الهدف الأساسي، ويكون زمن الوصول للاستدلال أقل أهمية. تجعلها بنيتها القابلة للتطوير مرشحًا قويًا للمعايير الأكاديمية ومهام المعالجة دون اتصال.

ومع ذلك، بالنسبة للغالبية العظمى من التطبيقات الواقعية، يبرز Ultralytics YOLOv5 باعتباره الخيار الأفضل. إن توازنه الاستثنائي بين السرعة والدقة يجعله مثاليًا للأنظمة في الوقت الفعلي. تكمن المزايا الرئيسية لـ YOLOv5 في سهولة الاستخدام، و النظام البيئي الشامل والذي تتم صيانته جيدًا، و كفاءة التدريب الرائعة. يمكن للمطورين البدء بسرعة، وتدريب النماذج المخصصة بأقل جهد، ونشرها عبر مجموعة واسعة من الأجهزة. يوفر المجتمع النشط وأدوات مثل Ultralytics HUB دعمًا لا مثيل له، مما يجعله إطار عمل عمليًا للغاية وسهل الاستخدام للمطورين.

بالنسبة لأولئك الذين يتطلعون إلى الاستفادة من أحدث التطورات، يجدر أيضًا استكشاف النماذج الأحدث في النظام البيئي Ultralytics، مثل YOLOv8 متعددة الاستخدامات أو YOLO11 الحديثة، والتي تعتمد على الأساس القوي لـ YOLOv5 لتقديم أداء أفضل وميزات أكثر. لمزيد من المقارنات، قم بزيارة صفحة مقارنة النماذج الخاصة بـ Ultralytics.



📅 تم إنشاؤه منذ سنة واحدة ✏️ تم التحديث منذ شهر واحد

تعليقات