تخطي إلى المحتوى

EfficientDet مقابل YOLOv7: مقارنة فنية

يُعد اختيار نموذج الكشف عن الأجسام المناسب قرارًا بالغ الأهمية يوازن بين الدقة والسرعة والتكلفة الحسابية. تقدم هذه الصفحة مقارنة فنية مفصلة بين EfficientDet و YOLOv7، وهما بنيتان مؤثرتان في الرؤية الحاسوبية. تشتهر EfficientDet بكفاءة المعلمات الاستثنائية وقابليتها للتوسع، بينما يتم الاحتفاء بـ YOLOv7 لدفع حدود سرعة ودقة الكشف في الوقت الفعلي.

سوف نستكشف الاختلافات المعمارية الأساسية ومعايير الأداء وحالات الاستخدام المثالية. في حين أن كلا النموذجين لهما نقاط قوة، بالنسبة للعديد من التطبيقات الحديثة، قد يجد المطورون بدائل متفوقة مثل Ultralytics YOLOv8 و YOLO11 التي تقدم حلاً أكثر شمولاً وسهولة في الاستخدام.

EfficientDet: بنية قابلة للتطوير وفعالة

EfficientDet، الذي قدمه فريق Google Brain، هي عائلة من نماذج الكشف عن الكائنات المصممة لتحقيق كفاءة ودقة عاليتين. يكمن ابتكاره الرئيسي في اتباع نهج منهجي لتوسيع نطاق النموذج وشبكة دمج ميزات جديدة.

البنية والميزات الرئيسية

تعتمد بنية EfficientDet على ثلاثة مكونات رئيسية:

  • EfficientNet Backbone: تستخدم EfficientNet عالية الكفاءة كعمود فقري لها لاستخراج الميزات، وهي مُحسَّنة لتحقيق توازن فائق بين الدقة والتكلفة الحسابية.
  • BiFPN (شبكة الهرم المميز ثنائية الاتجاه): على عكس شبكات FPN التقليدية التي تجمع الميزات في اتجاه واحد، تتيح BiFPN دمج الميزات متعددة المقاييس مع اتصالات مرجحة، مما يتيح تمثيلات ميزات أكثر ثراءً مع عدد أقل من المعلمات.
  • التحجيم المركب: تقدم EfficientDet طريقة تحجيم مركبة تعمل على توسيع نطاق العمق والعرض والدقة للعمود الفقري وشبكة الميزات ورأس التنبؤ بشكل موحد. يتيح ذلك توسيع نطاق النموذج من EfficientDet-D0 الصغير إلى D7 الكبير، لتلبية قيود الموارد المختلفة.

نقاط القوة

  • كفاءة عالية في استخدام البارامترات: تحقق نماذج EfficientDet دقة تنافسية مع عدد أقل بكثير من البارامترات وعمليات الفلوبس (FLOPs) مقارنة بنماذج أخرى في وقتها.
  • قابلية التوسع: توفر طريقة التحجيم المركب مسارًا واضحًا لتوسيع النموذج أو تقليصه، مما يجعله قابلاً للتكيف مع مختلف الأجهزة بدءًا من الأجهزة الطرفية ووصولاً إلى الخوادم السحابية القوية.
  • أداء قوي على وحدة المعالجة المركزية (CPU): تعمل المتغيرات الأصغر من EfficientDet بشكل جيد على وحدات المعالجة المركزية (CPUs)، مما يجعلها مناسبة للتطبيقات التي لا تتوفر فيها أجهزة GPU.

نقاط الضعف

  • استدلال أبطأ لوحدة معالجة الرسومات (GPU): على الرغم من كفاءة FLOP، يمكن أن يكون EfficientDet أبطأ من نماذج مثل YOLOv7 على وحدات معالجة الرسومات (GPU)، حيث أن بنيته أقل تحسينًا للمعالجة المتوازية.
  • خاصية المهمة: تم تصميم EfficientDet في الأساس لاكتشاف الأجسام ويفتقر إلى التنوع الأصلي متعدد المهام الموجود في الأطر الأكثر حداثة.
  • التعقيد: قد تضيف مفاهيم BiFPN والتحجيم المركب، على الرغم من قوتها، تعقيدًا إلى فهم النموذج وتخصيصه.

تعرف على المزيد حول EfficientDet

YOLOv7: معيار جديد في الكشف في الوقت الفعلي

ظهر YOLOv7 كقفزة كبيرة إلى الأمام في سلسلة YOLO، حيث وضع أحدث التقنيات للكشف عن الأجسام في الوقت الفعلي. قدم العديد من التحسينات المعمارية والتدريبية لتعزيز الدقة دون المساس بسرعة الاستدلال.

البنية والميزات الرئيسية

تأتي مكاسب الأداء في YOLOv7 من عدة ابتكارات رئيسية:

  • شبكة تجميع الطبقات الفعالة الموسعة (E-ELAN): تعمل هذه الوحدة، المستخدمة في الهيكل الأساسي للنموذج، على تحسين قدرة الشبكة على التعلم والتقارب بفعالية من خلال التحكم في مسارات التدرج.
  • إعادة تحديد معلمات النموذج: يستخدم YOLOv7 الالتفاف المعاد تحديده والمخطط له، وهي تقنية تدمج وحدات متعددة في وحدة واحدة أثناء الاستدلال لتقليل النفقات الحسابية وزيادة السرعة.
  • حقيبة الحيل المجانية القابلة للتدريب: يقدم تقنيات تدريب متقدمة، مثل الرؤوس الإضافية التي تعمق الإشراف والتدريب الموجه الرئيسي من الخشن إلى الدقيق، مما يحسن الدقة دون إضافة إلى تكلفة الاستدلال النهائية.

نقاط القوة

  • مقايضة استثنائية بين السرعة والدقة: يوفر YOLOv7 سرعات استدلال في الوقت الفعلي مذهلة على وحدات معالجة الرسوميات (GPUs) مع الحفاظ على دقة عالية جدًا، مما يجعله يتفوق على العديد من النماذج الأخرى.
  • تحسينات التدريب المتقدمة: يتيح نهج "bag-of-freebies" تحقيق درجات mAP أعلى دون زيادة حجم النموذج المنشور.
  • أداء مثبت: لقد تم قياسه على نطاق واسع على مجموعات البيانات القياسية مثل MS COCO، مما يدل على قدراته.

نقاط الضعف

  • التدريب المكثف للموارد: يمكن أن تكون نماذج YOLOv7 الأكبر حجمًا مكلفة حسابيًا وتتطلب ذاكرة GPU كبيرة للتدريب.
  • تنوع محدود: على الرغم من أن المستودع الرسمي يتضمن ملحقات لمهام مثل تقدير الوضعية و التجزئة، إلا أنه ليس إطار عمل متكامل للمهام المتعددة مثل نماذج Ultralytics الأحدث.
  • التعقيد: البنية الأساسية وخطوات التدريب معقدة، مما قد يشكل عائقًا أمام المطورين الذين يتطلعون إلى تخصيص النموذج أو فهمه بعمق.

تعرف على المزيد حول YOLOv7

تحليل الأداء: السرعة والدقة

عند مقارنة EfficientDet و YOLOv7، يكمن الاختلاف الرئيسي في أهداف التحسين الخاصة بهما. تعطي EfficientDet الأولوية لكفاءة المعلمات وعمليات الفاصلة العائمة في الثانية (FLOPs)، بينما تركز YOLOv7 على زيادة سرعة الاستدلال (FPS) على أجهزة GPU لتحقيق دقة معينة.

النموذج الحجم
(بالبكسل)
mAPval
50-95
السرعة
وحدة المعالجة المركزية CPU ONNX
(بالمللي ثانية)
السرعة
T4 TensorRT
(مللي ثانية)
المعلمات
(M)
FLOPs
(B)
YOLOv7l 640 51.4 - 6.84 36.9 104.7
YOLOv7x 640 53.1 - 11.57 71.3 189.9
EfficientDet-d0 640 34.6 10.2 3.92 3.9 2.54
EfficientDet-d1 640 40.5 13.5 7.31 6.6 6.1
EfficientDet-d2 640 43.0 17.7 10.92 8.1 11.0
EfficientDet-d3 640 47.5 28.0 19.59 12.0 24.9
EfficientDet-d4 640 49.7 42.8 33.55 20.7 55.2
EfficientDet-d5 640 51.5 72.5 67.86 33.7 130.0
EfficientDet-d6 640 52.6 92.8 89.29 51.9 226.0
EfficientDet-d7 640 53.7 122.0 128.07 51.9 325.0

من الجدول، يمكننا استخلاص عدة استنتاجات:

  • الدقة: يحقق أكبر نموذج EfficientDet (d7) أعلى mAP، لكن YOLOv7x قريب جدًا منه.
  • الكفاءة: نماذج EfficientDet خفيفة بشكل استثنائي من حيث المعلمات والعمليات الحسابية، وخاصة المتغيرات الأصغر. EfficientDet-d0 هو الفائز الواضح للبيئات ذات الموارد المحدودة.
  • السرعة: نماذج YOLOv7 أسرع بشكل ملحوظ على وحدة معالجة الرسوميات GPU (TensorRT). على سبيل المثال، يحقق YOLOv7l معدل 51.4 mAP في 6.84 مللي ثانية فقط، في حين أن EfficientDet-d5 المماثل يحقق معدل 51.5 mAP ولكنه يستغرق وقتًا أطول بكثير يبلغ 67.86 مللي ثانية. هذا يجعل YOLOv7 أكثر ملاءمة للتطبيقات في الوقت الفعلي التي تتطلب إنتاجية عالية.

لماذا تختار نماذج Ultralytics YOLO؟

في حين أن YOLOv7 يقدم أداءً ممتازًا، فإن نماذج Ultralytics YOLO الأحدث مثل YOLOv8 و YOLO11 توفر مزايا كبيرة:

  • سهولة الاستخدام: تأتي نماذج Ultralytics مع واجهة Python API مبسطة، و توثيق شامل، و أوامر CLI مباشرة، مما يبسط التدريب والتحقق والنشر.
  • نظام بيئي مُدار بشكل جيد: استفد من التطوير النشط ومجتمع مفتوح المصدر قوي والتحديثات المتكررة والتكامل مع أدوات مثل Ultralytics HUB لـ MLOps سلس.
  • موازنة الأداء: تحقق نماذج Ultralytics توازنًا ممتازًا بين السرعة والدقة، ومناسبة لسيناريوهات العالم الحقيقي المتنوعة من الأجهزة الطرفية إلى الخوادم السحابية.
  • كفاءة الذاكرة: تم تصميم نماذج Ultralytics YOLO لتحقيق كفاءة في استخدام الذاكرة أثناء التدريب والاستدلال، وغالبًا ما تتطلب ذاكرة CUDA أقل من النماذج القائمة على المحولات أو حتى بعض متغيرات EfficientDet أو YOLOv7.
  • تنوع الاستخدامات: تدعم نماذج مثل YOLOv8 و YOLO11 مهام متعددة تتجاوز اكتشاف الكائنات، بما في ذلك التجزئة، و التصنيف، و تقدير الوضعية، و اكتشاف الكائنات الموجهة (OBB)، مما يوفر حلاً موحدًا.
  • كفاءة التدريب: استفد من عمليات التدريب الفعالة والأوزان المدربة مسبقًا المتاحة بسهولة على مجموعات البيانات مثل COCO، وأوقات التقارب الأسرع.

الخلاصة

تتفوق EfficientDet في السيناريوهات التي تكون فيها كفاءة المعلمات و FLOP ذات أهمية قصوى، مما يوفر قابلية التوسع عبر ميزانيات موارد مختلفة. تدفع YOLOv7 حدود الكشف عن الكائنات في الوقت الفعلي، مما يوفر سرعة ودقة استثنائيتين، خاصة على أجهزة GPU، من خلال الاستفادة من تقنيات التدريب المتقدمة.

ومع ذلك، بالنسبة للمطورين الذين يبحثون عن إطار عمل حديث ومتعدد الاستخدامات وسهل الاستخدام مع أداء قوي ووثائق ممتازة ونظام بيئي شامل يدعم مهام رؤية متعددة، غالبًا ما تقدم نماذج Ultralytics مثل YOLOv8 و YOLO11 خيارًا أكثر إقناعًا لمجموعة واسعة من التطبيقات، من البحث إلى نشر الإنتاج.

مقارنات النماذج الأخرى

للمزيد من الاستكشاف، ضع في اعتبارك هذه المقارنات التي تتضمن EfficientDet و YOLOv7 ونماذج أخرى ذات صلة:



📅 تم إنشاؤه منذ سنة واحدة ✏️ تم التحديث منذ شهر واحد

تعليقات