تخطي إلى المحتوى

YOLOv9 مقارنة بـ EfficientDet: مقارنة تفصيلية

يُعد اختيار نموذج الكشف عن الكائنات الأمثل أمرًا بالغ الأهمية لمهام الرؤية الحاسوبية، حيث يوازن بين الدقة والسرعة والموارد الحسابية. تقدم هذه الصفحة مقارنة فنية مفصلة بين Ultralytics YOLOv9 و EfficientDet، وهما نموذجان مهمان في مجال الكشف عن الكائنات. سوف نتعمق في تصميماتهما المعمارية ومعايير الأداء والتطبيقات المناسبة لمساعدتك في اتخاذ قرار مستنير لمشاريعك.

YOLOv9: أحدث ما توصلت إليه التكنولوجيا في الدقة والكفاءة

تمثل YOLOv9، التي تم تقديمها في عام 2024 بواسطة Chien-Yao Wang و Hong-Yuan Mark Liao من معهد علوم المعلومات، أكاديمية سينيكا، تايوان، تقدمًا كبيرًا في سلسلة YOLO. وهي مفصلة في ورقتهم "YOLOv9: Learning What You Want to Learn Using Programmable Gradient Information" وتم تنفيذها في مستودع GitHub الخاص بهم. تعالج YOLOv9 تحدي فقدان المعلومات في الشبكات العميقة من خلال عناصر معمارية مبتكرة مثل معلومات التدرج القابلة للبرمجة (PGI) وشبكة تجميع الطبقات الفعالة المعممة (GELAN). تضمن هذه الابتكارات أن النموذج يتعلم بشكل فعال ويحافظ على دقة عالية مع عدد أقل من المعلمات، مما يعرض توازنًا قويًا بين الأداء والكفاءة.

تفاصيل فنية:

نقاط القوة

  • دقة هي الأحدث على مستوى التقنية: تحقق YOLOv9 دقة فائقة في اكتشاف الكائنات، وغالبًا ما تتفوق على المنافسين بأعداد معلمات مماثلة.
  • استخدام فعال للمعلمات: تعمل بنيتا PGI و GELAN على تحسين استخلاص الميزات وتقليل فقد المعلومات، مما يؤدي إلى أداء أفضل مع عدد أقل من المعلمات وعمليات FLOPs.
  • قابلية التوسع: تشتمل عائلة YOLOv9 على أحجام نماذج مختلفة (YOLOv9t إلى YOLOv9e)، مما يوفر مرونة لقدرات حسابية مختلفة.
  • نظام Ultralytics البيئي: في حين أن البحث الأصلي من Academia Sinica، فإن التكامل داخل إطار عمل Ultralytics يوفر مزايا هائلة. وتشمل هذه سهولة الاستخدام من خلال واجهة برمجة تطبيقات Python بسيطة و وثائق شاملة وعمليات تدريب فعالة مع أوزان مُدرَّبة مسبقًا متاحة بسهولة. يضمن النظام البيئي الذي تتم صيانته جيدًا التطوير النشط والدعم المجتمعي القوي والتكامل مع أدوات مثل Ultralytics HUB للتدريب بدون تعليمات برمجية.
  • بصمة ذاكرة منخفضة: تُظهر نماذج YOLO عادةً متطلبات ذاكرة أقل أثناء التدريب مقارنة بالعديد من البنى الأخرى، وخاصة النماذج القائمة على المحولات مثل RT-DETR.

نقاط الضعف

  • الجدة: كنموذج أحدث، قد تكون أمثلة النشر الواقعية أقل عددًا من النماذج القديمة والراسخة مثل EfficientDet، على الرغم من أن التبني داخل مجتمع Ultralytics سريع.
  • تحديد المهام: تركز ورقة YOLOv9 الأصلية بشكل أساسي على اكتشاف الكائنات. ومع ذلك، فإن دمجها في نظام Ultralytics البيئي يشير إلى إمكانات أوسع، بما يتماشى مع القدرات متعددة المهام لنماذج مثل Ultralytics YOLOv8.

حالات الاستخدام

يعد YOLOv9 مناسبًا بشكل خاص للتطبيقات التي تكون فيها الدقة والكفاءة أمرًا بالغ الأهمية، مثل:

تعرف على المزيد حول YOLOv9

EfficientDet: كشف الكائنات بكفاءة وقابلية للتوسع

تم تقديم EfficientDet في عام 2019 بواسطة فريق في Google Research. اقترح الفريق مجموعة جديدة من كاشفات الكائنات القابلة للتطوير والتي تعطي الأولوية للكفاءة دون التضحية بالدقة. تعتمد بنية النموذج على EfficientNet عالي الكفاءة، وشبكة Bi-directional Feature Pyramid Network (BiFPN) المبتكرة لدمج الميزات، وطريقة توسيع مركبة تعمل على توسيع الدقة والعمق والعرض بشكل موحد لجميع أجزاء النموذج.

تفاصيل فنية:

نقاط القوة

  • التحجيم المركب: الابتكار الرئيسي في EfficientDet هو منهجه المنتظم في التحجيم، مما يسمح له بإنشاء مجموعة من النماذج (D0-D7) التي تلبي قيود الموارد المختلفة.
  • BiFPN: تتيح شبكة الهرم المميز ثنائية الاتجاه دمج ميزات متعددة المقاييس أكثر ثراءً مقارنة بشبكات FPN التقليدية، مما يحسن دقة الاكتشاف.
  • أهمية تاريخية: في وقت إصداره، وضع EfficientDet معيارًا جديدًا للكفاءة في اكتشاف الكائنات، مما أثر على العديد من البنى اللاحقة.

نقاط الضعف

  • أداء قديم: على الرغم من كونه رائداً في عصره، إلا أن EfficientDet قد تجاوزه من حيث الدقة والسرعة نماذج أحدث مثل YOLOv9. كما هو موضح في جدول الأداء، تحقق نماذج YOLOv9 باستمرار mAP أعلى مع عدد أقل من المعلمات وسرعات استدلال أسرع بشكل ملحوظ.
  • استدلال أبطأ: على الأجهزة الحديثة مثل NVIDIA T4، حتى أصغر نماذج EfficientDet تكون أبطأ من متغيرات YOLOv9 المماثلة أو الأكثر دقة.
  • نظام بيئي محدود: EfficientDet هو في الأساس مستودع للأبحاث. يفتقر إلى النظام البيئي الشامل وسهل الاستخدام الذي توفره Ultralytics، والذي يتضمن التدريب المبسط والنشر ودعم المجتمع.
  • خاصية المهمة: تم تصميم EfficientDet حصريًا لاكتشاف الأجسام ولا يوفر التنوع المدمج للمهام الأخرى مثل تقسيم المثيلات أو تقدير الوضعيات الموجودة في إطار Ultralytics.

حالات الاستخدام

لا يزال من الممكن اعتبار EfficientDet للأنظمة القديمة أو كخط أساس للمقارنة الأكاديمية. تشمل تطبيقاته:

  • الكشف عن الكائنات للأغراض العامة حيث لا يمثل الاستدلال عالي السرعة القيد الأساسي.
  • الأغراض التعليمية لفهم شبكات هرم الميزات ومبادئ توسيع نطاق النموذج.
  • المشاريع التي تم توحيدها على إطار عمل TensorFlow، حيث يوجد التنفيذ الأصلي.

تعرف على المزيد حول EfficientDet

تحليل الأداء: YOLOv9 ضد EfficientDet

توضح مقارنة الأداء بين YOLOv9 و EfficientDet بوضوح التطورات التي تم إحرازها في الكشف عن الكائنات على مدى السنوات القليلة الماضية. تقدم YOLOv9 باستمرار مقايضة فائقة بين الدقة والسرعة وحجم النموذج.

النموذج الحجم
(بالبكسل)
mAPval
50-95
السرعة
وحدة المعالجة المركزية CPU ONNX
(بالمللي ثانية)
السرعة
T4 TensorRT
(مللي ثانية)
المعلمات
(M)
FLOPs
(B)
YOLOv9t 640 38.3 - 2.30 2.0 7.7
YOLOv9s 640 46.8 - 3.54 7.1 26.4
YOLOv9m 640 51.4 - 6.43 20.0 76.3
YOLOv9c 640 53.0 - 7.16 25.3 102.1
YOLOv9e 640 55.6 - 16.77 57.3 189.0
EfficientDet-d0 640 34.6 10.2 3.92 3.9 2.54
EfficientDet-d1 640 40.5 13.5 7.31 6.6 6.1
EfficientDet-d2 640 43.0 17.7 10.92 8.1 11.0
EfficientDet-d3 640 47.5 28.0 19.59 12.0 24.9
EfficientDet-d4 640 49.7 42.8 33.55 20.7 55.2
EfficientDet-d5 640 51.5 72.5 67.86 33.7 130.0
EfficientDet-d6 640 52.6 92.8 89.29 51.9 226.0
EfficientDet-d7 640 53.7 122.0 128.07 51.9 325.0

من الجدول، تظهر العديد من الرؤى الرئيسية:

  • الدقة مقابل الكفاءة: يحقق نموذج YOLOv9c 53.0 mAP مع 25.3 مليون معلمة فقط ووقت استدلال سريع للغاية يبلغ 7.16 مللي ثانية على وحدة معالجة الرسومات T4 GPU. في المقابل، يتطلب EfficientDet-d6 ذو الدقة المماثلة (52.6 mAP) أكثر من ضعف عدد المعلمات (51.9 مليون) وهو أبطأ بأكثر من 12 مرة عند 89.29 مللي ثانية.
  • أداء من الدرجة الأولى: يصل أكبر نموذج، YOLOv9e، إلى 55.6 mAP مثير للإعجاب، متجاوزًا حتى أكبر نموذج EfficientDet-d7 ‏(53.7 mAP) مع كونه أسرع بأكثر من 7 مرات ويتطلب عددًا أقل بكثير من FLOPs.
  • نماذج خفيفة الوزن: في الطرف الأصغر، يقدم YOLOv9s (46.8 mAP) دقة مماثلة لـ EfficientDet-d3 (47.5 mAP) ولكن مع ما يقرب من نصف المعلمات وأسرع بأكثر من 5 مرات على وحدة معالجة الرسوميات GPU.

الخلاصة: أي نموذج يجب أن تختاره؟

بالنسبة لجميع تطبيقات الكشف عن الكائنات الحديثة تقريبًا، يعد YOLOv9 هو الفائز الواضح. توفر بنيته المتقدمة دقة متطورة مع الحفاظ على سرعة استدلال استثنائية وكفاءة في المعلمات. إن التكامل في نظام Ultralytics البيئي يزيد من قيمته، مما يوفر سير عمل مبسطًا من التدريب إلى النشر، مدعومًا بوثائق قوية ومجتمع نشط.

تظل EfficientDet نموذجًا مهمًا من منظور تاريخي وأكاديمي، حيث أنها رائدة في مفاهيم قياس النموذج ودمج الميزات. ومع ذلك، بالنسبة للتطوير والنشر العملي، فقد طغت على أدائها بنى أحدث وأكثر كفاءة مثل YOLOv9. إذا كنت تبدأ مشروعًا جديدًا أو تتطلع إلى ترقية مشروع حالي، فإن اختيار YOLOv9 سيوفر أداءً فائقًا ودورات تطوير أسرع ودعمًا أفضل للتطورات المستقبلية.

استكشف نماذج أخرى

إذا كنت تستكشف نماذج أخرى حديثة، ففكر في إلقاء نظرة على مقارنات مع YOLOv10 و YOLOv8 وهياكل قائمة على المحولات مثل RT-DETR. يمكنك العثور على مزيد من التحليلات التفصيلية على صفحة مقارنة النماذج الخاصة بنا.



📅 تم إنشاؤه منذ سنة واحدة ✏️ تم التحديث منذ شهر واحد

تعليقات