تخطي إلى المحتوى

EfficientDet ضد YOLOv9: مقارنة فنية

يُعد اختيار نموذج الكشف عن الكائنات الأمثل أمرًا بالغ الأهمية لمهام الرؤية الحاسوبية، حيث يوازن بين الدقة والسرعة والموارد الحسابية. تقدم هذه الصفحة مقارنة فنية مفصلة بين EfficientDet من Google و Ultralytics YOLOv9، وهما نموذجان مهمان في مجال الكشف عن الكائنات. سوف نتعمق في تصميماتهما المعمارية ومعايير الأداء والتطبيقات المناسبة لمساعدتك في اتخاذ قرار مستنير لمشاريعك.

EfficientDet: بنية قابلة للتطوير وفعالة

تم تقديم EfficientDet في عام 2019 بواسطة باحثين في Google Research وسرعان ما أصبح معيارًا للكشف الفعال عن الكائنات. لقد اقترح مجموعة من النماذج التي يمكن أن تتوسع من الإصدارات خفيفة الوزن والمتوافقة مع الحافة إلى الإصدارات عالية الدقة والقائمة على السحابة باستخدام طريقة توسيع مركبة منهجية.

البنية والميزات الرئيسية

تعتمد بنية EfficientDet على ثلاثة مكونات رئيسية:

  • EfficientNet Backbone: تستخدم EfficientNet عالية الكفاءة كعمود فقري لها لاستخراج الميزات، والتي صُممت باستخدام البحث عن البنية العصبية (NAS) لتحسين كل من الدقة وعمليات الفاصلة العائمة في الثانية (FLOPs).
  • BiFPN (شبكة الهرم المميز ثنائية الاتجاه): بدلاً من شبكة FPN التقليدية، يستخدم EfficientDet شبكة BiFPN، التي تتيح دمج ميزات متعددة المقاييس أكثر ثراءً مع اتصالات مرجحة، مما يحسن الدقة بأقل قدر من الحمل الحسابي الزائد.
  • التحجيم المركب: طريقة جديدة تعمل على توسيع نطاق العمق والعرض والدقة للعمود الفقري وشبكة الميزات ورأس الاكتشاف بشكل موحد. يتيح ذلك إنشاء عائلة من النماذج (D0 إلى D7) التي تلبي قيود الموارد المختلفة.

نقاط القوة

  • قابلية التوسع: تتمثل القوة الأساسية لـ EfficientDet في عائلة النماذج الخاصة بها، والتي توفر مجموعة واسعة من الخيارات لأهداف النشر المختلفة، بدءًا من الأجهزة المحمولة ووصولاً إلى مراكز البيانات.
  • كفاءة رائدة: في وقت إصداره، وضع معيارًا جديدًا للكفاءة، حيث حقق دقة عالية مع عدد أقل من المعلمات وعمليات الفاصلة العائمة في الثانية (FLOPs) مقارنةً بالنماذج المنافسة.

نقاط الضعف

  • العمر والأداء: على الرغم من أن البنية تأسيسية، إلا أنها تعود إلى عام 2019. تفوقت عليها النماذج الأحدث مثل YOLOv9 في كل من السرعة والدقة، خاصة على الأجهزة الحديثة مثل وحدات معالجة الرسوميات GPUs.
  • سرعة الاستدلال: يمكن أن تكون نماذج EfficientDet الأكبر حجمًا بطيئة، خاصة عند مقارنتها بسرعات الاستدلال المحسّنة للغاية لنماذج YOLO.
  • تحديد المهمة: تم تصميم EfficientDet بشكل خالص لاكتشاف الأجسام، ويفتقر إلى المرونة المدمجة للمهام الأخرى مثل تجزئة المثيلات أو تقدير الوضع الموجودة في الأطر الحديثة.
  • النظام البيئي: يركز المستودع الرسمي بشكل أقل على تجربة المستخدم ولا يتم صيانته أو دعمه بنشاط مثل النظام البيئي الشامل لـ Ultralytics.

حالات الاستخدام

لا يزال EfficientDet خيارًا قابلاً للتطبيق لما يلي:

  • التطبيقات التي يكون فيها نقطة المقايضة المحددة التي تقدمها إحدى المتغيرات المتدرجة (D0-D7) مناسبة تمامًا.
  • المشاريع التي تتطلب النشر على وحدات المعالجة المركزية CPUs، حيث تُظهر النماذج الأصغر أداءً تنافسيًا.
  • الأنظمة القديمة التي تم فيها دمج النموذج بالفعل ويؤدي أداءً كافيًا.

تعرف على المزيد حول EfficientDet

YOLOv9: أحدث ما توصلت إليه التكنولوجيا في الدقة والكفاءة

يمثل Ultralytics YOLOv9، الذي تم تقديمه في عام 2024 بواسطة Chien-Yao Wang و Hong-Yuan Mark Liao، تقدمًا كبيرًا في اكتشاف الكائنات في الوقت الفعلي. يعالج تحدي فقدان المعلومات في الشبكات العميقة من خلال عناصر معمارية مبتكرة، ويضع معايير جديدة لأحدث التقنيات.

البنية والميزات الرئيسية

ينبع الأداء الفائق لـ YOLOv9 من ابتكارين رئيسيين:

  • معلومات التدرج القابلة للبرمجة (PGI): تم تصميم هذا المفهوم لمعالجة مشكلة عنق الزجاجة المعلوماتي في الشبكات العصبية العميقة. يولد PGI تدرجات موثوقة لضمان قدرة النموذج على تعلم معلومات كاملة، مما يؤدي إلى تمثيلات ميزات أكثر دقة.
  • شبكة تجميع الطبقات الفعالة المعممة (GELAN): يقدم YOLOv9 شبكة GELAN، وهي بنية جديدة وعالية الكفاءة تعتمد على مبادئ CSPNet و ELAN. إنها تعمل على تحسين استخدام المعلمات والكفاءة الحسابية، مما يسمح للنموذج بتحقيق دقة أعلى بموارد أقل.

نقاط القوة

  • دقة هي الأحدث على مستوى التقنية: تحقق YOLOv9 دقة فائقة في اكتشاف الكائنات، متفوقةً على منافسين مثل EfficientDet بأعداد معلمات مماثلة أو أقل، كما هو مفصل في ورقتها "YOLOv9: تعلم ما تريد أن تتعلمه باستخدام معلومات التدرج القابلة للبرمجة".
  • توازن أداء استثنائي: يوفر حلاً وسطًا رائعًا بين الدقة وسرعة الاستدلال وحجم النموذج، مما يجعله مناسبًا لمجموعة واسعة من التطبيقات من الذكاء الاصطناعي الطرفي إلى خوادم السحابة عالية الأداء.
  • سهولة الاستخدام: عند استخدام YOLOv9 داخل إطار عمل Ultralytics، فإنه يستفيد من تجربة مستخدم مبسطة و واجهة برمجة تطبيقات Python بسيطة و وثائق شاملة.
  • نظام بيئي مُدار بشكل جيد: يوفر نظام Ultralytics البيئي تطويرًا نشطًا ومجتمعًا كبيرًا وداعمًا وتحديثات متكررة وتكاملاً مع أدوات مثل Ultralytics HUB للتدريب بدون تعليمات برمجية و MLOps.
  • كفاءة التدريب: عادةً ما يكون لنماذج YOLO متطلبات ذاكرة أقل أثناء التدريب مقارنة بالبنى الأخرى. يوفر الإطار عمليات تدريب فعالة وأوزان مُدرَّبة مسبقًا متاحة بسهولة.
  • تنوع الاستخدامات: في حين أن الورقة الأصلية تركز على الكشف، إلا أن بنية GELAN الأساسية متعددة الاستخدامات. يلمح المستودع الأصلي إلى دعم مهام مثل تجزئة المثيلات والتجزئة الشاملة، بما يتماشى مع إمكانات المهام المتعددة لنماذج Ultralytics الأخرى مثل YOLOv8.

نقاط الضعف

  • الجدة: كنموذج أحدث، قد تكون أمثلة النشر الواقعية أقل عددًا من النماذج القديمة والراسخة مثل EfficientDet، على الرغم من أن التبني داخل مجتمع Ultralytics سريع.
  • موارد التدريب: على الرغم من الكفاءة الحسابية لمستوى أدائه، إلا أن تدريب أكبر متغيرات YOLOv9 (مثل YOLOv9-E) لا يزال يتطلب موارد حسابية كبيرة.

حالات الاستخدام

يعد YOLOv9 مناسبًا بشكل خاص للتطبيقات التي تكون فيها الدقة والكفاءة أمرًا بالغ الأهمية، مثل:

تعرف على المزيد حول YOLOv9

تحليل الأداء: YOLOv9 ضد EfficientDet

يقدم الجدول التالي مقارنة مباشرة لمقاييس الأداء لأحجام النماذج المختلفة لـ EfficientDet و YOLOv9، والتي تم قياسها على مجموعة بيانات COCO.

النموذج الحجم
(بالبكسل)
mAPval
50-95
السرعة
وحدة المعالجة المركزية CPU ONNX
(بالمللي ثانية)
السرعة
T4 TensorRT10
(بالمللي ثانية)
المعلمات
(M)
FLOPs
(B)
EfficientDet-d0 640 34.6 10.2 3.92 3.9 2.54
EfficientDet-d1 640 40.5 13.5 7.31 6.6 6.1
EfficientDet-d2 640 43.0 17.7 10.92 8.1 11.0
EfficientDet-d3 640 47.5 28.0 19.59 12.0 24.9
EfficientDet-d4 640 49.7 42.8 33.55 20.7 55.2
EfficientDet-d5 640 51.5 72.5 67.86 33.7 130.0
EfficientDet-d6 640 52.6 92.8 89.29 51.9 226.0
EfficientDet-d7 640 53.7 122.0 128.07 51.9 325.0
YOLOv9t 640 38.3 - 2.3 2.0 7.7
YOLOv9s 640 46.8 - 3.54 7.1 26.4
YOLOv9m 640 51.4 - 6.43 20.0 76.3
YOLOv9c 640 53.0 - 7.16 25.3 102.1
YOLOv9e 640 55.6 - 16.77 57.3 189.0

من البيانات، تظهر العديد من الرؤى الرئيسية:

  • الدقة والكفاءة: يوفر YOLOv9 باستمرار مقايضة أفضل. على سبيل المثال، يحقق YOLOv9-C قيمة mAP أعلى (53.0) من EfficientDet-D6 (52.6) مع ما يقرب من نصف عدد المعلمات وعمليات الفاصلة العائمة في الثانية (FLOPs).
  • سرعة الاستدلال: على وحدة معالجة رسوميات (GPU) حديثة مع تحسين TensorRT، تكون نماذج YOLOv9 أسرع بشكل ملحوظ. YOLOv9-E أسرع بأكثر من 7 مرات من EfficientDet-D7 مع كونه أكثر دقة أيضًا. حتى أصغر نموذج YOLOv9t أسرع بكثير من أصغر EfficientDet-d0.
  • استخدام الموارد: نماذج YOLOv9 أكثر كفاءة في استخدام المعلمات. يتفوق YOLOv9-S (7.1 مليون معلمة) على دقة EfficientDet-D3 (12.0 مليون معلمة). هذه الكفاءة ضرورية للنشر على الأجهزة ذات الموارد المحدودة.

الخلاصة والتوصيات

في حين أن EfficientDet كان نموذجًا رائدًا دفع حدود الكفاءة، فقد تقدم مجال رؤية الكمبيوتر بسرعة. بالنسبة للمشاريع الجديدة التي تبدأ اليوم، يعد YOLOv9 هو الخيار الواضح. فهو يوفر دقة متطورة وسرعة استدلال فائقة على الأجهزة الحديثة وكفاءة حسابية أكبر.

إن دمج YOLOv9 في نظام Ultralytics يعزز ميزته، مما يمنح المطورين إطار عمل سهل الاستخدام ومدعوم جيدًا ومتعدد الاستخدامات يسرع سير العمل بأكمله من التدريب إلى النشر. يظل EfficientDet نموذجًا مهمًا تاريخيًا وقد يكون مناسبًا للحفاظ على الأنظمة القديمة، ولكن بالنسبة للتطبيقات الجديدة عالية الأداء، يوفر YOLOv9 ميزة حاسمة.

استكشف نماذج أخرى

إذا كنت تستكشف نماذج حديثة مختلفة، فتأكد من إطلاعك على صفحات المقارنة الأخرى الخاصة بنا:



📅 تم إنشاؤه منذ سنة واحدة ✏️ تم التحديث منذ شهر واحد

تعليقات