EfficientDet ضد YOLO11: مقارنة فنية مفصلة
تقدم هذه الصفحة مقارنة فنية مفصلة بين EfficientDet من Google و Ultralytics YOLO11، وهما نموذجان بارزان في اكتشاف الكائنات. نحلل بنيتيهما ومعايير الأداء الخاصة بهما ومدى ملاءمتهما للتطبيقات المختلفة لمساعدتك في اختيار النموذج الأمثل لتلبية احتياجاتك في رؤية الكمبيوتر. في حين أن كلا النموذجين يهدف إلى اكتشاف الكائنات بكفاءة ودقة، إلا أنهما ينبعان من خطوط بحث مختلفة (Google و Ultralytics) ويستخدمان فلسفات معمارية متميزة.
EfficientDet
EfficientDet عبارة عن مجموعة من نماذج الكشف عن الكائنات التي طورها باحثون في Google Brain. تم تقديمه في عام 2019، وقد وضع معيارًا جديدًا للكفاءة من خلال الجمع بين عمود فقري قوي وآلية دمج ميزات جديدة وطريقة قياس فريدة.
تفاصيل فنية:
- المؤلفون: مينغشينغ تان، رومينغ بانغ، وكوك ف. لي
- المنظمة: Google
- التاريخ: 2019-11-20
- Arxiv: https://arxiv.org/abs/1911.09070
- GitHub: https://github.com/google/automl/tree/master/efficientdet
- المستندات: https://github.com/google/automl/tree/master/efficientdet#readme
البنية والميزات الرئيسية
تعتمد بنية EfficientDet على ثلاثة مكونات أساسية:
- EfficientNet Backbone: تستخدم EfficientNet عالية الكفاءة كـ عمود فقري لها لاستخراج الميزات.
- BiFPN (شبكة الهرم المميز ثنائية الاتجاه): شبكة هرم مميز مرجحة ومبتكرة تتيح دمج الميزات متعددة المقاييس ببساطة وسرعة. وهي تقدم أوزانًا قابلة للتعلم لفهم أهمية ميزات الإدخال المختلفة وتطبق اتصالات من أعلى إلى أسفل ومن أسفل إلى أعلى.
- التحجيم المركب: ابتكار رئيسي حيث يتم توسيع نطاق عمق النموذج وعرضه ودقته معًا باستخدام معامل مركب واحد. يتيح ذلك لعائلة النماذج (من D0 إلى D7) التوسع بكفاءة عبر مجموعة واسعة من قيود الموارد.
نقاط القوة
- كفاءة عالية: تشتهر نماذج EfficientDet بعدد المعلمات المنخفض و عمليات الفاصلة العائمة في الثانية (FLOPs)، وتحقيق دقة قوية لميزانيتها الحسابية.
- قابلية التوسع: توفر طريقة التحجيم المركب مسارًا واضحًا لتوسيع النموذج أو تقليصه، مما يجعله قابلاً للتكيف مع مختلف مواصفات الأجهزة، بدءًا من الأجهزة المحمولة ووصولاً إلى مراكز البيانات.
- معيار أكاديمي قوي: لقد كان نموذجًا حديثًا عند إصداره ولا يزال خط أساس قوي للبحث الذي يركز على الكفاءة.
نقاط الضعف
- استدلال أبطأ لوحدة معالجة الرسومات (GPU): على الرغم من كفاءة FLOP، يمكن أن يكون EfficientDet أبطأ من حيث زمن الوصول للاستدلال في العالم الحقيقي على وحدات معالجة الرسومات (GPU) مقارنة بنماذج مثل YOLO11، المصممة خصيصًا لأجهزة المعالجة المتوازية.
- تعددية المهام محدودة: EfficientDet هو في الأساس أداة لاكتشاف الكائنات. يفتقر إلى الدعم الأصلي للمهام الأخرى مثل تجزئة المثيلات أو تقدير الوضع أو التصنيف المدمج في أطر العمل الحديثة مثل Ultralytics.
- نظام بيئي أقل صيانة: المستودع الرسمي ليس قيد التطوير النشط مثل نظام Ultralytics البيئي. يمكن أن يؤدي ذلك إلى تحديات في سهولة الاستخدام ودعم المجتمع والتكامل مع أحدث الأدوات ومنصات النشر.
تعرف على المزيد حول EfficientDet
Ultralytics YOLO11
Ultralytics YOLO11 هو أحدث تطور في سلسلة YOLO (أنت تنظر مرة واحدة فقط)، التي طورتها Ultralytics. وهي تعتمد على نجاح سابقاتها مثل YOLOv8، مع التركيز على تجاوز حدود الدقة والأداء في الوقت الفعلي مع توفير سهولة استخدام وتنوع لا مثيل لهما.
تفاصيل فنية:
- المؤلفون: Glenn Jocher و Jing Qiu
- المنظمة: Ultralytics
- التاريخ: 2024-09-27
- GitHub: https://github.com/ultralytics/ultralytics
- المستندات: https://docs.ultralytics.com/models/yolo11/
البنية والميزات الرئيسية
يستخدم YOLO11 بنية كاشف خالي من المرساة أحادي المرحلة مُحسَّنة للسرعة والدقة. يتميز تصميمه بطبقات استخلاص ميزات مُحسَّنة وهيكل شبكة مبسط، مما يقلل من عدد المعلمات والحمل الحسابي دون التضحية بالدقة. يضمن هذا أداءً استثنائيًا عبر الأجهزة المتنوعة، من الأجهزة الطرفية مثل NVIDIA Jetson إلى الخوادم السحابية القوية.
تتمثل إحدى المزايا الهامة لـ YOLO11 في تكاملها داخل نظام Ultralytics البيئي الشامل. يوفر هذا للمطورين:
- سهولة الاستخدام: تعمل واجهة برمجة تطبيقات Python و CLI بسيطة وسهلة الاستخدام على جعل التدريب والتحقق والاستدلال أمرًا مباشرًا.
- تنوع الاستخدامات: YOLO11 هو نموذج متعدد المهام يدعم الكشف عن الكائنات، وتجزئة المثيلات، وتصنيف الصور، وتقدير الوضعية، ومربعات الإحاطة الموجهة (OBB) ضمن إطار عمل موحد واحد.
- نظام بيئي مُدار بشكل جيد: يستفيد النموذج من التطوير النشط ومجتمع مفتوح المصدر كبير وداعم وتحديثات متكررة وتكامل سلس مع أدوات مثل Ultralytics HUB لـ MLOps شامل.
- كفاءة التدريب والذاكرة: تم تصميم YOLO11 من أجل التدريب الفعال، وغالبًا ما يتطلب ذاكرة CUDA أقل ويتقارب بشكل أسرع من البدائل. يأتي مع أوزان مُدرَّبة مسبقًا متاحة بسهولة على مجموعات بيانات مثل COCO.
نقاط القوة
- أداء هو الأفضل على الإطلاق: يحقق توازنًا ممتازًا بين درجات mAP العالية وسرعات الاستدلال السريعة، خاصة على وحدات معالجة الرسوميات (GPUs).
- مرونة النشر: مُحسَّن لمجموعة واسعة من الأجهزة، مع سهولة التصدير إلى تنسيقات مثل ONNX و TensorRT لتحقيق أقصى أداء.
- إطار عمل سهل الاستخدام: مدعوم بوثائق شاملة، وبرامج تعليمية، ومجتمع قوي، مما يقلل من حاجز الدخول لكل من المبتدئين والخبراء.
- دعم المهام المتعددة: يمكن تدريب نموذج YOLO11 واحد لمهام رؤية مختلفة، مما يقلل من تعقيد ووقت التطوير.
نقاط الضعف
- المفاضلات في أداء وحدة المعالجة المركزية: على الرغم من أنها مُحسَّنة للغاية لوحدات معالجة الرسومات (GPUs)، إلا أن نماذج YOLO11 الأكبر يمكن أن تكون أبطأ في البيئات التي تعتمد على وحدة المعالجة المركزية (CPU) فقط مقارنةً بأصغر متغيرات EfficientDet.
- اكتشاف الأجسام الصغيرة: مثل الكاشفات الأخرى ذات المرحلة الواحدة، يمكن أن تواجه في بعض الأحيان تحديًا في اكتشاف الأجسام الصغيرة جدًا أو المحجوبة بشدة في المشاهد المزدحمة، على الرغم من التحسينات المستمرة التي يتم إجراؤها مع كل إصدار.
الأداء والمعايير
تسلط مقارنة الأداء على مجموعة بيانات COCO val2017 الضوء على فلسفات التصميم المختلفة لـ EfficientDet و YOLO11. تتفوق EfficientDet في الكفاءة النظرية (mAP لكل معلمة/FLOP)، خاصة مع نماذجها الأصغر. ومع ذلك، عندما يتعلق الأمر بالنشر العملي، خاصة على وحدات معالجة الرسوميات (GPUs)، تُظهر YOLO11 ميزة واضحة في سرعة الاستدلال.
على سبيل المثال، يحقق YOLO11s خريطة متوسطة للدقة مماثلة (47.0) لـ EfficientDet-d3 (47.5) ولكن مع سرعة استدلال أسرع بشكل مذهل 2.9x على وحدة معالجة الرسوميات T4. يتفوق أكبر نموذج، YOLO11x، على جميع نماذج EfficientDet في الدقة (54.7 خريطة متوسطة للدقة) مع بقائه أسرع بشكل ملحوظ على وحدة معالجة الرسوميات من حتى نماذج EfficientDet متوسطة الحجم. هذا يجعل YOLO11 الخيار الأفضل للتطبيقات التي يكون فيها الاستدلال في الوقت الفعلي أمرًا بالغ الأهمية.
النموذج | الحجم (بالبكسل) |
mAPval 50-95 |
السرعة وحدة المعالجة المركزية CPU ONNX (بالمللي ثانية) |
السرعة T4 TensorRT10 (بالمللي ثانية) |
المعلمات (M) |
FLOPs (B) |
---|---|---|---|---|---|---|
EfficientDet-d0 | 640 | 34.6 | 10.2 | 3.92 | 3.9 | 2.54 |
EfficientDet-d1 | 640 | 40.5 | 13.5 | 7.31 | 6.6 | 6.1 |
EfficientDet-d2 | 640 | 43.0 | 17.7 | 10.92 | 8.1 | 11.0 |
EfficientDet-d3 | 640 | 47.5 | 28.0 | 19.59 | 12.0 | 24.9 |
EfficientDet-d4 | 640 | 49.7 | 42.8 | 33.55 | 20.7 | 55.2 |
EfficientDet-d5 | 640 | 51.5 | 72.5 | 67.86 | 33.7 | 130.0 |
EfficientDet-d6 | 640 | 52.6 | 92.8 | 89.29 | 51.9 | 226.0 |
EfficientDet-d7 | 640 | 53.7 | 122.0 | 128.07 | 51.9 | 325.0 |
YOLO11n | 640 | 39.5 | 56.1 | 1.5 | 2.6 | 6.5 |
YOLO11s | 640 | 47.0 | 90.0 | 2.5 | 9.4 | 21.5 |
YOLO11m | 640 | 51.5 | 183.2 | 4.7 | 20.1 | 68.0 |
YOLO11l | 640 | 53.4 | 238.6 | 6.2 | 25.3 | 86.9 |
YOLO11x | 640 | 54.7 | 462.8 | 11.3 | 56.9 | 194.9 |
حالات الاستخدام المثالية
EfficientDet
تعتبر EfficientDet هي الأنسب للسيناريوهات التي تكون فيها الموارد الحسابية هي العائق الأساسي ويكون تحسين GPU أقل أهمية.
- البحث الأكاديمي: ممتاز للدراسات التي تركز على كفاءة النموذج وتصميم الهندسة المعمارية.
- التطبيقات المعتمدة على وحدة المعالجة المركزية (CPU): يمكن للمتغيرات الأصغر (D0-D2) أن تعمل بشكل جيد في البيئات التي لا تحتوي على وحدات معالجة رسوميات (GPU) مخصصة.
- النشر السحابي الحساس للتكلفة: حيث يرتبط الفوترة مباشرةً بعمليات الفاصلة العائمة في الثانية (FLOPs) أو استخدام وحدة المعالجة المركزية.
YOLO11
يتفوق YOLO11 في مجموعة واسعة من التطبيقات الواقعية التي تتطلب دقة وسرعة وكفاءة تطوير عالية.
- الأنظمة الذاتية: تشغيل الروبوتات و السيارات ذاتية القيادة من خلال الإدراك بزمن انتقال منخفض.
- الأمن والمراقبة: تمكين المراقبة في الوقت الفعلي لـ أنظمة الأمان والسلامة العامة.
- الأتمتة الصناعية: تستخدم في مراقبة الجودة عالية السرعة واكتشاف العيوب على خطوط الإنتاج.
- تحليلات البيع بالتجزئة: قيادة تطبيقات مثل إدارة المخزون وتحليل سلوك العملاء.
الخلاصة
EfficientDet عبارة عن بنية بارزة دفعت حدود كفاءة النموذج. يظل تصميمه القابل للتطوير مساهمة قيمة في هذا المجال، خاصة للبيئات محدودة الموارد.
ومع ذلك، بالنسبة للمطورين والباحثين الذين يبحثون عن حل حديث ومتعدد الاستخدامات وسهل الاستخدام، تعد Ultralytics YOLO11 الخيار الواضح. إنها توفر مزيجًا فائقًا من الدقة والسرعة في العالم الحقيقي، خاصةً على الأجهزة الحديثة. لا تكمن المزايا الرئيسية لـ YOLO11 في أدائها فحسب، بل في النظام البيئي القوي الذي يحيط بها. تعمل واجهة برمجة التطبيقات (API) المبسطة والوثائق الشاملة وقدرات المهام المتعددة ودعم المجتمع النشط على تسريع دورة حياة التطوير والنشر بشكل كبير، مما يجعلها الخيار الأكثر عملية وقوة لمجموعة واسعة من تحديات رؤية الكمبيوتر اليوم.
استكشف نماذج أخرى
للمزيد من الاستكشاف، ضع في اعتبارك هذه المقارنات مع النماذج الأخرى الحديثة: