EfficientDet مقابل YOLO11: مقارنة تقنية شاملة
يعد اختيار بنية الشبكة العصبية المثلى أساسًا لأي تطبيق ناجح للرؤية الحاسوبية. يقدم هذا الدليل الشامل مقارنة تقنية متعمقة بين EfficientDet Google و Ultralytics YOLO11، ويحلل الاختلافات في البنية ومقاييس الأداء وسيناريوهات النشر المثالية.
سواء كنت تستهدف زمن انتقال يبلغ أجزاء من الألف من الثانية على أجهزة الذكاء الاصطناعي المتطورة أو تحتاج إلى دقة قابلة للتطوير للاستدلال القائم على السحابة، فإن فهم الفروق الدقيقة بين هذه النماذج أمر بالغ الأهمية.
ملفات تعريف النماذج والتفاصيل الفنية
فهم نسب كل بنية وفلسفة التصميم الكامنة وراءها يساعد على وضع أدائها في سياق مهام الكشف عن الأشياء في العالم الحقيقي.
EfficientDet
طور باحثو Google برنامج EfficientDet الذي قدم نهجًا مبدئيًا لتوسيع نطاق شبكات الكشف عن الكائنات إلى جانب شبكة BiFPN (شبكة هرمية ثنائية الاتجاه) الجديدة.
- المؤلفون: مينغشينغ تان، رومينغ بانغ، وكوك ف. لي
- المؤسسة:Google
- التاريخ: 2019-11-20
- أرشيف:https://arxiv.org/abs/1911.09070
- GitHub:https://github.com/google/automl/tree/master/efficientdet
- الوثائق:https://github.com/google/automl/tree/master/efficientdet#readme
تعرف على المزيد حول EfficientDet
YOLO11
YOLO11 تطوراً مهماً في Ultralytics حيث يوسع حدود الأداء في الوقت الفعلي وكفاءة المعلمات والتعلم متعدد المهام.
- المؤلفون: غلين جوشر وجينغ تشيو
- المؤسسة:Ultralytics
- التاريخ: 2024-09-27
- GitHub:https://github.com/ultralytics/ultralytics
- الوثائق:https://docs.ultralytics.com/models/yolo11/
مقارنة معمارية
تسلط الاختلافات المعمارية بين هذين النموذجين الضوء على الاختلافات في استراتيجيات التصميم على مر السنين.
يستفيد EfficientDet من العمود الفقري EfficientNet ويقدم BiFPN، الذي يسمح بدمج الميزات متعددة المستويات من أعلى إلى أسفل ومن أسفل إلى أعلى. ويستخدم طريقة تحجيم مركبة تقوم بتحجيم الدقة والعمق والعرض بشكل موحد لجميع شبكات العمود الفقري وشبكات الميزات وشبكات التنبؤ بالصندوق/الفئة في وقت واحد. على الرغم من فعاليته العالية في تعظيم متوسط الدقة (mAP)، إلا أن التوجيه المعقد في BiFPN قد يؤدي في بعض الأحيان إلى اختناق عرض النطاق الترددي للذاكرة أثناء الاستدلال.
من ناحية أخرى، يستخدم YOLO11 وحدة C2f محسّنة ورأس كشف متطور بدون مرساة. يقلل هذا النهج المبسط من النفقات العامة أثناء استخراج الميزات. Ultralytics YOLO11 استخدام GPU مما أدى إلى انخفاض متطلبات الذاكرة بشكل كبير أثناء التدريب والاستدلال مقارنة بالبنى القديمة أو نماذج المحولات الثقيلة.
تعدد المهام وتعدد الاستخدامات
في حين أن EfficientDet هو مجرد كاشف للأجسام، YOLO11 بتنوعه الشديد. تدعم YOLO11 الواحدة بشكل أساسي تقسيم المثيلات وتصنيف الصور وتقدير الوضع ومربعات الحدود الموجهة (OBB).
معايير الأداء
يُقارن الجدول أدناه أداء كلتا العائلتين النموذجيتين عبر مختلف المقاييس على COCO .
| النموذج | الحجم (بالبكسل) | mAPval 50-95 | السرعة وحدة المعالجة المركزية CPU ONNX (بالمللي ثانية) | السرعة T4 TensorRT10 (بالمللي ثانية) | المعلمات (M) | FLOPs (B) |
|---|---|---|---|---|---|---|
| EfficientDet-d0 | 640 | 34.6 | 10.2 | 3.92 | 3.9 | 2.54 |
| EfficientDet-d1 | 640 | 40.5 | 13.5 | 7.31 | 6.6 | 6.1 |
| EfficientDet-d2 | 640 | 43.0 | 17.7 | 10.92 | 8.1 | 11.0 |
| EfficientDet-d3 | 640 | 47.5 | 28.0 | 19.59 | 12.0 | 24.9 |
| EfficientDet-d4 | 640 | 49.7 | 42.8 | 33.55 | 20.7 | 55.2 |
| EfficientDet-d5 | 640 | 51.5 | 72.5 | 67.86 | 33.7 | 130.0 |
| EfficientDet-d6 | 640 | 52.6 | 92.8 | 89.29 | 51.9 | 226.0 |
| EfficientDet-d7 | 640 | 53.7 | 122.0 | 128.07 | 51.9 | 325.0 |
| YOLO11n | 640 | 39.5 | 56.1 | 1.5 | 2.6 | 6.5 |
| YOLO11s | 640 | 47.0 | 90.0 | 2.5 | 9.4 | 21.5 |
| YOLO11m | 640 | 51.5 | 183.2 | 4.7 | 20.1 | 68.0 |
| YOLO11l | 640 | 53.4 | 238.6 | 6.2 | 25.3 | 86.9 |
| YOLO11x | 640 | 54.7 | 462.8 | 11.3 | 56.9 | 194.9 |
تحليل متوازن: نقاط القوة والضعف
تسريع GPU: يتفوق YOLO11 في بيئات GPU. على سبيل المثال، يقدم YOLO11m نسبة mAP تبلغ 51.5% بسرعة فائقة تبلغ 4.7 مللي ثانية على وحدة T4 GPU باستخدام TensorRT. لتحقيق دقة مماثلة، يستغرق EfficientDet-d5 67.86 مللي ثانية — أي أبطأ بأكثر من 14 مرة. وهذا يسلط الضوء على التوازن الفائق في أداء نماذج Ultralytics لتطبيقات الوقت الفعلي.
بيئات CPU: يُظهر EfficientDet سرعات استدلال CPU محسّنة للغاية في متغيراته الأصغر (مثل d0 و d1) باستخدام ONNX. ومع ذلك، تتدهور دقته بشكل كبير دون تكبد عقوبات زمن استجابة ضخمة لوحدة معالجة الرسوميات (GPU) في المتغيرات الأكبر مثل d7.
منهجية التدريب والنظام البيئي
غالبًا ما تكون تجربة المطورين مهمة بقدر أهمية القدرات النظرية للنموذج. وهنا يبرز Ultralytics .
يعتمد EfficientDet بشكل كبير على الإرث TensorFlow ومكتبات AutoML المعقدة. يتطلب إعداد خط أنابيب تدريب مخصص منحنيات تعلم حادة وإدارة تعقيدات التبعية وتكوين المراسي ووظائف الخسارة يدويًا.
على النقيض، توفر Ultralytics سهولة استخدام لا مثيل لها. بدعم من نظام PyTorch البيئي المُصان جيدًا، يتطلب تدريب نموذج YOLO بضعة أسطر فقط من التعليمات البرمجية. يدير الإطار تلقائيًا ضبط المعلمات الفائقة، وتحسينات البيانات المتقدمة، وجدولة معدل التعلم الأمثل بشكل جاهز.
مثال على الكود: البدء في استخدام Ultralytics
يوضح هذا المقتطف القوي والجاهز للإنتاج مدى سهولة التدريب والاستدلال في Python .
from ultralytics import YOLO
# Load a pre-trained YOLO11 small model
model = YOLO("yolo11s.pt")
# Train the model on your custom dataset with automated hyperparameter tuning
train_results = model.train(data="coco8.yaml", epochs=50, imgsz=640, device=0)
# Perform fast inference on an image
results = model.predict("https://ultralytics.com/images/bus.jpg")
results[0].show()
حالات الاستخدام المثالية
متى تستخدم EfficientDet: يظل EfficientDet خيارًا قابلاً للتطبيق لبيئات البحث المتجذرة بعمق في مسارات TensorFlow أو قيود CPU المحددة حيث تعمل البنى المبكرة مثل d0 بشكل مناسب.
متى تستخدم YOLO11: يُعد YOLO11 الخيار الأمثل لعمليات النشر الحديثة في المؤسسات. فسرعته الاستثنائية تجعله مثاليًا لـ المركبات ذاتية القيادة، وتحليلات الرياضة في الوقت الفعلي، واكتشاف عيوب التصنيع عالية الإنتاجية. علاوة على ذلك، يتيح استهلاكه المنخفض للذاكرة نشرًا مرنًا على الأجهزة محدودة الموارد مثل NVIDIA Jetson.
التطلع إلى المستقبل: ترقية YOLO26
على الرغم من أن YOLO11 بقدرات استثنائية، إلا أن المطورين الذين يبدؤون مشاريع جديدة يجب أن يقيّموا Ultralytics الأخرى مثل YOLOv8 أو YOLO26 التي تم إصدارها مؤخرًا. تم إصدار YOLO26 في أوائل عام 2026، وهي تستند إلى أساس YOLO11 قدم العديد من الابتكارات الثورية:
- تصميم خالٍ من NMS وشامل: استنادًا إلى إرث YOLOv10، يلغي YOLO26 قمع غير الحد الأقصى (NMS) بالكامل أثناء المعالجة اللاحقة، مما يقلل زمن الانتقال بشكل كبير ويبسط مسارات النشر.
- مُحسِّن MuSGD: مُحسِّن هجين يمزج SGD القياسي مع Muon (مستوحى من تدريب نماذج اللغة الكبيرة)، مما يحسن استقرار التدريب بشكل كبير.
- استدلال أسرع على CPU بنسبة تصل إلى 43%: تجعله التحسينات المحددة لـ YOLO26 قويًا بشكل لا يصدق على الأجهزة الطرفية التي تفتقر إلى وحدات GPU المنفصلة.
- ProgLoss + STAL: دوال خسارة متقدمة تحسن بشكل ملحوظ detect الأجسام الصغيرة، وهو أمر بالغ الأهمية للصور الجوية والروبوتات.
استكشف المشهد الأوسع لنظم الرؤية، بما في ذلك أجهزة الكشف القائمة على المحولات مثل RT-DETR، في Ultralytics الشاملة.