YOLO11 EfficientDet: مقارنة تقنية بين هياكل الرؤية
في مجال الرؤية الحاسوبية سريع التطور، يعد اختيار نموذج الكشف عن الأجسام المناسب أمراً بالغ الأهمية لنجاح المشروع. تستكشف هذه المقارنة الاختلافات التقنية بين Ultralytics YOLO11، وهو كاشف متطور يعمل في الوقت الفعلي تم إصداره في أواخر عام 2024، و Google ، وهي بنية مؤثرة للغاية من عام 2019 أدخلت التوسع المركب إلى هذا المجال.
بينما وضع EfficientDet معايير مرجعية لكفاءة المعلمات عند إصداره، YOLO11 سنوات من الابتكار اللاحق، مع التركيز على تعظيم سرعة الاستدلال والدقة وسهولة الاستخدام لتطبيقات الذكاء الاصطناعي الحديثة وتطبيقات السحابة.
طراز أحدث متوفر
في حين أن YOLO11 نموذج قوي، فإن Ultralytics (الذي تم إصداره في يناير 2026) هو الآن الخيار الموصى به والأكثر تطوراً للمشاريع الجديدة. يوفر YOLO26 تصميمًا شاملاً NMS واستنتاجًا أسرع، ودقة محسنة.
مقاييس الأداء والتحليل
يعرض الجدول التالي مقارنة مباشرة لمقاييس الأداء على COCO . تشمل المقاييس الرئيسية متوسط الدقة (mAP) للدقة، وسرعة الاستدلال (الكمون) على أجهزة مختلفة، وحجم النموذج (المعلمات)، والتعقيد الحسابي (FLOPs).
| النموذج | الحجم (بالبكسل) | mAPval 50-95 | السرعة وحدة المعالجة المركزية CPU ONNX (بالمللي ثانية) | السرعة T4 TensorRT10 (بالمللي ثانية) | المعلمات (M) | FLOPs (B) |
|---|---|---|---|---|---|---|
| YOLO11n | 640 | 39.5 | 56.1 | 1.5 | 2.6 | 6.5 |
| YOLO11s | 640 | 47.0 | 90.0 | 2.5 | 9.4 | 21.5 |
| YOLO11m | 640 | 51.5 | 183.2 | 4.7 | 20.1 | 68.0 |
| YOLO11l | 640 | 53.4 | 238.6 | 6.2 | 25.3 | 86.9 |
| YOLO11x | 640 | 54.7 | 462.8 | 11.3 | 56.9 | 194.9 |
| EfficientDet-d0 | 640 | 34.6 | 10.2 | 3.92 | 3.9 | 2.54 |
| EfficientDet-d1 | 640 | 40.5 | 13.5 | 7.31 | 6.6 | 6.1 |
| EfficientDet-d2 | 640 | 43.0 | 17.7 | 10.92 | 8.1 | 11.0 |
| EfficientDet-d3 | 640 | 47.5 | 28.0 | 19.59 | 12.0 | 24.9 |
| EfficientDet-d4 | 640 | 49.7 | 42.8 | 33.55 | 20.7 | 55.2 |
| EfficientDet-d5 | 640 | 51.5 | 72.5 | 67.86 | 33.7 | 130.0 |
| EfficientDet-d6 | 640 | 52.6 | 92.8 | 89.29 | 51.9 | 226.0 |
| EfficientDet-d7 | 640 | 53.7 | 122.0 | 128.07 | 51.9 | 325.0 |
النقاط الرئيسية
- زمن الاستدلال: يتفوق Ultralytics YOLO11 على EfficientDet في زمن الاستدلال. على سبيل المثال، يحقق YOLO11x دقة أعلى (54.7 mAP) من EfficientDet-d7 (53.7 mAP) مع تشغيل أسرع بأكثر من 10 مرات على GPU T4 GPU 11.3 مللي ثانية مقابل 128.07 مللي ثانية).
- كفاءة الهندسة المعمارية: بينما يعمل EfficientDet على تحسين FLOPs (عمليات النقطة العائمة)، YOLO11 تحسين YOLO11 لاستخدام الأجهزة. وهذا يسلط الضوء على فرق مهم في مقاييس أداء الذكاء الاصطناعي: لا تعني FLOPs الأقل دائمًا استنتاجًا أسرع في العالم الواقعي بسبب تكاليف الوصول إلى الذاكرة وقيود التوازي.
- قابلية التوسع في النموذج: YOLO11 منحنى توسع أكثر عملية. يوفر النموذج "nano" (YOLO11n) 39.5 mAP قابل للاستخدام mAP في حين أن أصغر نموذج EfficientDet-d0 يتخلف عن الركب عند 34.6 mAP.
Ultralytics YOLO11: البنية والميزات
YOLO11 Ultralytics YOLO11 على إرث عائلة YOLO You Only Look Once)، حيث يعمل على تحسين البنية الهندسية لتتناسب مع العصر الحديث للرؤية الحاسوبية. ويقدم تغييرات مهمة في العمود الفقري والرقبة لتعزيز استخراج الميزات وسرعة المعالجة.
تشمل التحسينات المعمارية البارزة كتلة C3k2، وهي نسخة محسنة من عنق الزجاجة Cross Stage Partial (CSP) المستخدم في الإصدارات السابقة، ووحدة C2PSA (Cross Stage Partial Spatial Attention). تسمح هذه المكونات للنموذج بالتقاط الأنماط المعقدة والسياق في الصور باستخدام معلمات أقل.
- المؤلفون: غلين جوشر وجينغ تشيو
- المؤسسة:Ultralytics
- التاريخ: 2024-09-27
- GitHub:ultralytics/ultralytics
- المستندات:توثيق YOLO11
نقاط القوة في YOLO11
- نظام بيئي موحد: YOLO11 مجرد نموذج للكشف؛ فهو يدعم تقسيم الحالات وتقدير الوضع و OBB والتصنيف بشكل فوري.
- الاستعداد للنشر: بفضل وضع التصدير المدمج، يمكن للمستخدمين تحويل النماذج إلى ONNX و TensorRT و CoreML و TFLite مما يضمن النشر السلس على الأجهزة المحمولة والأجهزة الطرفية.
- كفاءة التدريب: YOLO11 بشكل أسرع بكثير من البنى القديمة مثل EfficientDet، وذلك باستخدام خطوط أنابيب تعزيز حديثة ووظائف خسارة محسّنة.
Google : الهندسة المعمارية والإرث
قدمت EfficientDet، التي طورها فريق Google ، مفهوم Compound Scaling إلى اكتشاف الكائنات. بدلاً من تصميم نماذج أكبر يدويًا، اقترح المؤلفون طريقة لتوسيع نطاق الدقة والعمق والعرض للشبكة في وقت واحد.
جوهر EfficientDet هو BiFPN (شبكة هرمية ثنائية الاتجاه للميزات)، والتي تسمح بدمج الميزات متعددة المقاييس بسهولة. وهي تستخدم هيكل EfficientNet، الذي تم تصميمه أيضًا باستخدام البحث عن البنية العصبية (NAS).
- المؤلفون: مينغشينغ تان، رومينغ بانغ، وكوك ف. لي
- المنظمة: Google
- التاريخ: 2019-11-20
- Arxiv:1911.09070
- GitHub:google/automl
نقاط القوة والقيود
- كفاءة المعلمات: يشتهر EfficientDet تاريخياً بتحقيق دقة عالية باستخدام عدد قليل جداً من المعلمات.
- الكفاءة النظرية: على الرغم من انخفاض معدل FLOPs، إلا أن الاتصالات المعقدة في طبقة BiFPN يمكن أن تستهلك الكثير من الذاكرة وتكون أبطأ في التنفيذ على وحدات معالجة الرسومات (GPU) مقارنة بالمسارات التلافيفية المباشرة في YOLO.
- تعدد الاستخدامات المحدود: يركز المستودع الأصلي بشكل أساسي على الكشف، ويفتقر إلى المرونة الأصلية متعددة المهام (التجزئة، الوضع، OBB) الموجودة في Ultralytics .
تحليل مقارن: لماذا تختار Ultralytics؟
عند مقارنة هذين النموذجين لبيئات الإنتاج في عامي 2025 و 2026، تتضح مزايا Ultralytics البيئي.
سهولة الاستخدام وتجربة المطور
Ultralytics تجربة المستخدم المبسطة Ultralytics . YOLO11 تنفيذ YOLO11 سوى بضع أسطر من Python ، في حين أن استخدام EfficientDet غالبًا ما يتطلب التنقل بين قواعد كود قديمة معقدة أو TensorFlow .
from ultralytics import YOLO
# Load a pre-trained YOLO11 model
model = YOLO("yolo11n.pt")
# Train the model on a custom dataset
model.train(data="coco8.yaml", epochs=100, imgsz=640)
# Run inference on an image
results = model("path/to/image.jpg")
نظام بيئي مُدار جيدًا
يتم صيانة Ultralytics بشكل فعال من خلال تحديثات متكررة. يتم معالجة المشكلات التي يتم طرحها على GitHub بسرعة، كما أن الدعم المجتمعي واسع النطاق. في المقابل، غالبًا ما تكون التحديثات نادرة في مستودعات الأبحاث القديمة مثل EfficientDet الأصلي، مما يجعل صيانتها أكثر صعوبة في المشاريع التجارية طويلة الأجل.
توازن الأداء والذاكرة
YOLO11 توازنًا فائقًا بين السرعة والدقة. YOLO11 الخيارات المعمارية في YOLO11 GPU ، مما يؤدي إلى أوقات استدلال أسرع حتى إذا كان عدد FLOP النظري أعلى من EfficientDet. علاوة على ذلك، تم تحسين Ultralytics لاستخدام ذاكرة أقل أثناء التدريب، مما يسمح للمستخدمين بتدريب نماذج فعالة على وحدات معالجة الرسومات (GPU) المخصصة للمستهلكين، على عكس العديد من البدائل القائمة على Transformer التي تتطلب ذاكرة VRAM ضخمة.
تعدد الاستخدامات عبر المهام
في حين أن EfficientDet هو في المقام الأول كاشف كائنات، YOLO11 كأساس لمجموعة متنوعة من المهام. هذه التنوعية تقلل من الحاجة إلى تعلم أطر عمل مختلفة لمشاكل مختلفة.
إطار عمل واحد، مهام متعددة
- الكشف: تحديد الأجسام ومواقعها.
- التجزئة: فهم الكائنات على مستوى البكسل.
- تقدير الوضع: اكتشاف النقاط الرئيسية على أجسام البشر.
- مربعات الحدود الموجهة (OBB): اكتشاف الأجسام المدورة مثل السفن في الصور الجوية.
- التصنيف: تصنيف الصور الكاملة بكفاءة.
الخلاصة
تمثل كلتا البنيتين علامات فارقة مهمة في تاريخ الرؤية الحاسوبية. أظهرت EfficientDet قوة البحث في البنية العصبية والتحجيم المركب. ومع ذلك، بالنسبة للتطبيقات العملية الحالية، Ultralytics YOLO11 هو الخيار الأفضل. فهو يوفر سرعات استدلال أسرع ودقة أعلى ونظامًا بيئيًا سهل الاستخدام للمطورين يقلل بشكل كبير من وقت طرح المنتج في السوق.
بالنسبة للمطورين الذين يبحثون عن أحدث ما توصلت إليه التكنولوجيا في مجال الأداء، نوصيهم باستكشاف YOLO26، الذي يبني على نجاحات YOLO11 كفاءة أكبر وتصميم NMS. قد يرغب المهتمون بالمنهجيات القائمة على المحولات في النظر أيضًا في RT-DETR للتعرف على السياق العام.
اكتشف الإمكانات الكاملة للذكاء الاصطناعي البصري من خلال زيارة Ultralytics لتدريب نماذجك ونشرها وإدارتها في السحابة.