تخطي إلى المحتوى

EfficientDet مقابل YOLO11: تقييم تطور اكتشاف الكائنات

غالبًا ما يتطلب اختيار البنية المثلى لتطبيقات الرؤية الحاسوبية تحقيق التوازن بين الكفاءة الحاسوبية ودقة الكشف. تستكشف هذه المقارنة الشاملة الاختلافات التقنية بين EfficientDet، وهي بنية الكشف القابلة للتطوير Google لعام 2019، و YOLO11، وهو إصدار عام 2024 من Ultralytics الذي أعاد تعريف الأداء في الوقت الفعلي.

بينما قدم EfficientDet مفاهيم رائدة في مجال تحجيم النماذج، YOLO11 قفزة كبيرة إلى الأمام في قابلية الاستخدام وسرعة الاستدلال وتعدد المهام. بالنسبة للمطورين الذين يبدؤون مشاريع جديدة في عام 2026، نوصي أيضًا باستكشاف أحدث إصدار YOLO26، الذي يعتمد على الابتكارات التي تمت مناقشتها هنا مع معالجة أصلية شاملة.

تحليل معايير الأداء

لقد تغير مشهد اكتشاف الأجسام بشكل جذري من التحسين من أجل FLOPs النظري إلى التحسين من أجل زمن الاستجابة في العالم الحقيقي. يوضح الجدول أدناه التباين الشديد في سرعات الاستدلال. في حين أن EfficientDet-d0 يتطلب حوالي 10 مللي ثانية CPU فإن البنى الحديثة مثل YOLO11n تؤدي مهام مماثلة بشكل أسرع بكثير، غالبًا في أقل من 2 مللي ثانية على أجهزة مماثلة، مع الحفاظ على متوسط دقة تنافسي (mAP).

النموذجالحجم
(بالبكسل)
mAPval
50-95
السرعة
وحدة المعالجة المركزية CPU ONNX
(بالمللي ثانية)
السرعة
T4 TensorRT10
(بالمللي ثانية)
المعلمات
(M)
FLOPs
(B)
EfficientDet-d064034.610.23.923.92.54
EfficientDet-d164040.513.57.316.66.1
EfficientDet-d264043.017.710.928.111.0
EfficientDet-d364047.528.019.5912.024.9
EfficientDet-d464049.742.833.5520.755.2
EfficientDet-d564051.572.567.8633.7130.0
EfficientDet-d664052.692.889.2951.9226.0
EfficientDet-d764053.7122.0128.0751.9325.0
YOLO11n64039.51.52.62.66.5
YOLO11s64047.02.59.49.421.5
YOLO11m64051.54.720.120.168.0
YOLO11l64053.46.225.325.386.9
YOLO11x64054.711.356.956.9194.9

EfficientDet: رائد التدرج المركب

ظهر EfficientDet، الذي طوره فريق Google كنهج منهجي لتوسيع نطاق النماذج. وقد تم بناؤه على أساس EfficientNet backbone وأدخل شبكة Weighted Bi-directional Feature Pyramid Network (BiFPN)، التي تسمح بدمج الميزات متعددة النطاقات بسهولة وسرعة.

كان الابتكار الأساسي هو التوسع المركب، وهي طريقة تعمل على توسيع الدقة والعمق والعرض لشبكة العمود الفقري والشبكة المميزة وشبكات التنبؤ بالصندوق/الفئة بشكل موحد. وقد سمح ذلك لعائلة EfficientDet (من D0 إلى D7) باستهداف مجموعة واسعة من قيود الموارد، من الأجهزة المحمولة إلى GPU عالية الطاقة.

على الرغم من نجاحه الأكاديمي وكفاءته العالية من حيث FLOPs، غالبًا ما يعاني EfficientDet من مشاكل في زمن الاستجابة على الأجهزة الحقيقية بسبب تكاليف الوصول إلى الذاكرة لاتصالات BiFPN المعقدة والتلافيف القابلة للفصل من حيث العمق، والتي لا يتم تحسينها دائمًا بواسطة مسرعات مثل TensorRT.

بيانات تعريف EfficientDet:

تعرف على المزيد حول EfficientDet

Ultralytics YOLO11: إعادة تعريف أحدث التقنيات في الوقت الفعلي

صدر في سبتمبر 2024، YOLO11 مصمم للكشف العملي عالي السرعة عن الأجسام والنشر الفوري. على عكس EfficientDet، الذي يركز بشكل كبير على كفاءة المعلمات، YOLO11 استخدام الأجهزة، مما يضمن تشغيل النموذج بسرعة استثنائية على كل من وحدات المعالجة المركزية الطرفية ووحدات معالجة الرسومات المؤسسية.

YOLO11 تحسينات معمارية مثل كتلة C3k2 ووحدة SPPF (Spatial Pyramid Pooling - Fast) المحسّنة. تعزز هذه التغييرات قدرة النموذج على استخراج الميزات بمقاييس مختلفة دون التأخير الذي كان يحدث في تصميمات هرم الميزات القديمة. علاوة على ذلك، YOLO11 إطار عمل موحد لمهام الرؤية المتعددة، بما في ذلك تجزئة المثيلات وتقدير الوضع وكشف الصندوق المحيط الموجه (OBB) ، وهي قدرات تتطلب تطبيقات مخصصة معقدة باستخدام EfficientDet.

ميزة النظام البيئي

تتكامل Ultralytics تمامًا مع Ultralytics مما يتيح إدارة سلسة لمجموعات البيانات، والتعليق التلقائي، وتدريب النماذج بنقرة واحدة في السحابة.

YOLO11 :

تعرف على المزيد حول YOLO11

الاختلافات التقنية الرئيسية

الهندسة المعمارية ودمج الميزات

يعتمد EfficientDet على BiFPN، وهي طبقة معقدة من دمج الميزات الموزونة التي تربط خرائط الميزات من أعلى إلى أسفل ومن أسفل إلى أعلى بشكل متكرر. على الرغم من كفاءتها النظرية، إلا أن أنماط الوصول غير المنتظمة إلى الذاكرة يمكن أن تبطئ الاستدلال على وحدات معالجة الرسومات (GPU).

في المقابل، YOLO11 بنية مبسطة مستوحاة من PANet (شبكة تجميع المسارات) مع كتل C3k2. يفضل هذا التصميم أنماط الوصول إلى الذاكرة الكثيفة والمنتظمة التي تتوافق جيدًا مع CUDA وبنى NPU الحديثة، مما يؤدي إلى زيادة السرعة الهائلة الملحوظة في جدول المقارنة (على سبيل المثال، YOLO11x أسرع بكثير من EfficientDet-d7 مع الحفاظ على دقة أعلى).

كفاءة التدريب وسهولة الاستخدام

عادةً ما يتطلب تدريب نموذج EfficientDet استخدام واجهة برمجة تطبيقات TensorFlow Detection API أو مكتبة AutoML، والتي قد تتطلب تعلمًا مكثفًا وملفات تكوين معقدة.

Ultralytics تجربة المطورين Ultralytics . YOLO11 الوصول YOLO11 تدريب YOLO11 عبر Python بسيطة أو واجهة سطر الأوامر (CLI). تتولى المكتبة ضبط المعلمات الفائقة وزيادة البيانات وتنسيق مجموعات البيانات تلقائيًا.

from ultralytics import YOLO

# Load a COCO-pretrained YOLO11n model
model = YOLO("yolo11n.pt")

# Train on a custom dataset with a single command
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)

التنوع والانتشار

EfficientDet هي في الأساس بنية لكشف الأجسام. يتطلب تكييفها لمهام مثل التجزئة أو تقدير الوضع تعديلات كبيرة في البنية.

YOLO11 متعدد الوسائط بطبيعته. يدعم نفس العمود الفقري وخط أنابيب التدريب:

  • detect: صناديق الإحاطة القياسية.
  • التجزئة: أقنعة على مستوى البكسل لحدود دقيقة للأجسام.
  • التصنيف: تصنيف الصورة بأكملها.
  • الوضعية: اكتشاف النقاط الرئيسية لتتبع الهيكل العظمي.
  • OBB: صناديق مقلوبة للصور الجوية واكتشاف النصوص.

هذه التنوعية تجعل YOLO11 "سكين جيب سويسري" لمهندسي الذكاء الاصطناعي، حيث تتيح لمستودع واحد تشغيل تطبيقات متنوعة من التصوير الطبي إلى الروبوتات المستقلة.

لماذا تختار نماذج Ultralytics؟

عند مقارنة هاتين البنيتين لنظم الإنتاج الحديثة، توفر Ultralytics مزايا واضحة:

  1. تقليل حجم الذاكرة: تم تحسين YOLO للتدريب على أجهزة المستهلكين. على عكس النماذج القائمة على المحولات أو البنى القديمة الثقيلة التي تتطلب CUDA ضخمة، تعمل YOLO الفعالة على إتاحة الوصول إلى تدريب الذكاء الاصطناعي المتطور للجميع.
  2. نشر مبسط: التصدير إلى ONNXو TensorRTأو CoreML أو TFLite أمر من سطر واحد في Ultralytics .
  3. الدعم النشط: Ultralytics نشط وحيوي. بفضل التحديثات المتكررة، يضمن إطار العمل التوافق مع أحدث إصدارات PyTorch CUDA.

الخلاصة: الخيار العصري

في حين أن EfficientDet لا يزال يمثل علامة فارقة مهمة في تاريخ أبحاث الرؤية الحاسوبية، حيث يبرهن على قوة التوسع المركب، YOLO11 و YOLO26 الأحدث هما الخياران الأفضل للاستخدام العملي اليوم. فهما يوفران توازنًا أفضل بين السرعة والدقة، وتجربة مستخدم أسهل بكثير، والمرونة اللازمة للتعامل مع مهام الرؤية الحاسوبية المتعددة ضمن إطار عمل واحد.

بالنسبة للمطورين الذين يرغبون في البقاء في طليعة التكنولوجيا، نوصيهم بالاطلاع على YOLO26، الذي يقدم تصميمًا شاملاً NMS لضمان زمن انتقال أقل وخطوط أنابيب نشر أبسط.

لاستكشاف خيارات أخرى عالية الأداء، ننصحك بقراءة مقارناتنا حول YOLOv10 أو RT-DETR.


تعليقات