تخطي إلى المحتوى

Ultralytics YOLOv8 EfficientDet: مقارنة تقنية شاملة

في مجال الكشف عن الأجسام الذي يشهد تطوراً سريعاً، يعد اختيار بنية الشبكة العصبية المثلى أمراً بالغ الأهمية لتحقيق التوازن بين الدقة وسرعة الاستدلال وإمكانية النشر. يقارن هذا التحليل التقني المتعمق بين بنيتين مؤثرتين للغاية: Ultralytics YOLOv8، وهو معيار متعدد الاستخدامات في نظام الرؤية الحاسوبية الحديث، و EfficientDet، وهو نموذج أساسي من Google باستراتيجيته المركبة للتوسع.

سواء كان هدف النشر الخاص بك هو خوادم سحابية عالية الأداء أو أجهزة طرفية محدودة الموارد، فإن فهم الفروق الدقيقة في بنية هذه النماذج سيرشد مشروعك إلى النجاح.

نظرة عامة معمارية

يتعامل كلا النموذجين مع التحدي المتمثل في تحديد وتوطين الكائنات في الصورة باستخدام الشبكات العصبية التلافيفية، لكنهما يستخدمان منهجيات مختلفة لتحقيق استخراج الميزات وانحدار مربع الحدود.

Ultralytics YOLOv8

أصدرت Ultralytics يناير 2023 YOLOv8 قفزة كبيرة إلى الأمام في YOLO . صممه Glenn Jocher و Ayush Chaurasia و Jing Qiu، وقد تم تصميمه من الألف إلى الياء لدعم مهام الرؤية المتعددة بسلاسة، بما في ذلك اكتشاف الكائنات وتجزئة الحالات وتقدير الوضع وتصنيف الصور.

تقدم هذه البنية رأس كشف بدون مرساة، مما يقلل بشكل كبير من عدد تنبؤات الصناديق ويسرع عملية القمع غير الأقصى (NMS). يستخدم العمود الفقري الخاص بها وحدة C2f جديدة (عنق زجاجة جزئي عبر المراحل مع اثنين من التلافيف) لتحسين تدفق التدرج أثناء التدريب مع الحفاظ على حجم خفيف الوزن. وهذا يجعل YOLOv8 فعالاً YOLOv8 عند تجميعه إلى تنسيقات مثل NVIDIA TensorRT أو ONNX.

تعرف على المزيد حول YOLOv8

EfficientDet

تم تأليف EfficientDet بواسطة Mingxing Tan و Ruoming Pang و Quoc V. Le في Google في أواخر عام 2019، ويركز على الكفاءة القابلة للتطوير. كما هو موضح في ورقتهم البحثية الرسمية على Arxiv، يستفيد النموذج بشكل كبير من نظام AutoML البيئي.

السمة المميزة لـ EfficientDet هي شبكة هرمية ثنائية الاتجاه (BiFPN)، التي تتيح دمج السمات متعددة المقاييس بسهولة وسرعة. بالاقتران مع العمود الفقري EfficientNet، تستخدم البنية طريقة قياس مركبة تقيس بشكل موحد الدقة والعمق والعرض لجميع شبكات العمود الفقري وشبكات الميزات وشبكات التنبؤ بالصندوق/الفئة في نفس الوقت. في حين أن هذا يؤدي إلى كفاءة ممتازة في المعلمات، غالبًا ما تواجه طوبولوجيا الشبكة المعقدة صعوبة في تحقيق السرعات المثلى في الوقت الفعلي على وحدات معالجة الرسومات القياسية.

تعرف على المزيد حول EfficientDet

مقارنة الأداء والمقاييس

عند مقارنة أجهزة الكشف عن الأجسام، فإن متوسط الدقة (mAP) وزمن الاستدلال هما المعايير الأساسية. يوضح الجدول أدناه كيفية مقارنة YOLOv8 وعائلة EfficientDet (d0-d7) عبر المقاييس القياسية على مجموعات البيانات مثل COCO.

النموذجالحجم
(بالبكسل)
mAPval
50-95
السرعة
وحدة المعالجة المركزية CPU ONNX
(بالمللي ثانية)
السرعة
T4 TensorRT10
(بالمللي ثانية)
المعلمات
(M)
FLOPs
(B)
YOLOv8n64037.380.41.473.28.7
YOLOv8s64044.9128.42.6611.228.6
YOLOv8m64050.2234.75.8625.978.9
YOLOv8l64052.9375.29.0643.7165.2
YOLOv8x64053.9479.114.3768.2257.8
EfficientDet-d064034.610.23.923.92.54
EfficientDet-d164040.513.57.316.66.1
EfficientDet-d264043.017.710.928.111.0
EfficientDet-d364047.528.019.5912.024.9
EfficientDet-d464049.742.833.5520.755.2
EfficientDet-d564051.572.567.8633.7130.0
EfficientDet-d664052.692.889.2951.9226.0
EfficientDet-d764053.7122.0128.0751.9325.0

تحليل توازن الأداء

بينما يحقق EfficientDet دقة جديرة بالثناء باستخدام عدد أقل من العمليات الحسابية النظرية (FLOPs)، Ultralytics YOLOv8 في سرعات GPU في العالم الحقيقي. على سبيل المثال، YOLOv8x معدل mAP أعلى قليلاً mAP 53.9) من EfficientDet-d7 (53.7) ولكنه يعالج الصور بشكل أسرع بكثير على GPU T4 GPU 14.37 مللي ثانية مقابل 128.07 مللي ثانية)، مما يجعل YOLOv8 الواضح لتحليلات الفيديو في الوقت الفعلي.

منهجيات التدريب والنظام البيئي

تعد تجربة المطور عاملاً حاسماً عند اختيار بنية التعلم الآلي. وهنا يكمن الفارق الحقيقي بين هذه النماذج من حيث دعم مجتمع المصادر المفتوحة وأدوات النظام البيئي.

يعتمد EfficientDet بشكل كبير على TensorFlow وخطوط أنابيب AutoML المتخصصة. على الرغم من فعاليتها في التدريب السحابي الموزع على نطاق واسع، إلا أن إعداد البيئة وتعديل المراسي وتحليل ملفات التكوين الكثيفة الموجودة في مستودع EfficientDet GitHub قد يكون أمرًا شاقًا لفرق الهندسة سريعة الوتيرة.

في المقابل، Ultralytics YOLOv8 مبنية أصلاً على PyTorch، مما يوفر سهولة استخدام لا مثيل لها. يمكن للمطورين بدء حلقات تدريب معقدة بسطر واحد من Python أو CLI . علاوة على ذلك، تم تحسين متطلبات ذاكرة النموذج أثناء التدريب بشكل كبير؛ YOLOv8 للمطورين الذين يستخدمون وحدات معالجة رسومات (GPU) متواضعة تدريب نماذج قوية دون مواجهة أخطاء نفاد الذاكرة (OOM) التي غالبًا ما تعاني منها البنى الثقيلة التي تعتمد على المحولات.

التكامل السلس مع Ultralytics يرتقي بهذا الأمر إلى مستوى أعلى، حيث يوفر واجهة بدون كود لتعليق مجموعات البيانات وتدريب النماذج ونشر السحابة بنقرة واحدة. تضمن ميزات مثل الضبط التلقائي للمعلمات الفائقة الحصول دائمًا على أفضل دقة ممكنة لمجموعات البيانات المخصصة.

مثال على Python : YOLOv8

يعد تشغيل كاشف متطور باستخدام مستودعUltralytics أمرًا بسيطًا للغاية:

from ultralytics import YOLO

# Initialize the YOLOv8 model natively in PyTorch
model = YOLO("yolov8n.pt")

# Train the model on the COCO8 example dataset
train_results = model.train(data="coco8.yaml", epochs=50, imgsz=640)

# Run fast inference on an image URL
inference_results = model("https://ultralytics.com/images/bus.jpg")

# Display the bounding boxes
inference_results[0].show()

الجيل القادم: الترقية إلى Ultralytics

بينما YOLOv8 نموذجًا إنتاجيًا عالي الكفاءة، يجب على الباحثين والمطورين الباحثين عن أحدث ما توصلت إليه تقنيات الذكاء الاصطناعي تقييم Ultralytics ، الذي تم إصداره في يناير 2026.

يعيد YOLO26 تعريف نموذج اكتشاف الكائنات من خلال تقديم تصميم أصلي شامل NMS. من خلال التخلص من الحاجة إلى القمع غير الأقصى أثناء المعالجة اللاحقة — وهو عنق زجاجة كان موجودًا منذ YOLO الأولى YOLO — تم التخلص عمليًا من تباين زمن الاستجابة. وهذا يمثل تغييرًا جذريًا في النشر على الأجهزة منخفضة الطاقة.

علاوة على ذلك، يتضمن YOLO26 العديد من الابتكارات التدريبية الرائدة:

  • MuSGD Optimizer: مستوحى من تقنيات التدريب المتقدمة LLM، يضمن هذا المزيج من SGD Muon تدريبًا عالي الاستقرار ومعدلات تقارب سريعة للغاية.
  • CPU أسرع بنسبة تصل إلى 43٪ CPU : بفضل NMS والبنية الأساسية المحسّنة بشكل كبير، يحقق YOLO26 سرعات غير مسبوقة على الأجهزة الطرفية CPU دون الاعتماد على وحدات المعالجة العصبية المخصصة.
  • ProgLoss + STAL: توفر وظائف الخسارة المتقدمة هذه قفزة ملحوظة في دقة التعرف على الأجسام الصغيرة، مما يجعل YOLO26 لا غنى عنه للصور الجوية وأجهزة استشعار إنترنت الأشياء الدقيقة.
  • إزالة DFL: تمت إزالة Distribution Focal Loss تمامًا لتبسيط عملية التصدير إلى تنسيقات مثل OpenVINO و CoreML.

حالات الاستخدام والتوصيات

يعتمد الاختيار بين هذه البنى في النهاية على قيود النشر والمتطلبات القديمة.

  • اختر Ultralytics YOLOv8 : كنت تقوم ببناء تطبيقات رؤية حاسوبية حديثة ومتعددة الاستخدامات تتطلب دقة عالية GPU في الوقت الفعلي وتجربة مطور سلسة. إن أداءه القوي في مهام التصنيف والتجزئة والكشف يجعله أداة متعددة الاستخدامات قوية لتحليلات البيع بالتجزئة والروبوتات وأنظمة الأمان.
  • اختر EfficientDet إذا: كنت مقيدًا TensorFlow القديم وكان اهتمامك الأساسي هو تقليل عدد المعلمات وعمليات FLOP النظرية، ربما لأغراض البحث بدلاً من النشر الصناعي الصارم في الوقت الفعلي.
  • اختر Ultralytics إذا: كنت تبدأ مشروعًا جديدًا وتحتاج إلى الأفضل على الإطلاق. بفضل بنيته الأصلية الشاملة NMS فهو الخيار الأمثل لكل من عمليات النشر السريعة للغاية على الحافة والمعالجة السحابية الثقيلة.

إذا كنت تستكشف أطر عمل أخرى عالية الكفاءة ضمن نظام Ultralytics ، فقد ترغب أيضًا في النظر في Ultralytics YOLO11 للحصول على أداء متوازن أو RT-DETR للحصول على نهج قائم على المحولات للكشف في الوقت الفعلي.


تعليقات