تخطي إلى المحتوى

EfficientDet مقابل YOLOv6.0: نظرة متعمقة على بنى اكتشاف الأجسام

غالبًا ما يكون اختيار نموذج الكشف عن الكائنات المناسب بمثابة عملية موازنة بين الدقة والكمون وقيود النشر. تستكشف هذه المقارنة معلمتين هامتين في تاريخ الرؤية الحاسوبية: EfficientDet، وهي بنية قابلة للتطوير Google أعادت تعريف كفاءة المعلمات في عام 2019، و YOLOv6.YOLOv6، وهو كاشف صناعي من Meituan تم تحسينه GPU عالية الإنتاجية في عام 2023.

مقارنة مقاييس الأداء

يوضح الجدول التالي الاختلافات في الأداء بين البنيتين. بينما يركز EfficientDet على كفاءة المعلمات (حجم نموذج أصغر لدقة معينة)، فإن YOLOv6. YOLOv6 يعطي الأولوية لسرعة الاستدلال على مسرعات الأجهزة مثل وحدات معالجة الرسومات (GPU).

النموذجالحجم
(بالبكسل)
mAPval
50-95
السرعة
وحدة المعالجة المركزية CPU ONNX
(بالمللي ثانية)
السرعة
T4 TensorRT10
(بالمللي ثانية)
المعلمات
(M)
FLOPs
(B)
EfficientDet-d064034.610.23.923.92.54
EfficientDet-d164040.513.57.316.66.1
EfficientDet-d264043.017.710.928.111.0
EfficientDet-d364047.528.019.5912.024.9
EfficientDet-d464049.742.833.5520.755.2
EfficientDet-d564051.572.567.8633.7130.0
EfficientDet-d664052.692.889.2951.9226.0
EfficientDet-d764053.7122.0128.0751.9325.0
YOLOv6-3.0n64037.5-1.174.711.4
YOLOv6-3.0s64045.0-2.6618.545.3
YOLOv6-3.0m64050.0-5.2834.985.8
YOLOv6-3.0l64052.8-8.9559.6150.7

EfficientDet: قابل للتطوير وفعال من حيث المعلمات

تم تقديم EfficientDet من قبل فريق Google لمواجهة التحدي المتمثل في توسيع نطاق نماذج الكشف عن الكائنات بكفاءة. على عكس النماذج السابقة التي كانت تكتفي بجعل الشبكات أعمق أو أوسع، قدم EfficientDet طريقة Compound Scaling التي تعمل على توسيع نطاق الدقة والعمق والعرض بشكل موحد.

الميزات المعمارية الرئيسية

  • BiFPN (شبكة هرمية ثنائية الاتجاه مرجحة): يقوم EfficientDet بإنشاء مسار اندماج معقد للميزات. على عكس شبكة FPN القياسية، تتيح شبكة BiFPN اندماجًا سهلاً للميزات متعددة المستويات من خلال إدخال أوزان قابلة للتعلم إلى ميزات إدخال مختلفة، مما يضمن أن الشبكة تعطي الأولوية للمعلومات الأكثر أهمية.
  • الهيكل الأساسي EfficientNet: يستخدم EfficientNet كهيكل أساسي، وهو مُحسّن للغاية لعمليات النقطة العائمة (FLOPs) وعدد المعلمات.
  • تحجيم المركب: يتحكم معامل بسيط $\phi$ في تحجيم الشبكة الأساسية وشبكة BiFPN وشبكات الفئات/المربعات في وقت واحد.

تحذير بشأن التعقيد

على الرغم من أن BiFPN أنيق من الناحية الحسابية وفعال من حيث المعلمات، إلا أن أنماط الوصول غير المنتظمة إلى الذاكرة قد تجعل من الصعب تحسينه على بعض مسرعات الأجهزة مقارنة بالكتل التلافيفية المباشرة الموجودة في YOLO .

البيانات الوصفية:

  • المؤلفون: مينغشينغ تان، رومينغ بانغ، كوك ف. لي
  • المؤسسة:Google Research
  • التاريخ: 20 نوفمبر 2019
  • روابط:Arxiv | GitHub

تعرف على المزيد حول EfficientDet

YOLOv6.0: شيطان السرعة الصناعي

أصدرت Meituan في عام 2023 YOLOv6. YOLOv6(الذي يشار إليه غالبًا باسم "Full-Scale Reloading")، والذي تم تصميمه خصيصًا للتطبيقات الصناعية. أعطى المؤلفون الأولوية لسرعة الاستدلال في العالم الواقعي على وحدات معالجة الرسومات (GPU) على حساب FLOPs النظرية، مما أدى إلى نموذج يهيمن على سيناريوهات الإنتاجية العالية مثل تحليلات الفيديو.

الميزات المعمارية الرئيسية

  • RepBi-PAN: تستخدم بنية العنق المحدثة هذه كتل من نوع RepVGG. أثناء التدريب، تتمتع هذه الكتل بتوبولوجيات متعددة الفروع لتحسين تدفق التدرج. أثناء الاستدلال، يتم إعادة تحديد معلماتها هيكليًا إلى تلافيف 3x3 واحدة، مما يقلل بشكل كبير من زمن الاستجابة.
  • التدريب بمساعدة المثبت (AAT): في حين أن YOLOv6 في الأساس كاشف خالٍ من المثبتات، فقد أدخلت النسخة 3.0 فرعًا إضافيًا قائمًا على المثبتات أثناء التدريب لتثبيت التقارب وتحسين الدقة دون التأثير على سرعة الاستدلال.
  • الرأس المنفصل: يتم فصل مهام التصنيف والانحدار إلى فروع مختلفة، وهو خيار تصميمي أصبح معيارًا في أجهزة الكشف الحديثة لحل التضارب بين هذين الهدفين.

البيانات الوصفية:

  • المؤلفون: تشوي لي، لولو لي، ييفي جينغ، وآخرون.
  • المؤسسة:Meituan
  • التاريخ: 13 يناير 2023
  • روابط:Arxiv | GitHub

تعرف على المزيد حول YOLOv6

تحليل مقارن

زمن الوصول والإنتاجية

يتميز YOLOv6.YOLOv6 بسرعة أكبر بكثير على GPU . كما هو موضح في الجدول، يحقق YOLOv6.YOLOv6 معدل mAP 52.8% مع TensorRT يبلغ 8.95 مللي ثانية فقط. في المقابل، يحقق EfficientDet-d6 معدل mAP مماثلًا بنسبة 52.6٪ mAP يتطلب 89.29 مللي ثانية، وهو أبطأ بكثير من الناحية العملية. وهذا يجعل YOLOv6 الواضح للتطبيقات التي تتطلب معالجة في الوقت الفعلي على أجهزة NVIDIA أو Jetson.

كفاءة المعلمات

يتفوق EfficientDet في البيئات التي يمثل التخزين فيها العائق الرئيسي. يوفر EfficientDet-d0 معدل mAP محترمًا يبلغ 34.6٪ mAP 3.9 مليون معلمة فقط. وهذا أقل من أصغر YOLOv6 . بالنسبة للبحوث الأكاديمية أو بيئات التخزين شديدة التقييد (على سبيل المثال، تضمين نموذج مباشرة في حزمة تطبيق جوال صغيرة)، تظل المساحة الصغيرة التي يشغلها EfficientDet ذات صلة.

التدريب وسهولة الاستخدام

يعتمد EfficientDet على نظام TensorFlow القديم، والذي قد يكون من الصعب دمجه في سير العمل الحديث PyTorch. غالبًا ما يتطلب التدريب ضبط معلمات معقدة للتحجيم المركب. يقدم YOLOv6. YOLOv6 طريقة تدريب أكثر حداثة، ولكنه يركز بشكل كبير على اكتشاف الكائنات، ويفتقر إلى الدعم الأصلي لمهام أخرى مثل التجزئة أو تقدير الوضع في إصداره الأساسي.

ميزة Ultralytics

في حين أن دراسة هذه البنى الهندسية توفر رؤية قيّمة، إلا أن التطوير الحديث يتطلب منصة شاملة. Ultralytics نظامًا بيئيًا شاملاً يتفوق على البنى الهندسية الفردية من خلال التركيز على دورة حياة التعلم الآلي بأكملها.

لماذا الانتقال إلى Ultralytics؟

  • تنوع لا مثيل له: على عكس EfficientDet و YOLOv6 يعتبران في المقام الأول أجهزة كشف للأجسام، تدعم Ultralytics بشكل أساسي تقسيم الحالات، وتقدير الوضع، والمربعات المحددة الاتجاه (OBB)، والتصنيف.
  • سهولة الاستخدام: تتيح لك Python المتسقة التبديل بين أجيال النماذج (على سبيل المثال، من YOLO11 YOLO26) عن طريق تغيير سلسلة واحدة.
  • كفاءة الذاكرة: تم تحسين Ultralytics لتقليل استخدام VRAM أثناء التدريب، مما يسمح بأحجام دفعات أكبر على وحدات معالجة الرسومات (GPU) الاستهلاكية مقارنة بالبنى الهندسية التي تستهلك الكثير من الذاكرة في EfficientDet.

أدخل YOLO26: المعيار الجديد

بالنسبة للمطورين الباحثين عن أحدث التقنيات، يمثل YOLO26 قمة الكفاءة والأداء. تم إصداره في يناير 2026، وهو يعالج قيود كل من EfficientDet (السرعة) و YOLOv6 CPU ).

اختراقات YOLO26:

  • NMS من البداية إلى النهاية: من خلال التخلص من Non-Maximum Suppression (NMS)، تعمل YOLO26 على تبسيط منطق النشر وتقليل تباين زمن الاستدلال.
  • MuSGD Optimizer: مستوحى من تدريب LLM، يعمل هذا المحسن الهجين على استقرار التدريب وتسريع التقارب.
  • تحسين الحواف: مع إزالة Distribution Focal Loss (DFL) وتعديلات معمارية محددة، أصبح YOLO26 أسرع بنسبة تصل إلى 43٪ في استنتاجات CPU مقارنة بالأجيال السابقة، مما يجعله متفوقًا في Raspberry Pi وعمليات النشر المتنقلة حيث غالبًا ما يواجه EfficientDet صعوبات.
  • وظائف الخسارة المتقدمة: يؤدي دمج ProgLoss و STAL إلى تحسين كبير في اكتشاف الأجسام الصغيرة، وهو مطلب أساسي لصور الطائرات بدون طيار وأجهزة استشعار إنترنت الأشياء.
from ultralytics import YOLO

# Load the latest YOLO26 model
model = YOLO("yolo26n.pt")

# Train on COCO8 dataset with MuSGD optimizer
model.train(data="coco8.yaml", epochs=100, optimizer="MuSGD")

# Export to ONNX for NMS-free deployment
model.export(format="onnx")

تعرف على المزيد حول YOLO26

توصيات حالات الاستخدام

  • اختر EfficientDet إذا: كنت تجري بحثًا أكاديميًا حول قياس دمج الميزات أو تعمل مع TensorFlow القديمة حيث حجم وزن النموذج (ميجابايت) هو القيد الصارم.
  • اختر YOLOv6. YOLOv6 إذا: كنت تقوم بالنشر حصريًا على NVIDIA (مثل T4 أو A10) وكان معدل الإنتاجية الخام (FPS) لاكتشاف الكائنات القياسية هو المقياس الوحيد الذي تستخدمه.
  • اختر Ultralytics إذا: كنت بحاجة إلى حل جاهز للإنتاج يوازن بينGPU ولا يتطلب معالجة لاحقة معقدة (NMS)، ويحتاج إلى أداء مهام تتجاوز الكشف البسيط (مثل التجزئة أو OBB)، أو يتطلب سير عمل تدريبي مبسط.

لمزيد من الاستكشاف حول أجهزة الكشف الحديثة عن الأشياء، ننصحك بقراءة مقارناتنا بين YOLOv8 EfficientDet أو قدرات محولات الكشف في الوقت الحقيقي (RT-DETR).


تعليقات