تخطي إلى المحتوى

EfficientDet مقابل YOLOv5: تحقيق التوازن بين قابلية التوسع والأداء في الوقت الفعلي

يتطلب اختيار بنية الكشف عن الكائنات المناسبة الموازنة بين الدقة وسرعة الاستدلال وتعقيد النشر. يقدم هذا الدليل مقارنة تقنية متعمقة بين EfficientDet، وهي بنية قابلة للتطوير من Google و YOLOv5، وهو كاشف في الوقت الفعلي معتمد على نطاق واسع من Ultralytics.

بينما قدم EfficientDet مفاهيم رائدة في مجال التوسع المركب، YOLOv5 هذا المجال من خلال توفير رؤية حاسوبية عالية الأداء عبر واجهة برمجة تطبيقات مبسطة ونظام بيئي قوي.

نظرة عامة على النموذج

Google EfficientDet

يعتمد EfficientDet على الهيكل الأساسي لـ EfficientNet، ويطبق طريقة تحجيم مركبة تعمل على تحجيم الدقة والعمق والعرض بشكل موحد. وقد أدخل شبكة هرم الميزات ثنائية الاتجاه (BiFPN) لتسهيل ودمج الميزات متعددة المقاييس بسرعة.

Ultralytics YOLOv5

YOLOv5 يركز على قابلية الاستخدام والسرعة في العالم الواقعي. يستخدم هيكل CSPDarknet الأساسي ومصمم لسهولة التدريب والنشر عبر أجهزة متنوعة. لا يزال أحد أكثر النماذج شيوعًا نظرًا لتوازنه بين الأداء والكفاءة.

تعرف على المزيد حول YOLOv5

مقارنة البنية التقنية

تختلف الفلسفات المعمارية لهذين النموذجين بشكل كبير، مما يؤثر على ملاءمتهما لمهام مختلفة.

EfficientDet: التحجيم المركب و BiFPN

تتمثل الابتكار الأساسي لـ EfficientDet في شبكة BiFPN (شبكة هرمية ثنائية الاتجاه مرجحة). على عكس شبكات FPN القياسية التي تجمع الميزات دون تمييز، تقدم شبكة BiFPN أوزانًا قابلة للتعلم لفهم أهمية الميزات المختلفة المدخلة. وهذا يسمح للشبكة بإعطاء الأولوية للميزات الأكثر إفادة أثناء الدمج.

بالإضافة إلى ذلك، يستخدم EfficientDet تقنية Compound Scaling، التي تعمل على زيادة الدقة والعمق والعرض في وقت واحد للهيكل الأساسي وشبكة الميزات وشبكة التنبؤ. وهذا يتيح للمستخدمين الاختيار من بين مجموعة من النماذج (D0 إلى D7) اعتمادًا على قيود الموارد المتاحة لديهم. ومع ذلك، قد تؤدي هذه التعقيدات إلى زيادة زمن الاستجابة على الأجهزة الطرفية التي تفتقر إلى الدعم المتخصص لهذه العمليات.

YOLOv5: CSPDarknet و PANet

YOLOv5 شبكة CSPDarknet الأساسية، التي تدمج شبكات Cross Stage Partial. يقلل هذا التصميم من عدد المعلمات و FLOPS مع الحفاظ على الدقة من خلال تقسيم خريطة الميزات في الطبقة الأساسية.

لتجميع الميزات، YOLOv5 شبكة تجميع المسار (PANet). تعزز هذه البنية تدفق المعلومات من الطبقات السفلية إلى الطبقات العليا، مما يحسن تحديد مواقع الكائنات، وهو أمر بالغ الأهمية للحصول على مربعات حدودية دقيقة. يعتمد الرأس على المراسي، حيث يتنبأ بالإزاحة من مربعات المراسي المحددة مسبقًا. تم تحسين هذه البنية بشكل كبير GPU مما يؤدي إلى أوقات استدلال أسرع مقارنة بعمليات القياس المعقدة في EfficientDet.

ميزة النظام البيئي لـ Ultralytics

YOLOv5 اختيار YOLOv5 الوصول إلى Ultralytics مما يضمن التكامل السلس مع أدوات تعليق البيانات وتتبع التجارب والتدريب السحابي عبر Ultralytics . غالبًا ما تكون بنية الدعم هذه غائبة في المستودعات التي تركز على الأبحاث مثل EfficientDet.

مقاييس الأداء

عند تقييم الأداء، من المهم النظر إلى كل من الدقة (mAP) والسرعة (زمن الاستجابة). في حين أن EfficientDet يصل إلى دقة أعلى مع متغيراته الأكبر (D7)، فإنه غالبًا ما يتكبد خسارة كبيرة في السرعة مقارنة YOLOv5 ذات الحجم المماثل.

يوضح الجدول أدناه الاختلافات في الأداء. لاحظ كيف YOLOv5 CPU أسرع بشكل ملحوظ، مما يجعله أكثر عملية للنشر دون الحاجة إلى مسرعات متخصصة.

النموذجالحجم
(بالبكسل)
mAPval
50-95
السرعة
وحدة المعالجة المركزية CPU ONNX
(بالمللي ثانية)
السرعة
T4 TensorRT10
(بالمللي ثانية)
المعلمات
(M)
FLOPs
(B)
EfficientDet-d064034.610.23.923.92.54
EfficientDet-d164040.513.57.316.66.1
EfficientDet-d264043.017.710.928.111.0
EfficientDet-d364047.528.019.5912.024.9
EfficientDet-d464049.742.833.5520.755.2
EfficientDet-d564051.572.567.8633.7130.0
EfficientDet-d664052.692.889.2951.9226.0
EfficientDet-d764053.7122.0128.0751.9325.0
YOLOv5n64028.073.61.122.67.7
YOLOv5s64037.4120.71.929.124.0
YOLOv5m64045.4233.94.0325.164.2
YOLOv5l64049.0408.46.6153.2135.0
YOLOv5x64050.7763.211.8997.2246.4

تحليل

  1. السرعة مقابل الدقة: EfficientDet-d0 فعال للغاية من حيث FLOPs، ولكن في الممارسة العملية، غالبًا ما يعمل YOLOv5n و YOLOv5s بشكل أسرع على وحدات معالجة الرسومات القياسية (GPU) بسبب عمليات أكثر ملاءمة للأجهزة (تجنب التلافيف القابلة للفصل العميق التي قد تكون بطيئة على بعض CUDA القديمة).
  2. كفاءة الذاكرة: يتطلب YOLOv5 ذاكرة VRAM أقل أثناء التدريب، مما يسمح بأحجام دفعات أكبر على الأجهزة الاستهلاكية. يمكن أن تؤدي الاتصالات المعقدة في EfficientDet إلى زيادة الحمل الزائد على الذاكرة.
  3. التحسين: يعتمد EfficientDet بشكل كبير على عمليات البحث في AutoML للهندسة المعمارية، والتي قد يكون تعديلها صعبًا. YOLOv5 تخصيص مضاعفات العمق والعرض بسهولة أكبر مباشرة في تكوين YAML.

التدريب وسهولة الاستخدام

كفاءة التدريب

YOLOv5 Ultralytics YOLOv5 بقدرتها على "التدريب الفوري". يتضمن المستودع زيادة بيانات Mosaic وحساب التثبيت التلقائي وتطور المعلمات الفائقة. وهذا يعني أن المستخدمين يمكنهم تحقيق نتائج ممتازة على مجموعات البيانات المخصصة دون الحاجة إلى ضبط مكثف. غالبًا ما تتطلب تطبيقات EfficientDet مزيدًا من الإعداد اليدوي TensorFlow وجدولة معدل التعلم بعناية.

تنوع الاستخدامات

في حين أن EfficientDet هو في الأساس نموذج للكشف عن الكائنات، YOLOv5 في Ultralytics يدعمون مجموعة أوسع من المهام. يمكنك التبديل بسلاسة إلى تقسيم المثيلات أو تصنيف الصور باستخدام نفس بنية واجهة برمجة التطبيقات.

علاوة على ذلك، YOLOv5 تبسيط نشر YOLOv5 من خلال وضع التصدير، الذي يدعم التحويل بنقرة واحدة إلى ONNX و TensorRT و CoreML و TFLite.

from ultralytics import YOLO

# Load a pretrained YOLOv5 model
model = YOLO("yolov5s.pt")

# Train the model on a custom dataset
model.train(data="coco128.yaml", epochs=100)

# Export to ONNX format for deployment
model.export(format="onnx")

الاستعداد للمستقبل: حالة YOLO26

في حين أن YOLOv5 خيارًا قويًا، إلا أن هذا المجال قد تطور. بالنسبة للمطورين الذين يبحثون عن أحدث ما توصلت إليه التكنولوجيا، فإن YOLO26 يبني على إرث YOLOv5 تحسينات كبيرة في البنية.

يقدم YOLO26 تصميمًا شاملاً NMS مما يلغي الحاجة إلى المعالجة اللاحقة لـ Non-Maximum Suppression. وهذا يقلل من زمن الاستجابة ويبسط خط أنابيب النشر، وهي ميزة كبيرة مقارنة بكل من EfficientDet و YOLOv5. علاوة على ذلك، يستخدم YOLO26 مُحسِّن MuSGD، المستوحى من تدريب LLM، مما يضمن تقاربًا أسرع وتدريبًا مستقرًا حتى على مجموعات البيانات الصعبة.

إذا كان مشروعك يتضمن الذكاء الاصطناعي المتطور، فإن YOLO26 مُحسّن خصيصًا CPU ، ويوفر سرعات تصل إلى 43٪ أسرع من الأجيال السابقة.

تعرف على المزيد حول YOLO26

حالات الاستخدام المثالية

متى تختار EfficientDet

  • قيود البحث: عندما يكون الهدف الأساسي هو دراسة قوانين قياس المركبات أو إعادة إنتاج معايير أكاديمية محددة.
  • أنظمة FLOP منخفضة: في السيناريوهات النظرية التي يكون فيها عدد FLOP هو المقياس الوحيد المهم، مع تجاهل تكاليف الوصول إلى الذاكرة أو زمن الوصول الفعلي على الأجهزة.

متى تختار Ultralytics YOLOv5 أو YOLO26)

  • التطبيقات في الوقت الفعلي: القيادة الذاتية، وتحليلات الفيديو، والروبوتات حيث لا يمكن التنازل عن انخفاض زمن الاستجابة.
  • نشر الحافة: يعمل على Raspberry Pi أو NVIDIA أو الأجهزة المحمولة حيث تعد كفاءة الذاكرةTensorRT أمرين بالغي الأهمية.
  • التطوير السريع: المشاريع التي تتطلب دورات تكرار سريعة وإدارة سهلة لمجموعات البيانات وأوزان مسبقة التدريب موثوقة.
  • مهام متنوعة: إذا كان مشروعك قد يتوسع ليشمل تقدير الوضع أو الكشف عن الكائنات الموجهة (OBB)، فإن Ultralytics يدعم هذه المهام بشكل أساسي.

ملخص

YOLOv5 كل من EfficientDet و YOLOv5 بشكل كبير في مجال الرؤية الحاسوبية. أظهر EfficientDet قوة التوسع المنهجي، بينما YOLOv5 الكشف عالي الأداء YOLOv5 . بالنسبة لمعظم التطبيقات العملية اليوم، يوفر Ultralytics — الذي يمثله YOLOv5 YOLO26المتطور — توازنًا فائقًا بين السرعة والدقة وسهولة الاستخدام، مدعومًا بقاعدة بيانات يتم تحديثها باستمرار ومجتمع مزدهر.

لمزيد من القراءة حول مقارنات النماذج، استكشف كيف تقارن YOLO مع نماذج أخرى مثل YOLOv8 EfficientDet أو النموذج القائم على المحول RT-DETR.


تعليقات