YOLOv5 EfficientDet: مقارنة فنية بين نماذج الرؤية الرائدة
في عالم الرؤية الحاسوبية، يعد اختيار البنية المثلى لاكتشاف الأجسام قرارًا محوريًا يؤثر على كل شيء بدءًا من دقة النموذج وحتى تكاليف النشر. يقدم هذا الدليل مقارنة تقنية شاملة بين Ultralytics YOLOv5 و EfficientDet، وهما نموذجان مؤثران شكّلا مشهد الذكاء الاصطناعي الحديث.
بينما قدم EfficientDet مفهوم الكفاءة القابلة للتطوير من خلال التوسع المركب، YOLOv5 هذا المجال من خلال الجمع بين الأداء المتطور وتجربة المستخدم التي لا مثيل لها. يتعمق هذا التحليل في الاختلافات المعمارية ومقاييس الأداء وقابلية التطبيق في العالم الواقعي لمساعدة المطورين والباحثين على اتخاذ قرارات تستند إلى البيانات.
نظرة عامة على النموذج
Ultralytics YOLOv5
YOLOv5 (You Only Look Once الإصدار 5) هو نموذج رائد في تاريخ اكتشاف الكائنات. تم إصداره في منتصف عام 2020 بواسطة Ultralytics وسرعان ما أصبح المعيار الصناعي بفضل توازنه بين السرعة والدقة وسهولة الاستخدام. على عكس سابقيه، YOLOv5 أول YOLO يتم تنفيذه أصلاً في PyTorch، مما جعله متاحًا بشكل استثنائي لمجتمع الباحثين ومطوري المؤسسات على حد سواء.
- المؤلف: جلين جوتشر
- المؤسسة:Ultralytics
- التاريخ: 2020-06-26
- GitHub:YOLOv5 Ultralytics YOLOv5
EfficientDet
EfficientDet هي مجموعة من نماذج الكشف عن الكائنات التي طورتها Google . وهي تستند إلى الهيكل الأساسي EfficientNet وتقدم شبكة هرمية ثنائية الاتجاه مرجحة (BiFPN) وطريقة قياس مركبة تقيس بشكل موحد الدقة والعمق والعرض لجميع الشبكات الأساسية وشبكات الميزات وشبكات التنبؤ بالصناديق/الفئات.
- المؤلفون: مينغشينغ تان، رومينغ بانغ، وكوك ف. لي
- المؤسسة:Google Research
- التاريخ: 2019-11-20
- Arxiv:EfficientDet: كشف الأجسام القابل للتطوير والفعال
- GitHub:مستودعGoogle
معايير الأداء التفاعلية
لفهم المفاضلات بين هذه البنى، من الضروري تصور أدائها على معايير قياسية. يقارن الرسم البياني أدناه المقاييس الرئيسية في COCO مع تسليط الضوء على حدود السرعة والدقة.
مقاييس الأداء التفصيلية
يقدم الجدول التالي نظرة تفصيلية على أداء مختلف نماذج المقاييس. تظهر Ultralytics باستمرار سرعات استدلال فائقة، خاصةً عند تحسينها لتطبيقات الوقت الفعلي.
| النموذج | الحجم (بالبكسل) | mAPval 50-95 | السرعة وحدة المعالجة المركزية CPU ONNX (بالمللي ثانية) | السرعة T4 TensorRT10 (بالمللي ثانية) | المعلمات (M) | FLOPs (B) |
|---|---|---|---|---|---|---|
| YOLOv5n | 640 | 28.0 | 73.6 | 1.12 | 2.6 | 7.7 |
| YOLOv5s | 640 | 37.4 | 120.7 | 1.92 | 9.1 | 24.0 |
| YOLOv5m | 640 | 45.4 | 233.9 | 4.03 | 25.1 | 64.2 |
| YOLOv5l | 640 | 49.0 | 408.4 | 6.61 | 53.2 | 135.0 |
| YOLOv5x | 640 | 50.7 | 763.2 | 11.89 | 97.2 | 246.4 |
| EfficientDet-d0 | 640 | 34.6 | 10.2 | 3.92 | 3.9 | 2.54 |
| EfficientDet-d1 | 640 | 40.5 | 13.5 | 7.31 | 6.6 | 6.1 |
| EfficientDet-d2 | 640 | 43.0 | 17.7 | 10.92 | 8.1 | 11.0 |
| EfficientDet-d3 | 640 | 47.5 | 28.0 | 19.59 | 12.0 | 24.9 |
| EfficientDet-d4 | 640 | 49.7 | 42.8 | 33.55 | 20.7 | 55.2 |
| EfficientDet-d5 | 640 | 51.5 | 72.5 | 67.86 | 33.7 | 130.0 |
| EfficientDet-d6 | 640 | 52.6 | 92.8 | 89.29 | 51.9 | 226.0 |
| EfficientDet-d7 | 640 | 53.7 | 122.0 | 128.07 | 51.9 | 325.0 |
الهندسة المعمارية والتصميم
يكمن الاختلاف الأساسي بين هذين النموذجين في فلسفة تصميمهما: YOLOv5 للاستدلال في الوقت الفعلي وسهولة الهندسة، بينما يركز EfficientDet على كفاءة المعلمات من خلال دمج الميزات المعقدة.
YOLOv5: مصمم للسرعة وسهولة الاستخدام
YOLOv5 شبكة CSPDarknet (شبكة جزئية متعددة المراحل) التي تعزز تدفق التدرج وتقلل من الاختناقات الحسابية. ويستخدم عنقها شبكة PANet (شبكة تجميع المسارات) لتجميع الميزات عبر مستويات مختلفة، مما يضمن اكتشاف الأجسام الكبيرة والصغيرة بدقة عالية.
ميزة Ultralytics
تتمثل إحدى أكبر نقاط قوة YOLOv5 في تصميمها المعياري. التركيز على "Bag of Freebies" و"Bag of Specials" — تقنيات تحسين تعمل على تحسين الدقة دون زيادة تكلفة الاستدلال — يجعلها قوية للغاية في سيناريوهات النشر المتنوعة.
EfficientDet: التحجيم المركب و BiFPN
تم تصميم EfficientDet على أساس EfficientNet ويقدم BiFPN (شبكة هرمية ثنائية الاتجاه). بينما تجمع شبكات FPN القياسية الميزات من مستويات مختلفة، تطبق BiFPN أوزانًا قابلة للتعلم على هذه الميزات، مما يسمح للشبكة بتعلم الميزات المدخلة الأكثر أهمية. على الرغم من كفاءتها النظرية من حيث FLOPs، غالبًا ما تؤدي أنماط الوصول غير المنتظمة المعقدة إلى الذاكرة في BiFPN إلى إبطاء الاستدلال في العالم الواقعي على وحدات معالجة الرسومات (GPU) مقارنةً بهيكل CSPNet المبسط في YOLOv5.
التدريب وسهولة الاستخدام
بالنسبة للمطورين، غالبًا ما تكون المقاييس "الناعمة" للنموذج — مدى سهولة التدريب والنشر والتصحيح — بنفس أهمية الدقة الأولية.
تجربة مستخدم مبسطة
تشتهر Ultralytics بتجربتها التي تبدأ من الصفر إلى القمة. YOLOv5 واجهة سطر أوامر (CLI) سلسة Python تتيح للمستخدمين بدء التدريب على البيانات المخصصة في غضون دقائق. في المقابل، غالبًا ما تتطلب تطبيقات EfficientDet ملفات تكوين أكثر تعقيدًا ومعرفة أعمق بـ TensorFlow PyTorch محددة لتعمل بفعالية.
كفاءة التدريب والموارد
YOLOv5 تحسين YOLOv5 بشكل كبير من أجل كفاءة التدريب. ويشمل ميزات مثل الحساب التلقائي للمرساة، وزيادة البيانات الفسيفسائية، وتطور المعلمات الفائقة. علاوة على ذلك، عادةً ما تتميز Ultralytics بمتطلبات ذاكرة أقل بكثير أثناء التدريب مقارنةً بـ EfficientDet والبنى القائمة على المحولات. وهذا يسمح للباحثين بتدريب أحجام دفعات أكبر على وحدات معالجة الرسومات (GPU) المخصصة للمستهلكين، مما يتيح الوصول إلى تدريب النماذج المتطورة للجميع.
from ultralytics import YOLO
# Load a pre-trained YOLO model (recommended over YOLOv5 for new projects)
model = YOLO("yolo26n.pt")
# Train the model on a custom dataset
model.train(data="coco8.yaml", epochs=100, imgsz=640)
تعدد الاستخدامات والتطبيقات الواقعية
في حين أن EfficientDet هو في المقام الأول كاشف كائنات، فإن Ultralytics قد وسع قدرات YOLO من مجرد مربعات الحدود البسيطة.
- YOLOv5 : يدعم اكتشاف الكائنات وتجزئة الحالات وتصنيف الصور.
- قدرات EfficientDet: تركز بشكل أساسي على اكتشاف الكائنات، مع بعض التعديلات للتجزئة التي تكون أقل تكاملاً في سير العمل الموحد.
حالات الاستخدام المثالية
اختر Ultralytics YOLOv5 أو أحدث) إذا:
- الأداء في الوقت الفعلي أمر بالغ الأهمية: تتطلب تطبيقات مثل القيادة الذاتية وتحليلات الفيديو والروبوتات زمن انتقال منخفضًا، وهو ما توفره YOLO .
- نشر الحافة: تقوم بالنشر على الأجهزة المحمولة أو Raspberry Pi أو NVIDIA حيث تكون الذاكرة والقدرة الحاسوبية محدودة.
- التطوير السريع: تحتاج إلى التكرار بسرعة باستخدام واجهة برمجة تطبيقات مستقرة وموثقة جيدًا ودعم مجتمع نشط.
اختر EfficientDet إذا:
- قيود FLOPs لها أهمية قصوى: في سيناريوهات نظرية محددة للغاية حيث تكون FLOPs هي القيد الوحيد (بدلاً من زمن الاستجابة)، قد يوفر قياس EfficientDet مزايا.
- أساسيات البحث: أنت تقارن بشكل خاص مع مستخلصات الميزات القائمة على EfficientNet في بيئة أكاديمية.
المستقبل: YOLO26
في حين أن YOLOv5 أداة قوية، إلا أن هذا المجال قد تطور. فقد أطلقت Ultralytics YOLO26، وهو نموذج من الجيل التالي يعيد تعريف المعايير التي وضعها أسلافه.
يقدم YOLO26 تصميمًا شاملاً NMS مما يلغي الحاجة إلى المعالجة اللاحقة لـ Non-Maximum Suppression. وينتج عن ذلك خطوط أنابيب نشر أبسط واستنتاج أسرع. علاوة على ذلك، يزيل YOLO26 Distribution Focal Loss (DFL) لتحسين توافق الحواف ويستخدم مُحسِّن MuSGD الجديد، المستوحى من ابتكارات تدريب LLM، لضمان تقارب مستقر.
بالنسبة للمطورين الذين يبحثون عن أفضل أداء على الإطلاق، يوصى بشدة بالانتقال إلى YOLO26. فهو يوفر CPU أسرع بنسبة تصل إلى 43٪ CPU مقارنةً بالأجيال السابقة، مما يجعله الخيار الأفضل لتطبيقات الذكاء الاصطناعي الحديثة.
الخلاصة
اكتسب كل من YOLOv5 EfficientDet مكانتهما في قاعة مشاهير الرؤية الحاسوبية. أظهر EfficientDet قوة التوسع المركب، بينما YOLOv5 أن الأداء العالي يمكن أن يكون متاحًا وسهل الاستخدام.
ومع ذلك، بالنسبة للتطبيقات العملية في عام 2026، يوفر Ultralytics ميزة واضحة. إن الجمع بين الصيانة النشطة، والمنصة الموحدة لتعليق البيانات والتدريب، والابتكار المعماري المستمر يجعل نماذج مثل YOLOv5— و YOLO26المتطورة — الخيار المفضل للمحترفين.
للمهتمين باستكشاف هياكل معمارية حديثة أخرى، يمكنكم مراجعة المقارنات مع YOLO11 أو RT-DETR لفهم نطاق الأدوات المتاحة بشكل كامل.