مقارنة النماذج: YOLOv5 مقابل YOLOv6-3.0 للكشف عن الأجسام
يُعد اختيار نموذج الكشف عن الأجسام الأمثل أمرًا بالغ الأهمية لتطبيقات الرؤية الحاسوبية الناجحة. يعتبر كل من Ultralytics YOLOv5 و Meituan YOLOv6-3.0 من الخيارات الشائعة المعروفة بكفاءتها ودقتها. تقدم هذه الصفحة مقارنة فنية لمساعدتك في تحديد النموذج الأفضل الذي يناسب احتياجات مشروعك. نتعمق في الفروق الدقيقة المعمارية ومعايير الأداء وأساليب التدريب والتطبيقات المناسبة، مع تسليط الضوء على نقاط قوة نظام Ultralytics.
Ultralytics YOLOv5: معيار الصناعة المعمول به
المؤلفون: جلين جوتشر
المنظمة: Ultralytics
التاريخ: 2020-06-26
GitHub: https://github.com/ultralytics/yolov5
المستندات: https://docs.ultralytics.com/models/yolov5/
Ultralytics YOLOv5 هو نموذج للكشف عن الكائنات أحادي المرحلة، يشتهر بسرعته وسهولة استخدامه وقابليته للتكيف. تم تطويره من قِبل Ultralytics وهو يمثل خطوة مهمة في إتاحة إمكانية الوصول إلى الكشف عن الأجسام عالية الأداء. تم تصميمه بالكامل في PyTorchويتميز YOLOv5 بعمود فقري CSPDarknet53 وعنق PANet لاستخراج الميزات ودمجها بكفاءة. بنيته معيارية للغاية، مما يسمح بتوسيع نطاقه بسهولة عبر أحجام النماذج المختلفة (n، s، m، l، x) لتلبية متطلبات الأداء المتنوعة.
نقاط القوة في YOLOv5
- السرعة والكفاءة: يتفوق YOLOv5 في سرعة الاستدلال، مما يجعله مثاليًا للتطبيقات في الوقت الفعلي والنشر على الأجهزة الطرفية ذات الموارد المحدودة. كما هو موضح في جدول الأداء، يوفر نموذج YOLOv5n أسرع أوقات استدلال لوحدات المعالجة المركزية ووحدات معالجة الرسوميات بين النماذج الأصغر.
- سهولة الاستخدام: تشتهر YOLOv5 ببساطتها، حيث تقدم تجربة مستخدم مبسطة مع واجهة برمجة تطبيقات بسيطة و وثائق شاملة والعديد من الدروس التعليمية.
- نظام بيئي مُدار بشكل جيد: يستفيد من النظام البيئي المتكامل لـ Ultralytics، بما في ذلك التطوير النشط، ودعم المجتمع القوي عبر Discord، والتحديثات المتكررة، والتكامل السلس مع Ultralytics HUB لـ MLOps.
- تنوع الاستخدامات: يدعم مهامًا متعددة بما في ذلك اكتشاف الكائنات، وتقسيم الحالات، وتصنيف الصور، مما يوفر حلاً أكثر شمولاً من النماذج ذات المهمة الواحدة.
- كفاءة التدريب: يوفر عمليات تدريب فعالة، و أوزان مُدرَّبة مسبقًا متاحة بسهولة، ومتطلبات ذاكرة أقل مقارنة بالعديد من البنى الأخرى، وخاصة النماذج القائمة على المحولات.
نقاط ضعف YOLOv5
- الدقة: على الرغم من دقتها وكفاءتها العالية، قد تقدم النماذج الأحدث مثل YOLOv6-3.0 أو Ultralytics YOLOv8 mAP أعلى قليلاً في بعض المعايير، خاصةً متغيرات النماذج الأكبر.
- اكتشاف قائم على المرساة: يعتمد على مربعات المرساة، والتي قد تتطلب ضبطًا لتحقيق الأداء الأمثل على مجموعات بيانات متنوعة مقارنةً بـ أجهزة الكشف الحديثة الخالية من المرساة.
Meituan YOLOv6-3.0: منافس صناعي
المؤلفون: تشوي لي، لولو لي، ييفي قنغ، هونغليانغ جيانغ، مينغ تشنغ، بو تشانغ، زيدان كه، شياومينغ شو، و شيانغشيانغ تشو
المنظمة: Meituan
التاريخ: 2023-01-13
Arxiv: https://arxiv.org/abs/2301.05586
GitHub: https://github.com/meituan/YOLOv6
المستندات: https://docs.ultralytics.com/models/yolov6/
تم تطوير YOLOv6-3.0 بواسطة Meituan، وهو إطار عمل للكشف عن الكائنات مصمم بشكل أساسي للتطبيقات الصناعية. تم إصداره في أوائل عام 2023، وكان يهدف إلى توفير توازن بين السرعة والدقة مناسبًا لسيناريوهات النشر في العالم الحقيقي في ذلك الوقت. قدم YOLOv6 تعديلات معمارية مثل تصميم فعال للهيكل الأساسي والعنق. قام الإصدار 3.0 بزيادة تحسين هذه العناصر ودمج تقنيات مثل التقطير الذاتي أثناء التدريب لتعزيز الأداء. كما يوفر نماذج محددة محسّنة للنشر على الأجهزة المحمولة (YOLOv6Lite).
نقاط قوة YOLOv6-3.0
- مقايضة جيدة بين السرعة والدقة: يوفر أداءً تنافسيًا، خاصة لمهام الكشف عن الأجسام الصناعية حيث تعظيم mAP على وحدة معالجة الرسوميات GPU هو الهدف.
- دعم تحديد الكمية: يوفر أدوات وبرامج تعليمية لـ تحديد كمية النموذج، وهو أمر مفيد للنشر على الأجهزة ذات الموارد المحدودة.
- تحسين الأجهزة المحمولة: يتضمن متغيرات YOLOv6Lite المصممة خصيصًا للاستدلال المستند إلى الأجهزة المحمولة أو وحدة المعالجة المركزية CPU.
نقاط ضعف YOLOv6-3.0
- تعددية المهام محدودة: يركز بشكل أساسي على اكتشاف الكائنات، ويفتقر إلى الدعم الأصلي للتجزئة أو التصنيف أو تقدير الوضع الموجود في نماذج Ultralytics مثل YOLOv5 و YOLOv8.
- النظام البيئي والصيانة: على الرغم من أنه مفتوح المصدر، إلا أن النظام البيئي ليس شاملاً أو نشطًا مثل منصة Ultralytics، مما قد يؤدي إلى تحديثات أبطأ ودعم مجتمعي أقل.
- استخدام أعلى للموارد: يمكن أن تحتوي نماذج YOLOv6 الأكبر على معلمات وعمليات FLOPs أكثر بكثير مقارنة بمكافئاتها في YOLOv5 للحصول على mAP مماثل، مما قد يتطلب المزيد من موارد الحوسبة.
مقارنة أداء مباشرة
يقدم الجدول أدناه مقارنة مباشرة لمقاييس الأداء بين نماذج YOLOv5 و YOLOv6-3.0 على مجموعة بيانات COCO. تُظهر Ultralytics YOLOv5 سرعة فائقة على كل من وحدة المعالجة المركزية CPU ووحدة معالجة الرسومات GPU للنماذج الأصغر، مما يجعلها خيارًا ممتازًا لتطبيقات الحافة في الوقت الفعلي. في حين أن نماذج YOLOv6-3.0 الأكبر يمكن أن تحقق ذروة mAP أعلى، إلا أن YOLOv5 توفر أداءً أكثر توازناً وكفاءة عبر اللوحة، خاصة عند النظر إلى عدد المعلمات وعمليات FLOPs الأقل.
النموذج | الحجم (بالبكسل) |
mAPval 50-95 |
السرعة وحدة المعالجة المركزية CPU ONNX (بالمللي ثانية) |
السرعة T4 TensorRT10 (بالمللي ثانية) |
المعلمات (M) |
FLOPs (B) |
---|---|---|---|---|---|---|
YOLOv5n | 640 | 28.0 | 73.6 | 1.12 | 2.6 | 7.7 |
YOLOv5s | 640 | 37.4 | 120.7 | 1.92 | 9.1 | 24.0 |
YOLOv5m | 640 | 45.4 | 233.9 | 4.03 | 25.1 | 64.2 |
YOLOv5l | 640 | 49.0 | 408.4 | 6.61 | 53.2 | 135.0 |
YOLOv5x | 640 | 50.7 | 763.2 | 11.89 | 97.2 | 246.4 |
YOLOv6-3.0n | 640 | 37.5 | - | 1.17 | 4.7 | 11.4 |
YOLOv6-3.0s | 640 | 45.0 | - | 2.66 | 18.5 | 45.3 |
YOLOv6-3.0m | 640 | 50.0 | - | 5.28 | 34.9 | 85.8 |
YOLOv6-3.0l | 640 | 52.8 | - | 8.95 | 59.6 | 150.7 |
منهجية التدريب
يستفيد كلا النموذجين من تقنيات التعلم العميق القياسية للتدريب على مجموعات بيانات كبيرة مثل COCO. ومع ذلك، يستفيد Ultralytics YOLOv5 بشكل كبير من نظام Ultralytics البيئي، حيث يقدم سير عمل تدريب مبسط و أدلة شاملة وتحسين AutoAnchor والتكامل مع أدوات مثل Weights & Biases و ClearML لتتبع التجارب. يبسط هذا النهج المتكامل دورة التطوير ويسرع الوقت اللازم للنشر. يتبع تدريب YOLOv6-3.0 الإجراءات الموضحة في مستودعه الرسمي.
حالات الاستخدام المثالية
- Ultralytics YOLOv5: موصى به للغاية للتطبيقات التي تتطلب أداءً في الوقت الفعلي و سهولة النشر، خاصة على وحدات المعالجة المركزية (CPU) أو الأجهزة الطرفية. إن تنوعه ودعمه الشامل واستخدامه الفعال للموارد يجعله مثاليًا للنماذج الأولية السريعة وتطبيقات الهاتف المحمول والمراقبة بالفيديو (رؤية الكمبيوتر لمنع السرقة) والمشاريع التي تستفيد من نظام بيئي ناضج وموثق جيدًا.
- Meituan YOLOv6-3.0: منافس قوي عندما يكون الهدف الأساسي هو تحقيق أقصى قدر من الدقة على وحدة معالجة الرسوميات GPU، مع الاستمرار في طلب استدلال سريع. إنه مناسب للتطبيقات الصناعية حيث تبرر التحسينات الطفيفة في متوسط الدقة (mAP) مقارنة بـ YOLOv5 زيادة محتملة في التعقيد أو دعم أقل للنظام البيئي.
الخلاصة
لا يزال Ultralytics YOLOv5 خيارًا متميزًا، ويحظى بتقدير خاص لسرعته الاستثنائية وسهولة استخدامه ونظامه البيئي القوي. إنه يوفر توازنًا ممتازًا بين الأداء والكفاءة، مدعومًا بوثائق شاملة ودعم المجتمع، مما يجعله في متناول المطورين والباحثين.
يوفر YOLOv6-3.0 أداءً تنافسيًا، لا سيما من حيث ذروة mAP للنماذج الأكبر حجمًا على وحدة معالجة الرسومات (GPU). إنه بمثابة بديل قابل للتطبيق للمستخدمين الذين يعطون الأولوية لأعلى دقة ممكنة داخل إطار عمل YOLO لمهام صناعية متخصصة.
بالنسبة لأولئك الذين يبحثون عن أحدث التطورات، ضع في اعتبارك استكشاف نماذج Ultralytics الأحدث مثل YOLOv8 و YOLOv9 و YOLOv10 و YOLO11، والتي توفر مزيدًا من التحسينات في الأداء والتنوع والكفاءة. توفر النماذج المتخصصة مثل RT-DETR أيضًا مزايا فريدة لحالات استخدام محددة.
استكشف المجموعة الكاملة من الخيارات في وثائق نماذج Ultralytics.