مقارنة النماذج: YOLOv6-3.0 مقابل YOLOv5 لاكتشاف الكائنات
يُعد اختيار نموذج الكشف عن الأجسام الأمثل أمرًا بالغ الأهمية لتطبيقات الرؤية الحاسوبية الناجحة. يعتبر كل من Meituan YOLOv6-3.0 و Ultralytics YOLOv5 من الخيارات الشائعة المعروفة بكفاءتها ودقتها. تقدم هذه الصفحة مقارنة فنية لمساعدتك في تحديد النموذج الأفضل الذي يناسب احتياجات مشروعك. نتعمق في الفروق الدقيقة المعمارية ومعايير الأداء وأساليب التدريب والتطبيقات المناسبة، مع تسليط الضوء على نقاط قوة نظام Ultralytics.
Meituan YOLOv6-3.0
إن YOLOv6-3.0، الذي طورته Meituan، هو إطار عمل للكشف عن الأجسام مصمم بشكل أساسي للتطبيقات الصناعية. تم إصداره في أوائل عام 2023، وكان يهدف إلى توفير توازن بين السرعة والدقة مناسب لسيناريوهات النشر في العالم الحقيقي.
- المؤلفون: تشوي لي، لولو لي، ييفي قنغ، هونغليانغ جيانغ، منغ تشنغ، بو تشانغ، زيدان كه، شياومينغ شو، وشيانغشيانغ تشو
- المنظمة: Meituan
- التاريخ: 2023-01-13
- Arxiv: https://arxiv.org/abs/2301.05586
- GitHub: https://github.com/meituan/YOLOv6
- الوثائق: https://docs.ultralytics.com/models/yolov6/
البنية والميزات الرئيسية
قدم YOLOv6 تعديلات معمارية مثل العمود الفقري الفعال والقابل لإعادة التهيئة وتصميم العنق المبسط. قامت النسخة 3.0 بتحسين هذه العناصر بشكل أكبر ودمجت تقنيات مثل التقطير الذاتي أثناء التدريب لتعزيز الأداء. كما أنها توفر نماذج محددة مُحسَّنة للنشر على الأجهزة المحمولة (YOLOv6Lite).
نقاط القوة
- مقايضة جيدة بين السرعة والدقة: يوفر أداءً تنافسيًا، خاصة لمهام الكشف عن الأجسام الصناعية على وحدة معالجة الرسوميات GPU.
- دعم تحديد الكمية: يوفر أدوات وبرامج تعليمية لـ تحديد كمية النموذج، وهو أمر مفيد للنشر على الأجهزة ذات الموارد المحدودة.
- تحسين الأجهزة المحمولة: يتضمن متغيرات YOLOv6Lite المصممة خصيصًا للاستدلال المستند إلى الأجهزة المحمولة أو وحدة المعالجة المركزية CPU.
نقاط الضعف
- تعددية المهام محدودة: يركز بشكل أساسي على اكتشاف الكائنات، ويفتقر إلى الدعم الأصلي لـ تجزئة المثيلات أو تصنيف الصور و تقدير الوضع الموجود في نماذج Ultralytics مثل YOLOv8.
- النظام البيئي والصيانة: على الرغم من أنه مفتوح المصدر، إلا أن النظام البيئي ليس شاملاً أو نشطًا مثل منصة Ultralytics. قد يؤدي ذلك إلى تحديثات أبطأ، ودعم مجتمعي أقل، وتجربة مستخدم أكثر تعقيدًا.
- استخدام أعلى للموارد: كما هو موضح في جدول الأداء، يمكن أن تحتوي نماذج YOLOv6 الأكبر على معلمات وعمليات FLOPs أكثر من نماذج YOLOv5 المماثلة، مما قد يتطلب المزيد من موارد الحوسبة.
Ultralytics YOLOv5
Ultralytics YOLOv5 هو نموذج للكشف عن الأجسام بمرحلة واحدة، يشتهر بسرعة وسهولة استخدامه وقابليته للتكيف. تم تطويره بواسطة Ultralytics، وهو يمثل خطوة مهمة في جعل الكشف عن الأجسام عالي الأداء في متناول جمهور واسع.
- المؤلفون: جلين جوتشر
- المنظمة: Ultralytics
- التاريخ: 2020-06-26
- GitHub: https://github.com/ultralytics/yolov5
- الوثائق: https://docs.ultralytics.com/models/yolov5/
مصمم بالكامل في PyTorchيتميز YOLOv5 بعمود فقري CSPDarkDarknet53 وعنق PANet لاستخراج الميزات ودمجها بكفاءة. بنيته معيارية للغاية، مما يسمح بتوسيع نطاقه بسهولة عبر أحجام النماذج المختلفة (n، s، m، l، x) لتلبية متطلبات الأداء المتنوعة.
نقاط القوة في YOLOv5
- السرعة والكفاءة: يتفوق YOLOv5 في سرعة الاستدلال، مما يجعله مثاليًا للتطبيقات في الوقت الفعلي والنشر على الأجهزة الطرفية ذات الموارد المحدودة. أداء وحدة المعالجة المركزية الخاصة به جدير بالذكر بشكل خاص.
- سهولة الاستخدام: تشتهر YOLOv5 ببساطتها، حيث تقدم تجربة مستخدم مبسطة مع واجهة برمجة تطبيقات بسيطة و وثائق شاملة والعديد من الدروس التعليمية.
- نظام بيئي مُدار بشكل جيد: يستفيد من النظام البيئي المتكامل لـ Ultralytics، بما في ذلك التطوير النشط، ودعم المجتمع القوي، والتحديثات المتكررة، والتكامل السلس مع Ultralytics HUB لـ MLOps.
- موازنة الأداء: يحقق توازنًا قويًا بين السرعة والدقة، مما يجعله مناسبًا لسيناريوهات النشر المتنوعة في العالم الحقيقي.
- كفاءة التدريب: يوفر عمليات تدريب فعالة، وأوزان مُدرَّبة مسبقًا متاحة بسهولة، ومتطلبات ذاكرة أقل مقارنة بالعديد من البنى الأخرى، وخاصة النماذج القائمة على المحولات.
- تنوع الاستخدامات: يدعم مهامًا متعددة بما في ذلك اكتشاف الكائنات وتقسيم الحالات وتصنيف الصور ضمن إطار عمل موحد.
نقاط ضعف YOLOv5
- ذروة الدقة: على الرغم من دقتها وكفاءتها العالية، قد توفر النماذج الأحدث مثل YOLOv6-3.0 أو Ultralytics YOLOv8 قيمة mAP أعلى قليلاً في بعض المعايير، وخاصةً متغيرات النماذج الأكبر حجمًا على وحدة معالجة الرسومات (GPU).
مقارنة أداء مباشرة: YOLOv6-3.0 ضد YOLOv5
يقدم الجدول أدناه مقارنة تفصيلية للأداء بين نماذج YOLOv6-3.0 و YOLOv5 على مجموعة بيانات COCO.
النموذج | الحجم (بالبكسل) |
mAPval 50-95 |
السرعة وحدة المعالجة المركزية CPU ONNX (بالمللي ثانية) |
السرعة T4 TensorRT10 (بالمللي ثانية) |
المعلمات (M) |
FLOPs (B) |
---|---|---|---|---|---|---|
YOLOv6-3.0n | 640 | 37.5 | - | 1.17 | 4.7 | 11.4 |
YOLOv6-3.0s | 640 | 45.0 | - | 2.66 | 18.5 | 45.3 |
YOLOv6-3.0m | 640 | 50.0 | - | 5.28 | 34.9 | 85.8 |
YOLOv6-3.0l | 640 | 52.8 | - | 8.95 | 59.6 | 150.7 |
YOLOv5n | 640 | 28.0 | 73.6 | 1.12 | 2.6 | 7.7 |
YOLOv5s | 640 | 37.4 | 120.7 | 1.92 | 9.1 | 24.0 |
YOLOv5m | 640 | 45.4 | 233.9 | 4.03 | 25.1 | 64.2 |
YOLOv5l | 640 | 49.0 | 408.4 | 6.61 | 53.2 | 135.0 |
YOLOv5x | 640 | 50.7 | 763.2 | 11.89 | 97.2 | 246.4 |
من البيانات، تميل نماذج YOLOv6-3.0 إلى تحقيق درجات mAP أعلى لأحجامها على وحدة معالجة الرسوميات (GPU). ومع ذلك، يوضح Ultralytics YOLOv5 توازنًا فائقًا في الأداء، خاصة من حيث سرعة وحدة المعالجة المركزية (CPU) وكفاءة النموذج. على سبيل المثال، YOLOv5n أسرع بكثير على وحدة المعالجة المركزية (CPU) ولديه عدد أقل من المعلمات وعمليات الفلوبس (FLOPs) من أي نموذج YOLOv6-3.0، مما يجعله خيارًا ممتازًا للتطبيقات خفيفة الوزن وفي الوقت الفعلي. في حين أن YOLOv6-3.0l لديه أعلى mAP، إلا أن YOLOv5x يوفر mAP تنافسيًا مع إطار عمل موثق ومدعوم جيدًا.
منهجية التدريب
يستفيد كلا النموذجين من تقنيات التعلم العميق القياسية للتدريب على مجموعات بيانات كبيرة مثل COCO. يستفيد Ultralytics YOLOv5 بشكل كبير من نظام Ultralytics البيئي، حيث يقدم سير عمل تدريب مبسط و أدلة شاملة وتحسين AutoAnchor والتكامل مع أدوات مثل Weights & Biases و ClearML لتتبع التجارب. يتبع تدريب YOLOv6-3.0 الإجراءات الموضحة في مستودعه، الأمر الذي قد يتطلب المزيد من الإعداد اليدوي ويفتقر إلى أدوات MLOps المتكاملة لمنصة Ultralytics.
حالات الاستخدام المثالية
- Meituan YOLOv6-3.0: منافس قوي عندما يكون الهدف الأساسي هو تحقيق أقصى قدر من الدقة على وحدة معالجة الرسوميات GPU، مع الاستمرار في طلب استدلال سريع. إنه مناسب للتطبيقات التي تبرر فيها التحسينات الطفيفة في متوسط الدقة (mAP) مقارنة بـ YOLOv5 زيادة محتملة في التعقيد أو دعم أقل للنظام البيئي، كما هو الحال في الأتمتة الصناعية المتخصصة.
- Ultralytics YOLOv5: موصى به للغاية للتطبيقات التي تتطلب أداءً في الوقت الفعلي و سهولة النشر، خاصة على وحدات المعالجة المركزية (CPU) أو الأجهزة الطرفية. إن تنوعه ودعمه الشامل واستخدامه الفعال للموارد يجعله مثاليًا للنماذج الأولية السريعة وتطبيقات الهاتف المحمول و المراقبة بالفيديو والمشاريع التي تستفيد من نظام بيئي ناضج وموثق جيدًا.
الخلاصة
لا يزال Ultralytics YOLOv5 خيارًا متميزًا، ويحظى بتقدير خاص لسرعته الاستثنائية وسهولة استخدامه ونظامه البيئي القوي. إنه يوفر توازنًا ممتازًا بين الأداء والكفاءة، مدعومًا بوثائق شاملة ودعم المجتمع، مما يجعله في متناول المطورين والباحثين.
يوفر YOLOv6-3.0 أداءً تنافسيًا، لا سيما من حيث ذروة mAP للنماذج الأكبر حجمًا على وحدة معالجة الرسومات (GPU). إنه بمثابة بديل قابل للتطبيق للمستخدمين الذين يعطون الأولوية لأعلى دقة ممكنة داخل إطار عمل YOLO، خاصة للتطبيقات الصناعية.
بالنسبة لأولئك الذين يبحثون عن أحدث التطورات، ضع في اعتبارك استكشاف نماذج Ultralytics الأحدث مثل YOLOv8 و YOLOv9 و YOLOv10 و YOLO11، والتي توفر مزيدًا من التحسينات في الأداء والتنوع والكفاءة. توفر النماذج المتخصصة مثل RT-DETR أيضًا مزايا فريدة لحالات استخدام محددة.
استكشف المجموعة الكاملة من الخيارات في وثائق نماذج Ultralytics.