YOLOv5 ضد YOLOv10: مقارنة تقنية تفصيلية
يعد اختيار نموذج الكشف عن الكائنات المناسب قرارًا حاسمًا لأي مشروع رؤية حاسوبية، لأنه يؤثر بشكل مباشر على أداء التطبيق وسرعته ومتطلبات الموارد. تقدم هذه الصفحة مقارنة فنية متعمقة بين نموذجين بارزين: Ultralytics YOLOv5، وهو معيار الصناعة الراسخ والواسع الانتشار، و YOLOv10، وهو نموذج متطور يدفع حدود الكفاءة في الوقت الفعلي. سيستكشف هذا التحليل الاختلافات المعمارية وقياسات الأداء وحالات الاستخدام المثالية لمساعدتك في اتخاذ خيار مستنير.
Ultralytics YOLOv5: المعيار الراسخ والمتعدد الاستخدامات
أصبح Ultralytics YOLOv5 معيارًا صناعيًا، ويُحتفى به لتوازنه الاستثنائي بين السرعة والدقة وسهولة الاستخدام التي لا مثيل لها. لقد قام بتشغيل عدد لا يحصى من التطبيقات في مختلف القطاعات منذ إطلاقه.
تفاصيل فنية:
- المؤلفون: Glenn Jocher
- المنظمة: Ultralytics
- التاريخ: 2020-06-26
- GitHub: https://github.com/ultralytics/yolov5
- المستندات: https://docs.ultralytics.com/models/yolov5/
البنية والميزات الرئيسية
تم تطوير YOLOv5 في PyTorch، ويتميز ببنية مرنة مع عمود فقري CSPDarknet53 وعنق PANet لتجميع الميزات القوي. رأس الكشف القائم على المرساة الخاص به فعال للغاية. إحدى خصائصه المميزة هي قابليته للتوسع، حيث يقدم مجموعة من أحجام النماذج (n, s, m, l, x) لتلبية الميزانيات الحسابية المتنوعة واحتياجات الأداء.
نقاط القوة
- سرعة وكفاءة استثنائيتان: تم تحسين YOLOv5 بشكل كبير للاستدلال السريع، مما يجعله خيارًا مفضلًا للأنظمة في الوقت الفعلي على كل من أجهزة CPU و GPU.
- سهولة الاستخدام: يشتهر YOLOv5 بتجربة المستخدم المبسطة و Python API البسيطة والـ وثائق الشاملة، مما يقلل بشكل كبير من حاجز الدخول لتطوير حلول رؤية الكمبيوتر المتقدمة.
- نظام بيئي مُدار بشكل جيد: باعتباره نموذج Ultralytics، فإنه يستفيد من مجتمع كبير ونشط وتحديثات متكررة وتكامل سلس مع أدوات مثل Ultralytics HUB للتدريب والنشر بدون تعليمات برمجية.
- تنوع الاستخدامات: لا يقتصر استخدام YOLOv5 على اكتشاف الكائنات فقط؛ بل يدعم أيضًا تقسيم الحالات وتصنيف الصور، مما يجعله أداة متعددة الاستخدامات لمهام الرؤية المختلفة.
- كفاءة التدريب: يقدم النموذج عمليات تدريب فعالة مع أوزان مُدرَّبة مسبقًا متاحة بسهولة، ويتطلب عمومًا ذاكرة أقل للتدريب مقارنة بالبنى الأكثر تعقيدًا.
نقاط الضعف
- اكتشاف قائم على المرساة: يمكن أن يتطلب اعتماده على مربعات مرساة محددة مسبقًا في بعض الأحيان ضبطًا إضافيًا لتحقيق الأداء الأمثل على مجموعات البيانات ذات الأشكال أو الأحجام غير التقليدية للكائنات، مقارنةً بـ أجهزة الكشف الحديثة الخالية من المرساة.
- الدقة مقابل النماذج الأحدث: على الرغم من دقتها العالية، فقد تجاوزتها البنى الأحدث مثل YOLOv10 في mAP في المعايير القياسية مثل COCO.
حالات الاستخدام
إن تنوع وكفاءة YOLOv5 يجعله حصان عمل موثوقًا به للعديد من التطبيقات:
- الحوسبة الطرفية: متغيراتها الأصغر مثالية للنشر على الأجهزة ذات الموارد المحدودة مثل Raspberry Pi و NVIDIA Jetson.
- الأتمتة الصناعية: تستخدم على نطاق واسع في مراقبة الجودة وأتمتة العمليات في التصنيع.
- الأمن والمراقبة: تشغيل المراقبة في الوقت الفعلي في أنظمة الأمان وتطبيقات السلامة العامة.
- النماذج الأولية السريعة: سهولة استخدامه تجعله مثاليًا لتطوير واختبار الأفكار الجديدة بسرعة.
YOLOv10: أحدث كاشف في الوقت الفعلي
يمثل YOLOv10 قفزة كبيرة إلى الأمام في الكشف عن الكائنات في الوقت الفعلي، مع التركيز على إنشاء خط أنابيب فعال حقًا من طرف إلى طرف من خلال إلغاء الحاجة إلى Non-Maximum Suppression (NMS).
تفاصيل فنية:
- المؤلفون: Ao Wang, Hui Chen, Lihao Liu، وآخرون.
- المنظمة: جامعة تسينغ هوا
- التاريخ: 2024-05-23
- Arxiv: https://arxiv.org/abs/2405.14458
- GitHub: https://github.com/THU-MIG/yolov10
- المستندات: https://docs.ultralytics.com/models/yolov10/
البنية والميزات الرئيسية
يكمن الابتكار الأساسي في YOLOv10 في استراتيجية التدريب الخالية من NMS، والتي تستخدم تعيينات مزدوجة متسقة لحل التنبؤات المتضاربة أثناء التدريب. كما هو مفصل في ورقة arXiv الخاصة به، فإن هذا يلغي خطوة المعالجة اللاحقة NMS، والتي كانت تقليديًا عنق الزجاجة الذي يزيد من زمن انتقال الاستدلال. علاوة على ذلك، تستخدم YOLOv10 تصميم نموذج شامل مدفوع بالكفاءة والدقة، وتحسين المكونات مثل backbone والعنق لتقليل التكرار الحسابي مع تحسين قدرة الكشف.
تحليل ومقارنة الأداء
يضع YOLOv10 معيارًا جديدًا لأحدث التقنيات في الموازنة بين السرعة والدقة. يوضح الجدول أدناه أن نماذج YOLOv10 تحقق باستمرار دقة أعلى مع عدد أقل من المعلمات وعمليات الفاصلة العائمة في الثانية (FLOPs) مقارنة بنظيراتها في YOLOv5. على سبيل المثال، يتفوق YOLOv10-M على YOLOv5-x في mAP مع وجود ما يقرب من 6 أضعاف أقل من المعلمات و 4 أضعاف أقل من FLOPs. هذه الكفاءة الرائعة تجعله منافسًا قويًا للتطبيقات الحديثة.
النموذج | الحجم (بالبكسل) |
mAPval 50-95 |
السرعة وحدة المعالجة المركزية CPU ONNX (بالمللي ثانية) |
السرعة T4 TensorRT10 (بالمللي ثانية) |
المعلمات (M) |
FLOPs (B) |
---|---|---|---|---|---|---|
YOLOv5n | 640 | 28.0 | 73.6 | 1.12 | 2.6 | 7.7 |
YOLOv5s | 640 | 37.4 | 120.7 | 1.92 | 9.1 | 24.0 |
YOLOv5m | 640 | 45.4 | 233.9 | 4.03 | 25.1 | 64.2 |
YOLOv5l | 640 | 49.0 | 408.4 | 6.61 | 53.2 | 135.0 |
YOLOv5x | 640 | 50.7 | 763.2 | 11.89 | 97.2 | 246.4 |
YOLOv10n | 640 | 39.5 | - | 1.56 | 2.3 | 6.7 |
YOLOv10s | 640 | 46.7 | - | 2.66 | 7.2 | 21.6 |
YOLOv10m | 640 | 51.3 | - | 5.48 | 15.4 | 59.1 |
YOLOv10b | 640 | 52.7 | - | 6.54 | 24.4 | 92.0 |
YOLOv10l | 640 | 53.3 | - | 8.33 | 29.5 | 120.3 |
YOLOv10x | 640 | 54.4 | - | 12.2 | 56.9 | 160.4 |
نقاط القوة
- سرعة وكفاءة فائقتان: يوفر التصميم الخالي من NMS زيادة كبيرة في السرعة أثناء الاستدلال، وهو أمر بالغ الأهمية للتطبيقات ذات متطلبات زمن الوصول المنخفض للغاية.
- دقة عالية مع عدد أقل من المعلمات: يحقق دقة متطورة مع أحجام نماذج أصغر، مما يجعله مناسبًا للغاية للنشر في البيئات محدودة الموارد.
- End-to-End Deployment: من خلال إزالة NMS، يبسط YOLOv10 مسار النشر، ممّا يجعله شاملاً حقًا.
- تكامل نظام Ultralytics البيئي: تم دمج YOLOv10 بالكامل في نظام Ultralytics البيئي، مما يوفر نفس سهولة الاستخدام والوثائق الشاملة والدعم مثل نماذج Ultralytics الأخرى.
نقاط الضعف
- نموذج أحدث: باعتباره نموذجًا تم إصداره حديثًا، فإن دعم المجتمع وأدوات الطرف الثالث لا يزال في ازدياد مقارنة بالنظام البيئي الواسع المحيط بـ YOLOv5.
- تخصص المهمة: يركز YOLOv10 بشكل أساسي على اكتشاف الأجسام. بالنسبة للمشاريع التي تتطلب نموذجًا واحدًا لمهام متعددة مثل التجزئة وتقدير الوضع، قد تكون النماذج مثل YOLOv8 أكثر ملاءمة.
حالات الاستخدام
يتفوق YOLOv10 في التطبيقات التي يكون فيها كل جزء من الثانية وكل معلمة مهمة:
- الروبوتات عالية السرعة: تتيح معالجة بصرية في الوقت الفعلي للروبوتات التي تعمل في بيئات ديناميكية ومعقدة.
- أنظمة مساعدة السائق المتقدمة (ADAS): توفر اكتشافًا سريعًا للكائنات لتعزيز السلامة على الطرق، وهو عنصر أساسي في الذكاء الاصطناعي للسيارات ذاتية القيادة.
- تحليلات الفيديو في الوقت الفعلي: معالجة الفيديو عالي الإطارات للحصول على رؤى فورية، وهو أمر مفيد في تطبيقات مثل إدارة حركة المرور.
الخلاصة
يعتبر كل من YOLOv5 و YOLOv10 من النماذج الاستثنائية، لكنهما يخدمان احتياجات مختلفة.
Ultralytics YOLOv5 لا يزال خيارًا رئيسيًا للمطورين الذين يحتاجون إلى نموذج ناضج وموثوق ومتعدد الاستخدامات. إن سهولة استخدامه، والوثائق الشاملة، ودعم المجتمع القوي تجعله مثاليًا للتطوير والنشر السريع عبر مجموعة واسعة من التطبيقات. لقد ثبت توازنه بين السرعة والدقة في عدد لا يحصى من السيناريوهات الواقعية.
YOLOv10 هو مستقبل الكشف عن الأجسام في الوقت الفعلي. توفر بنيتها المبتكرة الخالية من NMS كفاءة لا مثيل لها، مما يجعلها الحل الأمثل للتطبيقات الحساسة لوقت الاستجابة والنشر على أجهزة الحافة. على الرغم من أنها أحدث، إلا أن دمجها في النظام البيئي لـ Ultralytics يضمن تجربة مستخدم سلسة.
بالنسبة لأولئك الذين يستكشفون خيارات أخرى حديثة، ضع في اعتبارك التحقق من النماذج الأخرى مثل YOLOv8 و YOLOv9 وأحدث YOLO11، والتي تستمر في البناء على الأساس القوي لهندسة YOLO.