YOLOv8 ضد YOLOv5: مقارنة تفصيلية
تكشف مقارنة Ultralytics YOLOv8 و Ultralytics YOLOv5 لاكتشاف الكائنات عن التطور المستمر لهندسة YOLO ونقاط القوة المميزة لكل نموذج. يشتهر كلا النموذجين، اللذين تم تطويرهما بواسطة Ultralytics، بتوازنهما الاستثنائي بين السرعة والدقة. ومع ذلك، فإنها تلبي أولويات مختلفة في مجال الرؤية الحاسوبية. تقدم هذه الصفحة مقارنة فنية مفصلة لمساعدة المطورين والباحثين على اتخاذ قرار مستنير بناءً على متطلبات مشروعهم، مع تسليط الضوء على مزايا نظام Ultralytics.
YOLOv8: الحل المتطور
المؤلفون: جلين جوتشر، أيوش تشوراسيا، و جينغ تشيو
المنظمة: Ultralytics
التاريخ: 2023-01-10
GitHub: https://github.com/ultralytics/ultralytics
المستندات: https://docs.ultralytics.com/models/yolov8/
Ultralytics YOLOv8 هو أحدث إصدار رئيسي في سلسلة YOLO، وقد تم تصميمه كإطار عمل موحد لدعم مجموعة كاملة من مهام الذكاء الاصطناعي البصري. وتشمل هذه اكتشاف الأجسام، و تجزئة المثيلات، و تصنيف الصور، و تقدير الوضعية، والمربعات المحيطة الموجهة (OBB). يقدم YOLOv8 ابتكارات معمارية كبيرة، مثل كاشف خالٍ من المرساة وعنق C2f محسّن، مما يعزز أدائه ومرونته.
نقاط القوة
- دقة وأداء فائقان: يقدم YOLOv8 باستمرار دقة أعلى (mAP) من YOLOv5 عبر جميع أحجام النماذج مع الحفاظ على سرعات استدلال تنافسية. يوفر هذا توازنًا ممتازًا للأداء للتطبيقات الصعبة.
- تنوع مُحسّن: تم تصميمه كإطار عمل شامل، يدعم YOLOv8 بشكل أصلي مهام رؤية متعددة. يتيح هذا التنوع للمطورين استخدام بنية نموذج واحدة ومتسقة للمشاريع المعقدة ومتعددة الأوجه، مما يبسط التطوير والنشر.
- هندسة معمارية حديثة: يقلل تصميم YOLOv8 الخالي من المرساة من تعقيد عملية التدريب وعدد المعلمات الفائقة التي يجب ضبطها، مما يؤدي غالبًا إلى تعميم أفضل على مجموعات البيانات المتنوعة. توفر وحدة C2f المحدثة دمجًا أكثر كفاءة للميزات مقارنةً بوحدة C3 الخاصة بـ YOLOv5.
- تجربة مستخدم مبسطة: كما هو الحال مع جميع نماذج Ultralytics، يستفيد YOLOv8 من واجهة برمجة تطبيقات Python بسيطة و CLI، و وثائق شاملة، ونظام بيئي مُدار بشكل جيد. يتضمن ذلك التكامل مع Ultralytics HUB للتدريب بدون تعليمات برمجية وإدارة MLOps.
- كفاءة الذاكرة: تم تحسين نماذج Ultralytics YOLO للاستخدام المنخفض للذاكرة أثناء التدريب والاستدلال، مما يجعلها أكثر سهولة من العديد من البنى التي تستهلك الكثير من الموارد مثل Transformers.
نقاط الضعف
- المتطلبات الحسابية: على الرغم من كفاءة نماذج YOLOv8 الأكبر (L / X)، إلا أنها تتطلب طاقة حسابية كبيرة، مما قد يمثل قيدًا على النشر على الأجهزة الطرفية محدودة الموارد بشدة.
حالات الاستخدام المثالية
YOLOv8 هو الخيار الموصى به للمشاريع الجديدة التي تتطلب أداءً ومرونة حديثين.
- الروبوتات المتقدمة: لفهم المشهد المعقد والتفاعل مع الأجسام حيث الدقة العالية أمر بالغ الأهمية.
- تحليل الصور عالي الدقة: يتفوق في تطبيقات مثل تحليل الصور الطبية حيث يكون اكتشاف التفاصيل الدقيقة أمرًا بالغ الأهمية.
- أنظمة الرؤية متعددة المهام: مثالية للأنظمة التي تحتاج إلى إجراء الكشف والتجزئة وتقدير الوضع في وقت واحد، كما هو الحال في تحليلات البيع بالتجزئة الذكية.
YOLOv5: المعيار الراسخ والمتعدد الاستخدامات
المؤلف: Glenn Jocher
المنظمة: Ultralytics
التاريخ: 2020-06-26
GitHub: https://github.com/ultralytics/yolov5
المستندات: https://docs.ultralytics.com/models/yolov5/
أصبح Ultralytics YOLOv5 معيارًا صناعيًا بعد فترة وجيزة من إصداره، واحتُفي به لتحقيقه توازنًا استثنائيًا بين السرعة والدقة وسهولة الاستخدام الرائعة. يعتمد على PyTorch، ويتميز بعمود فقري CSPDarknet53 وعنق PANet. رأس الاكتشاف القائم على المرساة فعال للغاية، ويتوسع النموذج عبر أحجام مختلفة (n, s, m, l, x) ليناسب الميزانيات الحسابية المختلفة.
نقاط القوة
- سرعة استدلال استثنائية: تم تحسين YOLOv5 بشكل كبير للاستدلال السريع، مما يجعله خيارًا مفضلًا للأنظمة في الوقت الفعلي، وخاصةً على CPU و الأجهزة الطرفية.
- نظام بيئي ناضج ومستقر: نظرًا لوجوده في هذا المجال لعدة سنوات، فإن YOLOv5 لديه قاعدة مستخدمين واسعة، ودعم مجتمعي مكثف، وثروة من البرامج التعليمية وعمليات تكامل الطرف الثالث. إن استقراره يجعله خيارًا موثوقًا به لبيئات الإنتاج.
- سهولة الاستخدام: تشتهر YOLOv5 بواجهة برمجة التطبيقات البسيطة وخط أنابيب التدريب المباشر، مما جعلها شائعة للغاية بين المبتدئين والخبراء على حد سواء. يضمن نظام Ultralytics البيئي تجربة مستخدم سلسة من التدريب إلى النشر.
- كفاءة التدريب: يوفر النموذج عملية تدريب فعالة مع أوزان مُدرَّبة مسبقًا متاحة بسهولة، مما يتيح النماذج الأولية والتطوير السريع.
نقاط الضعف
- دقة أقل: بالمقارنة مع YOLOv8، فإن نماذج YOLOv5 لديها بشكل عام درجات mAP أقل لحجم معين. تصبح فجوة الأداء أكثر وضوحًا مع النماذج الأكبر.
- اكتشاف قائم على المرساة: يمكن أن يتطلب اعتماده على مربعات مرساة محددة مسبقًا في بعض الأحيان ضبطًا يدويًا لتحقيق الأداء الأمثل على مجموعات البيانات ذات الكائنات ذات الأشكال أو الأحجام غير العادية.
حالات الاستخدام المثالية
تظل YOLOv5 نموذجًا قويًا وذا صلة، خاصة للتطبيقات التي تكون فيها السرعة والاستقرار أمرًا بالغ الأهمية.
- الحوسبة الطرفية: متغيراتها الأصغر (n/s) مثالية للنشر على الأجهزة ذات الموارد المحدودة مثل Raspberry Pi و NVIDIA Jetson.
- المراقبة الآنية: مثالية لـ أنظمة الأمان ومراقبة الفيديو المباشر حيث يكون الكمون المنخفض ضروريًا.
- تطبيقات الهواتف المحمولة: مناسب لمهام الكشف عن العناصر على الجهاز حيث تكون موارد الحوسبة محدودة.
مقارنة الأداء: YOLOv8 ضد YOLOv5
توضح معايير الأداء على مجموعة بيانات COCO بوضوح التطورات التي تم إجراؤها باستخدام YOLOv8. بشكل عام، تقدم نماذج YOLOv8 دقة فائقة مع خصائص أداء مماثلة أو محسنة.
النموذج | الحجم (بالبكسل) |
mAPval 50-95 |
السرعة وحدة المعالجة المركزية CPU ONNX (بالمللي ثانية) |
السرعة T4 TensorRT10 (بالمللي ثانية) |
المعلمات (M) |
FLOPs (B) |
---|---|---|---|---|---|---|
YOLOv8n | 640 | 37.3 | 80.4 | 1.47 | 3.2 | 8.7 |
YOLOv8s | 640 | 44.9 | 128.4 | 2.66 | 11.2 | 28.6 |
YOLOv8m | 640 | 50.2 | 234.7 | 5.86 | 25.9 | 78.9 |
YOLOv8l | 640 | 52.9 | 375.2 | 9.06 | 43.7 | 165.2 |
YOLOv8x | 640 | 53.9 | 479.1 | 14.37 | 68.2 | 257.8 |
YOLOv5n | 640 | 28.0 | 73.6 | 1.12 | 2.6 | 7.7 |
YOLOv5s | 640 | 37.4 | 120.7 | 1.92 | 9.1 | 24.0 |
YOLOv5m | 640 | 45.4 | 233.9 | 4.03 | 25.1 | 64.2 |
YOLOv5l | 640 | 49.0 | 408.4 | 6.61 | 53.2 | 135.0 |
YOLOv5x | 640 | 50.7 | 763.2 | 11.89 | 97.2 | 246.4 |
من الجدول، من الواضح أن نماذج YOLOv8 تقدم تعزيزًا كبيرًا في mAP. على سبيل المثال، تحقق YOLOv8s معدل 44.9 mAP، متجاوزة بكثير 37.4 mAP لـ YOLOv5s مع زيادة طفيفة فقط في المعلمات والكمون. وبالمثل، تصل YOLOv8x إلى 53.9 mAP، متفوقة على 50.7 mAP لـ YOLOv5x مع كونها أكثر كفاءة من الناحية الحسابية.
الخلاصة: أي نموذج يجب أن تختاره؟
يعتبر كل من YOLOv5 و YOLOv8 من النماذج الممتازة، لكنهما يخدمان احتياجات مختلفة.
-
YOLOv5 هو خيار رائع للتطبيقات التي تكون فيها أقصى سرعة استدلال ومنصة ناضجة ومستقرة هي الأولويات القصوى. ولا يزال منافسًا قويًا للنشر على الأجهزة ذات الموارد المحدودة وللمشاريع التي تستفيد من نظامها البيئي الواسع.
-
يمثل YOLOv8 الجيل التالي من تكنولوجيا YOLO. إنه الخيار الموصى به للمشاريع الجديدة التي تسعى إلى الحصول على أعلى دقة و تنوع عبر مهام رؤية متعددة. إن بنيته الحديثة والخالية من المرساة وإطاره الموحد يجعله حلاً أكثر قوة ومرونة لمجموعة واسعة من التطبيقات، من البحث إلى الإنتاج.
بالنسبة لمعظم حالات الاستخدام، فإن الأداء والمرونة الفائقة لـ YOLOv8 تجعله الخيار المفضل.
استكشف نماذج أخرى
تواصل Ultralytics الابتكار في مجال رؤية الكمبيوتر. بالنسبة للمستخدمين الذين يستكشفون خيارات أخرى حديثة، فإننا نقدم أيضًا نماذج مثل YOLOv9 و YOLOv10 وأحدث YOLO11، يقدم كل منها مزايا فريدة. يمكنك العثور على تحليلات أكثر تفصيلاً على صفحة مقارنة النماذج الخاصة بنا.