مقارنة فنية تفصيلية بين YOLOv6-3.0 و YOLOv8
يعد اختيار نموذج الكشف عن الكائنات المناسب قرارًا حاسمًا يؤثر بشكل مباشر على الأداء والكفاءة وقابلية التوسع لأي مشروع رؤية حاسوبية. تقدم هذه الصفحة مقارنة فنية شاملة بين YOLOv6-3.0، الذي طورته Meituan، و Ultralytics YOLOv8، وهو أحدث نموذج من Ultralytics. سوف نتعمق في الاختلافات المعمارية وقياسات الأداء وحالات الاستخدام المثالية لمساعدتك في اختيار أفضل إطار عمل لاحتياجاتك. في حين أن كلا النموذجين قويان، إلا أن YOLOv8 يتميز بتعدد استخداماته الفائقة وسهولة استخدامه ونظام بيئي قوي ومصان جيدًا.
YOLOv6-3.0
المؤلفون: تشوي لي، لولو لي، ييفي قنغ، هونغليانغ جيانغ، مينغ تشنغ، بو تشانغ، زيدان كه، شياومينغ شو، و شيانغشيانغ تشو
المنظمة: Meituan
التاريخ: 2023-01-13
Arxiv: https://arxiv.org/abs/2301.05586
GitHub: https://github.com/meituan/YOLOv6
المستندات: https://docs.ultralytics.com/models/yolov6/
YOLOv6-3.0 هو إطار عمل للكشف عن الأجسام مصمم مع التركيز القوي على التطبيقات الصناعية. تعطي أولوياته للتطوير إيجاد توازن فعال بين سرعة الاستدلال ودقة الكشف، مما يجعله خيارًا قابلاً للتطبيق لسيناريوهات النشر الواقعية حيث يكون الأداء أمرًا بالغ الأهمية.
البنية والميزات الرئيسية
قدم YOLOv6-3.0 العديد من الابتكارات المعمارية التي تهدف إلى تعزيز الكفاءة. ويتميز بتصميم شبكة مدركة للأجهزة مع عمود فقري فعال لإعادة المعلمات وعنق مبسط (Rep-PAN). تتضمن عملية التدريب التقطير الذاتي لتحسين الأداء دون إضافة تكلفة الاستدلال. يقدم الإطار أيضًا نماذج متخصصة مثل YOLOv6Lite، والتي تم تحسينها لعمليات النشر المستندة إلى الأجهزة المحمولة ووحدات المعالجة المركزية CPU.
نقاط القوة
- سرعة استدلال عالية على وحدة معالجة الرسوميات GPU: تُظهر نماذج YOLOv6-3.0 سرعات استدلال ممتازة على وحدات معالجة الرسوميات GPUs، خاصةً عند تحسينها باستخدام TensorRT، مما يجعلها مناسبة للتطبيقات في الوقت الفعلي مع أجهزة GPU مخصصة.
- دعم تحديد الكمية: يوفر الإطار دعمًا جيدًا وبرامج تعليمية لـ تحديد كمية النموذج، وهو أمر مفيد لنشر النماذج على الأجهزة ذات الموارد المحدودة.
- التركيز الصناعي: تم تصميم النموذج خصيصًا لحالات الاستخدام الصناعي، وهو متفوق في السيناريوهات التي تكون فيها السرعة هي الشغل الشاغل.
نقاط الضعف
- تعدد استخدامات محدود: YOLOv6 هو في الأساس كاشف للأجسام. يفتقر إلى الدعم المدمج لمهام رؤية الكمبيوتر الأخرى مثل تقسيم الحالات، وتقدير الوضعية، أو تصنيف الصور وهو أمر قياسي في YOLOv8.
- استخدام أعلى للموارد: للحصول على مستويات دقة مماثلة، غالبًا ما تحتوي نماذج YOLOv6 على معلمات وعمليات FLOPs أعلى من نظيراتها في YOLOv8، مما قد يؤدي إلى زيادة متطلبات الحوسبة.
- النظام البيئي والصيانة: على الرغم من أن YOLOv6 مفتوح المصدر، إلا أن النظام البيئي المحيط به ليس شاملاً أو نشطًا مثل منصة Ultralytics. قد يؤدي ذلك إلى تحديثات أبطأ، وعمليات تكامل أقل، ودعم مجتمعي أقل.
Ultralytics YOLOv8
المؤلفون: جلين جوتشر، أيوش تشوراسيا، و جينغ تشيو
المنظمة: Ultralytics
التاريخ: 2023-01-10
Arxiv: لا يوجد
GitHub: https://github.com/ultralytics/ultralytics
المستندات: https://docs.ultralytics.com/models/yolov8/
Ultralytics YOLOv8 هو نموذج متطور وحديث يعتمد على نجاح إصدارات YOLO السابقة. إنه مصمم ليكون سريعًا ودقيقًا وسهل الاستخدام، مما يوفر نظامًا أساسيًا شاملاً لمجموعة واسعة من مهام رؤية الكمبيوتر. إن بنيته ونظامه البيئي الذي يركز على المطورين يجعله الخيار الموصى به لمعظم التطبيقات.
البنية والميزات الرئيسية
يقدم YOLOv8 تحسينات معمارية كبيرة، بما في ذلك شبكة خلفية جديدة ورأس كشف جديد خالي من المرساة ووظيفة خسارة جديدة. ينتج عن هذا نموذج ليس أكثر دقة فحسب، بل أيضًا أكثر كفاءة من حيث المعلمات والحمل الحسابي. باعتباره كاشفًا خاليًا من المرساة، يبسط YOLOv8 طبقة الإخراج ويحسن التعميم.
نقاط القوة
- توازن أداء فائق: تحقق YOLOv8 مقايضة استثنائية بين السرعة والدقة. كما هو موضح في الجدول أدناه، غالبًا ما تقدم درجات mAP أعلى مع عدد أقل من المعلمات وعمليات الفاصلة العائمة في الثانية (FLOPs) مقارنة بـ YOLOv6، مما يجعلها فعالة للغاية.
- تنوع لا مثيل له: YOLOv8 هو إطار عمل متعدد المهام يدعم اكتشاف الكائنات، و تجزئة المثيلات، و تصنيف الصور، و تقدير الوضعية، و تتبع الكائنات خارج الصندوق. يتيح هذا التنوع للمطورين استخدام إطار عمل واحد ومتسق لتطبيقات متعددة.
- سهولة الاستخدام: تم تصميم نظام Ultralytics البيئي لتوفير تجربة مستخدم مبسطة. بفضل واجهة برمجة تطبيقات Python و CLI البسيطة و الوثائق الشاملة والأوزان المدربة مسبقًا المتاحة بسهولة، فإن البدء في استخدام YOLOv8 أمر في غاية السهولة.
- نظام بيئي مُدار بشكل جيد: يتم دعم YOLOv8 من خلال التطوير النشط من Ultralytics، مما يضمن تحديثات متكررة، ودعم مجتمعي قوي عبر GitHub و Discord، وتكامل سلس مع أدوات مثل Ultralytics HUB للتدريب والنشر بدون تعليمات برمجية.
- كفاءة التدريب: تم تصميم النموذج لعمليات تدريب فعالة. غالبًا ما يتطلب ذاكرة أقل من البنى الأخرى، وخاصة النماذج القائمة على المحولات، ويستفيد من استراتيجيات زيادة البيانات المحسّنة.
نقاط الضعف
- اكتشاف الأجسام الصغيرة: على غرار معظم أجهزة الكشف أحادية المرحلة، يمكن أن يواجه YOLOv8 أحيانًا تحديات في اكتشاف الأجسام الصغيرة جدًا أو المعبأة بكثافة مقارنةً بأجهزة الكشف المتخصصة ثنائية المرحلة.
مقارنة الأداء
يقارن الجدول التالي مقاييس الأداء لنماذج YOLOv8 و YOLOv6-3.0 المختلفة على مجموعة بيانات COCO val2017. يتم تمييز أفضل قيمة أداء في كل عمود بالخط العريض.
النموذج | الحجم (بالبكسل) |
mAPval 50-95 |
السرعة وحدة المعالجة المركزية CPU ONNX (بالمللي ثانية) |
السرعة T4 TensorRT10 (بالمللي ثانية) |
المعلمات (M) |
FLOPs (B) |
---|---|---|---|---|---|---|
YOLOv6-3.0n | 640 | 37.5 | - | 1.17 | 4.7 | 11.4 |
YOLOv6-3.0s | 640 | 45.0 | - | 2.66 | 18.5 | 45.3 |
YOLOv6-3.0m | 640 | 50.0 | - | 5.28 | 34.9 | 85.8 |
YOLOv6-3.0l | 640 | 52.8 | - | 8.95 | 59.6 | 150.7 |
YOLOv8n | 640 | 37.3 | 80.4 | 1.47 | 3.2 | 8.7 |
YOLOv8s | 640 | 44.9 | 128.4 | 2.66 | 11.2 | 28.6 |
YOLOv8m | 640 | 50.2 | 234.7 | 5.86 | 25.9 | 78.9 |
YOLOv8l | 640 | 52.9 | 375.2 | 9.06 | 43.7 | 165.2 |
YOLOv8x | 640 | 53.9 | 479.1 | 14.37 | 68.2 | 257.8 |
من بيانات الأداء، تظهر العديد من الرؤى الرئيسية:
- الدقة مقابل الكفاءة: تحقق نماذج YOLOv8 باستمرار درجات mAP قابلة للمقارنة أو أفضل قليلاً مع عدد أقل بكثير من المعلمات و FLOPs. على سبيل المثال، يحقق YOLOv8m قيمة mAP أعلى (50.2 مقابل 50.0) من YOLOv6-3.0m مع استخدام ~ 26٪ أقل من المعلمات و ~ 8٪ أقل من FLOPs.
- سرعة وحدة المعالجة المركزية (CPU) مقابل وحدة معالجة الرسوميات (GPU): يُظهر YOLOv6-3.0 سرعات استدلال تنافسية للغاية على وحدات معالجة الرسوميات NVIDIA T4 مع TensorRT. ومع ذلك، يُظهر YOLOv8 أداءً ممتازًا لوحدة المعالجة المركزية مع ONNX، وهي ميزة حاسمة للنشر على نطاق أوسع من الأجهزة الطرفية ومثيلات السحابة بدون وحدات معالجة رسوميات (GPU) مخصصة.
- القيمة الإجمالية: يوفر YOLOv8 حزمة أكثر جاذبية. تترجم كفاءته المعمارية إلى متطلبات موارد أقل لمستوى معين من الدقة، وهو ما يمثل فائدة كبيرة للتطبيقات العملية.
الخلاصة والتوصيات
في حين أن YOLOv6-3.0 هو كاشف كائنات قادر يتمتع بسرعات GPU مثيرة للإعجاب للتطبيقات الصناعية، فإن Ultralytics YOLOv8 هو الخيار الأفضل للغالبية العظمى من المستخدمين والمشاريع.
إن المزايا الرئيسية لـ YOLOv8 - تعدد استخداماته في المهام المتعددة، والتوازن الاستثنائي بين السرعة والدقة، ومتطلبات الموارد المنخفضة، والنظام البيئي سهل الاستخدام - تجعله أداة أكثر قوة ومرونة. سواء كنت باحثًا يدفع حدود الذكاء الاصطناعي (AI) أو مطورًا يقوم ببناء حلول قوية في العالم الحقيقي، فإن YOLOv8 يوفر نظامًا أساسيًا أكثر شمولاً وكفاءة ومقاومة لمستقبل التطورات.
استكشاف نماذج أخرى
بالنسبة للمهتمين باستكشاف المزيد، تقدم Ultralytics مجموعة واسعة من النماذج. يمكنك مقارنة YOLOv8 مع سابقاتها مثل YOLOv5 و YOLOv7، أو استكشاف أحدث النماذج المتطورة مثل YOLOv10 و YOLO11. بالإضافة إلى ذلك، تتوفر مقارنات مع بنيات أخرى مثل RT-DETR في وثائق Ultralytics.