تخطي إلى المحتوى

مقارنة النماذج: YOLOv8 ضد YOLOv10 للكشف عن الأجسام

يُعد اختيار نموذج الكشف عن العناصر المناسب أمرًا بالغ الأهمية لنجاح أي مشروع رؤية حاسوبية. تقدم هذه الصفحة مقارنة فنية مفصلة بين Ultralytics YOLOv8 و YOLOv10، وهما نموذجان حديثان في هذا المجال. سنقوم بتحليل الفروق الدقيقة في بنيتهما ومقاييس الأداء ومنهجيات التدريب والتطبيقات المثالية لإرشادك في اتخاذ قرار مستنير بشأن احتياجاتك الخاصة.

Ultralytics YOLOv8: التنوع والنضج

المؤلفون: جلين جوتشر، أيوش شوراسيا، و جينغ تشيو
المنظمة: Ultralytics
التاريخ: 2023-01-10
GitHub: https://github.com/ultralytics/ultralytics
المستندات: https://docs.ultralytics.com/models/yolov8/

تُعد Ultralytics YOLOv8، التي أطلقتها Ultralytics في يناير 2023، نموذجًا ناضجًا ومتعدد الاستخدامات للغاية يعتمد على نقاط القوة في أسلافه من YOLO. وهي مصممة للسرعة والدقة و سهولة الاستخدام عبر مجموعة واسعة من مهام الذكاء الاصطناعي البصري، بما في ذلك اكتشاف الكائنات، و تقسيم المثيلات، و تصنيف الصور، و تقدير الوضعية، والمربعات المحيطة الموجهة (OBB).

البنية والميزات الرئيسية

يمثل YOLOv8 تطورًا كبيرًا في سلسلة YOLO، حيث يتميز بنهج كشف خالي من المرساة يبسط بنية النموذج ويعزز التعميم عبر مجموعات البيانات المختلفة. تساهم الشبكة الخلفية المرنة ووظائف الخسارة المحسّنة في تحسين الدقة وتدريب أكثر استقرارًا. إحدى المزايا الرئيسية لـ YOLOv8 هي قابلية التوسع، حيث تقدم مجموعة من أحجام النماذج من Nano (n) إلى Extra-large (x) لتلبية متطلبات الحوسبة والدقة المتنوعة. هذا التنوع يجعله خيارًا مفضلاً للمشاريع التي قد تتطلب أكثر من مجرد اكتشاف الكائنات، لأنه يدعم مهام متعددة ضمن إطار عمل موحد.

الأداء ونقاط القوة

يوفر YOLOv8 توازنًا قويًا في الأداء، حيث يحقق درجات mAP عالية مع الحفاظ على سرعات استدلال سريعة مناسبة للتطبيقات في الوقت الفعلي. على سبيل المثال، يصل YOLOv8x إلى 53.9% mAPval 50-95 على مجموعة بيانات COCO. يضمن تصميمه الفعال متطلبات ذاكرة أقل أثناء التدريب والاستدلال مقارنة بالعديد من البنى الأخرى، وخاصةً النماذج القائمة على المحولات مثل RT-DETR.

  • ناضج وموثق جيدًا: يستفيد YOLOv8 من الوثائق الشاملة، والمجتمع الكبير، والموارد المتاحة بسهولة، مما يجعله سهل الاستخدام بشكل استثنائي وسهل التنفيذ عبر واجهات Python و CLI بسيطة.
  • متعدد الاستخدامات ومتعدد المهام: يعد دعمه لمجموعة واسعة من مهام الرؤية ميزة رئيسية على النماذج الأكثر تخصصًا، مما يوفر مرونة لا مثيل لها لمتطلبات المشاريع المعقدة.
  • نظام بيئي مُدار بشكل جيد: تم دمج النموذج بسلاسة مع Ultralytics HUB، وهي منصة تعمل على تبسيط سير العمل من التدريب إلى النشر. وهو مدعوم بالتطوير النشط والتحديثات المتكررة من Ultralytics.
  • موازنة الأداء: يوفر توازنًا ممتازًا بين السرعة والدقة وحجم النموذج، مما يجعله مناسبًا لمجموعة واسعة من سيناريوهات النشر في العالم الحقيقي.
  • كفاءة التدريب: يوفر YOLOv8 عمليات تدريب فعالة وأوزان مُدرَّبة مسبقًا متاحة بسهولة، مما يسرع دورات التطوير بشكل كبير.

نقاط الضعف

في حين أنها عالية الكفاءة، قد يتم تجاوز أداء YOLOv8 بشكل طفيف في معايير محددة ومقيدة للغاية من خلال نماذج أحدث مثل YOLOv10، والتي تعطي الأولوية للسرعة الأولية أو عدد المعلمات قبل كل شيء آخر. ومع ذلك، غالبًا ما يوفر YOLOv8 حزمة أفضل بشكل عام من حيث سهولة الاستخدام وتعدد الاستخدامات والدعم.

حالات الاستخدام المثالية

إن تعدد استخدامات YOLOv8 وسهولة استخدامه يجعله مثاليًا لمجموعة واسعة من التطبيقات:

  • أنظمة الأمان: ممتاز للكشف عن الكائنات في الوقت الفعلي في أنظمة إنذار الأمان.
  • تحليلات البيع بالتجزئة: مفيدة في البيع بالتجزئة الذكي لفهم سلوك العملاء وإدارة المخزون.
  • مراقبة الجودة الصناعية: قابل للتطبيق في التصنيع للفحص البصري الآلي.
  • مشاريع المهام المتعددة: مثالية للمشاريع التي تتطلب الكشف والتجزئة وتقدير الوضع في وقت واحد من نموذج واحد.

تعرف على المزيد حول YOLOv8

YOLOv10: دفع حدود الكفاءة

المؤلفون: Ao Wang, Hui Chen, Lihao Liu، وآخرون.
المنظمة: جامعة Tsinghua
التاريخ: 2024-05-23
Arxiv: https://arxiv.org/abs/2405.14458
GitHub: https://github.com/THU-MIG/yolov10
المستندات: https://docs.ultralytics.com/models/yolov10/

YOLOv10، الذي تم تقديمه في مايو 2024، يركز على زيادة الكفاءة والسرعة إلى أقصى حد مع الحفاظ على دقة تنافسية. وهو يستهدف بشكل خاص التطبيقات في الوقت الفعلي والتطبيقات الطرفية. يتمثل الابتكار الرئيسي في نهج التدريب الخاص به الذي يلغي الحاجة إلى تثبيط غير الأقصى (NMS)، مما يساعد على تقليل زمن انتقال ما بعد المعالجة ويتيح الكشف الحقيقي عن الأجسام من طرف إلى طرف.

البنية والميزات الرئيسية

يتميز YOLOv10 بتصميم نموذج شامل يعتمد على الكفاءة والدقة. فهو يحسن المكونات المختلفة لتقليل التكرار الحسابي وتعزيز قدرات الكشف. باستخدام تعيينات مزدوجة متسقة للتدريب، فإنه يزيل خطوة NMS، مما يبسط خط أنابيب النشر. على الرغم من أن هذه خطوة كبيرة إلى الأمام، فمن المهم ملاحظة أن YOLOv10 يركز بشكل أساسي على الكشف عن الكائنات ويفتقر إلى تعدد استخدامات المهام المتعددة المدمج في YOLOv8.

تحليل الأداء

يُظهر YOLOv10 كفاءة فائقة، مما يوفر سرعات استدلال أسرع وأحجام نماذج أصغر مقارنة بالعديد من إصدارات YOLO السابقة. على سبيل المثال، يحقق YOLOv10-S دقة mAP تبلغ 46.7%val 50-95 مع 7.2 مليون معلمة فقط. يوضح الجدول أدناه أنه بالنسبة لمستوى دقة معين، غالبًا ما تحتوي نماذج YOLOv10 على عدد أقل من المعلمات وFLOPs أقل من نظيراتها في YOLOv8. ومع ذلك، تحافظ YOLOv8 على سرعات تنافسية للغاية، خاصة على وحدة المعالجة المركزية CPU، حيث تم تحسينها بشكل كبير.

النموذج الحجم
(بالبكسل)
mAPval
50-95
السرعة
وحدة المعالجة المركزية CPU ONNX
(بالمللي ثانية)
السرعة
T4 TensorRT10
(بالمللي ثانية)
المعلمات
(M)
FLOPs
(B)
YOLOv8n 640 37.3 80.4 1.47 3.2 8.7
YOLOv8s 640 44.9 128.4 2.66 11.2 28.6
YOLOv8m 640 50.2 234.7 5.86 25.9 78.9
YOLOv8l 640 52.9 375.2 9.06 43.7 165.2
YOLOv8x 640 53.9 479.1 14.37 68.2 257.8
YOLOv10n 640 39.5 - 1.56 2.3 6.7
YOLOv10s 640 46.7 - 2.66 7.2 21.6
YOLOv10m 640 51.3 - 5.48 15.4 59.1
YOLOv10b 640 52.7 - 6.54 24.4 92.0
YOLOv10l 640 53.3 - 8.33 29.5 120.3
YOLOv10x 640 54.4 - 12.2 56.9 160.4

نقاط القوة والضعف

  • كفاءة محسنة: يوفر سرعات استدلال أسرع وأحجام نماذج أصغر في العديد من المقارنات، وهو أمر مفيد للبيئات ذات الموارد المحدودة.
  • تدريب بدون NMS: يبسط مسار النشر عن طريق إزالة خطوة المعالجة اللاحقة NMS، مما يقلل من زمن الوصول.
  • أداء متطور: يحقق أداءً ممتازًا، خاصة في معايير قياس الأداء المدفوعة بالكمون.

ومع ذلك، فإن YOLOv10 لديه أيضًا بعض القيود:

  • نموذج أحدث: باعتباره نموذجًا أحدث، لديه مجتمع أصغر وعدد أقل من الموارد المتاحة بسهولة أو عمليات تكامل الطرف الثالث مقارنة بـ YOLOv8 الراسخ.
  • تكامل النظام البيئي: على الرغم من أنه مدمج في مكتبة Ultralytics، إلا أنه قد يتطلب المزيد من الجهد للتكيف مع سير عمل MLOps القائم مقارنة بنماذج مثل YOLOv8 الأصلية في نظام Ultralytics البيئي الشامل.
  • تخصص المهمة: يركز بشكل أساسي على اكتشاف الأجسام، ويفتقر إلى المرونة المدمجة للتجزئة والتصنيف وتقدير الوضع التي يوفرها YOLOv8.

حالات الاستخدام المثالية

YOLOv10 مناسب بشكل خاص للتطبيقات التي يكون فيها الأداء في الوقت الفعلي وكفاءة الموارد على رأس الأولويات المطلقة:

  • أجهزة الحافة: مثالية للنشر على الأجهزة ذات القدرة الحسابية المحدودة مثل الهواتف المحمولة والأنظمة المدمجة.
  • معالجة عالية السرعة: مناسبة للتطبيقات التي تتطلب زمن انتقال منخفض للغاية، مثل الطائرات بدون طيار ذاتية القيادة و الروبوتات.
  • تحليلات في الوقت الفعلي: مثالية للبيئات سريعة الوتيرة التي تحتاج إلى الكشف الفوري عن الأجسام، مثل إدارة حركة المرور.

تعرف على المزيد حول YOLOv10

الخلاصة

يعتبر كل من Ultralytics YOLOv8 و YOLOv10 من نماذج الكشف عن الأجسام القوية والفعالة. يعتمد الاختيار بينهما بشكل كبير على الأولويات الخاصة بالمشروع.

Ultralytics YOLOv8 هو الخيار الموصى به لمعظم المطورين والباحثين. يتميز بتعدد استخداماته الاستثنائي وسهولة استخدامه ونظامه البيئي القوي والتوازن الممتاز بين السرعة والدقة. إن قدراته متعددة المهام تجعله حلاً مقاومًا للمستقبل للمشاريع التي قد تتطور لتشمل التجزئة أو تقدير الوضع أو مهام الرؤية الأخرى.

توفر YOLOv10 مكاسب كبيرة في الكفاءة للتطبيقات المتخصصة والحساسة لوقت الاستجابة. إذا كان القيد الأساسي لمشروعك هو النشر على أجهزة الحافة منخفضة الطاقة أو تحقيق أقل وقت استدلال ممكن لمهمة واحدة، فإن YOLOv10 هو منافس قوي.

بالنسبة للمستخدمين المهتمين باستكشاف نماذج أخرى حديثة، تقدم Ultralytics مجموعة من الخيارات، بما في ذلك YOLOv5 الموقرة، و YOLOv9 المبتكرة، وأحدث YOLO11. تتوفر المزيد من المقارنات، مثل YOLOv9 مقابل YOLOv8 و YOLOv5 مقابل YOLOv8، لمساعدتك في اختيار أفضل نموذج لاحتياجاتك.



📅 تم إنشاؤه منذ سنة واحدة ✏️ تم التحديث منذ شهر واحد

تعليقات