تخطي إلى المحتوى

YOLOv10 مقابل YOLOv8: مقارنة فنية للكشف عن الكائنات

يُعد اختيار نموذج الكشف عن العناصر المناسب أمرًا بالغ الأهمية لنجاح أي مشروع رؤية حاسوبية. تقدم هذه الصفحة مقارنة فنية مفصلة بين YOLOv10 و Ultralytics YOLOv8، وهما نموذجان حديثان في هذا المجال. سنقوم بتحليل الاختلافات المعمارية ومقاييس الأداء والتطبيقات المثالية لمساعدتك في اتخاذ قرار مستنير بناءً على احتياجاتك الخاصة للسرعة والدقة وكفاءة الموارد.

YOLOv10: دفع حدود الكفاءة

المؤلفون: Ao Wang, Hui Chen, Lihao Liu، وآخرون.
المنظمة: جامعة Tsinghua
التاريخ: 2024-05-23
Arxiv: https://arxiv.org/abs/2405.14458
GitHub: https://github.com/THU-MIG/yolov10
المستندات: https://docs.ultralytics.com/models/yolov10/

YOLOv10، الذي تم تقديمه في مايو 2024، يمثل خطوة مهمة نحو تحقيق الكشف الحقيقي عن الأجسام في الوقت الفعلي ومن طرف إلى طرف. يتمثل ابتكاره الأساسي في تركيزه على إزالة الاختناقات في مرحلة ما بعد المعالجة وتحسين بنية النموذج لتحقيق أقصى قدر من الكفاءة. إحدى الميزات الرئيسية هي نهج التدريب الخالي من NMS، والذي يستخدم مهام مزدوجة متسقة لإزالة الحاجة إلى تثبيط غير الأقصى (NMS)، وبالتالي تقليل زمن انتقال الاستدلال.

البنية والميزات الرئيسية

يقدم YOLOv10 تصميم نموذج شامل يعتمد على الكفاءة والدقة. فهو يحسن المكونات المختلفة، مثل تنفيذ رأس تصنيف خفيف الوزن واستخدام أخذ عينات منفصلة مكانيًا وقنواتيًا، لتقليل التكرار الحسابي وتعزيز قدرات الكشف. على الرغم من تطوير YOLOv10 بواسطة جامعة Tsinghua، إلا أنه مبني على إطار Ultralytics ومدمج فيه، مما يجعله سهل الوصول إليه وسهل الاستخدام مع واجهة برمجة التطبيقات Ultralytics المألوفة.

نقاط القوة

  • كفاءة محسنة: يوفر سرعات استدلال أسرع وأحجام نماذج أصغر في المقارنات المباشرة، وهو أمر مفيد للغاية للبيئات ذات الموارد المحدودة مثل الأجهزة الطرفية.
  • تصميم خالٍ من NMS: يبسط خط أنابيب النشر عن طريق إزالة خطوة المعالجة اللاحقة NMS، مما يؤدي إلى تقليل زمن الوصول الشامل.
  • أداء متطور: يحقق أداءً ممتازًا، خاصةً في معايير قياس الأداء التي تركز على الكمون، مما يدفع بأحدث التقنيات في مجال الموازنة بين السرعة والدقة.

نقاط الضعف

  • نموذج أحدث: باعتباره إصدارًا أحدث، لديه مجتمع أصغر وعدد أقل من عمليات تكامل الطرف الثالث مقارنة بـ YOLOv8 الراسخ.
  • تخصص المهمة: يركز YOLOv10 بشكل أساسي على اكتشاف الأجسام. يفتقر إلى المرونة المدمجة لمهام الرؤية الأخرى مثل التجزئة و تقدير الوضع الأصلية في YOLOv8.
  • نضج النظام البيئي: على الرغم من أنه مدمج في النظام البيئي Ultralytics، إلا أنه لا يمتلك حتى الآن نفس عمق الموارد والأمثلة المدفوعة من المجتمع مثل YOLOv8.

حالات الاستخدام المثالية

YOLOv10 مناسب بشكل خاص للتطبيقات التي يكون فيها الأداء في الوقت الفعلي وكفاءة الموارد على رأس الأولويات المطلقة:

  • Edge AI: مثالي للنشر على الأجهزة ذات القدرة الحاسوبية المحدودة، مثل الهواتف المحمولة والأنظمة المدمجة مثل NVIDIA Jetson.
  • معالجة عالية السرعة: مناسب للتطبيقات التي تتطلب زمن انتقال منخفض جدًا، مثل الطائرات بدون طيار ذاتية القيادة و الروبوتات.
  • تحليلات في الوقت الفعلي: مثالي للبيئات سريعة الخطى التي تحتاج إلى الكشف الفوري عن العناصر، مثل إدارة حركة المرور.

تعرف على المزيد حول YOLOv10

Ultralytics YOLOv8: التنوع والنضج

المؤلفون: جلين جوتشر، أيوش شوراسيا، و جينغ تشيو
المنظمة: Ultralytics
التاريخ: 2023-01-10
GitHub: https://github.com/ultralytics/ultralytics
المستندات: https://docs.ultralytics.com/models/yolov8/

تُعد Ultralytics YOLOv8، التي أُطلقت في يناير 2023، نموذجًا ناضجًا ومتعدد الاستخدامات للغاية يعتمد على نقاط القوة في أسلافه من YOLO. وهي مصممة للسرعة والدقة و سهولة الاستخدام عبر مجموعة واسعة من مهام الذكاء الاصطناعي البصري. وهذا يجعلها خيارًا قويًا وموثوقًا لكل من المطورين والباحثين.

البنية والميزات الرئيسية

يتميز YOLOv8 بنهج كشف anchor-free، مما يبسط بنية النموذج ويحسن التعميم. يساهم عموده الفقري المرن ووظائف الخسارة المحسّنة في زيادة الدقة وتدريب أكثر استقرارًا. الميزة البارزة في YOLOv8 هي دعمه الأصلي لمهام الرؤية المتعددة، بما في ذلك اكتشاف الكائنات، و تقسيم المثيلات، و تصنيف الصور، و تقدير الوضعية، والصناديق المحيطة الموجهة (OBB).

نقاط القوة

  • ناضج وموثق جيدًا: يستفيد من الوثائق الشاملة، والمجتمع الكبير، والموارد المتاحة بسهولة، مما يجعله سهل الاستخدام وسهل التنفيذ عبر واجهات Python و CLI بسيطة.
  • متعدد الاستخدامات ومتعدد المهام: يدعم مجموعة واسعة من مهام الرؤية خارج الصندوق، مما يوفر مرونة لا مثيل لها للمشاريع المعقدة التي تتطلب أكثر من مجرد الاكتشاف.
  • نظام بيئي مُدار بشكل جيد: يتكامل بسلاسة مع Ultralytics HUB وأدوات MLOps الأخرى، مما يبسط سير العمل من التدريب إلى النشر. وهو مدعوم بالتطوير النشط والتحديثات المتكررة.
  • موازنة الأداء: يوفر توازنًا ممتازًا بين السرعة والدقة وحجم النموذج، مما يجعله مناسبًا لمجموعة واسعة من سيناريوهات النشر في العالم الحقيقي.
  • كفاءة التدريب: يوفر عمليات تدريب فعالة وأوزان مُدرَّبة مسبقًا متاحة بسهولة، مما يؤدي إلى تسريع دورات التطوير. كما أن لديه متطلبات ذاكرة أقل مقارنة بالعديد من البنى الأخرى، وخاصة النماذج القائمة على المحولات.

نقاط الضعف

  • في حين أنها عالية الكفاءة، يمكن للنماذج الأحدث مثل YOLOv10 أن تقدم تحسينات هامشية في مقاييس محددة مثل عدد المعلمات أو زمن الانتقال في السيناريوهات المقيدة للغاية.

حالات الاستخدام المثالية

إن تعدد استخدامات YOLOv8 وسهولة استخدامه يجعله الخيار الأمثل لمجموعة واسعة من التطبيقات:

  • أنظمة الأمان: ممتازة للكشف عن الكائنات في الوقت الفعلي في أنظمة إنذار الأمان.
  • تحليلات البيع بالتجزئة: مفيدة في البيع بالتجزئة الذكي لفهم سلوك العملاء وإدارة المخزون.
  • مراقبة الجودة الصناعية: قابل للتطبيق في التصنيع للفحص البصري الآلي.
  • مشاريع المهام المتعددة: الخيار الأمثل للمشاريع التي تتطلب الكشف والتجزئة وتقدير الوضع في وقت واحد من نموذج واحد فعال.

تعرف على المزيد حول YOLOv8

تحليل الأداء: YOLOv10 مقابل YOLOv8

تكشف مقاييس الأداء على مجموعة بيانات COCO عن الاختلافات الرئيسية بين النموذجين. تحقق YOLOv10 باستمرار درجات mAP أعلى مع عدد أقل من المعلمات وعمليات النقطة العائمة في الثانية (FLOPs) مقارنة بنظيراتها في YOLOv8 ذات الحجم المماثل. على سبيل المثال، تحقق YOLOv10-S نسبة mAP تبلغ 46.7% مع 7.2 مليون معلمة، بينما تصل YOLOv8-S إلى 44.9% mAP مع 11.2 مليون معلمة. هذا يسلط الضوء على الكفاءة المعمارية الفائقة لـ YOLOv10.

ومع ذلك، يحافظ YOLOv8 على سرعات استدلال تنافسية للغاية، خاصة على وحدة معالجة الرسومات GPU. النموذج الأصغر، YOLOv8n، أسرع قليلاً على وحدة معالجة الرسومات T4 مع TensorRT من YOLOv10n (1.47 مللي ثانية مقابل 1.56 مللي ثانية). علاوة على ذلك، يوفر YOLOv8 مجموعة كاملة من معايير وحدة المعالجة المركزية CPU الراسخة، مما يدل على أدائه القوي والموثوق به لعمليات النشر التي قد لا تتمكن من الوصول إلى وحدة معالجة الرسومات GPU.

النموذج الحجم
(بالبكسل)
mAPval
50-95
السرعة
وحدة المعالجة المركزية CPU ONNX
(بالمللي ثانية)
السرعة
T4 TensorRT10
(بالمللي ثانية)
المعلمات
(M)
FLOPs
(B)
YOLOv10n 640 39.5 - 1.56 2.3 6.7
YOLOv10s 640 46.7 - 2.66 7.2 21.6
YOLOv10m 640 51.3 - 5.48 15.4 59.1
YOLOv10b 640 52.7 - 6.54 24.4 92.0
YOLOv10l 640 53.3 - 8.33 29.5 120.3
YOLOv10x 640 54.4 - 12.2 56.9 160.4
YOLOv8n 640 37.3 80.4 1.47 3.2 8.7
YOLOv8s 640 44.9 128.4 2.66 11.2 28.6
YOLOv8m 640 50.2 234.7 5.86 25.9 78.9
YOLOv8l 640 52.9 375.2 9.06 43.7 165.2
YOLOv8x 640 53.9 479.1 14.37 68.2 257.8

الخلاصة والتوصيات

يعتبر كل من YOLOv10 و YOLOv8 من النماذج القوية، لكنهما يلبيان أولويات مختلفة. يتفوق YOLOv10 في الكفاءة الخالصة، حيث يقدم أداءً حديثًا مع زمن وصول أقل وعدد أقل من المعلمات، مما يجعله خيارًا ممتازًا للتطبيقات المتخصصة والحساسة لزمن الوصول.

ومع ذلك، بالنسبة للغالبية العظمى من المطورين والباحثين، يعد Ultralytics YOLOv8 الخيار الموصى به. تكمن مزاياه الرئيسية في نضجه وتعدد استخداماته ونظامه البيئي القوي. يوفر دعم YOLOv8 الأصلي لمهام متعددة (الكشف والتجزئة والوضع والتصنيف و OBB) ميزة كبيرة لبناء حلول ذكاء اصطناعي معقدة ومتعددة الأوجه. تعمل الوثائق الشاملة والمجتمع النشط والتكامل السلس مع أدوات مثل Ultralytics HUB على إنشاء تجربة تطوير فائقة وأكثر انسيابية. إنه يوفر توازنًا متميزًا ومثبتًا بين السرعة والدقة وهو موثوق به لأوسع نطاق من تطبيقات العالم الحقيقي.

استكشاف نماذج أخرى

بالنسبة للمستخدمين المهتمين باستكشاف نماذج أخرى حديثة، تقدم Ultralytics مجموعة شاملة بما في ذلك YOLOv5 التأسيسية، و YOLOv9 الفعالة، وأحدث YOLO11. تتوفر أيضًا مقارنات تفصيلية مثل YOLOv9 مقابل YOLOv8 و YOLOv5 مقابل YOLOv8 لمساعدتك في اختيار النموذج المثالي لمشروعك.



📅 تم إنشاؤه منذ سنة واحدة ✏️ تم التحديث منذ شهر واحد

تعليقات