تخطي إلى المحتوى

مقارنة فنية بين YOLOX و YOLOv8

يُعد اختيار نموذج الكشف عن الأجسام المناسب قرارًا بالغ الأهمية يوازن بين الدقة والسرعة ومتطلبات النشر. تقدم هذه الصفحة مقارنة فنية مفصلة بين YOLOX، وهو نموذج عالي الأداء وخالي من المرساة من Megvii، و Ultralytics YOLOv8، وهو نموذج حديث معروف بتعدد استخداماته ونظامه البيئي القوي. سوف نتعمق في الاختلافات المعمارية ومقاييس الأداء وحالات الاستخدام المثالية لمساعدتك في اختيار أفضل نموذج لمشروع الرؤية الحاسوبية الخاص بك.

YOLOX: كاشف عالي الأداء للأجسام بدون نقاط ارتكاز

تم تقديم YOLOX بواسطة Megvii لتبسيط بنية YOLO مع تحقيق أداء قوي. إنه نموذج خالٍ من المرساة يهدف إلى سد الفجوة بين البحث الأكاديمي والتطبيقات الصناعية.

البنية والميزات الرئيسية

قدم تصميم YOLOX العديد من الابتكارات الرئيسية لعائلة YOLO:

  • تصميم بدون مربعات ارتكاز (Anchor-Free): من خلال إلغاء مربعات الارتكاز المحددة مسبقًا، يبسّط YOLOX مسار الكشف ويقلل من عدد المعلمات الفائقة التي تحتاج إلى ضبط، مما قد يحسن التعميم عبر مجموعات بيانات مختلفة.
  • Decoupled Head: تفصل مهام التصنيف والتوطين إلى رأسين مختلفين. يمكن أن يؤدي هذا الاختيار المعماري إلى تقارب أسرع ودقة محسنة مقارنة بالرؤوس المزدوجة المستخدمة في بعض نماذج YOLO السابقة.
  • استراتيجيات التدريب المتقدمة: تشتمل YOLOX على SimOTA (Simplified Optimal Transport Assignment)، وهي إستراتيجية لتعيين التصنيفات الديناميكي، وتقنيات تقوية البيانات القوية مثل MixUp لتعزيز الأداء.

نقاط القوة والضعف

نقاط القوة:

  • دقة عالية: يقدم YOLOX نتائج mAP تنافسية، خاصة مع متغيرات النموذج الأكبر.
  • بساطة بدون مرساة: يقلل النهج الخالي من الإرساء من التعقيد المرتبط بتكوين وضبط مربع الإرساء.
  • نموذج راسخ: نظرًا لأنه متاح منذ عام 2021، فهناك مجتمع والعديد من موارد الطرف الثالث المتاحة للنشر.

نقاط الضعف:

  • تنوع محدود: يركز YOLOX بشكل أساسي على اكتشاف الكائنات. يفتقر إلى الدعم المدمج لمهام الرؤية الأخرى مثل تجزئة المثيلات، و تقدير الوضعية، أو التصنيف الأصلية في إطار عمل Ultralytics.
  • النظام البيئي والدعم: على الرغم من أنه مفتوح المصدر، إلا أنه ليس جزءًا من نظام بيئي متكامل مثل Ultralytics. قد يعني هذا بذل المزيد من الجهد لنشره وتتبع التجارب والاستفادة من أدوات مثل Ultralytics HUB.
  • فجوات الأداء: على الرغم من سرعتها، إلا أنها قد تتخلف عن الركب بسبب النماذج الأحدث والمحسّنة للغاية مثل YOLOv8، خاصة في سيناريوهات الاستدلال على وحدة المعالجة المركزية (CPU) حيث لا تتوفر المعايير بسهولة.

حالات الاستخدام المثالية

يعتبر YOLO خيارًا قويًا للتطبيقات التي يكون فيها الهدف الأساسي هو الكشف عن الكائنات بدقة عالية:

  • التطبيقات الصناعية: مناسبة لمهام مثل مراقبة الجودة الآلية حيث تكون دقة الاكتشاف ذات أهمية قصوى.
  • الأبحاث: تُستخدم كقاعدة ممتازة للباحثين الذين يستكشفون منهجيات الكشف الخالية من المرساة.
  • النشر الطرفي: تم تصميم المتغيرات الأصغر مثل YOLOX-Nano للأجهزة ذات الموارد المحدودة.

تعرف على المزيد حول YOLOX

Ultralytics YOLOv8: أحدث ما توصل إليه التنوع والأداء

Ultralytics YOLOv8 هو نموذج متطور وحديث يعتمد على نجاحات إصدارات YOLO السابقة. إنه مصمم ليكون سريعًا ودقيقًا وسهل الاستخدام بشكل لا يصدق، مما يوفر حلاً شاملاً لمجموعة واسعة من مهام رؤية الكمبيوتر.

البنية والميزات الرئيسية

يقدم YOLOv8 تحسينات معمارية كبيرة وتجربة مطور فائقة:

  • خالٍ من المربعات المحورية ومُحسَّن (Anchor-Free and Optimized): على غرار YOLOX، فإن YOLOv8 خالٍ من المربعات المحورية ولكنه يتميز بشبكة أساسية جديدة ووحدة C2f تحل محل وحدة C3 الموجودة في YOLOv5، مما يوفر استخلاصًا وأداءً أفضل للميزات.
  • دعم المهام المتعددة: إحدى الميزات الرئيسية في YOLOv8 هي تعدد استخداماته. فهو يدعم مهام رؤية متعددة خارج الصندوق داخل إطار عمل موحد واحد، بما في ذلك الكشف عن الكائنات و تجزئة المثيلات و تصنيف الصور و تقدير الوضع و الكشف عن المربعات المحيطة الموجهة (OBB).
  • نظام بيئي سهل الاستخدام: يتم دعم YOLOv8 بواسطة نظام Ultralytics البيئي القوي، والذي يتضمن وثائق شاملة، و Python API و CLI بسيط، وعمليات تكامل سلسة مع أدوات وضع العلامات والتدريب والنشر مثل Roboflow و Ultralytics HUB.

نقاط القوة والضعف

نقاط القوة:

  • توازن أداء ممتاز: يحقق YOLOv8 توازنًا فائقًا بين السرعة والدقة، مما يجعله مناسبًا لمجموعة واسعة من تطبيقات الوقت الفعلي.
  • تنوع لا مثيل له: القدرة على التعامل مع مهام رؤية متعددة ضمن إطار عمل واحد تبسط مسارات التطوير وتقلل الحاجة إلى نماذج متعددة.
  • سهولة الاستخدام: توفر Ultralytics تجربة مستخدم مبسطة مع واجهة برمجة تطبيقات بسيطة، ووثائق شاملة، والعديد من البرامج التعليمية، مما يجعلها في متناول المبتدئين والخبراء على حد سواء.
  • نظام بيئي مُدار بشكل جيد: يستفيد المستخدمون من التطوير النشط، ومجتمع قوي، والتحديثات المتكررة، والأدوات المتكاملة لدورة حياة MLOps كاملة.
  • كفاءة التدريب والذاكرة: تم تصميم YOLOv8 من أجل عمليات تدريب فعالة مع أوزان مُدرَّبة مسبقًا متاحة بسهولة على مجموعات بيانات مثل COCO. كما يُظهر أيضًا استخدامًا فعالًا للذاكرة أثناء التدريب والاستنتاج، خاصةً مقارنةً بالتصميمات المعمارية الأكثر تعقيدًا.
  • مرونة النشر: تم تحسين النموذج بدرجة كبيرة للنشر عبر الأجهزة المتنوعة، من أجهزة الحافة إلى الخوادم السحابية، مع سهولة التصدير إلى تنسيقات مثل ONNX و TensorRT.

نقاط الضعف:

  • نظرًا لكونه نموذجًا متعدد الاستخدامات وقويًا للغاية، تتطلب المتغيرات الأكبر (مثل YOLOv8x) موارد حسابية كبيرة للتدريب والنشر، وهي سمة شائعة للنماذج الحديثة.

حالات الاستخدام المثالية

إن الجمع بين أداء YOLOv8 وتنوعه وسهولة استخدامه يجعله الخيار الأمثل لمجموعة واسعة من التطبيقات:

  • أنظمة الرؤية في الوقت الفعلي: مثالية لـ الروبوتات، و المركبات ذاتية القيادة، و الأنظمة الأمنية المتقدمة.
  • حلول الذكاء الاصطناعي متعددة الوسائط: يمكن لنموذج واحد تشغيل تطبيقات معقدة تتطلب الكشف والتجزئة وتقدير الوضع في وقت واحد، عبر صناعات مثل الزراعة و الرعاية الصحية.
  • النماذج الأولية والإنتاج السريع: يمكّن الإطار سهل الاستخدام والدعم المكثف المطورين من الانتقال من المفهوم إلى الإنتاج بسرعة وكفاءة.

تعرف على المزيد حول YOLOv8

الأداء والمعايير: YOLOX ضد YOLOv8

عند مقارنة الأداء، من الواضح أن كلا النموذجين يتمتعان بقدرات عالية. ومع ذلك، يُظهر YOLOv8 باستمرار تفوقًا في المفاضلة بين السرعة والدقة. يوضح الجدول أدناه أنه بالنسبة لأحجام النماذج المماثلة، يحقق YOLOv8 درجات mAP أعلى مع عدد أقل من المعلمات وعمليات الفاصلة العائمة في الثانية (FLOPs) في كثير من الحالات. علاوة على ذلك، يوفر YOLOv8 معايير واضحة لاستدلال CPU، وهو مجال تفتقر فيه بيانات YOLOX، مما يسلط الضوء على تحسينه لنطاق أوسع من الأجهزة.

النموذج الحجم
(بالبكسل)
mAPval
50-95
السرعة
وحدة المعالجة المركزية CPU ONNX
(بالمللي ثانية)
السرعة
T4 TensorRT10
(بالمللي ثانية)
المعلمات
(M)
FLOPs
(B)
YOLOXnano 416 25.8 - - 0.91 1.08
YOLOXtiny 416 32.8 - - 5.06 6.45
YOLOXs 640 40.5 - 2.56 9.0 26.8
YOLOXm 640 46.9 - 5.43 25.3 73.8
YOLOXl 640 49.7 - 9.04 54.2 155.6
YOLOXx 640 51.1 - 16.1 99.1 281.9
YOLOv8n 640 37.3 80.4 1.47 3.2 8.7
YOLOv8s 640 44.9 128.4 2.66 11.2 28.6
YOLOv8m 640 50.2 234.7 5.86 25.9 78.9
YOLOv8l 640 52.9 375.2 9.06 43.7 165.2
YOLOv8x 640 53.9 479.1 14.37 68.2 257.8

الخلاصة: أي نموذج يجب أن تختاره؟

يعتبر كل من YOLOX و YOLOv8 من نماذج الكشف عن الأجسام القوية، لكنهما يلبيان احتياجات وأولويات مختلفة.

YOLOX هو كاشف قوي وراسخ خالٍ من المرساة ويوفر دقة عالية. إنه خيار قابل للتطبيق للمشاريع التي تركز فقط على الكشف عن الكائنات، خاصة في السياقات البحثية أو للفرق التي لديها الموارد اللازمة لبناء خطوط أنابيب MLOps الخاصة بها.

ومع ذلك، بالنسبة للغالبية العظمى من المطورين والباحثين اليوم، يقدم Ultralytics YOLOv8 خيارًا أكثر إقناعًا وملاءمة. إن توازنه الفائق بين السرعة والدقة، جنبًا إلى جنب مع تعدد استخداماته التي لا مثيل لها للتعامل مع مهام رؤية متعددة، يجعله أداة أكثر قوة ومرونة. إن العامل الحاسم الحقيقي هو نظام Ultralytics البيئي—سهولة الاستخدام والوثائق الشاملة ودعم المجتمع النشط والأدوات المتكاملة مثل Ultralytics HUB تقلل بشكل كبير من حاجز الدخول وتسريع دورات التطوير.

بالنسبة لأولئك الذين يبحثون عن إطار عمل حديث وعالي الأداء وسهل الاستخدام يدعم مجموعة واسعة من التطبيقات من البحث إلى الإنتاج، فإن Ultralytics YOLOv8 هي التوصية الواضحة.

مقارنات النماذج الأخرى

إذا كنت مهتمًا بمعرفة كيف تقارن هذه النماذج بغيرها في المجال، فراجع صفحات المقارنة الأخرى هذه:



📅 تم إنشاؤه منذ سنة واحدة ✏️ تم التحديث منذ شهر واحد

تعليقات