مقارنة فنية بين YOLOX و YOLO11
يعد اختيار نموذج الكشف عن الكائنات المناسب قرارًا حاسمًا يوازن بين متطلبات الدقة والسرعة والموارد الحسابية. تقدم هذه الصفحة مقارنة فنية مفصلة بين YOLOX، وهو نموذج عالي الأداء وخالٍ من المرساة من Megvii، و Ultralytics YOLO11، وهو أحدث نموذج من Ultralytics. سوف نتعمق في الاختلافات المعمارية وقياسات الأداء وحالات الاستخدام المثالية لمساعدتك في اختيار أفضل نموذج لمشروع الرؤية الحاسوبية الخاص بك.
YOLOX: كاشف عالي الأداء وخالٍ من المرساة
تم تقديم YOLOX بواسطة Megvii كإصدار من YOLO خالٍ من المرساة، ومصمم لتبسيط مسار الكشف مع تحقيق أداء قوي. وهدف إلى سد الفجوة بين البحث الأكاديمي والتطبيقات الصناعية عن طريق إزالة تعقيد مربعات المرساة المحددة مسبقًا.
تفاصيل فنية:
- المؤلفون: تشنغ قه، سونغتاو ليو، فنغ وانغ، زيمينغ لي، وجيان صن
- المنظمة: Megvii
- التاريخ: 2021-07-18
- Arxiv: https://arxiv.org/abs/2107.08430
- GitHub: https://github.com/Megvii-BaseDetection/YOLOX
- المستندات: https://yolox.readthedocs.io/en/latest/
البنية والميزات الرئيسية
قدم YOLO العديد من الابتكارات الرئيسية لعائلة YOLO:
- تصميم خالٍ من المربعات المحورية (Anchor-Free Design): من خلال التخلص من المربعات المحورية، يقلل YOLOX من عدد معلمات التصميم ويبسط عملية التدريب، مما قد يؤدي إلى تعميم أفضل.
- Decoupled Head: تستخدم رؤوس تنبؤ منفصلة لمهام التصنيف والانحدار. يمكن أن يحسن هذا الفصل سرعة التقارب ويعزز دقة النموذج مقارنة بالرؤوس المزدوجة المستخدمة في إصدارات YOLO السابقة.
- استراتيجيات التدريب المتقدمة: تشتمل YOLOX على تقنيات متقدمة مثل SimOTA (إستراتيجية مبسطة لتعيين النقل الأمثل) لتعيين التصنيفات الديناميكي أثناء التدريب، جنبًا إلى جنب مع طرق تقوية البيانات القوية.
نقاط القوة والضعف
نقاط القوة:
- دقة عالية: تحقق نماذج YOLOX، وخاصة المتغيرات الأكبر، نتائج mAP تنافسية على المعايير القياسية مثل مجموعة بيانات COCO.
- بساطة بدون مرساة: يبسط التصميم خط أنابيب الكشف عن طريق إزالة الحاجة إلى تكوين مربعات الإرساء، وهي نقطة ألم شائعة في الكاشفات الأخرى.
- نموذج راسخ: باعتباره نموذجًا تم إصداره في عام 2021، فإنه يحظى بمتابعة مجتمعية مع أمثلة نشر متنوعة متاحة.
نقاط الضعف:
- أداء قديم: على الرغم من قوته في وقته، إلا أن أداءه من حيث السرعة والدقة قد تجاوزه نماذج أحدث مثل YOLO11.
- تنوع محدود: يركز YOLOX بشكل أساسي على اكتشاف الكائنات. يفتقر إلى الدعم المدمج لمهام الرؤية الأخرى مثل تجزئة المثيلات أو تقدير الوضعية أو التصنيف التي تعتبر قياسية في الأطر الحديثة مثل Ultralytics.
- النظام البيئي الخارجي: إنه ليس جزءًا من نظام Ultralytics البيئي المتكامل، مما يعني أن المستخدمين يفوتون الأدوات المبسطة والتحديثات المستمرة والدعم الشامل للتدريب والتحقق والنشر.
حالات الاستخدام المثالية
يعتبر YOLO خيارًا قابلاً للتطبيق من أجل:
- خطوط الأساس للبحث: إنها بمثابة خط أساس ممتاز للباحثين الذين يستكشفون طرق الكشف الخالية من المرساة.
- التطبيقات الصناعية: مناسبة لمهام مثل مراقبة الجودة في التصنيع حيث يكون الكاشف القوي والمفهوم جيدًا كافيًا.
Ultralytics YOLO11: أحدث ما توصلت إليه التنوع والأداء
Ultralytics YOLO11 هو أحدث نموذج رائد من Ultralytics، وهو يمثل قمة سلسلة YOLO. وهي تعتمد على نجاح سابقاتها مثل YOLOv8، مما يوفر أداءً متطوراً وتنوعاً لا مثيل له وتجربة مستخدم استثنائية.
تفاصيل فنية:
- المؤلفون: Glenn Jocher و Jing Qiu
- المنظمة: Ultralytics
- التاريخ: 2024-09-27
- GitHub: https://github.com/ultralytics/ultralytics
- المستندات: https://docs.ultralytics.com/models/yolo11/
البنية والميزات الرئيسية
يتميز YOLO11 ببنية مُحسَّنة للغاية، أحادية المرحلة، وخالية من المرساة مصممة لتحقيق أقصى قدر من الكفاءة والدقة.
- موازنة الأداء: يحقق YOLO11 توازنًا استثنائيًا بين السرعة والدقة، مما يجعله مناسبًا لمجموعة واسعة من التطبيقات، بدءًا من المعالجة في الوقت الفعلي على الأجهزة الطرفية إلى التحليل عالي الإنتاجية على خوادم الحوسبة السحابية.
- تعدد الاستخدامات: إحدى الميزات الرئيسية في YOLO11 هي قدرتها على أداء مهام متعددة. فهي تدعم اكتشاف الأجسام، و تجزئة المثيلات، و تصنيف الصور، و تقدير الوضعية، و اكتشاف الصناديق المحيطة الموجهة (OBB) ضمن إطار عمل واحد وموحد.
- سهولة الاستخدام: تم دمج YOLO11 في نظام بيئي جيد الصيانة مع واجهة برمجة تطبيقات Python بسيطة و CLI قوي و وثائق شاملة. وهذا يجعله في متناول المبتدئين والخبراء على حد سواء.
- كفاءة التدريب: يستفيد النموذج من عمليات التدريب الفعالة والأوزان المدربة مسبقًا المتاحة بسهولة ومتطلبات الذاكرة المنخفضة، مما يسمح بدورات تطوير أسرع.
- نظام بيئي مُدار بشكل جيد: توفر Ultralytics تطويرًا نشطًا ودعمًا مجتمعيًا قويًا وتكاملاً سلسًا مع أدوات مثل Ultralytics HUB لـ MLOps شامل، بدءًا من إدارة البيانات وحتى نشر الإنتاج.
نقاط القوة والضعف
نقاط القوة:
- أداء هو الأفضل على الإطلاق: يقدم أعلى مستويات درجات mAP مع الحفاظ على سرعات استدلال عالية.
- كفاءة فائقة: تؤدي البنية المحسّنة إلى عدد أقل من المعلمات وعمليات الفاصلة العائمة في الثانية (FLOPs) لمستوى دقة معين مقارنة بـ YOLOX.
- دعم المهام المتعددة: يمكن تدريب نموذج YOLO11 واحد لمهام رؤية مختلفة، مما يوفر مرونة لا مثيل لها.
- إطار عمل سهل الاستخدام: يبسط نظام Ultralytics البيئي دورة التطوير بأكملها.
- تطوير ودعم نشط: يستفيد من التحديثات المستمرة ومجتمع كبير ودعم احترافي من Ultralytics.
نقاط الضعف:
- باعتباره كاشفًا أحادي المرحلة، قد يواجه تحديات في اكتشاف الأجسام الصغيرة للغاية أو المحجوبة بشدة في المشاهد المزدحمة، وهو قيد شائع لهذه الفئة من النماذج.
- تتطلب النماذج الأكبر، مثل YOLO11x، موارد حسابية كبيرة لتحقيق أقصى قدر من الدقة، على الرغم من أنها تظل فعالة للغاية بالنسبة لمستوى أدائها.
حالات الاستخدام المثالية
تعتبر YOLO11 الخيار الأمثل لمجموعة واسعة من التطبيقات الحديثة:
- الأنظمة الذاتية: تشغيل الروبوتات و السيارات ذاتية القيادة من خلال الإدراك في الوقت الفعلي.
- الأمن الذكي: تمكين أنظمة المراقبة المتقدمة و منع السرقة.
- الأتمتة الصناعية: أتمتة مراقبة الجودة وتحسين كفاءة إعادة التدوير.
- تحليلات البيع بالتجزئة: تحسين إدارة المخزون وتحليل سلوك العملاء.
مقارنة أداء مباشرة: YOLOX ضد YOLO11
عند مقارنة الأداء على مجموعة بيانات COCO، تتضح التطورات في YOLO11.
النموذج | الحجم (بالبكسل) |
mAPval 50-95 |
السرعة وحدة المعالجة المركزية CPU ONNX (بالمللي ثانية) |
السرعة T4 TensorRT10 (بالمللي ثانية) |
المعلمات (M) |
FLOPs (B) |
---|---|---|---|---|---|---|
YOLOX-Nano | 416 | 25.8 | - | - | 0.91 | 1.08 |
YOLOX-Tiny | 416 | 32.8 | - | - | 5.06 | 6.45 |
YOLOX-s | 640 | 40.5 | - | 2.56 | 9.0 | 26.8 |
YOLOX-m | 640 | 46.9 | - | 5.43 | 25.3 | 73.8 |
YOLOX-l | 640 | 49.7 | - | 9.04 | 54.2 | 155.6 |
YOLOX-x | 640 | 51.1 | - | 16.1 | 99.1 | 281.9 |
YOLO11n | 640 | 39.5 | 56.1 | 1.5 | 2.6 | 6.5 |
YOLO11s | 640 | 47.0 | 90.0 | 2.5 | 9.4 | 21.5 |
YOLO11m | 640 | 51.5 | 183.2 | 4.7 | 20.1 | 68.0 |
YOLO11l | 640 | 53.4 | 238.6 | 6.2 | 25.3 | 86.9 |
YOLO11x | 640 | 54.7 | 462.8 | 11.3 | 56.9 | 194.9 |
يُظهر YOLO11 أداءً فائقًا في جميع المجالات. على سبيل المثال، يحقق YOLO11s قيمة mAP أعلى (47.0) من YOLOX-m (46.9) مع أقل من نصف عدد المعلمات وعدد أقل بكثير من عمليات الفاصلة العائمة في الثانية (FLOPs). والأكثر إثارة للإعجاب، أن YOLO11m يتفوق على أكبر نموذج YOLOX-x في الدقة (51.5 mAP مقابل 51.1 mAP) مع كونه أكثر كفاءة بكثير (20.1 مليون معلمة مقابل 99.1 مليون).
من حيث السرعة، فإن نماذج YOLO11 سريعة بشكل استثنائي، خاصة على GPU مع تحسين TensorRT. يضع YOLO11n معيارًا جديدًا للنماذج خفيفة الوزن مع وقت استدلال يبلغ 1.5 مللي ثانية فقط. علاوة على ذلك، توفر Ultralytics معايير أداء واضحة لوحدة المعالجة المركزية CPU، وهو عامل حاسم للعديد من عمليات النشر الواقعية التي تفتقر إليها معايير YOLOX.
الخلاصة: أي نموذج يجب أن تختاره؟
في حين أن YOLOX كانت مساهمة مهمة في تطوير كاشفات الكائنات الخالية من الارتكاز، فإن Ultralytics YOLO11 هو الفائز الواضح لجميع حالات الاستخدام الحديثة تقريبًا. فهو يوفر مزيجًا فائقًا من الدقة والسرعة والكفاءة الحسابية.
تمتد مزايا YOLO11 إلى أبعد من المقاييس الأولية. يوفر تكاملها في نظام Ultralytics البيئي الشامل دفعة كبيرة للإنتاجية. بفضل تنوعها في المهام المتعددة وسهولة استخدامها وصيانتها النشطة ودعمها المكثف، تمكن YOLO11 المطورين والباحثين من بناء ونشر حلول الرؤية الحاسوبية المتقدمة بشكل أسرع وأكثر فعالية. لأي مشروع جديد يتطلب أداءً حديثًا وتجربة تطوير سلسة، فإن YOLO11 هو الخيار الموصى به.
مقارنات النماذج الأخرى
إذا كنت مهتمًا بمعرفة كيف تتم مقارنة YOLOX و YOLO11 بالنماذج الرائدة الأخرى، فراجع صفحات المقارنة الأخرى هذه:
- YOLOv10 مقارنة بـ YOLOX
- YOLOv8 مقابل YOLOX
- RT-DETR ضد YOLOX
- YOLO11 مقابل YOLOv10
- YOLO11 مقارنة بـ YOLOv8
- YOLO11 مقابل EfficientDet
- YOLO11 مقابل RT-DETR