مقارنة فنية بين YOLOX و YOLOv10
يُعد اختيار نموذج الكشف عن الأجسام الأمثل أمرًا ضروريًا لتحقيق التوازن بين الدقة والسرعة والمتطلبات الحسابية في مشاريع رؤية الكمبيوتر. تقدم هذه الصفحة مقارنة فنية مفصلة بين YOLOX و YOLOv10، وهما نموذجان مهمان في مجال الكشف عن الأجسام. سنقوم بتحليل تصميماتهما المعمارية ومقاييس الأداء وحالات الاستخدام المثالية لمساعدتك في اختيار الأنسب لاحتياجاتك.
YOLOX: كاشف عالي الأداء للأجسام بدون نقاط ارتكاز
YOLO هو نموذج للكشف عن الكائنات وخالٍ من المرساة تم تطويره بواسطة Megvii، بهدف تبسيط تصميم YOLO مع تحقيق أداء عالٍ. تم تقديمه في عام 2021، وكان يسعى إلى سد الفجوة بين البحث والتطبيقات الصناعية من خلال اقتراح بديل داخل عائلة YOLO.
تفاصيل فنية:
- المؤلفون: تشنغ قه، سونغتاو ليو، فنغ وانغ، زيمينغ لي، وجيان صن
- المنظمة: Megvii
- التاريخ: 2021-07-18
- Arxiv: https://arxiv.org/abs/2107.08430
- GitHub: https://github.com/Megvii-BaseDetection/YOLOX
- المستندات: https://yolox.readthedocs.io/en/latest/
البنية والميزات الرئيسية
يطبق YOLO العديد من التغييرات المعمارية الرئيسية مقارنة بنماذج YOLO السابقة، مع التركيز على البساطة والأداء:
- تصميم خالٍ من المربعات المحورية (Anchor-Free Design): من خلال التخلص من المربعات المحورية (anchor boxes) المحددة مسبقًا، يبسط YOLOX مسار الكشف ويقلل من عدد المعلمات الفائقة التي تحتاج إلى ضبط. هذا يمكن أن يؤدي إلى تحسين التعميم عبر مجموعات البيانات وأحجام الكائنات المختلفة.
- Decoupled Head: تستخدم رؤوسًا منفصلة لمهام التصنيف والتوطين. يمكن أن يحسن هذا الفصل سرعة التقارب ويحل مشكلة عدم التوافق بين ثقة التصنيف ودقة التوطين، وهي مشكلة شائعة في الكاشفات أحادية المرحلة.
- استراتيجيات التدريب المتقدمة: يتضمن النموذج تقنيات متقدمة مثل SimOTA (Simplified Optimal Transport Assignment) لتعيين التصنيفات الديناميكي أثناء التدريب. كما يستفيد من طرق تقوية البيانات القوية مثل MixUp لتعزيز قوة النموذج.
نقاط القوة والضعف
نقاط القوة:
- دقة عالية: يحقق YOLOX mAP قويًا، خاصة مع متغيراته الأكبر مثل YOLOX-x، مما يجعله خيارًا موثوقًا به للمهام التي تتطلب دقة عالية.
- بساطة بدون مرساة: يقلل التصميم من التعقيد المتعلق بتكوين مربع الإرساء، والذي يمكن أن يكون جزءًا مرهقًا من تدريب الكاشفات الأخرى.
- نموذج راسخ: نظرًا لكونه متاحًا منذ عام 2021، فإن YOLOX لديه قاعدة ناضجة من موارد المجتمع والبرامج التعليمية وأمثلة النشر.
نقاط الضعف:
- سرعة وكفاءة الاستدلال: على الرغم من كفاءته في وقته، إلا أنه يمكن أن يكون أبطأ وأكثر كثافة من الناحية الحسابية من النماذج الحديثة المحسّنة للغاية مثل YOLOv10، خاصة عند مقارنة النماذج ذات الدقة المماثلة.
- النظام البيئي الخارجي: YOLOX غير مدمج أصليًا في نظام Ultralytics البيئي. هذا قد يعني المزيد من الجهد اليدوي للنشر والتحسين باستخدام أدوات مثل TensorRT والتكامل مع منصات مثل Ultralytics HUB.
- تنوع المهام: يركز بشكل أساسي على اكتشاف الكائنات ويفتقر إلى الدعم المدمج لمهام الرؤية الأخرى مثل تقسيم المثيلات أو تقدير الوضع أو اكتشاف الصندوق المحيط الموجه الموجود في أطر العمل الأحدث والأكثر تنوعًا مثل Ultralytics YOLOv8.
حالات الاستخدام
YOLOX مناسب لـ:
- الكشف العام عن الكائنات: التطبيقات التي تتطلب توازنًا قويًا بين الدقة والسرعة، مثل أنظمة الأمان وتحليلات البيع بالتجزئة.
- خط الأساس للبحث: تصميمها الخالي من المرساة يجعلها خط أساس قيّم للباحثين الذين يستكشفون طرقًا جديدة للكشف عن الأجسام.
- التطبيقات الصناعية: مهام مثل مراقبة الجودة الآلية حيث الدقة العالية في الكشف هي مطلب أساسي.
YOLOv10: كاشف شامل متطور في الوقت الحقيقي
Ultralytics YOLOv10، الذي طوره باحثون في جامعة Tsinghua، يمثل تقدماً كبيراً في اكتشاف الكائنات في الوقت الفعلي من خلال التركيز على الكفاءة من طرف إلى طرف. وهو يعالج اختناقات المعالجة اللاحقة ويحسن البنية لتحقيق أداء فائق على حدود السرعة والدقة.
تفاصيل فنية:
- المؤلفون: Ao Wang, Hui Chen, Lihao Liu، وآخرون.
- المنظمة: جامعة تسينغ هوا
- التاريخ: 2024-05-23
- Arxiv: https://arxiv.org/abs/2405.14458
- GitHub: https://github.com/THU-MIG/yolov10
- المستندات: https://docs.ultralytics.com/models/yolov10/
البنية والميزات الرئيسية
يقدم YOLOv10 العديد من الابتكارات لتحقيق أحدث كفاءة:
- تدريب بدون NMS: يستخدم تعيينات ثنائية متسقة أثناء التدريب لإزالة الحاجة إلى تثبيط غير الأقصى (NMS) أثناء الاستدلال. هذا الابتكار يقلل من زمن الوصول للاستدلال ويبسط مسار النشر، مما يتيح كاشفًا حقيقيًا من طرف إلى طرف.
- تصميم شامل للكفاءة والدقة: تم تصميم بنية النموذج بنهج شامل لتحسين المكونات المختلفة. يتضمن ذلك رأس تصنيف خفيف الوزن وتقليل أبعاد مفصول مكانيًا وقنواتيًا، مما يقلل من التكرار الحسابي ويعزز قدرة النموذج دون التضحية بالدقة.
- خفيف الوزن وقابل للتطوير: يركز YOLOv10 على تقليل المعلمات وعمليات الفاصلة العائمة في الثانية (FLOPs)، مما يؤدي إلى سرعات استدلال أسرع ومناسبة للأجهزة المتنوعة، من وحدات معالجة الرسومات المتطورة إلى الأجهزة الطرفية ذات الموارد المحدودة.
نقاط القوة والضعف
نقاط القوة:
- سرعة وكفاءة استثنائيتان: تم تحسين YOLOv10 للاستدلال في الوقت الفعلي وبزمن انتقال منخفض، مما يجعله يتفوق على العديد من النماذج الأخرى في السرعة مع الحفاظ على دقة عالية.
- استدلال خالٍ من NMS: تؤدي إزالة NMS إلى تبسيط النشر وتسريع المعالجة اللاحقة، وهي ميزة حاسمة في التطبيقات الحساسة للوقت.
- أداء هو الأفضل على الإطلاق: يضع معيارًا جديدًا للمفاضلة بين الدقة والكفاءة، كما هو موضح في جدول الأداء.
- تكامل نظام Ultralytics البيئي: تم دمج YOLOv10 بسلاسة في نظام Ultralytics البيئي، ويستفيد من Python API سهل الاستخدام، و وثائق شاملة، وصيانة نشطة.
- سهولة الاستخدام: يتبع النموذج تجربة المستخدم المبسطة المعتادة لنماذج Ultralytics، مما يجعله سهل التدريب والتحقق والنشر.
- كفاءة التدريب: يوفر عملية تدريب فعالة مع أوزان مُدرَّبة مسبقًا متاحة بسهولة وعادة ما يكون لديه متطلبات ذاكرة أقل مقارنة بالبنى الأكثر تعقيدًا.
نقاط الضعف:
- جديد نسبيًا: كنموذج أحدث، قد يكون اتساع الأمثلة التي ساهم بها المجتمع وعمليات تكامل الطرف الثالث لا يزال في ازدياد مقارنة بالنماذج الراسخة منذ فترة طويلة مثل YOLOX.
حالات الاستخدام
YOLOv10 مثالي للتطبيقات الصعبة في الوقت الفعلي حيث تكون السرعة والدقة أمرًا بالغ الأهمية:
- Edge AI: مثالي للنشر على الأجهزة ذات الموارد المحدودة مثل Raspberry Pi و NVIDIA Jetson.
- الأنظمة الآنية: تطبيقات في المركبات ذاتية القيادة، الروبوتات، تحليلات الفيديو عالية السرعة، و المراقبة.
- معالجة عالية الإنتاجية: الفحص الصناعي والخدمات اللوجستية والتطبيقات الأخرى التي تتطلب تحليلًا سريعًا لحجم كبير من الصور أو تدفقات الفيديو.
تحليل الأداء: YOLOX ضد YOLOv10
يقدم الجدول التالي مقارنة تفصيلية لمقاييس الأداء لأحجام النماذج المختلفة لـ YOLOX و YOLOv10، والتي تم قياسها على مجموعة بيانات COCO.
النموذج | الحجم (بالبكسل) |
mAPval 50-95 |
السرعة وحدة المعالجة المركزية CPU ONNX (بالمللي ثانية) |
السرعة T4 TensorRT10 (بالمللي ثانية) |
المعلمات (M) |
FLOPs (B) |
---|---|---|---|---|---|---|
YOLOXnano | 416 | 25.8 | - | - | 0.91 | 1.08 |
YOLOXtiny | 416 | 32.8 | - | - | 5.06 | 6.45 |
YOLOXs | 640 | 40.5 | - | 2.56 | 9.0 | 26.8 |
YOLOXm | 640 | 46.9 | - | 5.43 | 25.3 | 73.8 |
YOLOXl | 640 | 49.7 | - | 9.04 | 54.2 | 155.6 |
YOLOXx | 640 | 51.1 | - | 16.1 | 99.1 | 281.9 |
YOLOv10n | 640 | 39.5 | - | 1.56 | 2.3 | 6.7 |
YOLOv10s | 640 | 46.7 | - | 2.66 | 7.2 | 21.6 |
YOLOv10m | 640 | 51.3 | - | 5.48 | 15.4 | 59.1 |
YOLOv10b | 640 | 52.7 | - | 6.54 | 24.4 | 92.0 |
YOLOv10l | 640 | 53.3 | - | 8.33 | 29.5 | 120.3 |
YOLOv10x | 640 | 54.4 | - | 12.2 | 56.9 | 160.4 |
تظهر البيانات بوضوح أن YOLOv10 يقدم باستمرار موازنة فائقة بين الدقة والكفاءة.
- YOLOv10-s تحقق نفس mAP تقريبًا مثل YOLOX-m (46.7% مقابل 46.9%) ولكن مع معلمات أقل بنسبة 72% (7.2 مليون مقابل 25.3 مليون) و عدد أقل من FLOPs بنسبة 70% (21.6 مليار مقابل 73.8 مليار).
- YOLOv10-m تتفوق على دقة YOLOX-l (51.3% مقابل 49.7%) مع كونها أكثر كفاءة بشكل ملحوظ من حيث المعلمات والحساب.
- في النهاية العالية، يقدم YOLOv10-x درجة mAP أعلى بكثير من YOLOX-x (54.4٪ مقابل 51.1٪) مع معلمات أقل بنسبة 43٪ و FLOPs أقل بنسبة 43٪.
الخلاصة
يعتبر كل من YOLOX و YOLOv10 من نماذج الكشف عن الأجسام القوية، لكنهما يخدمان أولويات مختلفة. يعتبر YOLOX جهاز كشف قوي وراسخ وخالي من نقاط الارتكاز يوفر دقة عالية، مما يجعله خيارًا قابلاً للتطبيق للمشاريع التي يكون نظامه البيئي موجودًا بالفعل.
ومع ذلك، بالنسبة للمطورين والباحثين الذين يسعون إلى تحقيق أفضل توازن بين السرعة والدقة وسهولة الاستخدام، فإن YOLOv10 هو الفائز الواضح. توفر بنيته المبتكرة الخالية من NMS مسارًا حقيقيًا للكشف الشامل، مما يؤدي إلى تقليل زمن الوصول وزيادة الكفاءة. كما أن التكامل السلس في نظام Ultralytics البيئي يعزز من جاذبيته، مما يوفر سير عمل مبسطًا ووثائق شاملة ودعمًا مجتمعيًا قويًا.
بالنسبة للمهتمين باستكشاف نماذج أخرى حديثة، تقدم Ultralytics مجموعة من الخيارات، بما في ذلك YOLOv8 متعددة الاستخدامات و YOLO11 الأحدث، والتي توفر إمكانات متعددة المهام مثل التجزئة والتصنيف وتقدير الوضع. يمكنك استكشاف المزيد من المقارنات، مثل YOLOv10 مقابل YOLOv8، للعثور على النموذج المثالي لاحتياجاتك الخاصة.