تخطي إلى المحتوى

YOLOv5 ضد YOLOX: مقارنة تقنية

يُعد اختيار نموذج الكشف عن الأجسام المناسب قرارًا بالغ الأهمية، حيث يوازن بين الدقة والسرعة وتعقيد النشر. تقدم هذه الصفحة مقارنة فنية مفصلة بين نموذجين مؤثرين في عائلة YOLO: Ultralytics YOLOv5 و YOLOX. في حين أن كلا النموذجين يوفران أداءً في الوقت الفعلي، إلا أنهما مبنيان على فلسفات تصميم مختلفة بشكل أساسي. YOLOv5 هو نموذج مُحسَّن للغاية يعتمد على المرساة، ويشتهر بسهولة استخدامه وكفاءته الاستثنائية، بينما يقدم YOLOX نهجًا خاليًا من المرساة لتجاوز حدود الدقة. سنتعمق في بنيتيهما ومقاييس الأداء وحالات الاستخدام المثالية لمساعدتك في تحديد النموذج الأفضل الذي يناسب احتياجات مشروعك.

Ultralytics YOLOv5: معيار الصناعة المعمول به

تفاصيل فنية:

البنية والميزات الرئيسية

أصبح Ultralytics YOLOv5 معيارًا صناعيًا نظرًا لمزيجه الرائع من السرعة والدقة وسهولة الاستخدام. تم بناء YOLOv5 بالكامل في PyTorch، ويتميز ببنية قوية مع عمود فقري CSPDarknet53، وعنق PANet لتجميع الميزات، ورأس كشف يعتمد على المرساة فعال. إحدى نقاط قوته الرئيسية هي قابليته للتوسع، حيث يقدم مجموعة من النماذج من YOLOv5n الصغير والسريع إلى YOLOv5x الكبير والدقيق. تتيح هذه المرونة للمطورين تحديد النموذج المثالي لمتطلباتهم الحسابية ومتطلبات الأداء المحددة.

نقاط القوة

  • سرعة وكفاءة استثنائيتان: تم تحسين YOLOv5 بشكل كبير لـ الاستدلال السريع، مما يجعله خيارًا رئيسيًا للأنظمة في الوقت الفعلي على أجهزة متنوعة، بدءًا من وحدات المعالجة المركزية (CPUs) إلى وحدات معالجة الرسوميات (GPUs) و الأجهزة الطرفية.
  • سهولة الاستخدام: يشتهر YOLOv5 بتجربة المستخدم المبسطة، ويوفر Python API و CLI بسيطة، ويكملها وثائق شاملة والعديد من البرامج التعليمية.
  • نظام بيئي مُدار بشكل جيد: باعتباره نموذج Ultralytics، يستفيد YOLOv5 من نظام بيئي ناضج ونشط. ويشمل ذلك التطوير المستمر ومجتمعًا كبيرًا وداعمًا وتحديثات متكررة وتكاملًا سلسًا مع أدوات مثل Ultralytics HUB للتدريب والنشر بدون تعليمات برمجية.
  • كفاءة التدريب: يقدم النموذج عملية تدريب فعالة مع أوزان مُدرَّبة مسبقًا متاحة بسهولة على مجموعات بيانات مثل COCO، مما يقلل بشكل كبير من وقت التدريب والتكلفة الحسابية.
  • تنوع الاستخدامات: لا يقتصر استخدام YOLOv5 على اكتشاف الكائنات فقط؛ بل يدعم أيضًا تقسيم الحالات وتصنيف الصور، مما يجعله أداة متعددة الاستخدامات لمهام رؤية الكمبيوتر المختلفة.
  • استهلاك أقل للذاكرة: بالمقارنة مع التصميمات الأكثر تعقيدًا، يتطلب YOLOv5 عمومًا ذاكرة أقل لكل من التدريب والاستدلال، مما يجعله في متناول المستخدمين ذوي موارد الأجهزة المحدودة.

نقاط الضعف

  • اكتشاف قائم على المرساة: يمكن أن يتطلب اعتماده على مربعات مرساة محددة مسبقًا في بعض الأحيان ضبطًا دقيقًا لتحقيق الأداء الأمثل على مجموعات البيانات ذات الكائنات ذات الأشكال أو الأحجام غير العادية، مقارنةً بـ أجهزة الكشف الخالية من المرساة.
  • موازنة الدقة: على الرغم من توفير توازن رائع، فإن نماذج YOLOv5 الأصغر تعطي الأولوية للسرعة، مما قد يؤدي إلى دقة أقل قليلاً مقارنة بالبنى الأحدث والأكثر تعقيدًا مثل YOLOX أو YOLOv9.

حالات الاستخدام

يتفوق YOLOv5 في التطبيقات التي تكون فيها السرعة والكفاءة أمرًا بالغ الأهمية:

تعرف على المزيد حول YOLOv5

YOLOX: بديل عالي الأداء وخالٍ من المرساة

تفاصيل فنية:

البنية والميزات الرئيسية

يقدم YOLOX، الذي تم تقديمه في عام 2021 من قبل باحثين من Megvii، نهجًا خاليًا من المرساة للكشف عن الأجسام. يهدف اختيار التصميم هذا إلى تبسيط خط الكشف وتحسين التعميم عن طريق إلغاء الحاجة إلى مربعات مرساة محددة مسبقًا. تتضمن الابتكارات المعمارية الرئيسية رأسًا منفصلًا، يفصل بين مهام التصنيف والتوطين في فروع مختلفة، واستخدام استراتيجيات تدريب متقدمة مثل SimOTA، وهي تقنية لتعيين التسميات الديناميكية تساعد النموذج على تعلم تمثيلات أفضل.

نقاط القوة

  • الكشف بدون نقاط ارتكاز: يبسط مسار الكشف عن طريق إزالة التعقيد والافتراضات المسبقة المرتبطة بمربعات الارتكاز، مما قد يؤدي إلى أداء أفضل على الكائنات ذات نسب العرض إلى الارتفاع المتنوعة.
  • دقة عالية: يحقق دقة تنافسية، لا سيما مع نماذجه الأكبر حجمًا. يعتبر الرأس المفصول واستراتيجية تعيين تسميات SimOTA المتقدمة من المساهمين الرئيسيين في درجات متوسط الدقة (mAP) القوية.

نقاط الضعف

  • التعقيد: في حين أن تصميم عدم وجود نقاط الارتكاز يبسط جانبًا واحدًا، إلا أن إدخال رؤوس منفصلة واستراتيجيات متقدمة مثل SimOTA يمكن أن يزيد من تعقيد التنفيذ ويجعل عملية التدريب أقل سهولة.
  • النظام البيئي الخارجي: لا يُعد YOLOX جزءًا من مجموعة Ultralytics، ممّا يعني أنه يفتقر إلى التكامل السلس مع أدوات قوية مثل Ultralytics HUB. يمكن أن يؤدي هذا إلى منحنى تعليمي أكثر حدة وجهد يدوي أكبر للتدريب والنشر و MLOps.
  • سرعة وحدة المعالجة المركزية (CPU): قد تتخلف سرعة الاستدلال على وحدة المعالجة المركزية عن النماذج المحسّنة للغاية مثل YOLOv5، خاصةً بالنسبة لمتغيرات YOLOX الأكبر، مما يجعلها أقل مثالية لبعض التطبيقات في الوقت الفعلي المعتمدة على وحدة المعالجة المركزية.

حالات الاستخدام

يعتبر YOLOX مناسبًا تمامًا للتطبيقات التي يكون فيها زيادة الدقة إلى أقصى حد هي الأولوية القصوى:

  • القيادة الذاتية: مناسبة لمهام الإدراك في المركبات ذاتية القيادة حيث الدقة العالية أمر بالغ الأهمية للسلامة.
  • الروبوتات المتقدمة: مثالية للبيئات المعقدة حيث تتطلب الروبوتات اكتشافًا دقيقًا للأجسام من أجل الملاحة والتفاعل.
  • الأبحاث: تُستخدم كقاعدة قوية لاستكشاف المنهجيات الخالية من المرساة وتقنيات التدريب المتقدمة في أبحاث الكشف عن الأجسام.

تعرف على المزيد حول YOLOX

مقارنة الأداء والسرعة

عند مقارنة YOLOv5 و YOLOX، يصبح التوازن بين السرعة والدقة وحجم النموذج واضحًا. تم تصميم YOLOv5 لتحقيق كفاءة استثنائية، مما يوفر سرعات استدلال سريعة جدًا، خاصة على وحدة المعالجة المركزية (CPU) وعند تصديرها إلى تنسيقات محسّنة مثل TensorRT. هذا يجعله خيارًا هائلاً للتطبيقات التي تتطلب أداءً في الوقت الفعلي على مجموعة واسعة من الأجهزة. من ناحية أخرى، يدفع YOLOX لتحقيق دقة أعلى، حيث يحقق نموذجه الأكبر، YOLOX-x، mAP أعلى قليلاً من YOLOv5x. ومع ذلك، غالبًا ما تأتي زيادة الدقة هذه مصحوبة بتكلفة حسابية متزايدة وأوقات استدلال أبطأ.

يوفر الجدول أدناه مقارنة كمية لأحجام النماذج المختلفة لكل من YOLOv5 و YOLOX، والتي تم قياسها على مجموعة بيانات COCO val2017.

النموذج الحجم
(بالبكسل)
mAPval
50-95
السرعة
وحدة المعالجة المركزية CPU ONNX
(بالمللي ثانية)
السرعة
T4 TensorRT10
(بالمللي ثانية)
المعلمات
(M)
FLOPs
(B)
YOLOv5n 640 28.0 73.6 1.12 2.6 7.7
YOLOv5s 640 37.4 120.7 1.92 9.1 24.0
YOLOv5m 640 45.4 233.9 4.03 25.1 64.2
YOLOv5l 640 49.0 408.4 6.61 53.2 135.0
YOLOv5x 640 50.7 763.2 11.89 97.2 246.4
YOLOXnano 416 25.8 - - 0.91 1.08
YOLOXtiny 416 32.8 - - 5.06 6.45
YOLOXs 640 40.5 - 2.56 9.0 26.8
YOLOXm 640 46.9 - 5.43 25.3 73.8
YOLOXl 640 49.7 - 9.04 54.2 155.6
YOLOXx 640 51.1 - 16.1 99.1 281.9

الخلاصة والتوصية

يعتبر كل من YOLOv5 و YOLOX من نماذج الكشف عن الأجسام القوية، لكنهما يلبيان أولويات مختلفة.

Ultralytics YOLOv5 لا يزال الخيار الأفضل للغالبية العظمى من التطبيقات الواقعية. إن مزاياه الرئيسية هي سهولة الاستخدام التي لا مثيل لها، وسرعة الاستدلال الاستثنائية، ونظام بيئي قوي تتم صيانته جيدًا. بالنسبة للمطورين والفرق التي تتطلع إلى الانتقال من المفهوم إلى الإنتاج بسرعة وكفاءة، فإن سير عمل YOLOv5 المبسط ووثائقه الشاملة وتكامله مع أدوات مثل Ultralytics HUB لا تقدر بثمن. إنه يوفر توازنًا ممتازًا بين السرعة والدقة، مما يجعله مثاليًا للنشر على كل شيء بدءًا من خوادم السحابة المتطورة وحتى الأجهزة الطرفية ذات الموارد المحدودة.

YOLOX هو نموذج أكاديمي وبحثي قوي يوضح إمكانات البنى الخالية من المرساة. إنه خيار مناسب للمشاريع التي يكون فيها تحقيق أعلى قيمة mAP مطلقة هو الهدف الأساسي، والفريق التطويري مستعد للتعامل مع التعقيد المتزايد والافتقار إلى نظام بيئي متكامل.

بالنسبة لمعظم المطورين والباحثين والشركات، نوصي بالبدء بنموذج Ultralytics. توفر فوائد الإطار الموحد الذي يتم تطويره بنشاط والذي يدعم مهام متعددة (الكشف والتجزئة والوضع وما إلى ذلك) ويوفر مسار ترقية واضحًا إلى نماذج أحدث مثل YOLOv8 و YOLO11 ميزة كبيرة على المدى الطويل. تم تصميم نظام Ultralytics البيئي لتسريع التطوير والتأكد من حصولك على الدعم والأدوات اللازمة للنجاح.

مقارنات النماذج الأخرى

إذا كنت مهتمًا بمقارنة هذه النماذج مع نماذج أخرى في عائلة YOLO وما بعدها، فراجع هذه الصفحات:



📅 تم إنشاؤه منذ سنة واحدة ✏️ تم التحديث منذ شهر واحد

تعليقات