تخطي إلى المحتوى

YOLOX مقابل YOLOv5: استكشاف الابتكار الخالي من المرساة والكفاءة المثبتة

في المشهد سريع التطور لاكتشاف الأجسام، يعد اختيار البنية الصحيحة أمرًا محوريًا لنجاح المشروع. تستكشف هذه المقارنة نموذجين مؤثرين: YOLOX، وهو نموذج أكاديمي قوي معروف بتصميمه الخالي من الارتكاز، و YOLOv5وهو معيار الصناعة للسرعة وسهولة النشر. لقد شكّل كلا النموذجين مجال الرؤية الحاسوبية، ومع ذلك فإنهما يخدمان احتياجات مختلفة اعتمادًا على ما إذا كانت أولويتك تكمن في الدقة على مستوى البحث أو الكفاءة الجاهزة للإنتاج.

تحليل الأداء: السرعة والدقة والكفاءة

عند تقييم YOLOX و YOLOv5 غالبًا ما ينحصر التمييز بين الدقة الأولية والكفاءة التشغيلية. أدخلت YOLOX تغييرات معمارية مهمة، مثل الرأس المنفصل والآلية الخالية من المرساة، مما سمح لها بتحقيق أحدث نتائج mAP (متوسط الدقة المتوسطة) عند إصدارها. وهو يتفوق في السيناريوهات التي تكون فيها كل نقطة مئوية من الدقة مهمة، خاصةً في المعايير الصعبة مثل COCO.

وعلى العكس من ذلك، فإن Ultralytics YOLOv5 تم تصميمه مع التركيز على الأداء "الواقعي". فهو يعطي الأولوية لسرعة الاستدلال والكمون المنخفض، مما يجعله مناسبًا بشكل استثنائي لتطبيقات الأجهزة المحمولة والأنظمة المدمجة وأجهزة الذكاء الاصطناعي المتطورة. على الرغم من أن YOLOX قد يحتفظ بميزة طفيفة في mAP لنماذج كبيرة محددة، إلا أن YOLOv5 يتفوق عليه باستمرار في الإنتاجية (الإطارات في الثانية) ومرونة النشر، مستفيدًا من نظامUltralytics الشامل.

يقدم الجدول أدناه مقارنة مفصلة جنبًا إلى جنب بين النماذج عبر مختلف الأحجام. لاحظ كيف يحافظ YOLOv5 على دقة تنافسية مع تقديم أوقات استدلال أسرع بكثير، خاصةً عند تحسينه باستخدام TensorRT.

النموذجالحجم
(بالبكسل)
mAPفال
50-95
السرعة
وحدة المعالجة المركزية CPU ONNX
(بالمللي ثانية)
السرعة
T4 TensorRT10
(بالمللي ثانية)
المعلمات
(M)
FLOPs
(B)
YOLOXnano41625.8--0.911.08
YOLOXtiny41632.8--5.066.45
YOLOXs64040.5-2.569.026.8
YOLOXm64046.9-5.4325.373.8
YOLOXl64049.7-9.0454.2155.6
YOLOXx64051.1-16.199.1281.9
YOLOv5n64028.073.61.122.67.7
YOLOv5s64037.4120.71.929.124.0
YOLOv5m64045.4233.94.0325.164.2
YOLOv5l64049.0408.46.6153.2135.0
YOLOv5x64050.7763.211.8997.2246.4

يولوكس: المنافس الخالي من المرساة

تم تطوير YOLOX من قِبل باحثين في Megvii لسد الفجوة بين سلسلة YOLO والتقدم الأكاديمي في الكشف الخالي من الارتكاز. من خلال إزالة قيود مربعات الارتكاز المحددة مسبقًا، تبسّط YOLOX عملية التدريب وتقلل من الحاجة إلى الضبط الاستدلالي.

الهندسة المعمارية والابتكارات

يشتمل YOLOX على رأس منفصل، والذي يفصل مهام التصنيف والانحدار إلى فروع مختلفة. يتناقض هذا التصميم مع الرؤوس المقترنة في إصدارات YOLO السابقة ويُقال إنه يحسن سرعة التقارب والدقة. علاوة على ذلك، فإنه يستخدم استراتيجية SimOTA، وهي استراتيجية متقدمة لتعيين التسميات تقوم بتعيين عينات إيجابية بشكل ديناميكي، مما يعزز من قوة النموذج في المشاهد الكثيفة.

نقاط القوة والضعف

تكمن قوة YOLOX الأساسية في سقف دقتها العالية، لا سيما مع متغيراتها الأكبر (YOLOX-x)، وتصميمها النظيف الخالي من المراسي الذي يجذب الباحثين. ومع ذلك، فإن هذه الفوائد تأتي مع مقايضات. حيث يضيف الرأس المنفصل تعقيدًا حسابيًا، مما يؤدي غالبًا إلى بطء في الاستدلال مقارنةً بـ YOLOv5. بالإضافة إلى ذلك، باعتباره نموذجًا يركز على البحث، فإنه يفتقر إلى الأدوات المتماسكة وسهلة الاستخدام الموجودة في نظام Ultralytics مما قد يؤدي إلى تعقيد التكامل في خطوط الأنابيب التجارية.

حالات الاستخدام المثالية

  • البحث الأكاديمي: تجربة بنيات الكشف الجديدة واستراتيجيات تعيين التسميات.
  • المهام عالية الدقة: السيناريوهات التي يفوق فيها المكسب بنسبة 1-2% في mAP تكلفة الاستدلال الأبطأ، مثل تحليلات الفيديو دون اتصال بالإنترنت.
  • اكتشاف الأجسام الكثيفة: البيئات ذات الأجسام المزدحمة بكثافة حيث تعمل SimOTA بشكل جيد.

تعرف على المزيد حول YOLOX

YOLOv5: معيار الإنتاج

منذ إطلاقه في عام 2020، فإن Ultralytics YOLOv5 أصبح النموذج المفضل للمطورين في جميع أنحاء العالم. فهو يحقق توازنًا استثنائيًا بين الأداء والتطبيق العملي، مدعومًا بمنصة مصممة لتبسيط دورة حياة عمليات التعلم الآلي (MLOps) بأكملها.

الهندسة المعمارية والنظام البيئي

يستخدم YOLOv5 العمود الفقري لشبكة CSPNet وشبكة تجميع المسار (PANet)، المحسّنة لاستخراج الميزات بكفاءة. في حين أنه شاع في الأصل النهج القائم على الارتكاز في PyTorch فإن أعظم ما يميزه هو النظام البيئي المحيط به. ويستفيد المستخدمون من التصدير التلقائي إلى تنسيقات مثل ONNX CoreML TFLite بالإضافة إلى التكامل السلس مع Ultralytics HUB لتدريب النماذج وإدارتها.

هل تعلم؟

لا يقتصر YOLOv5 على المربعات المحدودة. فهو يدعم مهام متعددة بما في ذلك تجزئة النماذج وتصنيف الصور، مما يجعله أداة متعددة الاستخدامات لخطوط أنابيب الرؤية المعقدة.

نقاط القوة والضعف

سهولة الاستخدام هي السمة المميزة YOLOv5. باستخدام واجهة برمجة تطبيقات Python البسيطة، يمكن للمطورين تحميل أوزان مُدرّبة مسبقًا وتشغيل الاستدلال في بضعة أسطر من التعليمات البرمجية. تم تحسين النموذج بشكل كبير من أجل السرعة، حيث يوفر باستمرار زمن استجابة أقل على كل من وحدات المعالجة المركزية ووحدات معالجة الرسومات مقارنةً ب YOLOX. كما أنه يتميز أيضًا بمتطلبات ذاكرة أقل أثناء التدريب، مما يجعله متاحًا على الأجهزة القياسية. وعلى الرغم من أن تصميمه القائم على الارتكاز يتطلب تطوير الارتكاز لمجموعات البيانات المخصصة (يتم التعامل معه تلقائيًا بواسطة YOLOv5)، إلا أن موثوقيته ونظامه البيئي الذي يتم صيانته جيدًا يجعله متفوقًا في الإنتاج.

حالات الاستخدام المثالية

  • تطبيقات الوقت الحقيقي: المراقبة بالفيديو، والقيادة الذاتية، والروبوتات حيث يكون وقت الاستجابة المنخفض أمرًا بالغ الأهمية.
  • نشر الحافة: يعمل على Raspberry Pi، أو NVIDIA Jetson، أو الأجهزة المحمولة بفضل بنيته الفعالة.
  • المنتجات التجارية: النماذج الأولية والنشر السريع حيث يتطلب الدعم طويل الأجل وسهولة التكامل.
  • رؤية متعددة المهام: المشاريع التي تتطلب الكشف والتجزئة والتصنيف في إطار عمل واحد.

تعرف على المزيد حول YOLOv5

مثال على الكود: تشغيل YOLOv5 مع Ultralytics

تجعل حزمة Ultralytics Python من استخدام نماذج YOLOv5 أمرًا بسيطًا للغاية. فيما يلي مثال على كيفية تشغيل الاستدلال باستخدام نموذج مدرب مسبقًا.

from ultralytics import YOLO

# Load a pre-trained YOLOv5 model (Nano version for speed)
model = YOLO("yolov5nu.pt")

# Run inference on an image
results = model("https://ultralytics.com/images/bus.jpg")

# Display the results
results[0].show()

الخاتمة اتخاذ الخيار الصحيح

يمثل كلا النموذجين إنجازات مهمة في مجال الرؤية الحاسوبية، لكنهما يلبيان احتياجات جمهور مختلف. يعد YOLOX خيارًا هائلًا للباحثين الذين يتخطون حدود الكشف الخالي من الارتكاز والذين يشعرون بالراحة في التنقل بين مجموعة أدوات أكثر تجزئة.

ومع ذلك، بالنسبة للغالبية العظمى من المطورين والمهندسين والشركات, Ultralytics YOLOv5 يظل الخيار الأفضل. ويضمن لك مزيجها الرابح من السرعة التي لا مثيل لها وتعدد الاستخدامات والنظام البيئي القوي والنشط إمكانية الانتقال من المفهوم إلى النشر بأقل قدر من الاحتكاك. علاوة على ذلك، يوفر اعتماد إطار عمل Ultralytics مسارًا واضحًا للترقية إلى نماذج الجيل التالي مثل YOLO11الذي يجمع بين أفضل ما في التصميم الخالي من الارتكاز وكفاءة Ultralytics المميزة.

مقارنات النماذج الأخرى

استكشف كيف تتوافق هذه النماذج مع البنى الأخرى للعثور على أفضل ما يناسب احتياجاتك الخاصة:


تعليقات