تخطي إلى المحتوى

YOLO مقابل YOLOX: مقارنة تقنية مفصلة

تعد نماذج اكتشاف الأجسام ضرورية لتطبيقات الرؤية الحاسوبية المختلفة، ويعتمد اختيار النموذج المناسب على احتياجات المشروع المحددة. تقدم هذه الصفحة مقارنة تقنية بين YOLO و YOLOX، وهما نموذجان متطوران للكشف عن الأجسام، مع تحليل بنيتهما وأدائهما وتطبيقاتهما.

دامو-YOLO

YOLO هو نموذج سريع ودقيق للكشف عن الأجسام طوّرته مجموعة علي بابا. وهو يقدم العديد من التقنيات الجديدة، بما في ذلك العمود الفقري لشبكة NAS وشبكة RepGFPN الفعالة، بهدف تحقيق أداء عالٍ في مهام اكتشاف الأجسام.

البنية والمميزات الرئيسية

تتضمن بنية YOLO العديد من المكونات المبتكرة:

  • العمود الفقري لـ NAS: يستخدم العمود الفقري للبحث في البنية العصبية (NAS) لاستخراج الميزات على النحو الأمثل.
  • RepGFPPN: توظف شبكة هرم ميزات التدرج المتدرج الفعال (GFPN) لتعزيز دمج الميزات.
  • ZeroHead: يتميز برأس كشف خفيف الوزن يسمى ZeroHead لتقليل النفقات الحسابية الزائدة.
  • AlignedOTA: يستخدم التعيين الأمثل للنقل المحاذي (OTA) لتحسين تعيين التسمية أثناء التدريب.

مقاييس الأداء

يُظهر YOLO توازناً قوياً بين السرعة والدقة، حيث يقدم أحجاماً مختلفة من النماذج لتناسب مختلف الاحتياجات الحسابية.

  • mAP: يحقق متوسط دقة متوسط تنافسي (mAP) على مجموعات بيانات مثل COCO.
  • سرعة الاستدلال: مصممة للاستدلال السريع، مما يجعلها مناسبة للتطبيقات في الوقت الحقيقي.
  • حجم النموذج: متوفرة بأحجام مختلفة (صغير، صغير، متوسط، كبير) مع اختلاف عدد المعلمات والفلوب.

نقاط القوة والضعف

نقاط القوة:

  • دقة عالية: يحقق درجات ممتازة في MAP، مما يشير إلى دقة كشف قوية.
  • بنية فعالة: تساهم المكونات المبتكرة مثل RepGFPPN و ZeroHead في تحقيق الكفاءة.
  • القدرة في الوقت الحقيقي: مصممة لسرعات استنتاج سريعة مناسبة لأنظمة الوقت الحقيقي.

نقاط الضعف:

  • التعقيد: قد تؤدي المكونات المعمارية المتقدمة إلى تعقيد في التخصيص والتنفيذ.
  • مجتمع محدود: بالمقارنة مع النماذج الأكثر رسوخاً، قد يكون المجتمع والموارد أصغر.

حالات الاستخدام

YOLO مناسب تمامًا للتطبيقات التي تتطلب دقة عالية وأداءً فوريًا، مثل

  • الروبوتات المتقدمة: تمكين الكشف الدقيق عن الأجسام للمهام الروبوتية المعقدة.
  • مراقبة عالية الدقة: معالجة تدفقات الفيديو عالية الوضوح للتعرف على الأجسام بالتفصيل.
  • مراقبة الجودة الصناعية: الكشف عن العيوب الدقيقة في عمليات التصنيع.

اعرف المزيد عن YOLO

يولوكس

إن YOLOX، الذي طورته شركة Megvii، هو نسخة خالية من المرساة من YOLO مع التركيز على البساطة والأداء العالي. ويهدف إلى سد الفجوة بين التطبيقات البحثية والصناعية بتصميمه الفعال.

البنية والمميزات الرئيسية

تبرز YOLOX بنهجها الخالي من المراسي وبنيتها الانسيابية:

  • الكشف بدون مرساة: يبسّط خط أنابيب الكشف عن طريق إزالة الحاجة إلى مربعات الارتكاز، مما يقلل من التعقيد وضبط المعلمة الفائقة.
  • الرأس المنفصل: يفصل بين رأسي التصنيف والانحدار لتحسين الأداء وكفاءة التدريب.
  • تعيين التسمية SimOTA: يستخدم استراتيجية تعيين التسمية SimOTA (تعيين النقل الأمثل المبسط) لتعيين التسمية من أجل تدريب أكثر فعالية.
  • تعزيزات قوية: يستخدم تقنيات تعزيز البيانات المتقدمة لتعزيز متانة النموذج وتعميمه.

مقاييس الأداء

توفر YOLOX توازنًا قويًا بين الدقة والسرعة، مع توفر أحجام مختلفة من الطرازات.

  • mAP: يحقق نتائج mAP تنافسية على مجموعات البيانات المعيارية مثل COCO، وغالبًا ما يتفوق على إصدارات YOLO السابقة.
  • سرعة الاستدلال: يوفر سرعات استنتاج سريعة ومناسبة للنشر في الوقت الحقيقي.
  • حجم النموذج: يوفر أحجام نماذج مختلفة (نانو، صغير، صغير، ق، م، ط، س) لاستيعاب قيود الموارد المتنوعة.

نقاط القوة والضعف

نقاط القوة:

  • البساطة: يعمل التصميم الخالي من المراسي على تبسيط النموذج وتقليل الحاجة إلى الضبط المعقد.
  • أداء عالٍ: تحقق دقة وسرعة ممتازة، وغالبًا ما تتفوق على نماذج YOLO القائمة على المرساة.
  • سهولة التنفيذ: موثقة بشكل جيد وسهلة التنفيذ والنشر نسبياً.

نقاط الضعف:

  • التكلفة الحسابية: يمكن أن تكون نماذج YOLOX الأكبر حجمًا كثيفة من الناحية الحسابية، مما يتطلب المزيد من الموارد.
  • التحسين لأجهزة محددة: قد يتطلب التحسين للنشر على أجهزة حافة محدودة الموارد للغاية مقارنةً بنماذج خفيفة الوزن للغاية.

حالات الاستخدام

YOLOX متعدد الاستخدامات ومناسب لمجموعة كبيرة من مهام الكشف عن الأجسام، بما في ذلك:

  • المراقبة بالفيديو في الوقت الحقيقي: معالجة موجزات الفيديو بكفاءة من أجل الأمن والمراقبة.
  • القيادة الذاتية: توفير اكتشاف قوي وسريع للأجسام للمركبات ذاتية القيادة.
  • نشر الحافة: نشر نماذج YOLOX الأصغر حجماً على أجهزة الحافة للتطبيقات ذات الموارد المحدودة.

اعرف المزيد عن يولوكس

جدول مقارنة النماذج

الطراز الحجم
(بكسل)
مافال
50-95
السرعة
CPU ONNX
(مللي ثانية)
السرعة
T4 T4TensorRT10
(مللي ثانية)
بارامز
(م)

(ب)
دامو يولوت 640 42.0 - 2.32 8.5 18.1
دامو يولو 640 46.0 - 3.45 16.3 37.8
دامو يولوم 640 49.2 - 5.09 28.2 61.8
دامو يولول 640 50.8 - 7.18 42.1 97.3
يولوكسنانو 416 25.8 - - 0.91 1.08
يولوكستيني 416 32.8 - - 5.06 6.45
يولوكس 640 40.5 - 2.56 9.0 26.8
يولوكسم 640 46.9 - 5.43 25.3 73.8
يولوكسل 640 49.7 - 9.04 54.2 155.6
يولوكس 640 51.1 - 16.1 99.1 281.9

يُعتبر كل من YOLO و YOLOX نموذجين قويين للكشف عن الأجسام. يركّز YOLO على الدقة والكفاءة من خلال الابتكارات المعمارية، بينما يركّز YOLOX على البساطة والأداء العالي من خلال تصميمه الخالي من المثبتات. يعتمد الاختيار بينهما على المتطلبات المحددة للتطبيق، مع مراعاة عوامل مثل احتياجات الدقة ومتطلبات السرعة وبيئة النشر.

يمكن للمستخدمين المهتمين بنماذج أخرى عالية الأداء للكشف عن الأجسام أن يفكروا أيضًا في Ultralytics YOLOv8و YOLOv10 و YOLO11. لإجراء مقارنات مع هذه النماذج وغيرها، راجع مستندات مقارنة نماذجUltralytics .

📅 تم إنشاؤها منذ 1 سنة مضت ✏️ تم التحديث منذ 1 شهر

التعليقات