تخطي إلى المحتوى

مقارنة تقنية: YOLOX مقابل EfficientDet للكشف عن الأجسام

تشتهر نماذج Ultralytics YOLO بسرعتها ودقتها في مهام اكتشاف الأجسام. تقدم هذه الصفحة مقارنة تقنية مفصلة بين نموذجين بارزين لاكتشاف الأجسام: YOLOX وEfficientDet. سنستكشف تصميماتهما المعمارية ومعايير الأداء ومنهجيات التدريب والتطبيقات المثلى لمساعدتك في اختيار النموذج الأنسب لاحتياجاتك في مجال الرؤية الحاسوبية.

YOLOX: كاشف عالي الأداء خالٍ من المرساة

YOLOX ("أنت تنظر مرة واحدة فقط X") هو كاشف أجسام متطور خالٍ من الارتكاز تم تطويره بواسطة Megvii. تم تصميمه من أجل البساطة والأداء العالي، وسد الفجوة بين الأبحاث والتطبيقات الصناعية العملية.

البنية والمميزات الرئيسية

يتميز YOLOX بنموذج اكتشاف خالٍ من الارتكاز، مما يبسّط البنية ويعزز الكفاءة. تشمل الملامح المعمارية الرئيسية ما يلي:

  • تصميم خالٍ من المراسي: يزيل تعقيد مربعات الارتكاز، مما يؤدي إلى تنفيذ أبسط وتعميم أفضل، خاصةً للأجسام ذات نسب أبعاد مختلفة.
  • الرأس المنفصل: يفصل بين رأسي التصنيف والتوطين، مما يعزز التحسين لكل مهمة ويحسن الدقة الإجمالية.
  • استراتيجيات التدريب المتقدمة: توظف تقنيات مثل تعيين التسمية SimOTA والتكثيف القوي للبيانات (MixUp وMosaic) لضمان التدريب القوي وتحسين الأداء.

المؤلفون: تشنغ جي، وسونغتاو ليو، وفنغ وانغ، وزيمينغ لي، وجيان صن المنظمة ميجفي التاريخ: 2021-07-18 رابط أركسيف: https://arxiv.org/abs/2107.08430 رابط جيثب: https://github.com/Megvii-BaseDetection/YOLOX رابط التوثيق: https://yolox.readthedocs.io/en/latest/

مقاييس الأداء

تقدم نماذج YOLOX توازنًا مقنعًا بين السرعة والدقة. كما هو موضح في جدول المقارنة، يحقق YOLOX نتائج تنافسية في MAP مع الحفاظ على سرعات استنتاج سريعة، مما يجعله مناسبًا للتطبيقات في الوقت الفعلي. للاطلاع على الأداء التفصيلي عبر مختلف أحجام النماذج، يُرجى الرجوع إلى الجدول أدناه.

حالات الاستخدام

  • الكشف عن الأجسام في الوقت الحقيقي: مثالي للتطبيقات التي تتطلب الكشف السريع، مثل أنظمة الأمان وتحليلات الفيديو المباشرة.
  • أجهزة الحافة: أداء فعال على الأجهزة ذات الموارد المحدودة مثل NVIDIA Jetson والمنصات المحمولة.
  • الأنظمة المستقلة: مناسبة تمامًا للروبوتات والمركبات ذاتية القيادة حيث يكون الإدراك السريع والدقيق أمرًا بالغ الأهمية.

نقاط القوة والضعف

نقاط القوة:

  • سرعة استنتاج عالية: تساهم البنية الخالية من المراسي والتصميم المحسّن في سرعة المعالجة.
  • البساطة: تصميم مبسط يجعل من السهل تدريبه ونشره مقارنةً بالنماذج القائمة على الارتكاز.
  • توازن جيد بين الدقة والسرعة: يوفر دقة تنافسية دون التضحية بسرعة الاستدلال.

نقاط الضعف:

  • mAP: على الرغم من كفاءتها العالية، إلا أنها قد تكون أقل دقة بقليل من بعض النماذج الأكبر والأكثر تعقيدًا في سيناريوهات معينة.

اعرف المزيد عن يولوكس

EfficientDet: كشف الكائنات القابل للتطوير والفعال

يشتهر برنامج EfficientDet، الذي طورته Google Research، بقابليته للتوسع وكفاءته في اكتشاف الأجسام. وهو يستخدم عائلة من النماذج التي تحقق أحدث ما توصلت إليه الدقة مع عدد أقل بكثير من المعلمات وعمليات FLOP مقارنةً بأجهزة الكشف السابقة.

البنية والمميزات الرئيسية

تقدم EfficientDet العديد من الابتكارات لتعزيز كل من الكفاءة والدقة:

  • BiFPPN (شبكة هرم السمات ثنائية الاتجاه): تسمح بدمج ميزات متعددة النطاقات بكفاءة، مما يتيح للشبكة الاستفادة الفعالة من الميزات ذات الدقة المختلفة.
  • القياس المركب: يعمل على توسيع نطاق جميع أبعاد الشبكة (العمود الفقري وشبكة التنبؤات الثنائية الفينيل المتعددة الأغراض وشبكة التنبؤات الصندوقية/الفئة) باستخدام معامل مركب واحد، مما يبسط عملية القياس ويحسن الأداء.
  • العمود الفقري الفعال: تستخدم شبكة EfficientNet كشبكة أساسية معروفة بكفاءتها وقدراتها القوية على استخراج الميزات.

المؤلفون: مينغشينغ تان ورومينغ بانغ وكوك ف. لي المنظمة: Google التاريخ: 2019-11-20 رابط Arxiv: https://arxiv.org/abs/1911.09070 رابط جيثب: https:google رابط التوثيق: https:google

مقاييس الأداء

صُممت نماذج EfficientDet لتكون عالية الكفاءة عبر مقاييس مختلفة، حيث تقدم مجموعة من النماذج من d0 إلى d7. وهي تحقق نتائج mAP ممتازة مع عدد صغير نسبيًا من المعلمات وعمليات التشغيل الحر، مما يجعلها مناسبة للنشر في البيئات محدودة الموارد. راجع جدول المقارنة للاطلاع على المقاييس التفصيلية.

حالات الاستخدام

  • النشر على الأجهزة المحمولة والحافة: إن أحجام طراز EfficientDet الصغيرة وكفاءته العالية تجعله مثاليًا للأجهزة المحمولة وسيناريوهات الحوسبة الطرفية.
  • التطبيقات التي تتطلب دقة عالية بموارد محدودة: مناسبة للتطبيقات التي تكون فيها الدقة بالغة الأهمية ولكن الموارد الحاسوبية محدودة، مثل فحص الجودة على الأجهزة المتطورة.
  • الأجهزة التي تعمل بالبطارية: يسمح التصميم الموفر للطاقة بالنشر على الأجهزة التي تعمل بالبطارية وتطبيقات إنترنت الأشياء.

نقاط القوة والضعف

نقاط القوة:

  • كفاءة عالية: يحقق أعلى مستوى من الدقة مع عدد أقل من المعلمات وعمليات التشغيل الحر، مما يؤدي إلى استدلال أسرع وتكلفة حسابية أقل.
  • قابلية التوسع: تسمح طريقة القياس المركب بتوسيع نطاق النموذج بسهولة لتلبية متطلبات الدقة والموارد المختلفة.
  • الدقة: أداء قوي من حيث mAP، خاصةً بالنسبة للنماذج الصغيرة والمتوسطة الحجم.

نقاط الضعف:

  • سرعة الاستدلال: على الرغم من كفاءة EfficientDet، إلا أنه قد يكون أبطأ من النماذج المحسّنة خصيصًا للسرعة مثل YOLOv10 أو YOLOv8خاصةً للمتغيرات الأكبر حجمًا.

اعرف المزيد عن EfficientDet

جدول مقارنة الأداء

الطراز الحجم
(بكسل)
مافال
50-95
السرعة
CPU ONNX
(مللي ثانية)
السرعة
T4 T4TensorRT10
(مللي ثانية)
بارامز
(م)

(ب)
يولوكسنانو 416 25.8 - - 0.91 1.08
يولوكستيني 416 32.8 - - 5.06 6.45
يولوكس 640 40.5 - 2.56 9.0 26.8
يولوكسم 640 46.9 - 5.43 25.3 73.8
يولوكسل 640 49.7 - 9.04 54.2 155.6
يولوكس 640 51.1 - 16.1 99.1 281.9
EfficientDet-d0 640 34.6 10.2 3.92 3.9 2.54
EfficientDet-d1 640 40.5 13.5 7.31 6.6 6.1
EfficientDet-d2 640 43.0 17.7 10.92 8.1 11.0
EfficientDet-d3 640 47.5 28.0 19.59 12.0 24.9
EfficientDet-d4 640 49.7 42.8 33.55 20.7 55.2
EfficientDet-d5 640 51.5 72.5 67.86 33.7 130.0
EfficientDet-d6 640 52.6 92.8 89.29 51.9 226.0
EfficientDet-d7 640 53.7 122.0 128.07 51.9 325.0

استكشف المقارنات الثاقبة الأخرى بين نماذج اكتشاف الكائنات المتوفرة في مستندات Ultralytics :

📅 تم إنشاؤها منذ 1 سنة مضت ✏️ تم التحديث منذ 1 شهر

التعليقات