تخطي إلى المحتوى

مقارنة فنية بين YOLOX و EfficientDet

يُعد اختيار نموذج الكشف عن الأجسام المناسب قرارًا بالغ الأهمية، حيث يوازن بين الدقة وسرعة الاستدلال والتكلفة الحسابية. تقدم هذه الصفحة مقارنة فنية مفصلة بين YOLOX، وهو نموذج عالي الأداء وخالي من المرساة من Megvii، و EfficientDet، وهي عائلة من الكاشفات القابلة للتطوير والفعالة من Google. سنتعمق في الاختلافات المعمارية ومقاييس الأداء وحالات الاستخدام المثالية لمساعدتك في تحديد أفضل نموذج لمشروع رؤية الحاسوب الخاص بك.

YOLOX: كشف عالي الأداء للأجسام بدون نقاط ارتكاز

YOLO هو نموذج للكشف عن الكائنات وخالٍ من المرساة تم تطويره بواسطة Megvii ويهدف إلى تبسيط بنية YOLO الشائعة مع تحقيق أداء حديث. تم تقديمه لسد الفجوة بين البحث الأكاديمي والتطبيقات الصناعية من خلال تقديم تصميم مبسط ولكنه قوي.

تفاصيل فنية:

البنية والميزات الرئيسية

يقدم YOLO العديد من التعديلات الهامة على إطار عمل YOLO التقليدي:

  • تصميم بدون مربعات ارتكاز (Anchor-Free): من خلال إلغاء مربعات الارتكاز المحددة مسبقًا، يبسّط YOLOX عملية التدريب ويقلل من عدد المعلمات الفائقة التي تحتاج إلى ضبط. يمكن أن يؤدي هذا النهج إلى تعميم أفضل عبر أحجام الكائنات ونسب العرض إلى الارتفاع المختلفة.
  • Decoupled Head: على عكس نماذج YOLO السابقة التي استخدمت رأسًا مزدوجًا للتصنيف والانحدار، تستخدم YOLOX رأسًا منفصلًا. يفصل هذا مهام التصنيف والتوطين، والتي ثبت أنها تحل مشكلة عدم التوافق وتحسن كلاً من سرعة التقارب والدقة.
  • تعيين متقدم للتسميات: تدمج YOLOX خوارزمية SimOTA (تعيين النقل الأمثل المبسط)، وهي استراتيجية تعيين تسميات ديناميكية تختار أفضل العينات الإيجابية لكل كائن ذي حقيقة أساسية أثناء التدريب. هذا نهج أكثر تقدمًا من قواعد التعيين الثابتة.
  • تقوية قوية: يستفيد النموذج من تقنيات تقوية البيانات القوية مثل MixUp و Mosaic لتحسين متانته وأدائه.

نقاط القوة والضعف

نقاط القوة:

  • أداء عالي: يحقق YOLOX توازنًا قويًا بين السرعة والدقة، مما يجعله منافسًا للكاشفات الأخرى الحديثة في عصره.
  • بساطة بدون مرساة: يقلل التصميم الخالي من الإرساء من تعقيد النموذج والجهد الهندسي المرتبط بتكوين مربع الإرساء.
  • نموذج راسخ: باعتباره نموذجًا معروفًا منذ عام 2021، فإنه يتمتع بقدر كبير من دعم المجتمع وأمثلة النشر المتاحة.

نقاط الضعف:

  • سرعة الاستدلال: على الرغم من سرعتها، إلا أنها يمكن أن تتجاوزها بنيات أحدث وأكثر تحسينًا مثل Ultralytics YOLOv8 و YOLO11، خاصة عند النظر في زمن انتقال وحدة معالجة الرسوميات GPU.
  • تنوع المهام: تم تصميم YOLOX في الأساس من أجل اكتشاف الكائنات. ويفتقر إلى الدعم المدمج لمهام الرؤية الأخرى مثل تقسيم المثيلات أو تقدير الوضع أو التصنيف وهي معيار في أطر العمل الحديثة مثل Ultralytics.
  • النظام البيئي الخارجي: إنه ليس جزءًا أصليًا من نظام Ultralytics البيئي، مما قد يعني الحاجة إلى مزيد من الجهد للتدريب والنشر والتكامل مع أدوات مثل Ultralytics HUB.

حالات الاستخدام المثالية

يعتبر YOLO خيارًا قويًا لـ:

  • الكشف العام عن الكائنات: التطبيقات التي تتطلب كاشفًا موثوقًا ودقيقًا، كما هو الحال في أنظمة الأمان أو تحليلات البيع بالتجزئة.
  • خط الأساس للبحث: إنها بمثابة خط أساس ممتاز للباحثين الذين يستكشفون طرق الكشف الخالية من المرساة وتقنيات تعيين الملصقات المتقدمة.
  • الأتمتة الصناعية: مهام مثل مراقبة الجودة في التصنيع حيث دقة الاكتشاف هي مطلب أساسي.

تعرف على المزيد حول YOLOX

EfficientDet: كشف الكائنات بكفاءة وقابلية للتوسع

EfficientDet، الذي تم تطويره بواسطة فريق Google Brain، هي عائلة من نماذج الكشف عن الكائنات المصممة لتحقيق كفاءة استثنائية. وهي تقدم بنية جديدة وطريقة توسيع نطاق مركبة تسمح لها بالتوسع من الأجهزة الطرفية ذات الموارد المحدودة إلى خوادم السحابة واسعة النطاق مع الحفاظ على نسبة دقة إلى كفاءة فائقة.

تفاصيل فنية:

البنية والميزات الرئيسية

يرتكز تصميم EfficientDet على ثلاثة ابتكارات رئيسية:

  • EfficientNet Backbone: تستخدم EfficientNet عالية الكفاءة كعمود فقري لها لاستخراج الميزات. تم تصميم EfficientNet نفسها باستخدام البحث عن البنية العصبية لتحسين الدقة وعمليات الفاصلة العائمة في الثانية (FLOPs).
  • BiFPN (شبكة الهرم المميز ثنائية الاتجاه): لدمج الميزات، يقدم EfficientDet شبكة BiFPN، وهي شبكة هرم مميز ثنائية الاتجاه مرجحة. على عكس شبكات FPN التقليدية، تتيح BiFPN دمج ميزات متعددة المقاييس أكثر ثراءً مع عدد أقل من المعلمات والحسابات عن طريق دمج أوزان قابلة للتعلم لكل ميزة إدخال.
  • التحجيم المركب: تستخدم EfficientDet طريقة تحجيم مركبة تعمل على توسيع نطاق العمق والعرض والدقة بشكل موحد للعمود الفقري وشبكة الميزات وشبكة التنبؤ. وهذا يضمن مقايضة متوازنة ومثالية بين الدقة والموارد الحسابية عبر عائلة النماذج بأكملها (D0 إلى D7).

نقاط القوة والضعف

نقاط القوة:

  • كفاءة هي الأحدث على مستوى التقنية: تتميز نماذج EfficientDet بكفاءة عالية من حيث المعلمات و FLOPs، وغالبًا ما تحقق دقة أعلى من النماذج الأخرى ذات الميزانيات الحسابية المماثلة.
  • قابلية التوسع: توفر عائلة النماذج مجموعة واسعة من الخيارات (D0-D7)، مما يجعل من السهل اختيار نموذج يناسب متطلبات الأجهزة والأداء المحددة.
  • دقة عالية: تحقق نماذج EfficientDet الأكبر درجات mAP عالية جدًا في المعايير القياسية مثل COCO.

نقاط الضعف:

  • زمن انتقال أعلى: على الرغم من انخفاض عمليات الفاصلة العائمة في الثانية (FLOPs)، إلا أن EfficientDet يمكن أن يكون لديه زمن انتقال استدلال أعلى على وحدات معالجة الرسوميات (GPUs) مقارنة بنماذج مثل YOLOX أو Ultralytics YOLO، والتي غالبًا ما تكون مُحسَّنة بشكل أفضل لأجهزة المعالجة المتوازية.
  • تعقيد التدريب: يمكن أن تكون عملية التدريب أكثر استهلاكًا للموارد وتعقيدًا مقارنةً بالتجربة المبسطة التي تقدمها أُطر العمل مثل Ultralytics.
  • تعددية المهام محدودة: مثل YOLOX، فإن EfficientDet متخصص في اكتشاف الكائنات ولا يقدم إطارًا موحدًا لمهام رؤية الكمبيوتر الأخرى.

حالات الاستخدام المثالية

تعتبر EfficientDet مناسبة بشكل خاص لما يلي:

  • Edge AI: المتغيرات الأصغر (D0-D2) ممتازة للنشر على أجهزة الحافة ذات الموارد المحدودة حيث يكون عدد المعلمات والذاكرة أمرًا بالغ الأهمية.
  • تطبيقات السحابة: المتغيرات الأكبر (D5-D7) مناسبة للتطبيقات المستندة إلى السحابة حيث يكون تحقيق أقصى قدر من الدقة هو الأولوية، وزمن الوصول أقل أهمية.
  • المشاريع محدودة الموارد: أي تطبيق يكون فيه القيد الأساسي هو الميزانية الحسابية (FLOPs) وليس زمن الوصول في الوقت الفعلي.

تعرف على المزيد حول EfficientDet

مقارنة الأداء والمعايير

عند مقارنة YOLOX و EfficientDet، يصبح التوازن بين السرعة والدقة والكفاءة واضحًا. يقدم الجدول أدناه تفصيلاً تفصيليًا للأداء على مجموعة بيانات COCO.

النموذج الحجم
(بالبكسل)
mAPval
50-95
السرعة
وحدة المعالجة المركزية CPU ONNX
(بالمللي ثانية)
السرعة
T4 TensorRT10
(بالمللي ثانية)
المعلمات
(M)
FLOPs
(B)
YOLOXnano 416 25.8 - - 0.91 1.08
YOLOXtiny 416 32.8 - - 5.06 6.45
YOLOXs 640 40.5 - 2.56 9.0 26.8
YOLOXm 640 46.9 - 5.43 25.3 73.8
YOLOXl 640 49.7 - 9.04 54.2 155.6
YOLOXx 640 51.1 - 16.1 99.1 281.9
EfficientDet-d0 640 34.6 10.2 3.92 3.9 2.54
EfficientDet-d1 640 40.5 13.5 7.31 6.6 6.1
EfficientDet-d2 640 43.0 17.7 10.92 8.1 11.0
EfficientDet-d3 640 47.5 28.0 19.59 12.0 24.9
EfficientDet-d4 640 49.7 42.8 33.55 20.7 55.2
EfficientDet-d5 640 51.5 72.5 67.86 33.7 130.0
EfficientDet-d6 640 52.6 92.8 89.29 51.9 226.0
EfficientDet-d7 640 53.7 122.0 128.07 51.9 325.0

من خلال المقارنات المعيارية، يمكننا ملاحظة العديد من الاتجاهات الرئيسية:

  • سرعة وحدة معالجة الرسوميات (GPU): تُظهر نماذج YOLOX باستمرار زمن انتقال أقل بشكل ملحوظ (سرعة أعلى) على وحدة معالجة الرسوميات T4 مع TensorRT مقارنةً بنماذج EfficientDet ذات خريطة دقة متوسطة (mAP) مماثلة أو حتى أقل. على سبيل المثال، يحقق YOLOX-l نفس خريطة دقة متوسطة (mAP) لـ EfficientDet-d4 تبلغ 49.7 ولكنه أسرع بأكثر من 3.5 مرة.
  • كفاءة المعلمات: تتفوق EfficientDet في كفاءة المعلمات وعمليات النقطة العائمة في الثانية (FLOPs). تحقق EfficientDet-d3 قيمة 47.5 mAP مع 12.0 مليون معلمة فقط، في حين أن YOLOX-m يحتاج إلى 25.3 مليون معلمة للوصول إلى 46.9 mAP مماثلة. وهذا يجعل EfficientDet مرشحًا قويًا للبيئات ذات القيود الصارمة على حجم النموذج.
  • الموازنة بين الدقة والسرعة: يوفر YOLOX موازنة أفضل للتطبيقات التي تتطلب استدلالًا في الوقت الفعلي على وحدات معالجة الرسوميات GPUs. في حين أن EfficientDet دقيق للغاية في الطرف العلوي (D7)، إلا أنه يدفع ثمنًا باهظًا في زمن الوصول، مما يجعل نماذجه الأكبر أقل ملاءمة للاستخدام في الوقت الفعلي.

في حين أن YOLOX و EfficientDet كلاهما نموذجان قويان، غالبًا ما يجد المطورون والباحثون المعاصرون حلاً أكثر إقناعًا في نظام Ultralytics YOLO البيئي. تقدم نماذج مثل YOLOv8 وأحدث YOLO11 مزيجًا فائقًا من الأداء وسهولة الاستخدام وتعدد الاستخدامات.

  • سهولة الاستخدام: توفر Ultralytics تجربة مستخدم مبسطة مع واجهة Python API بسيطة، و توثيق شامل، والعديد من البرامج التعليمية.
  • نظام بيئي مُدار بشكل جيد: استفد من التطوير النشط ودعم المجتمع القوي والتحديثات المتكررة والأدوات المتكاملة مثل Ultralytics HUB لإدارة البيانات والتدريب.
  • موازنة الأداء: تحقق نماذج Ultralytics YOLO توازنًا ممتازًا بين السرعة والدقة، مما يجعلها مناسبة لسيناريوهات النشر المتنوعة في العالم الحقيقي من الأجهزة الطرفية إلى خوادم الحوسبة السحابية.
  • متطلبات الذاكرة: تتسم نماذج Ultralytics YOLO عمومًا بالكفاءة في استخدام الذاكرة أثناء التدريب والاستدلال، وغالبًا ما تتطلب ذاكرة CUDA أقل من البنى الأكثر تعقيدًا.
  • تنوع الاستخدامات: تدعم نماذج Ultralytics مهام متعددة تتجاوز الكشف، بما في ذلك تجزئة المثيلات، وتصنيف الصور، وتقدير الوضعية، والكشف عن مربعات الإحاطة الموجهة (OBB) ضمن إطار عمل موحد واحد.
  • كفاءة التدريب: استفد من عمليات التدريب الفعالة، والأوزان المدربة مسبقًا المتاحة بسهولة على مجموعات البيانات المختلفة، والتكامل السلس مع أدوات تتبع التجارب مثل ClearML و Weights & Biases.

بالنسبة للمستخدمين الذين يبحثون عن أحدث أداء مقترنًا بسهولة الاستخدام ونظام بيئي قوي، يوصى بشدة باستكشاف نماذج Ultralytics YOLO.

الخلاصة: أي نموذج يجب أن تختاره؟

يعتمد الاختيار بين YOLOX و EfficientDet بشكل كبير على الأولويات المحددة لمشروعك.

  • YOLOX هو خيار ممتاز للتطبيقات التي تحتاج إلى كاشف كائنات سريع ودقيق، خاصة للنشر المستند إلى GPU. تصميمه الخالي من المرساة يبسط جوانب معينة من خط أنابيب الكشف ولا يزال يتمتع بأداء قوي.

  • EfficientDet تتألق في السيناريوهات التي تكون فيها الموارد الحسابية، مثل معلمات النموذج وعمليات الفاصلة العائمة في الثانية (FLOPs)، هي القيد الأساسي. تجعلها بنيتها القابلة للتطوير خيارًا متعدد الاستخدامات للمشاريع التي تحتاج إلى النشر عبر مجموعة من الأجهزة ذات القدرات المتفاوتة.

ومع ذلك، بالنسبة لمعظم مهام رؤية الكمبيوتر الحديثة، تقدم نماذج Ultralytics YOLO مثل YOLOv8 و YOLO11 الخيار الأكثر فائدة. فهي توفر توازنًا فائقًا بين السرعة والدقة، وهي سهلة الاستخدام بشكل لا يصدق، وهي مدعومة بنظام بيئي شامل يسرع التطوير من البحث إلى الإنتاج. إن تعدد استخداماتها في المهام المتعددة يجعلها خيارًا مضمونًا للمستقبل لمجموعة واسعة من حلول الذكاء الاصطناعي.

مقارنات النماذج الأخرى

إذا كنت مهتمًا بمقارنة هذه النماذج مع نماذج أخرى، فراجع هذه الصفحات:



📅 تم إنشاؤه منذ سنة واحدة ✏️ تم التحديث منذ شهر واحد

تعليقات