تخطي إلى المحتوى

EfficientDet مقابل YOLOX: مقارنة فنية شاملة

يعد اختيار بنية الكشف عن الكائنات الصحيحة قرارًا محوريًا في تطوير الرؤية الحاسوبية. من بين النماذج البارزة التي شكلت هذا المجال EfficientDet، الذي طورته Google لتحقيق قابلية تطوير مثالية، و YOLOX، وهو كاشف عالي الأداء وخالي من المرساة من Megvii. بينما يركز EfficientDet على زيادة الدقة إلى أقصى حد ضمن ميزانيات حسابية صارمة باستخدام التحجيم المركب، يعطي YOLOX الأولوية لسرعة الاستدلال وخطوط أنابيب التدريب المبسطة.

يوفر هذا الدليل تحليلاً مفصلاً لبنياتها ومقاييس الأداء وسيناريوهات النشر المثالية لمساعدتك في اختيار الأنسب لمشروعك. بالإضافة إلى ذلك، نستكشف كيف تدمج البدائل الحديثة مثل Ultralytics YOLO11 نقاط قوة هذه النماذج السابقة في إطار عمل موحد وسهل الاستخدام.

EfficientDet: كفاءة قابلة للتطوير

تم تقديم EfficientDet لمعالجة تحدي تحجيم نماذج الكشف عن الأجسام بكفاءة. على عكس البنى السابقة التي وسعت الأبعاد بشكل تعسفي، تستخدم EfficientDet طريقة تحجيم مركبة مبدئية توسع الدقة والعمق والعرض بشكل موحد.

البنية والميزات الرئيسية

يكمن الابتكار الأساسي في EfficientDet في شبكة هرم الميزات ثنائية الاتجاه (BiFPN). تجمع FPNs التقليدية الميزات من مقاييس مختلفة دون تمييز، لكن BiFPN تقدم أوزانًا قابلة للتعلم للتأكيد على أهم الميزات أثناء الدمج. جنبًا إلى جنب مع العمود الفقري EfficientNet، يسمح هذا للنموذج بتحقيق دقة متطورة مع عدد أقل بكثير من المعلمات و FLOPs (عمليات النقطة العائمة في الثانية).

  • التحجيم المركب: يقوم في الوقت نفسه بتوسيع نطاق عرض الشبكة وعمقها ودقة الصورة باستخدام معامل مركب بسيط.
  • BiFPN: تتيح دمج الميزات متعددة المقاييس بسهولة وسرعة.
  • الكفاءة: مُحسَّن لتقليل استخدام الموارد مع زيادة mAP (متوسط الدقة المتوسطة).

بيانات تعريف النموذج

تعرف على المزيد حول EfficientDet

YOLOX: تطور خالٍ من الـ Anchor

تمثل YOLOX تحولًا في سلسلة YOLO نحو تصميم خالٍ من المرساة. من خلال إزالة الحاجة إلى مربعات الربط محددة مسبقًا، تبسط YOLOX عملية التدريب وتحسن التعميم عبر مجموعات البيانات المتنوعة.

البنية والميزات الرئيسية

يفصل YOLOX رأس الاكتشاف، ويفصل مهام التصنيف والانحدار إلى فروع مختلفة. يؤدي تصميم "الرأس المفصول" هذا عادةً إلى تقارب أسرع وأداء أفضل. علاوة على ذلك، فإنه يتضمن SimOTA، وهي إستراتيجية متقدمة لتعيين التسميات تقوم بتعيين عينات موجبة ديناميكيًا، مما يقلل وقت التدريب ويحسن الدقة.

  • خالٍ من المرتكزات (Anchor-Free): يلغي الحاجة إلى الضبط اليدوي لمربع الارتكاز، مما يقلل من تعقيد التصميم.
  • رأس منفصل: يحسن الأداء عن طريق فصل مهام التصنيف وتحديد الموقع.
  • زيادة متقدمة: يستخدم تحسينات Mosaic و MixUp لتدريب قوي.

بيانات تعريف النموذج

تعرف على المزيد حول YOLOX

مقارنة الأداء والمعايير

تتميز المقايضات بين هذين النموذجين بأنها متميزة. تم تصميم EfficientDet من أجل كفاءة المعلمات، مما يجعله منافسًا قويًا لـ التطبيقات المرتبطة بوحدة المعالجة المركزية CPU أو السيناريوهات التي يكون فيها حجم النموذج (التخزين) هو القيد الأساسي. وعلى العكس من ذلك، تم تحسين YOLOX لـ زمن انتقال GPU، والاستفادة من العمليات سهلة الاستخدام للأجهزة لتقديم سرعات استدلال سريعة على أجهزة مثل NVIDIA T4 أو V100.

يسلط الجدول أدناه الضوء على هذه الاختلافات في مجموعة بيانات COCO. لاحظ كيف تقدم نماذج YOLOX عمومًا سرعات استدلال أسرع على أجهزة وحدة معالجة الرسومات مقارنة بمتغيرات EfficientDet ذات الدقة المماثلة.

النموذجالحجم
(بالبكسل)
mAPval
50-95
السرعة
وحدة المعالجة المركزية CPU ONNX
(بالمللي ثانية)
السرعة
T4 TensorRT10
(بالمللي ثانية)
المعلمات
(M)
FLOPs
(B)
EfficientDet-d064034.610.23.923.92.54
EfficientDet-d164040.513.57.316.66.1
EfficientDet-d264043.017.710.928.111.0
EfficientDet-d364047.528.019.5912.024.9
EfficientDet-d464049.742.833.5520.755.2
EfficientDet-d564051.572.567.8633.7130.0
EfficientDet-d664052.692.889.2951.9226.0
EfficientDet-d764053.7122.0128.0751.9325.0
YOLOXnano41625.8--0.911.08
YOLOXtiny41632.8--5.066.45
YOLOXs64040.5-2.569.026.8
YOLOXm64046.9-5.4325.373.8
YOLOXl64049.7-9.0454.2155.6
YOLOXx64051.1-16.199.1281.9

النقاط الرئيسية

  • الكمون مقابل الإنتاجية: تحقق YOLOX-s سرعة فائقة تبلغ 2.56 مللي ثانية على T4 TensorRT، وهي أسرع بكثير من EfficientDet-d0 (3.92 مللي ثانية)، على الرغم من وجود المزيد من المعلمات. وهذا يوضح التحسين الفائق لـ YOLOX من أجل الاستدلال في الوقت الفعلي على وحدات معالجة الرسومات.
  • حجم النموذج: يظل EfficientDet-d0 منافسًا للغاية للأجهزة الطرفية ذات التخزين المحدود للغاية، ويتميز بعدد معلمات مضغوط يبلغ 3.9 مليون.
  • التحجيم: تصل EfficientDet-det-d7 إلى mAP عالية تصل إلى 53.7 ولكن على حساب زمن انتقال عالٍ (128 مللي ثانية)، مما يجعلها أقل ملاءمة لبث الفيديو المباشر مقارنةً بالطرازات الأخف.

ميزة Ultralytics

بينما EfficientDet و YOLOX رائدتان في التقنيات الهامة، فإن مجال رؤية الحاسوب يتحرك بسرعة. يمثل Ultralytics YOLO11 أحدث التقنيات، حيث يدمج أفضل الدروس المعمارية من الأجيال السابقة في حزمة موحدة عالية الأداء.

بالنسبة للمطورين والباحثين، تقدم Ultralytics مزايا مقنعة مقارنة بالنماذج القديمة:

  • سهولة الاستخدام: تم تصميم Python API الخاص بـ Ultralytics ببساطة. يمكنك تحميل نموذج والتنبؤ بصورة وتصور النتائج ببضعة أسطر فقط من التعليمات البرمجية، مما يقلل من حاجز الدخول إلى حلول الذكاء الاصطناعي.
  • نظام بيئي شامل: على عكس المستودعات المستقلة، يتم دعم نماذج Ultralytics من خلال نظام بيئي قوي. يتضمن ذلك عمليات تكامل سلسة مع أدوات MLOps مثل Weights & Biases و ClearML، بالإضافة إلى دعم مجتمعي نشط.
  • موازنة الأداء: تم تصميم نماذج Ultralytics YOLO لتوفير التوازن الأمثل بين السرعة والدقة. غالبًا ما تتفوق على YOLOX في زمن الوصول مع مطابقة كفاءة المعلمات لـ EfficientDet.
  • متطلبات الذاكرة: تم تحسين نماذج Ultralytics لتقليل استخدام ذاكرة CUDA أثناء التدريب مقارنةً بالعديد من البنى القائمة على المحولات أو CNN الأقدم، مما يسمح لك بتدريب دفعات أكبر على الأجهزة القياسية.
  • Versatility: إطار عمل Ultralytics واحد يدعم Object Detection و Instance Segmentation و Pose Estimation و Classification و Oriented Bounding Boxes (OBB). هذا التنوع يلغي الحاجة إلى تعلم قواعد بيانات مختلفة لمهام مختلفة.

مثال استدلال بسيط

تعرف على مدى سهولة تشغيل الاستدلال باستخدام Ultralytics YOLO11 مقارنةً بخطوط الأنابيب القديمة المعقدة:

from ultralytics import YOLO

# Load a pre-trained YOLO11n model
model = YOLO("yolo11n.pt")

# Run inference on a local image
results = model("bus.jpg")

# Display the results
results[0].show()

الخلاصة: حالات الاستخدام المثالية

يعتمد الاختيار بين EfficientDet و YOLOX و Ultralytics YOLO على قيودك المحددة.

  • اختر EfficientDet إذا تم نشر تطبيقك على أجهزة حيث مساحة التخزين وFLOPs تمثلان عنق الزجاجة المطلق، مثل وحدات التحكم الدقيقة المدمجة الصغيرة جدًا. يتيح التحجيم المبدئي تحكمًا دقيقًا في حجم النموذج.
  • اختر YOLOX إذا كنت تقوم بالنشر على وحدات معالجة الرسوميات GPUs وتحتاج إلى سرعة خام. تتجنب بنيته بعض النفقات التشغيلية العامة لطرق الارتكاز، مما يجعلها فعالة للغاية لتحليلات الفيديو في الوقت الفعلي على الأجهزة المدعومة.
  • اختر Ultralytics YOLO11 للحصول على أفضل أداء شامل. فهو يجمع بين سرعة YOLOX وكفاءة التصميمات المعمارية الحديثة. علاوة على ذلك، فإن النظام البيئي والوثائق ودعم المهام المتعددة يقلل بشكل كبير من وقت التطوير، مما يجعله الخيار الأفضل لكل من النماذج الأولية السريعة وعمليات النشر الإنتاجية القابلة للتطوير.

مقارنات النماذج الأخرى

استكشف بشكل أعمق الاختلافات الفنية بين نماذج رؤية الكمبيوتر الرائدة:


تعليقات