مقارنة تقنية شاملة بين EfficientDet و YOLOX: مقارنة تقنية شاملة
يعد اختيار البنية الصحيحة للكشف عن الأجسام قراراً محورياً في تطوير الرؤية الحاسوبية. هناك نموذجان بارزان شكّلا المشهد، وهما EfficientDet، الذي طورته Google لتحقيق قابلية التوسع المثلى، و YOLOX، وهو كاشف عالي الأداء خالٍ من الارتكاز من Megvii. في حين يركز EfficientDet على زيادة الدقة إلى أقصى حد ضمن ميزانيات حسابية صارمة باستخدام القياس المركب، فإن YOLOX يعطي الأولوية لسرعة الاستدلال وخطوط أنابيب التدريب المبسطة.
يقدم هذا الدليل تحليلاً مفصلاً لبنياتها ومقاييس أدائها وسيناريوهات النشر المثالية لمساعدتك في اختيار الأنسب لمشروعك. بالإضافة إلى ذلك، نستكشف كيف يمكن للبدائل الحديثة مثل Ultralytics YOLO11 تدمج نقاط قوة هذه البدائل السابقة في إطار عمل موحد وسهل الاستخدام.
EfficientDet: الكفاءة القابلة للتطوير
تم تقديم EfficientDet لمعالجة التحدي المتمثل في تحجيم نماذج اكتشاف الأجسام بكفاءة. على عكس البنى السابقة التي كانت تقيس الأبعاد بشكل اعتباطي، تستخدم EfficientDet طريقة قياس مركبة مبدئية تقيس الدقة والعمق والعرض بشكل موحد.
البنية والميزات الرئيسية
يكمن الابتكار الأساسي في EfficientDet في شبكة الهرم ثنائية الاتجاه (BiFPPN). تجمع الشبكات الهرمية للخصائص التقليدية ميزات من مقاييس مختلفة دون تمييز، لكن الشبكة الهرمية ثنائية الاتجاه تقدم أوزانًا قابلة للتعلم للتأكيد على أهم الميزات أثناء الدمج. وبالاقتران مع العمود الفقري EfficientNet، يتيح ذلك للنموذج تحقيق دقة فائقة مع عدد أقل بكثير من المعلمات وعمليات النقطة العائمة في الثانية (FLOPs).
- التحجيم المركب: يعمل على قياس عرض الشبكة وعمقها ودقة الصورة في نفس الوقت باستخدام معامل مركب بسيط.
- BiFPPN: تتيح دمج الميزات متعددة المقاييس بسهولة وسرعة.
- الكفاءة: تم تحسينها لتقليل استخدام الموارد إلى الحد الأدنى مع زيادة متوسطmAP (متوسط الدقة المتوسطة).
البيانات الوصفية للنموذج
- المؤلفون: مينغشينغ تان، رومينغ بانغ، وكوك ف. لي
- المنظمة:Google
- التاريخ: 2019-11-20
- اركسيف:EfficientDet: كشف الكائنات القابل للتطوير والفعال
تعرف على المزيد حول EfficientDet
يولوكس: التطور الخالي من المرساة
يمثل YOLOX تحولاً في سلسلة YOLO نحو تصميم خالٍ من المرتكزات. من خلال إزالة الحاجة إلى مربعات الارتكاز المحددة مسبقًا، تعمل YOLOX على تبسيط عملية التدريب وتحسين التعميم عبر مجموعات البيانات المتنوعة.
البنية والميزات الرئيسية
تقوم YOLOX بفصل رأس الكشف، وفصل مهام التصنيف والانحدار إلى فروع مختلفة. يؤدي هذا التصميم "الرأس المنفصل" عادةً إلى تقارب أسرع وأداء أفضل. علاوةً على ذلك، فهو يشتمل على استراتيجية SimOTA، وهي استراتيجية متقدمة لتعيين التسميات تقوم بتعيين عينات إيجابية بشكل ديناميكي، مما يقلل من وقت التدريب ويحسن الدقة.
- خالي من المرساة: يلغي الحاجة إلى الضبط اليدوي لصندوق التثبيت مما يقلل من تعقيد التصميم.
- الرأس المنفصل: يحسّن الأداء من خلال الفصل بين مهام التصنيف والتوطين.
- تعزيز متقدم: يستخدم تعزيزات Mosaic و MixUp لتدريب قوي.
البيانات الوصفية للنموذج
- المؤلفون: تشنغ قه، سونغتاو ليو، فنغ وانغ، زيمينغ لي، وجيان صن
- المنظمةميجفي
- التاريخ: 2021-07-18
- آركسيفYOLOX: تجاوز سلسلة YOLO في عام 2021
مقارنة الأداء والمعايير
تختلف المفاضلة بين هذين النموذجين. تم تصميم EfficientDet من أجل كفاءة البارامترات، مما يجعله منافسًا قويًا للتطبيقاتCPU أو السيناريوهات التي يكون فيها حجم النموذج (التخزين) هو القيد الأساسي. وعلى العكس من ذلك، تم تحسين YOLOX من أجل زمن انتقالGPU والاستفادة من العمليات الملائمة للأجهزة لتقديم سرعات استنتاج سريعة على أجهزة مثل NVIDIA T4 أو V100.
يوضح الجدول أدناه هذه الاختلافات في مجموعة بيانات COCO . لاحظ كيف تقدم نماذج YOLOX عمومًا سرعات استدلال أسرع على أجهزة GPU مقارنةً بنماذج EfficientDet ذات الدقة المماثلة.
| النموذج | الحجم (بالبكسل) | mAPفال 50-95 | السرعة وحدة المعالجة المركزية CPU ONNX (بالمللي ثانية) | السرعة T4 TensorRT10 (بالمللي ثانية) | المعلمات (M) | FLOPs (B) |
|---|---|---|---|---|---|---|
| EfficientDet-d0 | 640 | 34.6 | 10.2 | 3.92 | 3.9 | 2.54 |
| EfficientDet-d1 | 640 | 40.5 | 13.5 | 7.31 | 6.6 | 6.1 |
| EfficientDet-d2 | 640 | 43.0 | 17.7 | 10.92 | 8.1 | 11.0 |
| EfficientDet-d3 | 640 | 47.5 | 28.0 | 19.59 | 12.0 | 24.9 |
| EfficientDet-d4 | 640 | 49.7 | 42.8 | 33.55 | 20.7 | 55.2 |
| EfficientDet-d5 | 640 | 51.5 | 72.5 | 67.86 | 33.7 | 130.0 |
| EfficientDet-d6 | 640 | 52.6 | 92.8 | 89.29 | 51.9 | 226.0 |
| EfficientDet-d7 | 640 | 53.7 | 122.0 | 128.07 | 51.9 | 325.0 |
| YOLOXnano | 416 | 25.8 | - | - | 0.91 | 1.08 |
| YOLOXtiny | 416 | 32.8 | - | - | 5.06 | 6.45 |
| YOLOXs | 640 | 40.5 | - | 2.56 | 9.0 | 26.8 |
| YOLOXm | 640 | 46.9 | - | 5.43 | 25.3 | 73.8 |
| YOLOXl | 640 | 49.7 | - | 9.04 | 54.2 | 155.6 |
| YOLOXx | 640 | 51.1 | - | 16.1 | 99.1 | 281.9 |
النقاط الرئيسية
- الكمون مقابل الإنتاجية: يحقق YOLOX-s زمنًا مذهلًا يبلغ 2.56 مللي ثانية على T4 TensorRT وهو أسرع بكثير من EfficientDet-d0 (3.92 مللي ثانية)، على الرغم من وجود المزيد من المعلمات. يوضح هذا تحسين YOLOX المتفوق للاستدلال في الوقت الحقيقي على وحدات معالجة الرسومات.
- حجم الطراز: لا يزال EfficientDet-d0 تنافسيًا للغاية بالنسبة للأجهزة المتطورة ذات التخزين المحدود للغاية، حيث يتميز بعدد معلمات مضغوط يبلغ 3.9M.
- التحجيم: تصل EfficientDet-det-d7 إلى mAP عالية تصل إلى 53.7 ولكن على حساب زمن انتقال عالٍ (128 مللي ثانية)، مما يجعلها أقل ملاءمة لبث الفيديو المباشر مقارنةً بالطرازات الأخف.
ميزة Ultralytics
بينما كانت شركتا EfficientDet و YOLOX رائدتان في مجال الرؤية الحاسوبية التي تتطور بسرعة. Ultralytics YOLO11 يمثل أحدث ما توصلت إليه التكنولوجيا، حيث يدمج أفضل الدروس المعمارية من الأجيال السابقة في حزمة موحدة عالية الأداء.
بالنسبة للمطورين والباحثين، تقدم Ultralytics مزايا مقنعة مقارنةً بالنماذج القديمة:
- سهولة الاستخدام: صُممت واجهة برمجة تطبيقات Ultralytics Python للبساطة. يمكنك تحميل نموذج، والتنبؤ على صورة، وتصور النتائج في بضعة أسطر من التعليمات البرمجية، مما يقلل من عائق الدخول إلى حلول الذكاء الاصطناعي.
- نظام بيئي شامل: على عكس المستودعات المستقلة، فإن نماذج Ultralytics مدعومة بنظام بيئي قوي. يتضمن ذلك عمليات تكامل سلسة مع أدوات MLOPS مثل Weights & Biases و ClearMLبالإضافة إلى دعم المجتمع النشط.
- توازن الأداء: تم تصميم نماذج Ultralytics YOLO لتوفير المفاضلة المثلى بين السرعة والدقة. وغالبًا ما تتفوق في الأداء على YOLOX في زمن الاستجابة مع مطابقة كفاءة المعلمات في EfficientDet.
- متطلبات الذاكرة: تم تحسين نماذج Ultralytics لتخفيض استخدام ذاكرة CUDA أثناء التدريب مقارنةً بالعديد من بنيات CNN القديمة أو القائمة على المحولات، مما يسمح لك بتدريب مجموعات أكبر على أجهزة قياسية.
- تعدد الاستخدامات: يدعم إطار عمل Ultralytics واحد الكشف عن الكائنات، وتقسيم المثيلات، وتقدير الوضعية، والتصنيف، والمربعات المحددة الموجهة (OBB). هذا التنوع يلغي الحاجة إلى تعلم قواعد برمجة مختلفة للمهام المختلفة.
مثال على الاستدلال البسيط
تعرف على مدى سهولة تشغيل الاستدلال باستخدام Ultralytics YOLO11 مقارنةً بخطوط الأنابيب القديمة المعقدة:
from ultralytics import YOLO
# Load a pre-trained YOLO11n model
model = YOLO("yolo11n.pt")
# Run inference on a local image
results = model("bus.jpg")
# Display the results
results[0].show()
الخاتمة: حالات الاستخدام المثالية
يعتمد الاختيار بين EfficientDet و YOLOX و Ultralytics YOLO على القيود الخاصة بك.
- اختر EfficientDet إذا كان تطبيقك منشورًا على أجهزة حيث تكون مساحة التخزين وفلوب هي عنق الزجاجة المطلق، مثل المتحكمات الدقيقة المدمجة الصغيرة جدًا. يسمح تحجيمه المبدئي بالتحكم الدقيق في حجم النموذج.
- اختر YOLOX إذا كنت تقوم بالنشر على وحدات معالجة الرسومات وتحتاج إلى سرعة أولية. تتجنب بنيتها بعض النفقات التشغيلية الزائدة للطرق القائمة على الارتكاز، مما يجعلها فعالة للغاية لتحليلات الفيديو في الوقت الفعلي على الأجهزة المدعومة.
- اختر Ultralytics YOLO11 للحصول على أفضل أداء شامل. فهو يجمع بين سرعة YOLOX وكفاءة التصميمات المعمارية الحديثة. علاوة على ذلك، فإن نظامه الإيكولوجي وتوثيقه ودعمه متعدد المهام يقلل بشكل كبير من وقت التطوير، مما يجعله الخيار الأفضل لكل من النماذج الأولية السريعة وعمليات نشر الإنتاج القابلة للتطوير.
مقارنات النماذج الأخرى
استكشف بشكل أعمق الاختلافات التقنية بين نماذج الرؤية الحاسوبية الرائدة:
- YOLOv8 ضد EfficientDet
- YOLO11 ضد EfficientDet
- RT-DETR مقابل YOLOX
- YOLOv8 ضد YOLOX
- YOLO11 مقابل يولوكس YOLO11