تخطي إلى المحتوى

YOLOX مقابل EfficientDet: مقارنة تقنية بين هياكل الكشف عن الكائنات

يعد اختيار البنية المثلى لاكتشاف الكائنات قرارًا بالغ الأهمية يؤثر على زمن الاستجابة والدقة وقابلية التوسع لأنظمة الرؤية الحاسوبية. تتعمق هذه المقارنة في الفروق التقنية بين YOLOX، وهو كاشف عالي الأداء بدون مرساة من Megvii، و EfficientDet، وهي بنية قابلة للتوسع Google تركز على الكفاءة.

في حين أن كلا النموذجين قد شكلا مشهد الرؤية الحاسوبية، فإن التطبيقات الحديثة تتطلب بشكل متزايد حلولاً توفر نشرًا مبسطًا وأداءً متطورًا. سنستكشف أيضًا كيف أن أحدث YOLO26 على هذه الإرث لتقديم نتائج فائقة.

مقاييس ومعايير الأداء

يُقارن الجدول التالي أداء نماذج مختلفة على COCO . تشمل المقاييس الرئيسية متوسط الدقة (mAP) ووقت الاستدلال، مما يسلط الضوء على التوازن بين السرعة والدقة.

النموذجالحجم
(بالبكسل)
mAPval
50-95
السرعة
وحدة المعالجة المركزية CPU ONNX
(بالمللي ثانية)
السرعة
T4 TensorRT10
(بالمللي ثانية)
المعلمات
(M)
FLOPs
(B)
YOLOXnano41625.8--0.911.08
YOLOXtiny41632.8--5.066.45
YOLOXs64040.5-2.569.026.8
YOLOXm64046.9-5.4325.373.8
YOLOXl64049.7-9.0454.2155.6
YOLOXx64051.1-16.199.1281.9
EfficientDet-d064034.610.23.923.92.54
EfficientDet-d164040.513.57.316.66.1
EfficientDet-d264043.017.710.928.111.0
EfficientDet-d364047.528.019.5912.024.9
EfficientDet-d464049.742.833.5520.755.2
EfficientDet-d564051.572.567.8633.7130.0
EfficientDet-d664052.692.889.2951.9226.0
EfficientDet-d764053.7122.0128.0751.9325.0

YOLOX: تطور خالٍ من الـ Anchor

يمثل YOLOX تحولًا مهمًا في YOLO من خلال اعتماد آلية خالية من المثبتات وفصل رأس الكشف. يعمل هذا التصميم على تبسيط عملية التدريب وتحسين الأداء على مجموعات بيانات متنوعة.

المؤلف: Zheng Ge، Songtao Liu، Feng Wang، Zeming Li، و Jian Sun
المنظمة: Megvii
التاريخ: 2021-07-18
Arxiv: https://arxiv.org/abs/2107.08430
GitHub: https://github.com/Megvii-BaseDetection/YOLOX

الميزات المعمارية الرئيسية

  • رأس منفصل: على عكس YOLO السابقة YOLO التي كانت تستخدم رأسًا مزدوجًا للتصنيف والتحديد المكاني، فإن YOLOX يفصل بين هاتين المهمتين. وهذا يؤدي إلى تقارب أسرع ودقة أفضل.
  • تصميم بدون مرساة: من خلال إزالة صناديق المرساة، يلغي YOLOX الحاجة إلى الضبط اليدوي للمرساة، مما يجعل النموذج أكثر قوة في التعامل مع أشكال الأجسام المتنوعة.
  • تعيين علامة SimOTA: تقدم YOLOX SimOTA، وهي استراتيجية متقدمة لتعيين العلامات تعمل على مطابقة الكائنات الحقيقية بشكل ديناميكي مع التنبؤات، مما يؤدي إلى تحقيق التوازن الفعال بين وظيفة الخسارة.

نقاط القوة والضعف

يتميز YOLOX في السيناريوهات التي تتطلب توازنًا بين السرعة والدقة، لا سيما عندما تكون المشكلات القديمة المتعلقة بالمرساة (مثل عدم التوازن) مشكلة. ومع ذلك، فإن اعتماده على خطوط أنابيب زيادة البيانات الثقيلة قد يعقد أحيانًا إعداد التدريب لمجموعات البيانات المخصصة.

EfficientDet: كفاءة قابلة للتطوير

يركز EfficientDet على تحسين الكفاءة من خلال طريقة قياس مركبة تقيس بشكل موحد الدقة والعمق والعرض للهيكل الأساسي وشبكة الميزات وشبكات التنبؤ بالصندوق/الفئة.

المؤلف: Mingxing Tan و Ruoming Pang و Quoc V. Le
المنظمة: Google
التاريخ: 2019-11-20
Arxiv: https://arxiv.org/abs/1911.09070
GitHub: google

الميزات المعمارية الرئيسية

  • EfficientNet Backbone: يستخدم EfficientNet، الذي تم تحسينه من أجل FLOPs وكفاءة المعلمات.
  • BiFPN (شبكة هرمية ثنائية الاتجاه للميزات): طبقة دمج ميزات مرجحة تسمح بدمج الميزات متعددة المقاييس بسهولة وسرعة.
  • التحجيم المركب: طريقة مميزة تقوم بتحجيم جميع أبعاد الشبكة في وقت واحد، بدلاً من زيادة العمق أو العرض بشكل منفصل.

نقاط القوة والضعف

يعد EfficientDet فعالاً للغاية في التطبيقات التي يمثل فيها حجم النموذج (التخزين) قيداً أساسياً، مثل تطبيقات الأجهزة المحمولة. على الرغم من أنه يحقق mAP عالياً، إلا أن سرعة الاستدلال على وحدات معالجة الرسومات (GPU) غالباً ما تتخلف عن YOLO بسبب تعقيد BiFPN والتلافيف القابلة للفصل من حيث العمق، والتي تكون أحياناً أقل تحسيناً في الأجهزة من التلافيف القياسية.

ميزة Ultralytics: تقديم YOLO26

بينما كان YOLOX و EfficientDet محوريين في 2019-2021، فقد تطور هذا المجال بسرعة. YOLO26، الذي أطلقته Ultralytics يناير 2026، يمثل أحدث ما توصلت إليه تقنية الذكاء الاصطناعي في مجال الرؤية، حيث يعالج قيود الأجيال السابقة من خلال ابتكارات ثورية.

تعرف على المزيد حول YOLO26

سهولة الاستخدام والنظام البيئي

Ultralytics المطورون الذين يختارون Ultralytics من نظام بيئي موحد "من الصفر إلى القمة". على عكس مستودعات الأبحاث المجزأة في YOLOX أو EfficientDet، تتيح لك Ultralytics وواجهة برمجة التطبيقات (API) تدريب النماذج والتحقق من صحتها ونشرها بسلاسة. يدعم النظام البيئي التكرار السريع بفضل ميزات مثل التعليق التلقائي والتصدير بنقرة واحدة إلى تنسيقات مثل ONNX و OpenVINO.

ميزات الأداء من الجيل التالي

يقدم YOLO26 العديد من الابتكارات المعمارية التي تجعله متفوقًا في النشر الحديث:

  1. تصميم شامل NMS: YOLO26 هو تصميم شامل أصلاً، مما يلغي الحاجة إلى المعالجة اللاحقة لـ Non-Maximum Suppression (NMS). وهذا يقلل من تباين زمن الاستجابة ويبسط خطوط الإنتاج، وهو مفهوم رائد في YOLOv10 وتم تحسينه هنا.

  2. MuSGD Optimizer: مستوحى من تدريب نموذج اللغة الكبيرة (LLM)، يجمع MuSGD Optimizer SGD استقرار SGD الزخم في Muon. وينتج عن ذلك تقارب أسرع أثناء التدريب وأوزان نهائية أكثر قوة.

  3. كفاءة الحافة أولاً: من خلال إزالة فقدان التركيز التوزيعي (DFL)، يبسط YOLO26 بنية طبقة الإخراج. ينتج عن هذا التغيير، إلى جانب تحسينات الهندسة المعمارية، CPU أسرع بنسبة تصل إلى 43٪ CPU مقارنة بالأجيال السابقة، مما يجعله أسرع بكثير من EfficientDet على أجهزة الحافة.

  4. ProgLoss + STAL: توفر وظائف الخسارة الجديدة، ProgLoss و STAL، تحسينات ملحوظة في اكتشاف الأجسام الصغيرة، وهو أحد نقاط الضعف الشائعة في النماذج السابقة الخالية من المراسي. وهذا أمر بالغ الأهمية للتطبيقات في مجال الصور الجوية والروبوتات.

نصيحة تدريبية

يتيح مُحسّن MuSGD من YOLO26 معدلات تعلم أكثر قوة. عند التدريب على مجموعات بيانات مخصصة، ضع في اعتبارك استخدام دليل Ultralytics Tuning لتحقيق أقصى قدر من الأداء.

تعدد الاستخدامات والذاكرة

على عكس YOLOX و EfficientDet، اللذين يعتبران في المقام الأول أجهزة كشف، فإن YOLO26 هو جهاز متعدد المهام. وهو يدعم بشكل أساسي:

علاوة على ذلك، تم تحسين Ultralytics من أجل كفاءة الذاكرة. يتطلب تدريب نموذج YOLO26 عادةً CUDA أقل من البدائل القائمة على المحولات مثل RT-DETR، مما يسمح بأحجام دفعات أكبر على وحدات معالجة الرسومات (GPU) المخصصة للمستهلكين.

مثال على الكود: تدريب YOLO26

يمكنك التبديل إلى YOLO26 بسهولة باستخدامPython Ultralytics Python .

from ultralytics import YOLO

# Load the state-of-the-art YOLO26n model
model = YOLO("yolo26n.pt")

# Train on the COCO8 dataset
# The MuSGD optimizer and ProgLoss are handled automatically
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)

# Run inference on an image
# NMS-free output is generated natively
results = model("https://ultralytics.com/images/bus.jpg")

الخلاصة

بينما يوفر YOLOX أساسًا قويًا للبحث بدون مرساة ويوفر EfficientDet دراسة في كفاءة التوسع، يبرز YOLO26 كخيار عملي لعام 2026 وما بعده. إن الجمع بين الاستدلال NMS CPU الفائقة والدعم القوي Ultralytics يجعله الخيار المثالي للمطورين الذين يسعون إلى تخطي حدود الاستدلال في الوقت الفعلي.

لأولئك المستعدين للترقية، استكشفوا الإمكانات الكاملة لـ YOLO26 في وثائقنا أو استشهدوا بخيارات حديثة أخرى مثل YOLO11 للمقارنات القديمة.


تعليقات