YOLO26 مقابل EfficientDet: مقارنة تقنية لبنيات الكشف عن الكائنات الحديثة

يعد اختيار بنية الشبكة العصبية المناسبة أمراً بالغ الأهمية لنجاح أي تطبيق رؤية حاسوبية. يستكشف هذا الدليل التقني المقايضات، ومقاييس الأداء، والابتكارات المعمارية لنموذجين بارزين: نموذج Ultralytics YOLO26 المتطور وEfficientDet الراسخ من Google.

سواء كان النشر يستهدف خوادم سحابية ذات إنتاجية عالية أو أجهزة ذكاء اصطناعي على الحافة ذات قيود في زمن الاستجابة، فإن فهم الاختلافات بين هذه البنيات يضمن توازناً مثالياً بين السرعة والدقة والكفاءة.

نظرة عامة على البنية: YOLO26

المؤلفون: Glenn Jocher و Jing Qiu
المنظمة: Ultralytics
التاريخ: 2026-01-14
GitHub: Ultralytics GitHub
التوثيق: التوثيق الرسمي لـ YOLO26

تم إطلاق YOLO26 في أوائل عام 2026، وهو يمثل أحدث تطور في عائلة YOLO، وقد تم تصميمه خصيصاً لتوفير تجربة مستخدم لا مثيل لها ومتوسط دقة (mAP) من الدرجة الأولى. تم تصميمه من الأساس للأجهزة الحديثة، ويوفر تنوعاً استثنائياً عبر مهام الكشف عن الكائنات، وتجزئة الحالات، وتصنيف الصور، وتقدير الوضعية.

يقدم YOLO26 العديد من الميزات الرائدة التي تحسن بشكل كبير من استقرار التدريب وسرعات الاستدلال:

  • تصميم من طرف إلى طرف بدون NMS: بناءً على المفاهيم التي تم ريادتها في YOLOv10، يعمل YOLO26 بشكل أصلي من طرف إلى طرف، مما يلغي تماماً الحاجة إلى معالجة لاحقة لـ Non-Maximum Suppression (NMS). وهذا يؤدي إلى منطق نشر أبسط وتباين أقل بكثير في زمن الاستجابة.
  • استدلال أسرع على CPU بنسبة تصل إلى 43%: من خلال التحسينات المعمارية العميقة، يحقق النموذج سرعات استدلال غير مسبوقة على وحدات CPU القياسية، مما يجعله مناسباً جداً لبيئات إنترنت الأشياء والأنظمة المدمجة.
  • إزالة DFL: تمت إزالة Distribution Focal Loss، مما أدى إلى عملية تصدير أنظف وتعزيز التوافق مع أجهزة الحافة منخفضة الطاقة باستخدام أدوات مثل ONNX.
  • مُحسّن MuSGD: مستوحى من روتين تدريب النماذج اللغوية الكبيرة لـ Moonshot AI's Kimi K2، يجلب هذا الهجين من SGD و Muon ابتكارات تدريب النماذج اللغوية الكبيرة مباشرة إلى الرؤية الحاسوبية، مما يضمن تقارباً أسرع وأنظمة تدريب أكثر استقراراً.
  • ProgLoss + STAL: تحقق دوال الخسارة المتقدمة هذه تحسينات ملحوظة في التعرف على الكائنات الصغيرة، وهو عامل حاسم للتطبيقات التي تتضمن صور الطائرات بدون طيار والروبوتات.
تصدير مبسط

بفضل إزالة DFL والبنية الخالية من NMS، لا يتطلب تصدير نماذج YOLO26 إلى تنسيقات ملائمة للحافة مثل NVIDIA TensorRT أو Intel OpenVINO أي تطوير إضافي للمكونات الإضافية المخصصة تقريباً.

اعرف المزيد عن YOLO26

نظرة عامة على البنية: EfficientDet

المؤلفون: Mingxing Tan و Ruoming Pang و Quoc V. Le
المنظمة: Google Research
التاريخ: 2019-11-20
Arxiv: ورقة بحث EfficientDet
GitHub: مستودع Google AutoML

تم تقديم EfficientDet بواسطة Google، وهي تستخدم نظام TensorFlow البيئي بشكل مكثف وقد تم تصميمها حول مفهوم القياس المركب. تعمل بنيتها على توسيع شبكة العمود الفقري، وشبكة الميزات، وشبكات التنبؤ بالمربعات/الفئات في وقت واحد بناءً على قيود الموارد.

تشمل الابتكارات الرئيسية لـ EfficientDet ما يلي:

  • BiFPN (شبكة هرم الميزات ثنائية الاتجاه): آلية تسمح بدمج ميزات متعددة المقاييس بسهولة وسرعة، مما يمكن الشبكة من فهم الكائنات ذات الأحجام المختلفة بشكل أفضل.
  • القياس المركب: طريقة إرشادية لتوسيع الدقة والعمق والعرض بشكل موحد، مما يخلق عائلة من النماذج من d0 (الأصغر) إلى d7 (الأكبر).

على الرغم من أن EfficientDet تظل خياراً قوياً للكشف عن مربعات الإحاطة الصارمة، إلا أنها تفتقر عموماً إلى تعدد المهام الحديث (مثل مهام OBB الأصلية) ونظام Python البيئي الموحد والمبسط الذي يتوقعه المطورون المعاصرون.

تعرف على المزيد حول EfficientDet

مقارنة الأداء والمقاييس

لتحديد حدود باريتو للسرعة والدقة، قمنا بقياس أداء كلتا البنيتين في بيئات قياسية باستخدام مجموعة بيانات COCO. يسلط الجدول التالي الضوء على الاختلافات في أحجام النماذج، والدقة، وزمن الاستجابة المقاس على مثيل AWS EC2 P4d.

النموذجالحجم
(بكسل)
mAPval
50-95
السرعة
CPU ONNX
(ملي ثانية)
السرعة
T4 TensorRT10
(ملي ثانية)
المعلمات
(مليون)
FLOPs
(مليار)
YOLO26n64040.938.91.72.45.4
YOLO26s64048.687.22.59.520.7
YOLO26m64053.1220.04.720.468.2
YOLO26l64055.0286.26.224.886.4
YOLO26x64057.5525.811.855.7193.9
EfficientDet-d064034.610.23.923.92.54
EfficientDet-d164040.513.57.316.66.1
EfficientDet-d264043.017.710.928.111.0
EfficientDet-d364047.528.019.5912.024.9
EfficientDet-d464049.742.833.5520.755.2
EfficientDet-d564051.572.567.8633.7130.0
EfficientDet-d664052.692.889.2951.9226.0
EfficientDet-d764053.7122.0128.0751.9325.0

كما هو موضح أعلاه، يثبت YOLO26 توازناً متفوقاً في الأداء. يحقق نموذج YOLO26x أعلى دقة (57.5 mAP)، متفوقاً بشكل كبير على نموذج EfficientDet-d7 الأثقل. علاوة على ذلك، تُظهر نماذج YOLO26 متطلبات ذاكرة أقل بكثير وسرعات استدلال أسرع بكثير على GPU (تصل إلى 1.7 مللي ثانية على TensorRT)، مما يؤكد فوائد التصميم الخالي من NMS.

كفاءة التدريب وميزة النظام البيئي

يكمن أحد الاختلافات الرئيسية بين البنيتين في بيئات التطوير الخاصة بهما. EfficientDet مدمجة بعمق ضمن نظام Google AutoML و TensorFlow، وهو نظام قوي ولكنه قد يقدم منحنيات تعلم حادة وتكوينات صارمة لمجموعات البيانات المخصصة مثل DOTAv1.

في المقابل، تقدم Ultralytics نظاماً بيئياً مُداراً بشكل جيد للغاية ومبنياً على PyTorch. تم تحسين استخدام الذاكرة أثناء التدريب بدقة، مما يسمح للمهندسين بتدريب نماذج قوية دون الحاجة إلى تخصيصات VRAM مفرطة شائعة في الشبكات القائمة على Transformer.

تكامل المنصة الموحدة

من خلال منصة Ultralytics، يحصل المطورون على إمكانية الوصول إلى سير عمل MLOps من طرف إلى طرف. يتضمن ذلك تعليق توضيحي سلس للبيانات، وضبطاً تلقائياً للمعلمات الفائقة، وتدريباً سحابياً بنقرة واحدة، مما يسرع بشكل كبير المسار من النمذجة إلى الإنتاج.

مثال على التنفيذ

سهولة الاستخدام التي توفرها واجهة برمجة تطبيقات Ultralytics تعني أنه يمكنك تدريب والتحقق من صحة نموذج YOLO26 متطور في بضعة أسطر فقط من التعليمات البرمجية.

from ultralytics import YOLO

# Initialize the End-to-End NMS-Free YOLO26 model
model = YOLO("yolo26n.pt")

# Train using the innovative MuSGD optimizer on a custom dataset
train_results = model.train(
    data="coco8.yaml",
    epochs=100,
    imgsz=640,
    device="0",  # Train on GPU
)

# Export natively to TensorRT for ultra-low latency deployment
model.export(format="engine")

حالات الاستخدام المثالية

متى تستخدم YOLO26:

  • حوسبة الحافة والجوال: مع استدلال أسرع على CPU بنسبة تصل إلى 43% وعدم وجود حمل NMS، يتفوق YOLO26 على الأجهزة ذات قيود الحوسبة الصارمة مثل Raspberry Pis أو الهواتف المحمولة.
  • تعدد المهام: عندما يتطلب خط إنتاج واحد مربعات إحاطة، وأقنعة تجزئة، وتتبع، فإن تعدد استخدامات YOLO26 لا مثيل له.
  • الصور الجوية والدرونز: يساهم الجمع بين ProgLoss و STAL في تعزيز الكشف عن الكائنات الصغيرة جداً من على ارتفاعات عالية بشكل كبير.

متى تستخدم EfficientDet:

  • خطوط أنابيب TensorFlow القديمة: إذا كانت بنيتك التحتية مشفرة بكثافة لدعم TensorFlow SavedModels فقط أو تتطلب خطوط أنابيب TensorFlow Serving محددة، فإن EfficientDet توفر توافقاً أصلياً.
  • وحدات TPU ذات الموارد المحدودة: تم تحسين EfficientDet بكثافة لوحدات معالجة Tensor المخصصة من Google (TPUs).

استكشاف بدائل أخرى

بينما يركز هذا الدليل بشكل كبير على نموذج YOLO26 مقابل EfficientDet، فإن نظام Ultralytics البيئي الأوسع يضم بنيات مذهلة أخرى. إذا كان تطبيقك يعتمد بشكل كبير على المحولات، فإن RT-DETR يوفر كشفاً يعتمد على المحولات في الوقت الفعلي. بدلاً من ذلك، إذا كنت تدعم الأنظمة القديمة، فإن YOLO11 يظل مدعوماً بالكامل وفعالاً للغاية. للحصول على نظرة عامة أوسع، قم بزيارة مركز مقارنات نماذج Ultralytics.

في النهاية، بالنسبة لأي خط إنتاج رؤية حاسوبية حديث يتم بناؤه اليوم، فإن السرعة الفائقة، وسهولة الاستخدام، والدقة المتطورة لـ YOLO26 تجعله التوصية التي لا جدال فيها للباحثين والمطورين على حد سواء.

التعليقات