تخطي إلى المحتوى

YOLO26 مقابل EfficientDet: مقارنة تقنية بين هياكل الكشف عن الكائنات الحديثة

يُعد اختيار بنية الشبكة العصبية الصحيحة أمرًا بالغ الأهمية لنجاح أي تطبيق لرؤية الكمبيوتر. يستكشف هذا الدليل التقني المفاضلات ومقاييس الأداء والابتكارات المعمارية لنموذجين بارزين: Ultralytics YOLO26 المتطور و EfficientDet الراسخ من Google.

سواء كان هدف النشر هو خوادم سحابية عالية الإنتاجية أو أجهزة ذكاء اصطناعي طرفية مقيدة بالكمون، فإن فهم الاختلافات بين هذه البنى يضمن تحقيق التوازن الأمثل بين السرعة والدقة والكفاءة.

نظرة عامة معمارية: YOLO26

المؤلفون: Glenn Jocher و Jing Qiu
المنظمة:Ultralytics
التاريخ: 2026-01-14
GitHub:GitHub لـ Ultralytics
الوثائق:الوثائق الرسمية لـ YOLO26

تم إصدار YOLO26 في أوائل عام 2026، وهو يمثل أحدث تطور في YOLO وقد تم تصميمه خصيصًا لتوفير تجربة مستخدم لا مثيل لها ودقة متوسطة (mAP) من الدرجة الأولى. تم تصميمه من الألف إلى الياء للأجهزة الحديثة، ويوفر تنوعًا استثنائيًا في اكتشاف الكائنات وتقسيم الحالات وتصنيف الصور وتقدير الوضع.

يقدم YOLO26 العديد من الميزات الرائدة التي تحسن بشكل كبير من استقرار التدريب وسرعة الاستدلال:

  • تصميم شامل خالٍ من NMS: استنادًا إلى المفاهيم الرائدة في YOLOv10، يتميز YOLO26 بتصميم شامل أصيل، مما يلغي تمامًا الحاجة إلى معالجة ما بعد التثبيط غير الأقصى (NMS). وهذا يؤدي إلى منطق نشر أبسط وتباين أقل بكثير في زمن الانتقال.
  • استدلال أسرع بنسبة تصل إلى 43% على وحدة المعالجة المركزية (CPU): من خلال التحسينات المعمارية العميقة، يحقق النموذج سرعات استدلال غير مسبوقة على وحدات CPU القياسية، مما يجعله مناسبًا للغاية لبيئات إنترنت الأشياء والأنظمة المدمجة.
  • إزالة DFL: تمت إزالة Distribution Focal Loss، مما أدى إلى عملية تصدير أنظف وتوافق معزز مع الأجهزة الطرفية منخفضة الطاقة باستخدام أدوات مثل ONNX.
  • مُحسِّن MuSGD: مستوحى من إجراءات تدريب نماذج LLM الخاصة بـ Kimi K2 من Moonshot AI، يجلب هذا المزيج الهجين من SGD و Muon ابتكارات تدريب نماذج اللغة الكبيرة مباشرة إلى الرؤية الحاسوبية، مما يضمن تقاربًا أسرع وأنظمة تدريب أكثر استقرارًا.
  • ProgLoss + STAL: تحقق دوال الخسارة المتقدمة هذه تحسينات ملحوظة في التعرف على الكائنات الصغيرة، وهو عامل حاسم للتطبيقات التي تتضمن صور الطائرات بدون طيار الجوية والروبوتات.

تصدير مبسط

بفضل إزالة DFL والبنية NMS، أصبح من الممكن تصدير نماذج YOLO26 إلى تنسيقات متوافقة مع الحواف مثل NVIDIA TensorRT أو Intel OpenVINO لا يتطلب أي تطوير مخصص للمكونات الإضافية.

تعرف على المزيد حول YOLO26

نظرة عامة معمارية: EfficientDet

المؤلفون: Mingxing Tan, Ruoming Pang, و Quoc V. Le
المنظمة:أبحاث Google
التاريخ: 2019-11-20
Arxiv:ورقة EfficientDet البحثية
GitHub:مستودع Google AutoML

قدمت Google برنامج EfficientDet الذي يستخدم بشكل مكثف TensorFlow وقد تم تصميمه بناءً على مفهوم التوسع المركب. تعمل بنيته على توسيع شبكة العمود الفقري وشبكة الميزات وشبكات التنبؤ بالصندوق/الفئة في وقت واحد بناءً على قيود الموارد.

تشمل الابتكارات الرئيسية لـ EfficientDet ما يلي:

  • BiFPN (شبكة الهرم الميزاتي ثنائية الاتجاه): آلية تسمح بدمج الميزات متعددة المقاييس بسهولة وسرعة، مما يمكّن الشبكة من فهم الكائنات ذات الأحجام المختلفة بشكل أفضل.
  • التحجيم المركب: طريقة استدلالية لتحجيم الدقة والعمق والعرض بشكل موحد، مما يؤدي إلى إنشاء عائلة من النماذج من d0 (الأصغر) إلى d7 (الأكبر).

في حين أن EfficientDet لا يزال خيارًا قويًا للكشف الدقيق عن الصناديق المحددة، إلا أنه يفتقر عمومًا إلى التنوع الحديث في المهام المتعددة (مثل مهام OBB الأصلية) والتبسيط والتوحيد. Python الذي يتوقعه المطورون المعاصرون.

تعرف على المزيد حول EfficientDet

مقارنة الأداء والمقاييس

لتحديد حدود باريتو للسرعة والدقة، قمنا بمقارنة كلتا البنيتين في بيئات قياسية باستخدام COCO . يوضح الجدول التالي الاختلافات في أحجام النماذج والدقة والكمون المقاسة على مثيل AWS EC2 P4d.

النموذجالحجم
(بالبكسل)
mAPval
50-95
السرعة
وحدة المعالجة المركزية CPU ONNX
(بالمللي ثانية)
السرعة
T4 TensorRT10
(بالمللي ثانية)
المعلمات
(M)
FLOPs
(B)
YOLO26n64040.938.91.72.45.4
YOLO26s64048.687.22.59.520.7
YOLO26m64053.1220.04.720.468.2
YOLO26l64055.0286.26.224.886.4
YOLO26x64057.5525.811.855.7193.9
EfficientDet-d064034.610.23.923.92.54
EfficientDet-d164040.513.57.316.66.1
EfficientDet-d264043.017.710.928.111.0
EfficientDet-d364047.528.019.5912.024.9
EfficientDet-d464049.742.833.5520.755.2
EfficientDet-d564051.572.567.8633.7130.0
EfficientDet-d664052.692.889.2951.9226.0
EfficientDet-d764053.7122.0128.0751.9325.0

كما هو موضح أعلاه، يحقق YOLO26 توازن أداء متفوقًا. يحقق نموذج YOLO26x أعلى دقة (57.5 mAP)، متفوقًا بشكل كبير على EfficientDet-d7 الأثقل. علاوة على ذلك، تُظهر نماذج YOLO26 متطلبات ذاكرة أقل بكثير وسرعات استدلال GPU أسرع بكثير (بما يصل إلى 1.7 مللي ثانية على TensorRT)، مما يؤكد فوائد التصميم الخالي من NMS.

كفاءة التدريب وميزة النظام البيئي

يكمن فرق رئيسي بين البنيتين المعماريتين في بيئات التطوير الخاصة بهما. EfficientDet مدمج بعمق ضمن نظام Google AutoML و TensorFlow البيئي، والذي، على الرغم من قوته، يمكن أن يقدم منحنيات تعلم حادة وتكوينات صارمة لمجموعات البيانات المخصصة مثل DOTAv1.

على النقيض، تقدم Ultralytics نظامًا بيئيًا مُصانًا بشكل استثنائي ومبنيًا على PyTorch. يتم تحسين استخدام الذاكرة أثناء التدريب بشكل صارم، مما يتيح للمهندسين تدريب نماذج قوية دون الحاجة إلى تخصيصات VRAM مفرطة شائعة في الشبكات القائمة على المحولات.

تكامل المنصة الموحدة

من خلال Ultralytics يحصل المطورون على إمكانية الوصول إلى سير عمل MLOps شامل. ويشمل ذلك التعليق السلس على البيانات، وضبط المعلمات الفائقة تلقائيًا، والتدريب السحابي بنقرة واحدة، مما يسرع بشكل كبير المسار من النموذج الأولي إلى الإنتاج.

مثال على التنفيذ

سهولة الاستخدام التي توفرها واجهة برمجة Ultralytics تعني أنه يمكنك تدريب وتقييم نموذج YOLO26 المتطور باستخدام بضع أسطر من التعليمات البرمجية فقط.

from ultralytics import YOLO

# Initialize the End-to-End NMS-Free YOLO26 model
model = YOLO("yolo26n.pt")

# Train using the innovative MuSGD optimizer on a custom dataset
train_results = model.train(
    data="coco8.yaml",
    epochs=100,
    imgsz=640,
    device="0",  # Train on GPU
)

# Export natively to TensorRT for ultra-low latency deployment
model.export(format="engine")

حالات الاستخدام المثالية

متى تستخدم YOLO26:

  • الحوسبة الحافة والأجهزة المحمولة: مع استدلال أسرع بنسبة تصل إلى 43% على CPU وبدون حمل NMS الزائد، يتفوق YOLO26 على الأجهزة ذات الميزانيات الحاسوبية المقيدة بشدة مثل Raspberry Pis أو الهواتف المحمولة.
  • تعدد المهام: عندما يتطلب مسار عمل واحد صناديق محيطة، وأقنعة الـsegmentation، والـtrack، فإن تعدد استخدامات YOLO26 لا مثيل له.
  • صور الطائرات بدون طيار والجوية: يعزز الجمع بين ProgLoss و STAL بشكل كبير اكتشاف الأجسام الصغيرة للغاية من الارتفاعات العالية.

متى تستخدم EfficientDet:

  • مسارات عمل TensorFlow القديمة: إذا كانت بنيتك التحتية مبرمجة بشكل ثابت لدعم TensorFlow SavedModels فقط أو تتطلب مسارات عمل TensorFlow Serving محددة، فإن EfficientDet يوفر توافقًا أصليًا.
  • وحدات معالجة Tensor (TPUs) محدودة الموارد: تم تحسين EfficientDet بشكل كبير لوحدات معالجة Tensor (TPUs) المخصصة من Google.

استكشاف البدائل الأخرى

بينما يركز هذا الدليل بشكل كبير على نموذج YOLO26 مقابل EfficientDet، فإن Ultralytics الأوسع نطاقًا يضم هياكل أخرى مذهلة. إذا كان تطبيقك يعتمد بشكل كبير على المحولات، RT-DETR يوفر الكشف في الوقت الفعلي القائم على المحولات. أو إذا كنت تدعم الأنظمة القديمة، فإن YOLO11 يظل مدعومًا بالكامل وفعالًا للغاية. للحصول على نظرة عامة أوسع، تفضل بزيارة مركز مقارناتUltralytics .

في النهاية، بالنسبة لأي خط أنابيب رؤية حاسوبية حديث يتم بناؤه اليوم، فإن السرعة الفائقة وسهولة الاستخدام والدقة المتطورة لـ YOLO26 تجعله الخيار الموصى به بلا منازع للباحثين والمطورين على حد سواء.


تعليقات