تخطي إلى المحتوى

YOLO11 EfficientDet: مقارنة تقنية شاملة

يتطلب اختيار الشبكة العصبية المثلى لمشاريع الرؤية الحاسوبية فهمًا عميقًا للبنى المتاحة. يقدم هذا الدليل مقارنة تقنية متعمقة بين Ultralytics YOLO11 و EfficientDet Google. سنستكشف الاختلافات في البنية ومقاييس الأداء وكفاءة التدريب وسيناريوهات النشر المثالية لمساعدتك في اتخاذ قرار مستنير بشأن أحمال عمل التعلم الآلي.

خلفيات النموذج والمواصفات

وقد أثر كلا النموذجين بشكل كبير على مجال التعلم العميق، على الرغم من أنهما ينبعان من فلسفات تصميم مختلفة وعصور مختلفة من تطور الذكاء الاصطناعي.

YOLO11

المؤلفون: جلين جوشر وجينغ تشيو
المنظمة: Ultralytics
التاريخ: 2024-09-27
GitHub: ultralytics
المستندات: yolo11

تعرف على المزيد حول YOLO11

تفاصيل EfficientDet

المؤلفون: Mingxing Tan، Ruoming Pang، و Quoc V. Le
المنظمة: Google
التاريخ: 2019-11-20
Arxiv: https://arxiv.org/abs/1911.09070
GitHub: google
المستندات: google

تعرف على المزيد حول EfficientDet

ميزة النظام البيئي

عند العمل مع نماذج الرؤية الحاسوبية، فإن النظام البيئي المحيط لا يقل أهمية عن النموذج نفسه. يوفر Ultralytics تجربة مطورين لا مثيل لها، حيث يقدم وثائق شاملة ودعمًا نشطًا من المجتمع وإمكانيات تصدير سلسة إلى تنسيقات مثل ONNX و TensorRT.

الابتكارات المعمارية

كفاءة الكشف: BiFPN والتحجيم المركب

تم طرح EfficientDet في أواخر عام 2019، بهدف تحقيق أقصى قدر من الدقة مع تقليل تكلفة الحوسبة إلى الحد الأدنى. ويحقق ذلك بشكل أساسي من خلال آليتين. أولاً، يستخدم EfficientNet backbone الذي يقيس العمق والعرض والدقة بشكل متماسك. ثانياً، أدخل شبكة Bi-directional Feature Pyramid Network (BiFPN)، التي تسمح بدمج الميزات متعددة المقاييس بسهولة وسرعة.

على الرغم من كفاءته العالية في ذلك الوقت، إلا أن اعتماد EfficientDet على مكتبة TensorFlow AutoML يمكن أن يجعله صارمًا. غالبًا ما يجد الباحثون أن تقليم النماذج والتعديلات المخصصة أمرًا صعبًا مقارنة بالأطر الحديثة القائمة PyTorch.

YOLO11: استخراج ميزات محسّن وتعدد الاستخدامات

YOLO11 قفزة كبيرة إلى الأمام في هياكل الكشف عن الأشياء. وهو يعتمد على نجاحات سابقيه، حيث يقدم كتل C3k2 محسنة ووحدة تجميع هرمية مكانية محسنة. تؤدي هذه التحسينات إلى استخراج ميزات فائقة، مما يسمح YOLO11 أنماط بصرية معقدة بوضوح استثنائي.

YOLO11 المزايا الرئيسية لـ YOLO11 تنوع استخداماته. في حين أن EfficientDet هو نموذج مخصص حصريًا لاكتشاف الأجسام ، YOLO11 YOLO11 يدعم YOLO11 تقسيم الحالات وتصنيف الصور وتقدير الوضع ومربعات الحدود الموجهة (OBB). علاوة على ذلك، YOLO11 بمتطلبات ذاكرة منخفضة للغاية أثناء التدريب والاستدلال، مما يجعله متفوقًا بشكل كبير على النماذج القديمة ومحولات الرؤية الضخمة عند نشره في بيئات الذكاء الاصطناعي المحدودة الموارد.

الأداء والمعايير

التوازن بين الدقة، المقاسة بمتوسط الدقة (mAP)، وسرعة الاستدلال هو العامل الحاسم في عمليات النشر في العالم الواقعي. يوضح الجدول أدناه الأداء الأولي لكلتا عائلتي النماذج على COCO القياسية.

النموذجالحجم
(بالبكسل)
mAPval
50-95
السرعة
وحدة المعالجة المركزية CPU ONNX
(بالمللي ثانية)
السرعة
T4 TensorRT10
(بالمللي ثانية)
المعلمات
(M)
FLOPs
(B)
YOLO11n64039.556.11.52.66.5
YOLO11s64047.090.02.59.421.5
YOLO11m64051.5183.24.720.168.0
YOLO11l64053.4238.66.225.386.9
YOLO11x64054.7462.811.356.9194.9
EfficientDet-d064034.610.23.923.92.54
EfficientDet-d164040.513.57.316.66.1
EfficientDet-d264043.017.710.928.111.0
EfficientDet-d364047.528.019.5912.024.9
EfficientDet-d464049.742.833.5520.755.2
EfficientDet-d564051.572.567.8633.7130.0
EfficientDet-d664052.692.889.2951.9226.0
EfficientDet-d764053.7122.0128.0751.9325.0

كما هو موضح، YOLO11 توازنًا عاليًا في الأداء. يحقق YOLO11x أعلى دقة إجمالية (54.7 mAP)، بينما تهيمن YOLO11 الأصغر حجمًا بشكل مطلق على سرعات GPU (تصل إلى 1.5 مللي ثانية على T4 باستخدام TensorRT).

كفاءة التدريب والنظام البيئي

إحدى السمات المميزة Ultralytics هي سهولة استخدامها. غالبًا ما يتطلب تدريب نموذج EfficientDet التنقل TensorFlow تكوينات TensorFlow المعقدة وإدارة سلاسل التبعية المعقدة. في المقابل، YOLO11 تصميم YOLO11 على أساس نظام حديث تمامًا وواضح PyTorch .

هذا النظام البيئي الذي يتم صيانته جيدًا يعني أنه يمكن للمطورين تثبيت الحزمة وتحميل نموذج مدرب مسبقًا والبدء في التدريب على مجموعة بيانات مخصصة باستخدام بضع أسطر من التعليمات البرمجية فقط.

مثال على كود python

فيما يلي مثال قابل للتشغيل بالكامل يوضح بساطة Ultralytics . يقوم هذا البرنامج النصي بتنزيل YOLO11 المدرب مسبقًا، وتدريبه، وتشغيل تنبؤ سريع.

from ultralytics import YOLO

# Initialize a pretrained YOLO11 nano model
model = YOLO("yolo11n.pt")

# Train the model efficiently using the integrated PyTorch engine
# Training efficiency is high, requiring less VRAM than legacy models
results = model.train(data="coco8.yaml", epochs=10, imgsz=640, device="cpu")

# Run real-time inference on a sample image
prediction = model.predict("https://ultralytics.com/images/bus.jpg")

# Display the output bounding boxes
prediction[0].show()

التطلع إلى المستقبل: ميزة YOLO26

على الرغم من أن YOLO11 بقوة استثنائية، إلا أن الفرق التي تبدأ مشاريع جديدة يجب أن تفكر جديًا في Ultralytics ، الذي تم إصداره في يناير 2026. يمثل YOLO26 تحولًا جذريًا في بساطة النشر وأداء الحافة.

تشمل ابتكارات YOLO26 الرئيسية ما يلي:

  • تصميم NMS من البداية إلى النهاية: من خلال التخلص من تقنية Non-Maximum Suppression (NMS) أثناء المعالجة اللاحقة، يضمن YOLO26 اتساقًا ووقت استجابة منخفضًا للغاية، وهو أمر بالغ الأهمية للروبوتات عالية السرعة والقيادة الذاتية.
  • CPU أسرع بنسبة تصل إلى 43٪ CPU : بالنسبة لعمليات النشر التي تفتقر إلى وحدات معالجة رسومات مخصصة، تم تحسين YOLO26 خصيصًا لزيادة الإنتاجية إلى أقصى حد على المعالجات القياسية.
  • MuSGD Optimizer: مستوحى من Kimi K2 من Moonshot AI، يوفر هذا المحسن الهجين استقرار تدريب LLM للرؤية الحاسوبية، مما يتيح تقاربًا أسرع.
  • ProgLoss + STAL: تعمل وظائف الخسارة المحسّنة هذه على تحسين التعرف على الأجسام الصغيرة بشكل كبير، وهو ما يمثل غالبًا مشكلة في تحليل الصور الفضائية ولقطات الطائرات بدون طيار.
  • إزالة DFL: تعمل إزالة Distribution Focal Loss على تبسيط عملية تصدير النموذج إلى الأجهزة الطرفية.

نماذج بديلة للاستكشاف

إذا كان مشروعك يتطلب متطلبات محددة للغاية، فقد ترغب أيضًا في إجراء مقارنة مع RT-DETR للكشف القائم على المحولات، أو نموذج YOLOv8، الذي لا يزال أساسيًا في العديد من عمليات النشر القديمة في المؤسسات.

حالات الاستخدام والتوصيات

يعتمد الاختيار بين YOLO11 EfficientDet على متطلبات مشروعك المحددة وقيود النشر وتفضيلات النظام البيئي.

متى تختار YOLO11

YOLO11 خيار قوي لـ:

  • نشر حافة الإنتاج: التطبيقات التجارية على أجهزة مثل Raspberry Pi أو NVIDIA حيث الموثوقية والصيانة النشطة أمران بالغا الأهمية.
  • تطبيقات الرؤية متعددة المهام: المشاريع التي تتطلب الكشف والتجزئة وتقدير الوضع و OBB ضمن إطار موحد واحد.
  • النماذج الأولية السريعة والنشر: الفرق التي تحتاج إلى الانتقال بسرعة من جمع البيانات إلى الإنتاج باستخدام Python Ultralytics Python المبسطة.

متى تختار EfficientDet

يوصى باستخدام EfficientDet في الحالات التالية:

  • Google و TPU : أنظمة متكاملة بشكل عميق مع واجهات برمجة تطبيقات Google Vision أو TPU حيث يتمتع EfficientDet بتحسين أصلي.
  • أبحاث التوسع المركب: مقارنة أكاديمية تركز على دراسة آثار التوازن بين عمق الشبكة وعرضها وتوسع الدقة.
  • النشر عبر الأجهزة المحمولة باستخدام TFLite: المشاريع التي تتطلب بشكل خاص تصدير TensorFlow لأجهزة Android أجهزة Linux المدمجة.

متى تختار Ultralytics YOLO26)

بالنسبة لمعظم المشاريع الجديدة، يوفر Ultralytics أفضل مزيج من الأداء وتجربة المطور:

  • نشر الحافةNMS: التطبيقات التي تتطلب استنتاجًا متسقًا ومنخفض التأخير دون تعقيدات المعالجة اللاحقة لـ Non-Maximum Suppression.
  • بيئاتCPU: الأجهزة التي لا تحتوي على GPU مخصص، حيث يوفر CPU الأسرع بنسبة تصل إلى 43٪ في YOLO26 ميزة حاسمة.
  • كشف الأجسام الصغيرة: سيناريوهات صعبة مثل صور الطائرات بدون طيار أو تحليل مستشعرات إنترنت الأشياء حيث يعزز ProgLoss و STAL الدقة بشكل كبير على الأجسام الصغيرة.

الخلاصة

كانت EfficientDet بنية رائدة أثبتت جدوى التوسع المركب في اكتشاف الكائنات. ومع ذلك، أدى التقدم السريع في أبحاث الذكاء الاصطناعي إلى ظهور نماذج أكثر قدرة وأسهل في التكامل وأسرع في التشغيل.

بفضل قدراته القوية في أداء المهام المتعددة، وسرعات GPU المذهلة GPU ، وواجهة برمجة التطبيقات (API) التي يمكن القول إنها الأكثر ملاءمة للمطورين في هذا المجال، YOLO11 هو الفائز الواضح في مجال خطوط الرؤية الحديثة. بالنسبة لأولئك الذين يهدفون إلى الحصول على أحدث التقنيات، خاصةً بالنسبة لعمليات النشر التي تعتمد على الحافة أولاً، فإن الترقية إلى YOLO26 توفر المزيج المثالي بين السرعة NMS والدقة التي لا مثيل لها.


تعليقات