تخطي إلى المحتوى

DAMO-YOLO مقابل YOLO11: مقارنة فنية

في مشهد الرؤية الحاسوبية سريع التطور، يعد اختيار النموذج الصحيح لاكتشاف الأجسام أمرًا بالغ الأهمية لنجاح التطبيق. تحلل هذه المقارنة الشاملة بنيتين هامتين: YOLO التي طورتها مجموعة علي بابا، و Ultralytics YOLO11وهو أحدث نموذج متطور من Ultralytics. في حين أن كلا النموذجين يهدفان إلى تحسين المفاضلة بين السرعة والدقة، إلا أنهما يخدمان أغراضًا أساسية مختلفة ويقدمان مزايا متميزة اعتمادًا على سيناريو النشر.

يقدم هذا الدليل نظرة متعمقة على بنيتها ومقاييس أدائها وحالات الاستخدام المثالية لمساعدة المطورين والباحثين على اتخاذ قرارات مستنيرة.

DAMO-YOLO

المؤلفون: شيانزهي شو، وييكي جيانغ، وويهوا تشن، وويلون هوانغ، ويوان تشانغ، ويوان تشانغ، وشيويو صن
المنظمة:مجموعة علي بابا
التاريخ: 2022-11-23
اركسيف:https://arxiv.org/abs/2211.15444v2
جيثب:YOLO
المستندات:YOLO

YOLO هو إطار عمل للكشف عن الأجسام يدمج العديد من التقنيات المتطورة لتحقيق أداء عالٍ. وهو يركز على تقليل زمن الاستجابة مع الحفاظ على دقة تنافسية من خلال سلسلة من الابتكارات المعمارية التي تعتمد على أبحاث علي بابا.

تعرف على المزيد حول DAMO-YOLO

الهندسة المعمارية والابتكار

يقدم YOLO نهج "التقطير والانتقاء" ويتضمن المكونات الرئيسية التالية:

  • العمود الفقري MAE-NAS: باستخدام البحث عن البنية العصبية (NAS)، يتم تحسين العمود الفقري في ظل قيود محددة لضمان استخراج الميزات بكفاءة.
  • شبكة هرم السمات المعممة الفعالة: تستخدم الشبكة الهرمية المعممة للميزات (GFPN) بكثافة آليات إعادة المعلمات لتحسين دمج الميزات عبر مقاييس مختلفة دون تكبد تكاليف حسابية باهظة أثناء الاستدلال.
  • ZeroHead: يفصل رأس الكشف الخفيف الوزن هذا بين مهام التصنيف والانحدار، بهدف زيادة سرعة الاستدلال إلى أقصى حد.
  • AlignedOTA: استراتيجية تعيين التسمية التي تحل عدم التوافق بين أهداف التصنيف والانحدار، مما يعزز التقارب أثناء التدريب.

في حين أن YOLO يقدم تطورات نظرية مثيرة للإعجاب، إلا أنه إطار عمل موجه نحو البحث بشكل أساسي يركز على اكتشاف الكائنات. فهو يفتقر عادةً إلى الدعم الأصلي متعدد المهام الموجود في الأنظمة البيئية الأكثر شمولاً.

Ultralytics YOLO11

المؤلفون: جلين جوتشر، جينغ تشيو
المنظمة:Ultralytics
التاريخ: 2024-09-27 2024
GitHubultralytics
المستنداتyolo11

يمثّل Ultralytics YOLO11 ذروة الرؤية الحاسوبية في الوقت الحقيقي، حيث يعمل على تحسين إرث سلسلة YOLO مع تحسينات كبيرة في البنية والكفاءة وسهولة الاستخدام. تم تصميمه ليس فقط كنموذج، ولكن كأداة متعددة الاستخدامات للنشر العملي والواقعي عبر بيئات أجهزة متنوعة.

تعرف على المزيد حول YOLO11

الهندسة المعمارية والنظام البيئي

يعتمد YOLO11 على النجاحات السابقة من خلال بنية محسنة خالية من المراسي. فهو يتميز بعمود فقري محسّن لاستخراج ميزات فائقة وتصميم عنق معدّل يعزز تدفق المعلومات على مختلف المقاييس.

تشمل المزايا الرئيسية لإطار عمل Ultralytics YOLO11 ما يلي:

  • تعدد الاستخدامات: على عكس العديد من المنافسين، يدعم YOLO11 أصلاً مجموعة واسعة من المهام بما في ذلك اكتشاف الأجسام، وتجزئة المثيلات، وتقدير الوضع، وتصنيف الصور، والمربعات المحدودة الموجهة (OBB).
  • سهولة الاستخدام: تم تغليف النموذج في واجهة برمجة تطبيقاتPython سهلة الاستخدام و CLIمما يجعله في متناول كل من المبتدئين والخبراء.
  • كفاءة التدريب: تم تحسين YOLO11 من أجل تقارب أسرع، ويستخدم YOLO11 وظائف فعالة لزيادة البيانات ووظائف الخسارة، مما يسمح للمستخدمين بتدريب نماذج مخصصة على مجموعات بيانات مثل COCO مع انخفاض النفقات العامة للموارد.
  • نظام بيئي جيد الصيانة: مدعومة بـ Ultralytics يستفيد المستخدمون من التحديثات المتكررة، والتوثيق الشامل، والتكامل السلس مع أدوات MLOPS مثل Ultralytics HUB.

هل كنت تعلم؟

تم تصميم YOLO11 ليكون عالي الكفاءة على أجهزة Edge AI. تضمن بنيته المحسّنة استخداماً منخفضاً للذاكرة وسرعات استنتاج عالية على أجهزة مثل NVIDIA Jetson وRaspberry Pi، مما يجعله خياراً ممتازاً للتطبيقات المدمجة مقارنةً بالنماذج القائمة على المحولات الأثقل.

مقارنة الأداء

يوضح الرسم البياني والجدول التاليان الفروق في الأداء بين YOLO و YOLO11. يُظهرYOLO11 Ultralytics YOLO11 باستمرار دقة فائقةmAP) وسرعات استدلال مواتية، خاصةً على أجهزة CPU حيث يفتقر برنامج YOLO إلى المعايير الرسمية.

النموذجالحجم
(بالبكسل)
mAPفال
50-95
السرعة
وحدة المعالجة المركزية CPU ONNX
(بالمللي ثانية)
السرعة
T4 TensorRT10
(بالمللي ثانية)
المعلمات
(M)
FLOPs
(B)
DAMO-YOLOt64042.0-2.328.518.1
DAMO-YOLOs64046.0-3.4516.337.8
DAMO-YOLOm64049.2-5.0928.261.8
DAMO-YOLOl64050.8-7.1842.197.3
YOLO11n64039.556.11.52.66.5
YOLO11s64047.090.02.59.421.5
YOLO11m64051.5183.24.720.168.0
YOLO11l64053.4238.66.225.386.9
YOLO11x64054.7462.811.356.9194.9

تحليل النتائج

  • الدقة: يتفوق YOLO11 بشكل ملحوظ على نماذج YOLO المماثلة. على سبيل المثال، يحقق YOLO11m دقة 51.5 mAP أي أعلى بشكل ملحوظ من دقة نموذج DAMO-YOLOm التي تبلغ 49.2 mAP على الرغم من وجود عدد أقل من البارامترات (20.1 مليون مقابل 28.2 مليون).
  • سرعة الاستدلال: على GPU (T4 TensorRT)، يوفر YOLO11 زمن انتقال تنافسي للغاية. يتميز YOLO11n بسرعة مذهلة تبلغ 1.5 مللي ثانية، مما يجعله مناسبًا للتطبيقات ذات زمن الاستجابة المنخفض للغاية.
  • أداءCPU : الميزة الرئيسية لنماذج Ultralytics هي شفافيتها فيما يتعلق بأداء CPU . تم تحسين YOLO11 للاستدلال بوحدة CPU عبر ONNXOpenVINO في حين يركز YOLO بشكل كبير على GPU وغالباً ما يترك أداء نشر CPU غير محدد.
  • كفاءة النموذج: يوضح YOLO11 توازنًا أفضل بين المعلمات والأداء. وتتيح الكفاءة المعمارية الحصول على ملفات نماذج أصغر، وهو ما يُترجم إلى تنزيلات أسرع ومتطلبات تخزين أقل على الأجهزة الطرفية.

العوامل الرئيسية المميِّزة وحالات الاستخدام

نقاط القوة في Ultralytics YOLO11

المطورون الذين يستخدمون Ultralytics YOLO11 الوصول إلى بيئة قوية على مستوى الإنتاج.

  • توازن الأداء: تم ضبط بنية النموذج بدقة لتقديم أفضل مفاضلة بين سرعة الاستدلال ودقته، وهو أمر بالغ الأهمية لتحليلات الفيديو في الوقت الحقيقي.
  • قدرات متعددة المهام: إذا توسع نطاق مشروعك من الاكتشاف إلى التتبع أو التجزئة، فإن YOLO11 يعالج ذلك بسلاسة داخل قاعدة التعليمات البرمجية نفسها.
  • سهولة الاستخدام: في ultralytics تبسط الحزمة خط الأنابيب بأكمله. يمكن تحميل نموذج، وتشغيل التنبؤات، والتصدير إلى تنسيقات مثل CoreML أو TFLite أو TensorRT ببضعة أسطر من التعليمات البرمجية.
  • متطلبات ذاكرة أقل: مقارنةً بالكاشفات القائمة على المحولات أو البنى غير المحسّنة، يتطلب YOLO11 عادةً ذاكرة CUDA أقل أثناء التدريب، مما يتيح للباحثين التدريب على وحدات معالجة رسومات من فئة المستهلك.
from ultralytics import YOLO

# Load a pretrained YOLO11 model
model = YOLO("yolo11n.pt")

# Train on a custom dataset
model.train(data="coco8.yaml", epochs=50, imgsz=640)

# Run inference on an image
results = model("path/to/image.jpg")

نقاط القوة في YOLO

YOLO يولو منافس قوي في دوائر البحث الأكاديمي.

  • الابتكار البحثي: تقدم ميزات مثل MAE-NAS و ZeroHead رؤى مثيرة للاهتمام في البحث في البنية العصبية وفصل الرأس.
  • إنتاجيةGPU : بالنسبة للتطبيقات الصناعية المحددة التي تعمل حصريًا على وحدات معالجة الرسومات المدعومة، يوفر YOLO إنتاجية عالية، على الرغم من أنه غالبًا ما يتخلف عن YOLO11 في كفاءة الدقة الخالصة لكل معيار.

الخلاصة

بينما يقدم YOLO مفاهيم جديدة من فريق البحث في علي بابا, Ultralytics YOLO11 يبرز كخيار متفوق للغالبية العظمى من المطورين والشركات. لا تتحدد هيمنته ليس فقط من خلال ارتفاع mAP والاستدلال الأسرع، ولكن من خلال النظام البيئي الشامل الذي يدعمه.

بدءًا من سهولة الاستخدام وتعدد الاستخدامات إلى قاعدة التعليمات البرمجية التي تتم صيانتها جيدًا والدعم المجتمعي النشط، يقلل YOLO11 من عائق الدخول لإنشاء حلول ذكاء اصطناعي متقدمة. يوفر YOLO11 الموثوقية والأداء اللازمين لتطبيقات الرؤية الحاسوبية الحديثة، سواءً كان النشر على الخوادم السحابية أو على الأجهزة الطرفية محدودة الموارد.

استكشف مقارنات النماذج الأخرى

لفهم أفضل لكيفية مقارنة نماذج Ultralytics بالبنى الأخرى، استكشف صفحات المقارنة التفصيلية الخاصة بنا:


تعليقات