تخطي إلى المحتوى

YOLO11 مقارنة بـ DAMO-YOLO: مقارنة فنية

في مجال الرؤية الحاسوبية سريع التطور، يعد اختيار النموذج الصحيح لاكتشاف الأجسام أمرًا بالغ الأهمية لنجاح المشروع. تقدم هذه الصفحة مقارنة تقنية مفصلة بين Ultralytics YOLO11YOLO وهما بنيتان عاليتا الأداء مصممتان للسرعة والدقة. في حين يقدم YOLO تقنيات مبتكرة من البحوث الأكاديمية، يبرز YOLO11 كحل متعدد الاستخدامات وجاهز للإنتاج مدعوم بنظام بيئي قوي.

ملخص تنفيذي

Ultralytics YOLO11 يمثل أحدث تطور في سلسلة YOLO، حيث يعمل على تحسين الاستدلال في الوقت الفعلي عبر أجهزة متنوعة، من الأجهزة الطرفية إلى الخوادم السحابية. وهو يدعم أصلاً مهام متعددة - بما في ذلك الاكتشاف و segmentation وتقدير الوضع - مما يجعله حلاً موحدًا لخطوط أنابيب الذكاء الاصطناعي المعقدة.

DAMO-YOLO، الذي طورته مجموعة علي بابا، يركز على تحقيق التوازن بين سرعة ودقة الاكتشاف باستخدام البحث عن البنية العصبية (NAS) وتقنيات دمج الميزات الجديدة. إنه في الأساس كاشف موجه نحو البحث ومُحسَّن لإنتاجية وحدة معالجة الرسومات (GPU).

Ultralytics YOLO11

المؤلفون: جلين جوتشر، جينغ تشيو
المنظمة:Ultralytics
التاريخ: 2024-09-27
GitHub:https://github.com/ultralytics/ultralytics
المستندات:https://docs.ultralytics.com/models/yolo11/

يقوم YOLO11 بتحسين أحدث التقنيات من خلال تقديم تحسينات معمارية تعزز استخراج الميزات مع الحفاظ على كفاءة عالية. يستخدم العمود الفقري CSPNet المعدل ورأس متقدم خالٍ من المرساة لتقديم دقة فائقة مع عدد أقل من المعلمات مقارنة بالأجيال السابقة.

الميزات ونقاط القوة الرئيسية

  • تعدد الاستخدامات: على عكس العديد من النماذج المتخصصة، فإن YOLO11 هو إطار عمل متعدد المهام. وهو يدعم object detection و instance segmentation و image classification و pose estimation و oriented bounding boxes (OBB).
  • هندسة معمارية محسنة: تتضمن كتل C3k2 ووحدات C2PSA (جزئي عبر المراحل مع الاهتمام المكاني) لالتقاط الأنماط المعقدة بشكل فعال، مما يحسن الأداء على الكائنات الصغيرة والخلفيات الصعبة.
  • دعم واسع للأجهزة: مُحسَّن للاستدلال على وحدة المعالجة المركزية (CPU) ووحدة معالجة الرسومات (GPU)، ويقدم مقاييس نموذجية متنوعة (من Nano إلى X-Large) لتناسب القيود التي تتراوح من Raspberry Pi إلى مجموعات NVIDIA A100.
  • سهولة الاستخدام: يتيح Python API و CLI الخاصان بـ Ultralytics للمطورين تدريب النماذج والتحقق من صحتها ونشرها بأقل قدر ممكن من التعليمات البرمجية.

نظام بيئي جاهز للإنتاج

يتكامل YOLO11 بسلاسة مع النظام البيئي Ultralytics، بما في ذلك أدوات إدارة البيانات وتدريب النماذج عبر Ultralytics HUB وعمليات التصدير بنقرة واحدة إلى تنسيقات مثل ONNX و TensorRT و CoreML.

تعرف على المزيد حول YOLO11

DAMO-YOLO

المؤلفون: شيانزه شو، يي تشي جيانغ، وي هوا تشن، يي لون هوانغ، يوان تشانغ، و شيو يو صن
المنظمة:مجموعة علي بابا
التاريخ: 2022-11-23
Arxiv:https://arxiv.org/abs/2211.15444v2
GitHub:https://github.com/tinyvision/DAMO-YOLO

تم تصميم DAMO-YOLO مع التركيز على زمن الوصول المنخفض والإنتاجية العالية للتطبيقات الصناعية. يقدم العديد من مكونات "التكنولوجيا الجديدة" لعائلة YOLO لدفع حدود المقايضات بين السرعة والدقة.

الابتكارات المعمارية

  • العمود الفقري MAE-NAS: يستخدم البحث في بنية الشبكة العصبية (NAS) الموجه بمتوسط الخطأ المطلق (MAE) لاكتشاف طوبولوجيا شبكة فعالة تلقائيًا.
  • RepGFPN فعال: شبكة هرم ميزات معممة (GFPN) تستخدم إعادة التهيئة، مما يسمح بدمج الميزات المعقدة أثناء التدريب مع الانهيار إلى هيكل أسرع وأبسط أثناء الاستدلال.
  • ZeroHead: رأس detect خفيف الوزن يفصل بين مهام classify والانحدار، مما يقلل بشكل كبير من النفقات الحسابية لطبقات الإخراج النهائية.
  • AlignedOTA: إستراتيجية محسنة لإسناد الملصقات تحل عدم التوافق بين الثقة في التصنيف ودقة الانحدار أثناء التدريب.

في حين أن DAMO-YOLO يتفوق في مقاييس محددة، إلا أنه في الأساس مستودع أبحاث. فهو يفتقر إلى الوثائق الشاملة والتحديثات المستمرة ودعم المجتمع الواسع الموجود في نظام Ultralytics البيئي.

تعرف على المزيد حول DAMO-YOLO

مقاييس الأداء: وجهاً لوجه

يقارن الجدول التالي أداء YOLO11 و DAMO-YOLO على مجموعة بيانات COCO val2017. تتضمن المقاييس الرئيسية متوسط الدقة (mAP) وسرعة الاستدلال على أجهزة CPU و GPU.

النموذجالحجم
(بالبكسل)
mAPval
50-95
السرعة
وحدة المعالجة المركزية CPU ONNX
(بالمللي ثانية)
السرعة
T4 TensorRT10
(بالمللي ثانية)
المعلمات
(M)
FLOPs
(B)
YOLO11n64039.556.11.52.66.5
YOLO11s64047.090.02.59.421.5
YOLO11m64051.5183.24.720.168.0
YOLO11l64053.4238.66.225.386.9
YOLO11x64054.7462.811.356.9194.9
DAMO-YOLOt64042.0-2.328.518.1
DAMO-YOLOs64046.0-3.4516.337.8
DAMO-YOLOm64049.2-5.0928.261.8
DAMO-YOLOl64050.8-7.1842.197.3

تحليل النتائج

  1. هيمنة الكفاءة: يُظهر YOLO11 كفاءة فائقة في المعلمات. على سبيل المثال، يحقق نموذج YOLO11m 51.5 mAP مع 20.1 مليون معلمة فقط، في حين أن DAMO-YOLOm المماثل يتخلف عن الركب عند 49.2 mAP مع مساحة أكبر تبلغ 28.2 مليون معلمة.
  2. الدقة القصوى: يصل أكبر متغير، YOLO11x، إلى 54.7 mAP ملحوظ، متجاوزًا أكبر نموذج DAMO-YOLO مدرج. هذا يجعل YOLO11 الخيار المفضل للمهام عالية الدقة مثل التصوير الطبي أو الكشف عن العيوب.
  3. النشر على الحافة: نموذج YOLO11n (Nano) خفيف الوزن بشكل استثنائي (2.6 مليون معلمة) وسريع (1.5 مللي ثانية على T4)، مما يجعله مثاليًا للأنظمة المدمجة حيث الذاكرة نادرة. في المقابل، فإن أصغر نموذج DAMO-YOLO أثقل بكثير (8.5 مليون معلمة).
  4. أداء وحدة المعالجة المركزية (CPU Performance): توفر Ultralytics معايير شفافة لوحدة المعالجة المركزية (CPU)، مما يسلط الضوء على صلاحية YOLO11 لعمليات النشر بدون مسرّعات مخصصة. لا يبلغ DAMO-YOLO رسميًا عن سرعات وحدة المعالجة المركزية (CPU)، مما يحد من تقييمه لتطبيقات إنترنت الأشياء منخفضة الطاقة.

نظرة فاحصة فنية

التدريب والهندسة المعمارية

يعتمد DAMO-YOLO بشكل كبير على البحث عن البنية العصبية (NAS) لتحديد هيكله الأساسي. في حين أن هذا يمكن أن ينتج هياكل مثالية من الناحية النظرية، إلا أنه غالبًا ما يؤدي إلى كتل غير منتظمة قد لا تكون صديقة للأجهزة عبر جميع الأجهزة. في المقابل، تستخدم YOLO11 كتلًا يدوية الصنع ومُحسَّنة (C3k2، C2PSA) مصممة بشكل حدسي لتسريع وحدة معالجة الرسومات GPU ووحدة المعالجة المركزية CPU القياسية.

يؤكد YOLO11 أيضًا على كفاءة التدريب. يتقارب بسرعة بفضل المعلمات الفائقة المحسّنة واستراتيجيات زيادة البيانات. متطلبات الذاكرة أثناء التدريب أقل عمومًا من البنى المعقدة القائمة على المحولات أو القائمة على NAS، مما يسمح للباحثين بتدريب نماذج فعالة على أجهزة من الدرجة الاستهلاكية.

النظام الإيكولوجي وسهولة الاستخدام

أحد أهم العوامل المميزة هو النظام البيئي. DAMO-YOLO هو في الأساس مستودع تعليمات برمجية لإعادة إنتاج نتائج ورقة بحثية.

ومع ذلك، فإن Ultralytics YOLO11 عبارة عن منصة خدمة كاملة:

  • الوثائق: أدلة شاملة حول كل جانب من جوانب خط سير العمل.
  • عمليات التكامل: دعم أصيل لـ MLFlow و TensorBoard و Weights & Biases لتتبع التجارب.
  • المجتمع: مجتمع ضخم ونشط على GitHub و Discord يضمن إصلاح الأخطاء بسرعة والإجابة على الأسئلة.
from ultralytics import YOLO

# Load a pre-trained YOLO11 model
model = YOLO("yolo11n.pt")

# Train on a custom dataset
model.train(data="coco8.yaml", epochs=100, imgsz=640)

# Run inference on an image
results = model("https://ultralytics.com/images/bus.jpg")

# Export to ONNX for deployment
path = model.export(format="onnx")

توصيات حالات الاستخدام

متى تختار Ultralytics YOLO11

  • النشر في العالم الحقيقي: إذا كنت بحاجة إلى النشر على أجهزة متنوعة (iOS، Android، Edge TPU، Jetson)، فإن إمكانات تصدير YOLO11 لا مثيل لها.
  • خطوط رؤية معقدة: عندما يتطلب مشروعك أكثر من مجرد مربعات إحاطة - مثل تتبع الكائنات أو تقدير وضعية الجسم - فإن YOLO11 يتعامل مع هذه الأمور أصلاً.
  • النماذج الأولية السريعة: تتيح سهولة الاستخدام للمطورين الانتقال من البيانات إلى عرض توضيحي عملي في دقائق.
  • قيود الموارد: توفر النماذج Nano و Small أفضل نسبة دقة إلى حجم للأجهزة التي تعمل بالبطاريات.

متى يجب التفكير في DAMO-YOLO

  • البحث الأكاديمي: قد يجد الباحثون الذين يدرسون فعالية NAS في الكشف عن الكائنات أو تقنيات إعادة المعلمات أن DAMO-YOLO هو خط أساس قيم.
  • إعدادات GPU محددة: في السيناريوهات التي تتوافق فيها الكتل المعمارية المحددة لـ DAMO-YOLO تمامًا مع التسلسل الهرمي لذاكرة التخزين المؤقت للمسرّع المستهدف، فقد توفر إنتاجية تنافسية.

الخلاصة

في حين أن DAMO-YOLO يقدم مفاهيم أكاديمية رائعة مثل MAE-NAS و RepGFPN، إلا أن Ultralytics YOLO11 يظل الخيار الأفضل للغالبية العظمى من المطورين والمؤسسات. إن جمعه بين الدقة الحديثة والبنية خفيفة الوزن والنظام البيئي المزدهر يضمن أن المشاريع ليست فقط عالية الأداء ولكن أيضاً قابلة للصيانة وقابلة للتطوير.

بالنسبة للمطورين الباحثين عن حل رؤية حاسوبية موثوق ومتعدد الاستخدامات وعالي الأداء، يوفر YOLO11 الأدوات والمقاييس اللازمة لتحقيق النجاح في عام 2025 وما بعده.

استكشف مقارنات النماذج الأخرى

لفهم مشهد نماذج الكشف عن الكائنات بشكل أكبر، استكشف هذه المقارنات ذات الصلة:


تعليقات