تخطي إلى المحتوى

YOLO11 مقارنة بـ DAMO-YOLO: مقارنة فنية

تقدم هذه الصفحة مقارنة فنية مفصلة بين نموذجين من أحدث طراز في اكتشاف الكائنات: Ultralytics YOLO11 و DAMO-YOLO. سنقوم بتحليل الاختلافات المعمارية ومقاييس الأداء والتطبيقات المثالية لمساعدتك في اتخاذ قرار مستنير لمشاريع رؤية الكمبيوتر الخاصة بك. في حين أن كلا النموذجين مصمم لاكتشاف الكائنات عالي الأداء، إلا أنهما يستخدمان أساليب متميزة ويظهران نقاط قوة مختلفة، حيث يقدم YOLO11 تنوعًا فائقًا ونظامًا بيئيًا أكثر قوة للنشر في العالم الحقيقي.

Ultralytics YOLO11

المؤلفون: جلين جوتشر، جينغ تشيو
المنظمة: Ultralytics
التاريخ: 2024-09-27
GitHub: https://github.com/ultralytics/ultralytics
المستندات: https://docs.ultralytics.com/models/yolo11/

يعد Ultralytics YOLO11 أحدث تقدم في سلسلة YOLO (أنت تنظر مرة واحدة فقط) الشهيرة، والمشهورة بقدراتها السريعة والفعالة في الكشف عن الكائنات. يعزز YOLO11 تكرارات YOLO السابقة بتحسينات معمارية تهدف إلى تعزيز كل من الدقة والسرعة. يحتفظ بطريقة الكشف من مرحلة واحدة، ومعالجة الصور في تمريرة واحدة للحصول على أداء في الوقت الفعلي.

تتمثل إحدى المزايا الرئيسية لـ YOLO11 في تنوعها. على عكس DAMO-YOLO، الذي يركز بشكل أساسي على الكشف، فإن YOLO11 هو إطار عمل متعدد المهام يدعم اكتشاف الكائنات، و تجزئة المثيلات، و تصنيف الصور، و تقدير الوضعية. هذا يجعله حلاً شاملاً لخطوط أنابيب رؤية الكمبيوتر المعقدة.

البنية والميزات الرئيسية

يركز YOLO11 على تحقيق التوازن بين حجم النموذج والدقة من خلال التحسينات المعمارية. وتشمل هذه التحسينات طبقات استخلاص ميزات مُحسَّنة لالتقاط ميزات أكثر ثراءً وشبكة مبسطة لخفض التكاليف الحسابية، مما يؤدي إلى نماذج أسرع وأكثر كفاءة في استخدام المعلمات. يسمح تصميمه القابل للتكيف بالنشر على مجموعة واسعة من الأجهزة، من الأجهزة الطرفية مثل NVIDIA Jetson إلى الخوادم السحابية القوية.

الأهم من ذلك، يستفيد YOLO11 بشكل كبير من نظام Ultralytics البيئي الذي تتم صيانته جيدًا. يوفر هذا ميزة كبيرة للمطورين والباحثين:

  • سهولة الاستخدام: واجهة Python API بسيطة، و CLI واضح، و وثائق شاملة تجعل البدء أمرًا سهلاً.
  • سير عمل متكامل: التكامل السلس مع Ultralytics HUB يبسط إدارة البيانات والتدريب والنشر، مما يبسط دورة حياة MLOps بأكملها.
  • كفاءة التدريب: عمليات تدريب فعالة، وأوزان مُدرَّبة مسبقًا متاحة بسهولة على مجموعات بيانات مثل COCO، ومتطلبات ذاكرة أقل عادةً مقارنة بالهياكل المعقدة الأخرى.
  • تطوير نشط: تحديثات متكررة، ودعم مجتمعي قوي عبر GitHub و Discord، والعديد من عمليات التكامل مع أدوات مثل TensorRT و OpenVINO.

تعرف على المزيد حول YOLO11

DAMO-YOLO

المؤلفون: شيانزه شو، يي تشي جيانغ، ويهوا تشن، ييلون هوانغ، يوان تشانغ، وشيو يو صن
المنظمة: مجموعة علي بابا
التاريخ: 2022-11-23
Arxiv: https://arxiv.org/abs/2211.15444v2
GitHub: https://github.com/tinyvision/DAMO-YOLO
المستندات: https://github.com/tinyvision/DAMO-YOLO/blob/master/README.md

DAMO-YOLO هو نموذج للكشف عن الأجسام تم تطويره بواسطة مجموعة علي بابا، ويقدم العديد من التقنيات المبتكرة لتحقيق توازن قوي بين السرعة والدقة. وهو جزء من عائلة YOLO ولكنه يتضمن مكونات معمارية فريدة مشتقة من مفاهيم بحثية متقدمة.

البنية والميزات الرئيسية

تم بناء هيكل DAMO-YOLO على العديد من الابتكارات الرئيسية:

  • العمود الفقري MAE-NAS: يستخدم نهج البحث عن بنية عصبية (NAS) للعثور على هيكل أساسي مثالي، مما يؤدي إلى استخراج ميزات فعال.
  • عنق RepGFPN الفعال: يستخدم شبكة هرم الميزات المعممة مع إعادة التهيئة لتعزيز دمج الميزات عبر مقاييس مختلفة بشكل فعال.
  • ZeroHead: يستخدم النموذج رأسًا مفصولًا وخفيف الوزن يفصل بين مهام التصنيف والانحدار بأقل قدر من النفقات.
  • تعيين تسميات AlignedOTA: يقدم استراتيجية محسّنة لتعيين التسميات لتحسين مواءمة أهداف التصنيف والانحدار أثناء التدريب، ممّا يساعد على تعزيز الدقة.

في حين أن هذه الميزات تجعل DAMO-YOLO كاشفًا قويًا، إلا أن تركيزه الأساسي لا يزال على الكشف عن الكائنات. فهو يفتقر إلى الدعم المدمج لمهام الرؤية الأخرى مثل التجزئة أو تقدير الوضع الذي يوفره YOLO11. علاوة على ذلك، فإن نظامه البيئي أقل شمولاً، مع عدد أقل من البرامج التعليمية الرسمية وعمليات التكامل ومجتمع أصغر مقارنة بـ Ultralytics YOLO.

تعرف على المزيد حول DAMO-YOLO

الأداء والمعايير: نظرة وجهاً لوجه

يكشف أداء كلا النموذجين على مجموعة بيانات COCO val2017 عن اختلافات رئيسية. تُظهر YOLO11 باستمرار دقة فائقة عبر أحجام النماذج القابلة للمقارنة.

النموذج الحجم
(بالبكسل)
mAPval
50-95
السرعة
وحدة المعالجة المركزية CPU ONNX
(بالمللي ثانية)
السرعة
T4 TensorRT10
(بالمللي ثانية)
المعلمات
(M)
FLOPs
(B)
YOLO11n 640 39.5 56.1 1.5 2.6 6.5
YOLO11s 640 47.0 90.0 2.5 9.4 21.5
YOLO11m 640 51.5 183.2 4.7 20.1 68.0
YOLO11l 640 53.4 238.6 6.2 25.3 86.9
YOLO11x 640 54.7 462.8 11.3 56.9 194.9
DAMO-YOLOt 640 42.0 - 2.32 8.5 18.1
DAMO-YOLOs 640 46.0 - 3.45 16.3 37.8
DAMO-YOLOm 640 49.2 - 5.09 28.2 61.8
DAMO-YOLOl 640 50.8 - 7.18 42.1 97.3

من الجدول، يمكننا استخلاص عدة استنتاجات:

  • الدقة: تحقق نماذج YOLO11 باستمرار درجات mAP أعلى من نظيراتها DAMO-YOLO. على سبيل المثال، يصل YOLO11m إلى 51.5 mAP، متفوقًا على 49.2 mAP لـ DAMO-YOLOm. يحقق أكبر نموذج، YOLO11x، أحدث طراز 54.7 mAP.
  • الكفاءة: نماذج YOLO11 أكثر كفاءة في استخدام المعلمات. يحقق YOLO11m دقته الفائقة مع 20.1 مليون معلمة فقط، مقارنة بـ 28.2 مليون لـ DAMO-YOLOm.
  • سرعة الاستدلال: YOLO11n هو النموذج الأسرع على كل من وحدة المعالجة المركزية CPU ووحدة معالجة الرسوميات GPU، مما يجعله مثاليًا لسيناريوهات الحوسبة الطرفية المقيدة للغاية. والجدير بالذكر أن Ultralytics توفر معايير شفافة لوحدة المعالجة المركزية CPU، وهو مقياس حاسم للعديد من التطبيقات الواقعية التي تحذفها نتائج DAMO-YOLO الرسمية.

العوامل الرئيسية المميِّزة وحالات الاستخدام

متى تختار Ultralytics YOLO11

تعتبر YOLO11 الخيار الأمثل للمشاريع التي تتطلب:

  • قدرات المهام المتعددة: إذا كان تطبيقك يحتاج إلى أكثر من مجرد الكشف عن الكائنات، مثل تجزئة المثيلات أو تقدير الوضع، فإن YOLO11 يوفر إطارًا موحدًا وفعالًا.
  • سهولة الاستخدام والتطوير السريع: تعمل الوثائق الشاملة وواجهة برمجة التطبيقات البسيطة ومنصة Ultralytics HUB المتكاملة على تسريع التطوير والنشر بشكل كبير.
  • مرونة النشر: مع الأداء القوي على كل من CPU و GPU ومجموعة واسعة من أحجام النماذج، يمكن نشر YOLO11 في أي مكان من Raspberry Pi إلى خادم سحابي.
  • دعم وصيانة قويان: يضمن التطوير النشط والمجتمع الكبير بقاء الإطار محدثًا وموثوقًا ومدعومًا جيدًا.

متى يجب التفكير في DAMO-YOLO

يمكن اعتبار DAMO-YOLO في الحالات التالية:

  • البحث الأكاديمي: تجعل مكوناته المعمارية الجديدة مثل RepGFPN و AlignedOTA نموذجًا مثيرًا للاهتمام للباحثين الذين يستكشفون تقنيات جديدة للكشف عن الكائنات.
  • عمليات النشر الخاصة بوحدة معالجة الرسوميات (GPU): بالنسبة للتطبيقات المضمون تشغيلها على وحدات معالجة الرسوميات وتتطلب فقط اكتشاف الكائنات، يوفر DAMO-YOLO سرعات استدلال تنافسية.

الخلاصة

في حين أن DAMO-YOLO يقدم ابتكارات أكاديمية مثيرة للاهتمام للكشف عن الأجسام، تبرز Ultralytics YOLO11 باعتبارها الخيار الأفضل للغالبية العظمى من التطبيقات الواقعية. دقتها العالية وتوازن الأداء الأفضل وتعدد استخداماتها التي لا مثيل لها تجعلها أداة أكثر قوة وعملية.

لا تكمن الميزة الرئيسية لـ YOLO11 في أدائها المتطور فحسب، بل في النظام البيئي القوي وسهل الاستخدام والمدار بشكل جيد الذي يحيط بها. يمكّن هذا المزيج المطورين والباحثين من بناء ونشر حلول رؤية حاسوبية متقدمة بشكل أسرع وأكثر فعالية. بالنسبة للمشاريع التي تتطلب الموثوقية وقابلية التوسع ومجموعة شاملة من الميزات، فإن YOLO11 هو الفائز الواضح.

استكشف مقارنات النماذج الأخرى

إذا كنت مهتمًا بمعرفة كيف تقارن هذه النماذج بغيرها، فراجع صفحات المقارنة الأخرى الخاصة بنا:



📅 تم إنشاؤه منذ سنة واحدة ✏️ تم التحديث منذ شهر واحد

تعليقات