تخطي إلى المحتوى

YOLOv8 مقابل DAMO-YOLO: مقارنة فنية

يتضمن اختيار نموذج الكشف عن الأجسام الصحيح مفاضلة بين الدقة والسرعة وسهولة الاستخدام. تقدم هذه الصفحة مقارنة فنية مفصلة بين نموذجين قويين: Ultralytics YOLOv8، وهو نموذج حديث من Ultralytics، و DAMO-YOLO، وهو نموذج عالي الأداء من مجموعة Alibaba. في حين أن كلا النموذجين يقدمان أداءً ممتازًا، إلا أنهما مبنيان على فلسفات تصميم مختلفة ويلبيان احتياجات تطوير متميزة. سوف نستكشف هياكلهما ومقاييس الأداء وحالات الاستخدام المثالية لمساعدتك في اتخاذ قرار مستنير.

Ultralytics YOLOv8

المؤلفون: جلين جوتشر، أيوش شوراسيا، و جينغ تشيو
المنظمة: Ultralytics
التاريخ: 2023-01-10
GitHub: https://github.com/ultralytics/ultralytics
المستندات: https://docs.ultralytics.com/models/yolov8/

إن Ultralytics YOLOv8 هو نموذج متطور وحديث يعتمد على نجاح إصدارات YOLO السابقة. وهو مصمم ليكون سريعًا ودقيقًا وسهل الاستخدام، مما يجعله خيارًا مثاليًا لمجموعة واسعة من مهام الكشف عن الأجسام والذكاء الاصطناعي البصري. YOLOv8 ليس مجرد نموذج ولكنه إطار عمل شامل يدعم دورة الحياة الكاملة لتطوير نموذج الذكاء الاصطناعي، بدءًا من التدريب والتحقق من الصحة وحتى النشر في التطبيقات الواقعية.

الميزات ونقاط القوة الرئيسية

  • هندسة معمارية متقدمة: يقدم YOLOv8 تصميم رأس غير مرتبط وخالي من نقاط الارتكاز، مما يحسن الدقة ويسرع المعالجة اللاحقة عن طريق إلغاء الحاجة إلى تثبيط غير الأقصى (NMS) في بعض الحالات. يستخدم هيكل CSPDarknet محسّن ووحدة C2f جديدة لتحسين دمج الميزات.

  • تنوع استثنائي: إحدى الميزات الرئيسية في YOLOv8 هي دعمه الأصلي لمهام رؤية متعددة ضمن إطار عمل موحد واحد. يعالج بسلاسة اكتشاف الكائنات، و تقسيم المثيلات، و تصنيف الصور، و تقدير الوضعية، واكتشاف الكائنات الموجهة (OBB). هذا التنوع يجعله حلاً شاملاً لمشاريع رؤية الكمبيوتر المعقدة.

  • سهولة الاستخدام: تعطي Ultralytics الأولوية لتجربة المطور. يأتي YOLOv8 مع Python API بسيط وسهل الاستخدام و CLI قوي، مدعومًا بـ توثيق ودروس تعليمية شاملة. وهذا يجعل من السهل للغاية على المبتدئين والخبراء تدريب النماذج والتحقق منها ونشرها.

  • نظام بيئي مُدار بشكل جيد: يعتبر YOLOv8 جزءًا من نظام بيئي مفتوح المصدر مزدهر مع تطوير نشط وتحديثات متكررة ودعم مجتمعي قوي. يتكامل مع أدوات مثل Ultralytics HUB للتدريب والنشر بدون تعليمات برمجية، والعديد من منصات MLOps مثل Weights & Biases و Comet.

  • الأداء والكفاءة: يوفر YOLOv8 توازنًا ممتازًا بين السرعة والدقة عبر مجموعة من أحجام النماذج (من Nano إلى Extra-Large). وهو مُحسَّن للغاية لكل من الاستدلال على CPU و GPU، مما يضمن النشر الفعال على أجهزة متنوعة، من الأجهزة الطرفية إلى الخوادم السحابية. علاوة على ذلك، فهو مصمم لكفاءة الذاكرة، ويتطلب ذاكرة CUDA أقل للتدريب مقارنة بالعديد من البنى الأخرى.

نقاط الضعف

  • باعتباره كاشفًا أحادي المرحلة، قد يواجه تحديات في اكتشاف الأجسام الصغيرة للغاية أو المحجوبة بشدة مقارنةً ببعض الكواشف ثنائية المرحلة المتخصصة، على الرغم من أنه يعمل بشكل جيد للغاية في معظم السيناريوهات ذات الأغراض العامة.

تعرف على المزيد حول YOLOv8

DAMO-YOLO

المؤلفون: شيانزه شو، يي تشي جيانغ، ويهوا تشن، ييلون هوانغ، يوان تشانغ، وشيو يو صن
المنظمة: مجموعة علي بابا
التاريخ: 2022-11-23
Arxiv: https://arxiv.org/abs/2211.15444v2
GitHub: https://github.com/tinyvision/DAMO-YOLO

DAMO-YOLO هو نموذج سريع ودقيق للكشف عن الأجسام تم تطويره بواسطة مجموعة علي بابا. يقدم العديد من التقنيات المبتكرة لتوسيع أداء كاشفات بنمط YOLO. يرمز الاسم "DAMO" إلى "الاكتشاف والمغامرة والزخم والتوقعات"، مما يعكس الطبيعة القائمة على البحث للمشروع.

الميزات ونقاط القوة الرئيسية

  • البحث في الهندسة العصبية (NAS): يستفيد DAMO-YOLO من NAS للعثور على بنية عمود فقري مثالية (MAE-NAS)، مما يساعد في تحقيق مقايضة أفضل بين الدقة وزمن الوصول.
  • تصميم رقبة متقدم: يتضمن رقبة RepGFPN (شبكة هرم الميزات المعممة) فعالة، وهي مصممة لتحسين دمج الميزات من مستويات مختلفة من الهيكل الأساسي.
  • ZeroHead: يقترح DAMO-YOLO نهج "ZeroHead"، الذي يستخدم رأسًا مقترنًا وخفيف الوزن لتقليل النفقات الحسابية مع الحفاظ على الأداء العالي.
  • تعيين تسميات AlignedOTA: يستخدم استراتيجية ديناميكية لتعيين التسميات تسمى AlignedOTA، ممّا يساعد النموذج على التعلّم بشكل أفضل من خلال مواءمة مهام التصنيف والانحدار أثناء التدريب.
  • أداء عالي لوحدة معالجة الرسوميات GPU: تم تحسين النموذج بشكل كبير للاستدلال على وحدة معالجة الرسوميات GPU، مما يوفر زمن انتقال منخفض للغاية على الأجهزة المتطورة، كما هو موضح في المعايير الرسمية الخاصة به.

نقاط الضعف

  • التعقيد: إن استخدام التقنيات المتقدمة مثل NAS والوحدات المخصصة (RepGFPN، ZeroHead) يجعل التصميم المعماري أكثر تعقيدًا وأقل سهولة للمطورين الذين يحتاجون إلى تخصيص أو فهم الأعمال الداخلية للنموذج.
  • تعددية المهام محدودة: تم تصميم DAMO-YOLO بشكل أساسي لاكتشاف الكائنات. ويفتقر إلى الدعم المدمج ومتعدد المهام للتجزئة والتصنيف وتقدير الوضع وهو أمر قياسي في إطار عمل Ultralytics YOLOv8.
  • النظام البيئي والدعم: على الرغم من أنه مشروع مفتوح المصدر، إلا أن نظامه البيئي ليس شاملاً أو يتم صيانته جيدًا مثل نظام Ultralytics. يمكن أن تكون الوثائق متفرقة، والدعم المجتمعي أقل شمولاً، مما يجعل من الصعب على المطورين التبني واستكشاف الأخطاء وإصلاحها.
  • أداء وحدة المعالجة المركزية (CPU): تم تحسين النموذج بشكل كبير لوحدة معالجة الرسوميات (GPU). المعلومات والمعايير المتعلقة بأداء وحدة المعالجة المركزية أقل توفرًا، مما قد يمثل قيدًا على عمليات النشر على أجهزة غير GPU.

تعرف على المزيد حول DAMO-YOLO

تحليل الأداء: YOLOv8 مقابل DAMO-YOLO

عند مقارنة الأداء، من الضروري النظر إلى كل من الدقة (mAP) وسرعة الاستدلال عبر الأجهزة المختلفة.

النموذج الحجم
(بالبكسل)
mAPval
50-95
السرعة
وحدة المعالجة المركزية CPU ONNX
(بالمللي ثانية)
السرعة
T4 TensorRT10
(بالمللي ثانية)
المعلمات
(M)
FLOPs
(B)
YOLOv8n 640 37.3 80.4 1.47 3.2 8.7
YOLOv8s 640 44.9 128.4 2.66 11.2 28.6
YOLOv8m 640 50.2 234.7 5.86 25.9 78.9
YOLOv8l 640 52.9 375.2 9.06 43.7 165.2
YOLOv8x 640 53.9 479.1 14.37 68.2 257.8
DAMO-YOLOt 640 42.0 - 2.32 8.5 18.1
DAMO-YOLOs 640 46.0 - 3.45 16.3 37.8
DAMO-YOLOm 640 49.2 - 5.09 28.2 61.8
DAMO-YOLOl 640 50.8 - 7.18 42.1 97.3

من الجدول، يمكننا استخلاص عدة استنتاجات:

  • الدقة: تتفوق نماذج YOLOv8 باستمرار على نظيراتها DAMO-YOLO على نطاقات مماثلة. على سبيل المثال، يحقق YOLOv8m قيمة 50.2 mAP، متجاوزًا 49.2 mAP لـ DAMO-YOLOm. تعمل نماذج YOLOv8l و YOLOv8x الأكبر حجمًا على توسيع هذه الصدارة بشكل كبير.
  • السرعة: في حين أن DAMO-YOLO يُظهر سرعات تنافسية جدًا لوحدة معالجة الرسوميات GPU، فإن YOLOv8n هو النموذج الأسرع على وحدة معالجة الرسوميات GPU بشكل عام. والأهم من ذلك، أن Ultralytics توفر معايير CPU شفافة، وهي حيوية للعديد من التطبيقات الواقعية حيث موارد GPU غير متوفرة. يُظهر YOLOv8 أداءً ممتازًا وموثقًا جيدًا على وحدات المعالجة المركزية CPUs.
  • الكفاءة: تقدم نماذج YOLOv8 بشكل عام توازنًا أفضل بين المعلمات وعمليات الفاصلة العائمة في الثانية (FLOPs) لدقتها المحددة. على سبيل المثال، يحقق YOLOv8s قيمة 44.9 mAP مع 11.2 مليون معلمة فقط، بينما يتطلب DAMO-YOLOs عدد 16.3 مليون معلمة للوصول إلى قيمة mAP مماثلة تبلغ 46.0.

الخلاصة

DAMO-YOLO هو نموذج مثير للإعجاب يعرض قوة تقنيات البحث المتقدمة مثل NAS لتحقيق أداء عالٍ على أجهزة GPU. إنه منافس قوي للتطبيقات التي تكون فيها سرعة GPU الخام هي المقياس الأساسي ولديه فريق تطوير يتمتع بالخبرة اللازمة لإدارة بنية أكثر تعقيدًا.

ومع ذلك، بالنسبة للغالبية العظمى من المطورين والباحثين والشركات، Ultralytics YOLOv8 هو الخيار الواضح والأفضل. فهو يوفر حزمة شاملة أفضل: دقة أعلى وأداء ممتاز على كل من CPU و GPU وتعدد استخدامات لا مثيل له مع دعمه متعدد المهام.

إن المزايا الرئيسية لنظام Ultralytics البيئي - بما في ذلك سهولة الاستخدام والوثائق الشاملة ودعم المجتمع النشط والتكامل السلس - تجعل YOLOv8 ليس مجرد نموذج قوي، ولكنه أداة عملية ومنتجة لبناء حلول رؤية حاسوبية قوية وواقعية. سواء كنت مبتدئًا تبدأ مشروعك الأول أو خبيرًا يقوم بنشر أنظمة معقدة، فإن YOLOv8 يوفر مسارًا أكثر موثوقية وكفاءة وسهولة في الاستخدام لتحقيق النجاح.

استكشف نماذج أخرى

إذا كنت مهتمًا بمقارنات النماذج الأخرى، فراجع الصفحات التالية لترى كيف تتم مقارنة YOLOv8 بالبنى الحديثة الأخرى:



📅 تم إنشاؤه منذ سنة واحدة ✏️ تم التحديث منذ شهر واحد

تعليقات