DAMO-YOLO مقابل YOLO11: مقارنة فنية

في المشهد المتطور بسرعة لـ رؤية الكمبيوتر، يعد اختيار نموذج الكشف عن الكائنات المناسب أمرًا بالغ الأهمية لنجاح التطبيق. تحلل هذه المقارنة الشاملة معماريتين مهمتين: DAMO-YOLO، الذي طورته مجموعة Alibaba، وUltralytics YOLO11، أحدث نموذج متطور من Ultralytics. بينما يهدف كلا النموذجين إلى تحسين التوازن بين السرعة والدقة، إلا أنهما يخدمان أغراضًا أساسية مختلفة ويقدمان مزايا متميزة اعتمادًا على سيناريو النشر.

يقدم هذا الدليل نظرة متعمقة على بنياتها ومقاييس الأداء وحالات الاستخدام المثالية لمساعدة المطورين والباحثين على اتخاذ قرارات مستنيرة.

DAMO-YOLO

المؤلفون: شيانزه شو، يي تشي جيانغ، وي هوا تشن، يي لون هوانغ، يوان تشانغ، و شيو يو صن
المنظمة:مجموعة علي بابا
التاريخ: 2022-11-23
Arxiv:https://arxiv.org/abs/2211.15444v2
GitHub:https://github.com/tinyvision/DAMO-YOLO
المستندات:https://github.com/tinyvision/DAMO-YOLO/blob/master/README.md

DAMO-YOLO هو إطار عمل للكشف عن الأجسام يدمج العديد من التقنيات المتطورة لتحقيق أداء عالٍ. يركز على تقليل زمن الوصول مع الحفاظ على دقة تنافسية من خلال سلسلة من الابتكارات المعمارية التي تقودها أبحاث Alibaba.

تعرف على المزيد حول DAMO-YOLO

الهيكلة والابتكار

تقدم DAMO-YOLO نهج "التقطير والاختيار" وتتضمن المكونات الرئيسية التالية:

العمود الفقري MAE-NAS: باستخدام البحث عن بنية عصبية (NAS)، يتم تحسين العمود الفقري وفقًا لقيود محددة لضمان استخلاص الميزات بكفاءة.
RepGFPN فعال: شبكة هرم ميزات معممة (GFPN) تستخدم بكثافة آليات إعادة التهيئة لتحسين دمج الميزات عبر مقاييس مختلفة دون تكبد تكاليف حسابية باهظة أثناء الاستدلال.
ZeroHead: يفصل رأس الاكتشاف خفيف الوزن هذا بين مهام التصنيف والانحدار، بهدف زيادة سرعة الاستدلال.
AlignedOTA: إستراتيجية لإسناد الملصقات تحل عدم التوافق بين أهداف التصنيف والانحدار، مما يعزز التقارب أثناء التدريب.

في حين أن DAMO-YOLO يقدم تطورات نظرية رائعة، إلا أنه في الأساس إطار عمل موجه نحو البحث يركز على object detection. عادةً ما يفتقر إلى دعم المهام المتعددة الأصلي الموجود في الأنظمة البيئية الأكثر شمولاً.

Ultralytics YOLO11

المؤلفون: جلين جوتشر، جينغ تشيو
المنظمة:Ultralytics
التاريخ: 2024-09-27
GitHub:https://github.com/ultralytics/ultralytics
المستندات:https://docs.ultralytics.com/models/yolo11/

يمثل Ultralytics YOLO11 قمة رؤية الكمبيوتر في الوقت الفعلي، حيث يعمل على تحسين إرث سلسلة YOLO مع تحسينات كبيرة في الهندسة المعمارية والكفاءة وسهولة الاستخدام. إنه مصمم ليس فقط كنموذج، ولكن كأداة متعددة الاستخدامات للنشر العملي والواقعي عبر بيئات الأجهزة المتنوعة.

تعرف على المزيد حول YOLO11

الهندسة المعمارية والنظام البيئي

يعتمد YOLO11 على النجاحات السابقة من خلال بنية محسنة خالية من المرساة. يتميز بعمود فقري محسّن لاستخراج ميزات فائقة وتصميم عنق مُعدَّل يعزز تدفق المعلومات بمقاييس مختلفة.

تشمل المزايا الرئيسية لإطار عمل Ultralytics YOLO11 ما يلي:

تنوع الاستخدامات: على عكس العديد من المنافسين، يدعم YOLO11 أصليًا مجموعة واسعة من المهام بما في ذلك الكشف عن الكائنات، و تقسيم المثيلات، و تقدير الوضعية، و تصنيف الصور، و الصناديق المحيطة الموجهة (OBB).
سهولة الاستخدام: تم تغليف النموذج في Python API سهل الاستخدام و CLI، مما يجعله في متناول المبتدئين والخبراء على حد سواء.
كفاءة التدريب: YOLO11 مُحسَّن للتقارب بشكل أسرع، ويستخدم زيادة البيانات الفعالة ووظائف الخسارة، مما يسمح للمستخدمين بتدريب نماذج مخصصة على مجموعات بيانات مثل COCO مع تقليل النفقات العامة للموارد.
نظام بيئي مُدار بشكل جيد: بدعم من فريق Ultralytics، يستفيد المستخدمون من التحديثات المتكررة والوثائق الشاملة والتكامل السلس مع أدوات MLOps مثل Ultralytics HUB.

هل تعلم؟

تم تصميم YOLO11 ليكون عالي الكفاءة على أجهزة Edge AI. تضمن بنيته المحسّنة استخدامًا منخفضًا للذاكرة وسرعات استدلال عالية على أجهزة مثل NVIDIA Jetson و Raspberry Pi، مما يجعله خيارًا متفوقًا للتطبيقات المضمنة مقارنة بالنماذج الأثقل القائمة على المحولات.

مقارنة الأداء

يوضح الرسم البياني والجدول التاليان اختلافات الأداء بين DAMO-YOLO و YOLO11. يُظهر Ultralytics YOLO11 باستمرار دقة فائقة (mAP) وسرعات استدلال مواتية، خاصةً على أجهزة CPU حيث يفتقر DAMO-YOLO إلى معايير رسمية.

النموذج	الحجم ^{(بالبكسل)}	mAP^val 50-95	السرعة ^{وحدة المعالجة المركزية CPU ONNX (بالمللي ثانية)}	السرعة ^{T4 TensorRT10 (بالمللي ثانية)}	المعلمات ^(M)	FLOPs ^(B)
DAMO-YOLOt	640	42.0	-	2.32	8.5	18.1
DAMO-YOLOs	640	46.0	-	3.45	16.3	37.8
DAMO-YOLOm	640	49.2	-	5.09	28.2	61.8
DAMO-YOLOl	640	50.8	-	7.18	42.1	97.3

YOLO11n	640	39.5	56.1	1.5	2.6	6.5
YOLO11s	640	47.0	90.0	2.5	9.4	21.5
YOLO11m	640	51.5	183.2	4.7	20.1	68.0
YOLO11l	640	53.4	238.6	6.2	25.3	86.9
YOLO11x	640	54.7	462.8	11.3	56.9	194.9

تحليل النتائج

الدقة: يتفوق YOLO11 بشكل كبير على نماذج DAMO-YOLO المماثلة. على سبيل المثال، يحقق YOLO11m قيمة 51.5 mAP، وهي أعلى بشكل ملحوظ من DAMO-YOLOm عند 49.2 mAP، على الرغم من وجود عدد أقل من المعلمات (20.1 مليون مقابل 28.2 مليون).
سرعة الاستدلال: على وحدة معالجة الرسوميات (T4 TensorRT)، يوفر YOLO11 زمن انتقال تنافسي للغاية. YOLO11n سريع بشكل لا يصدق حيث يبلغ 1.5 مللي ثانية، مما يجعله مناسبًا للتطبيقات ذات زمن الانتقال المنخفض للغاية.
أداء وحدة المعالجة المركزية (CPU Performance): إحدى المزايا الرئيسية لنماذج Ultralytics هي شفافيتها فيما يتعلق بأداء وحدة المعالجة المركزية (CPU). تم تحسين YOLO11 للاستدلال على وحدة المعالجة المركزية (CPU) عبر ONNX و OpenVINO، في حين أن DAMO-YOLO يركز بشكل كبير على وحدة معالجة الرسومات (GPU)، وغالبًا ما يترك أداء نشر وحدة المعالجة المركزية (CPU) غير محدد.
كفاءة النموذج: يُظهر YOLO11 توازنًا أفضل بين المعلمات والأداء. تسمح الكفاءة المعمارية بملفات نموذج أصغر، مما يترجم إلى تنزيلات أسرع ومتطلبات تخزين أقل على الأجهزة الطرفية.

العوامل الرئيسية المميِّزة وحالات الاستخدام

نقاط قوة Ultralytics YOLO11

يحصل المطورون الذين يستخدمون Ultralytics YOLO11 على إمكانية الوصول إلى بيئة قوية من الدرجة الإنتاجية.

موازنة الأداء: تم ضبط بنية النموذج بدقة لتقديم أفضل توازن بين سرعة الاستدلال والدقة، وهو أمر بالغ الأهمية لتحليلات الفيديو في الوقت الفعلي.
إمكانيات متعددة المهام: إذا توسع نطاق مشروعك من الـ detect إلى track أو التقسيم segment، فإن YOLO11 يتعامل مع هذا بسلاسة داخل نفس قاعدة التعليمات البرمجية.
سهولة الاستخدام: في ultralytics الحزمة تبسط خط الأنابيب بأكمله. يمكن تحميل نموذج وتشغيل التنبؤات والتصدير إلى تنسيقات مثل CoreML أو TFLite أو TensorRT ببضعة أسطر فقط من التعليمات البرمجية.
متطلبات ذاكرة أقل: بالمقارنة مع الكاشفات القائمة على المحولات أو البنى غير المحسّنة، يتطلب YOLO11 عادةً ذاكرة CUDA أقل أثناء التدريب، مما يمكّن الباحثين من التدريب على وحدات معالجة الرسوميات (GPUs) من الدرجة الاستهلاكية.

from ultralytics import YOLO

# Load a pretrained YOLO11 model
model = YOLO("yolo11n.pt")

# Train on a custom dataset
model.train(data="coco8.yaml", epochs=50, imgsz=640)

# Run inference on an image
results = model("path/to/image.jpg")

نقاط قوة DAMO-YOLO

DAMO-YOLO منافس قوي في الأوساط البحثية الأكاديمية.

الابتكار البحثي: توفر ميزات مثل MAE-NAS و ZeroHead رؤى مثيرة للاهتمام في البحث عن الهندسة المعمارية العصبية وفصل الرأس.
إنتاجية وحدة معالجة الرسوميات (GPU): بالنسبة للتطبيقات الصناعية المحددة التي تعمل حصريًا على وحدات معالجة الرسوميات (GPU) المدعومة، يوفر DAMO-YOLO إنتاجية عالية، على الرغم من أنه غالبًا ما يتخلف عن YOLO11 في كفاءة الدقة لكل معلمة.

الخلاصة

في حين أن DAMO-YOLO يقدم مفاهيم جديدة من فريق أبحاث Alibaba، فإن Ultralytics YOLO11 يبرز كخيار أفضل للغالبية العظمى من المطورين والشركات. لا يتم تعريف هيمنتها فقط من خلال درجات mAP الأعلى والاستدلال الأسرع، ولكن من خلال النظام البيئي الشامل الذي يدعمها.

من سهولة الاستخدام و التنوع إلى قاعدة التعليمات البرمجية التي تتم صيانتها جيدًا ودعم المجتمع النشط، يقلل YOLO11 من حاجز الدخول لإنشاء حلول ذكاء اصطناعي متقدمة. سواء تم النشر على خوادم سحابية أو أجهزة طرفية محدودة الموارد، فإن YOLO11 يوفر الموثوقية والأداء اللازمين لتطبيقات رؤية الكمبيوتر الحديثة.

استكشف مقارنات النماذج الأخرى

لفهم أفضل لكيفية مقارنة نماذج Ultralytics بال architectures الأخرى، استكشف صفحات المقارنة التفصيلية الخاصة بنا: