تخطي إلى المحتوى

YOLO11 مقارنة بـ DAMO-YOLO: مقارنة فنية

في مجال الرؤية الحاسوبية سريع التطور، يعد اختيار النموذج الصحيح لاكتشاف الأجسام أمرًا بالغ الأهمية لنجاح المشروع. تقدم هذه الصفحة مقارنة تقنية مفصلة بين Ultralytics YOLO11YOLO وهما بنيتان عاليتا الأداء مصممتان للسرعة والدقة. في حين يقدم YOLO تقنيات مبتكرة من البحوث الأكاديمية، يبرز YOLO11 كحل متعدد الاستخدامات وجاهز للإنتاج مدعوم بنظام بيئي قوي.

ملخص تنفيذي

Ultralytics YOLO11 يمثل أحدث تطور في سلسلة YOLO حيث يعمل على تحسين الاستدلال في الوقت الفعلي عبر أجهزة متنوعة، بدءًا من الأجهزة المتطورة وحتى الخوادم السحابية. وهو يدعم في الأصل مهام متعددة - بما في ذلك الاكتشاف والتجزئة وتقدير الوضعية - مما يجعله حلاً موحداً لخطوط أنابيب الذكاء الاصطناعي المعقدة.

يركز برنامج YOLO الذي طورته مجموعة علي بابا، على تحقيق التوازن بين سرعة الكشف والدقة باستخدام البحث بالبنية العصبية (NAS) وتقنيات دمج الميزات الجديدة. وهو في المقام الأول كاشف موجه للأبحاث ومُحسّن لإنتاجية GPU .

Ultralytics YOLO11

المؤلفون: جلين جوتشر، جينغ تشيو
المنظمة:Ultralytics
التاريخ: 2024-09-27 2024
GitHubultralytics
المستنداتyolo11

يعمل YOLO11 على تحسين أحدث ما توصلت إليه التكنولوجيا من خلال إدخال تحسينات معمارية تعزز استخراج الملامح مع الحفاظ على الكفاءة العالية. وهو يستخدم عمودًا فقريًا معدلًا لشبكة CSPNet ورأسًا متقدمًا خاليًا من المراسي لتقديم دقة فائقة بمعلمات أقل مقارنةً بالأجيال السابقة.

الميزات ونقاط القوة الرئيسية

  • تعدد الاستخدامات: على عكس العديد من النماذج المتخصصة، فإن YOLO11 هو إطار عمل متعدد المهام. فهو يدعم الكشف عن الأجسام، وتجزئة النماذج، وتصنيف الصور، وتقدير الوضع، والصناديق المحدودة الموجهة (OBB).
  • بنية محسنة: تدمج كتل C3k2 ووحدات C2PSA (الجزئي عبر المراحل مع الانتباه المكاني) لالتقاط الأنماط المعقدة بفعالية، وتحسين الأداء على الأجسام الصغيرة والخلفيات الصعبة.
  • دعم واسع للأجهزة: مُحسَّن ل CPUGPU )، مما يوفر مقاييس نماذج متنوعة (من النانو إلى X-Large) لتناسب القيود التي تتراوح من Raspberry Pi إلى مجموعات NVIDIA A100.
  • سهولة الاستخدام: تسمح واجهة برمجة تطبيقات Ultralytics Python API وواجهة برمجة تطبيقاتPython و CLI للمطورين بتدريب النماذج والتحقق من صحتها ونشرها بأقل قدر من التعليمات البرمجية.

النظام البيئي الجاهز للإنتاج

يتكامل YOLO11 بسلاسة مع نظامUltralytics بما في ذلك أدوات إدارة البيانات، والتدريب على النماذج عبر Ultralytics HUB، والتصدير بنقرة واحدة إلى تنسيقات مثل ONNX, TensorRTCoreML.

تعرف على المزيد حول YOLO11

DAMO-YOLO

المؤلفون: شيانزهي شو، وييكي جيانغ، وويهوا تشن، ووي هوا تشن، ويلون هوانغ، ويوان تشانغ، وشيويو صن
المنظمة:مجموعة علي بابا
التاريخ: 2022-11-23
اركسيف:https://arxiv.org/abs/2211.15444v2
جيثب:YOLO

صُمم YOLO مع التركيز على زمن الاستجابة المنخفض والإنتاجية العالية للتطبيقات الصناعية. وهو يقدم العديد من المكونات "التقنية الجديدة" إلى عائلة YOLO لدفع مفاضلات السرعة والدقة إلى أقصى الحدود.

الابتكارات المعمارية

  • العمود الفقري MAE-NAS: يستخدم البحث عن البنية العصبية (NAS) مسترشدًا بمتوسط الخطأ المطلق (MAE) لاكتشاف طوبولوجيا شبكة فعالة تلقائيًا.
  • شبكة هرم السمات المعممة الفعالة: شبكة هرمية معممة للميزات (GFPN) تستخدم إعادة المعرفات، مما يسمح بدمج الميزات المعقدة أثناء التدريب بينما تنهار في بنية أسرع وأبسط أثناء الاستدلال.
  • ZeroHead: رأس كشف خفيف الوزن يفصل بين مهمتي التصنيف والانحدار، مما يقلل بشكل كبير من العبء الحسابي لطبقات الإخراج النهائية.
  • AlignedOTA: استراتيجية محسّنة لتعيين التسميات تعمل على حل مشكلة عدم التوافق بين ثقة التصنيف ودقة الانحدار أثناء التدريب.

في حين أن YOLO يتفوق في مقاييس محددة، إلا أنه مستودع بحثي في المقام الأول. فهو يفتقر إلى التوثيق الشامل، والتحديثات المستمرة، والدعم المجتمعي الواسع الموجود في نظام Ultralytics البيئي.

تعرف على المزيد حول DAMO-YOLO

مقاييس الأداء: وجهاً لوجه

يقارن الجدول التالي أداء YOLO11 YOLO على مجموعة بياناتCOCO val2017. تشمل المقاييس الرئيسية متوسط الدقة المتوسطةmAP) وسرعة الاستدلال على أجهزة CPU GPU .

النموذجالحجم
(بالبكسل)
mAPفال
50-95
السرعة
وحدة المعالجة المركزية CPU ONNX
(بالمللي ثانية)
السرعة
T4 TensorRT10
(بالمللي ثانية)
المعلمات
(M)
FLOPs
(B)
YOLO11n64039.556.11.52.66.5
YOLO11s64047.090.02.59.421.5
YOLO11m64051.5183.24.720.168.0
YOLO11l64053.4238.66.225.386.9
YOLO11x64054.7462.811.356.9194.9
DAMO-YOLOt64042.0-2.328.518.1
DAMO-YOLOs64046.0-3.4516.337.8
DAMO-YOLOm64049.2-5.0928.261.8
DAMO-YOLOl64050.8-7.1842.197.3

تحليل النتائج

  1. هيمنة الكفاءة: يُظهر YOLO11 كفاءة بارامترات متفوقة. على سبيل المثال، يحقق نموذج YOLO11m 51.5 mAP مع 20.1 مليون معلمة فقط، في حين أن نموذج YOLO11m المماثل DAMO-YOLOm متخلف عن ذلك عند 49.2 mAP مع مساحة أكبر تبلغ 28.2 مليون معلمة.
  2. دقة متناهية: يصل أكبر متغير، وهو YOLO11x، إلى دقة ملحوظة تبلغ 54.7 mAP متجاوزًا بذلك أكبر طراز YOLO المدرج في القائمة. وهذا يجعل من YOLO11 الخيار المفضل للمهام عالية الدقة مثل التصوير الطبي أو اكتشاف العيوب.
  3. نشر الحافة: نموذج YOLO11n (Nano) خفيف الوزن بشكل استثنائي (2.6M params) وسريع (1.5 مللي ثانية على T4)، مما يجعله مثاليًا للأنظمة المدمجة حيث تكون الذاكرة نادرة. وعلى النقيض من ذلك، فإن أصغر طراز YOLO أثقل بكثير (8.5M بارامز).
  4. أداءCPU : يوفر Ultralytics معايير شفافة لوحدة CPU المركزية، مما يسلط الضوء على صلاحية YOLO11 لعمليات النشر بدون مسرعات مخصصة. لا يبلغ YOLO رسميًا عن سرعات CPU المركزية، مما يحد من تقييمه لتطبيقات إنترنت الأشياء منخفضة الطاقة.

التعمق التقني

التدريب والهندسة المعمارية

يعتمد نظام YOLO بشكل كبير على البحث عن البنية العصبية (NAS) لتحديد عموده الفقري. في حين أن هذا يمكن أن يؤدي إلى هياكل مثالية من الناحية النظرية، إلا أنه غالبًا ما ينتج عنه كتل غير منتظمة قد لا تكون ملائمة للأجهزة عبر جميع الأجهزة. في المقابل، يستخدم YOLO11 كتلًا مصممة يدويًا ومكررة (C3k2 و C2PSA) مصممة بشكل بديهي لتناسب مع GPU ومكتبات تسريع CPU القياسية.

YOLO11 أيضًا على كفاءة التدريب. فهو يتقارب بسرعة بفضل المعلمات الفائقة المحسّنة واستراتيجيات زيادة البيانات. كما أن متطلبات الذاكرة أثناء التدريب أقل بشكل عام من البنى المعقدة القائمة على المحولات أو البنى القائمة على NAS، مما يسمح للباحثين بتدريب نماذج فعالة على أجهزة من فئة المستهلكين.

النظام البيئي وسهولة الاستخدام

أحد أهم ما يميزه هو النظام البيئي. إن YOLO هو في المقام الأول مستودع أكواد لاستنساخ نتائج الأوراق البحثية.

ومع ذلك، فإن منصة Ultralytics YOLO11 هي منصة متكاملة الخدمات:

  • التوثيق: أدلة شاملة عن كل جانب من جوانب خط الأنابيب.
  • عمليات التكامل: الدعم الأصلي ل MLFlow، و TensorBoard، و Weights & Biases لتتبع التجارب.
  • المجتمع: مجتمع ضخم ونشط على GitHub و Discord يضمن إصلاح الأخطاء بسرعة والإجابة على الأسئلة.
from ultralytics import YOLO

# Load a pre-trained YOLO11 model
model = YOLO("yolo11n.pt")

# Train on a custom dataset
model.train(data="coco8.yaml", epochs=100, imgsz=640)

# Run inference on an image
results = model("https://ultralytics.com/images/bus.jpg")

# Export to ONNX for deployment
path = model.export(format="onnx")

توصيات حالة الاستخدام

متى تختار Ultralytics YOLO11

  • النشر في العالم الحقيقي: إذا كنت بحاجة إلى النشر على أجهزة متنوعة (iOSو Android و Edge TPU و Jetson)، فإن قدرات تصدير YOLO11 لا مثيل لها.
  • خطوط أنابيب الرؤية المعقدة: عندما يتطلب مشروعك ما هو أكثر من مجرد مربعات محددة - مثل تتبع الأجسام أو تقدير وضعية الجسم - فإن يولوYOLO11 يتعامل مع هذه الأمور بشكل أصلي.
  • النماذج الأولية السريعة: تتيح سهولة الاستخدام للمطورين الانتقال من البيانات إلى عرض توضيحي عملي في دقائق.
  • قيود الموارد: يوفر الطرازان النانو والصغير أفضل نسبة دقة إلى الحجم للأجهزة التي تعمل بالبطارية.

متى يجب التفكير في DAMO-YOLO

  • البحث الأكاديمي: قد يجد الباحثون الذين يدرسون فعالية NAS في تقنيات الكشف عن الأجسام أو إعادة تحديد المعالم في YOLO خط أساس قيّم.
  • إعدادات محددة GPU : في السيناريوهات التي تتوافق فيها الكتل المعمارية المحددة لوحدة معالجة الرسومات YOLO بشكل مثالي مع التسلسل الهرمي لذاكرة التخزين المؤقت للمسرّع المستهدف، قد يوفر إنتاجية تنافسية.

الخلاصة

بينما يقدم YOLO مفاهيم أكاديمية مثيرة للإعجاب مثل MAE-NAS و RepGFPN, Ultralytics YOLO11 يظل الخيار الأفضل للغالبية العظمى من المطورين والمؤسسات. ويضمن مزيجها من الدقة المتطورة والبنية خفيفة الوزن والنظام الإيكولوجي المزدهر أن تكون المشاريع ليست فقط قابلة للأداء بل وقابلة للصيانة والتوسع أيضاً.

بالنسبة للمطورين الذين يبحثون عن حل موثوق به ومتعدد الاستخدامات وعالي الأداء للرؤية الحاسوبية، يوفر YOLO11 الأدوات والمقاييس اللازمة للنجاح في عام 2025 وما بعده.

استكشف مقارنات النماذج الأخرى

لمزيد من فهم مشهد نماذج اكتشاف الأجسام، استكشف هذه المقارنات ذات الصلة:


تعليقات