تخطي إلى المحتوى

YOLOv10 مقابل YOLO: مقارنة تقنية مفصلة لاكتشاف الأجسام

يعد اختيار النموذج الأمثل لاكتشاف الأجسام أمرًا بالغ الأهمية لتطبيقات الرؤية الحاسوبية، حيث تختلف النماذج بشكل كبير من حيث الدقة والسرعة والكفاءة. تقدم هذه الصفحة مقارنة تقنية مفصّلة بين YOLOv10 YOLO وهما نموذجان متقدمان في مجال اكتشاف الأجسام. سنستكشف بنيتيهما ومعايير أدائهما والتطبيقات المناسبة لتوجيه عملية اختيار النموذج الخاص بك.

يولوف 10

YOLOv10 هو أحدث تطور في سلسلة YOLO التي تشتهر بقدراتها على اكتشاف الأجسام في الوقت الحقيقي. تم تطوير YOLOv10 من قبل باحثين في جامعة تسينغهوا، وتم تقديمه في 2024-05-23(arXiv preprint arXiv:2405.14458)، وقد صُمم YOLOv10 لتحقيق الكفاءة الشاملة والأداء المحسّن. يتوفر تطبيق PyTorch الرسمي على GitHub.

البنية والمميزات الرئيسية

يقدم YOLOv10 العديد من الابتكارات التي تركز على تبسيط البنية وتحسين التوازن بين السرعة والدقة، والانتقال نحو التدريب الخالي من نظام إدارة الشبكة وتصميم نموذج فعال. تشمل أبرز الملامح المعمارية الرئيسية ما يلي:

  • التدريب الخالي من NMS: يوظف تعيينات مزدوجة متسقة للتدريب دون الحاجة إلى كبت غير الحد الأقصى (NMS)، مما يقلل من النفقات العامة بعد المعالجة وزمن الاستجابة للاستدلال.
  • تصميم شامل مدفوع بالكفاءة والدقة: التحسين الشامل لمكونات النموذج المختلفة لتقليل التكرار الحسابي وتعزيز قدرات الكشف.
  • العمود الفقري وهيكل الشبكة: طبقات محسّنة لاستخراج الميزات وهيكل شبكة مبسط لتحسين كفاءة المعلمات ومعالجة أسرع.

مقاييس الأداء

يوفر YOLOv10 أداءً متطورًا على أحدث طراز عبر مقاييس نموذجية مختلفة، مما يوفر مجموعة من الخيارات لتناسب الاحتياجات الحسابية المختلفة. تتضمن مقاييس الأداء على مجموعة بيانات COCO ما يلي:

  • mAP: يحقق متوسط دقة متوسط تنافسي (mAP) على مجموعة بيانات التحقق من صحة COCO. على سبيل المثال، يحقق YOLOv10-S نسبة 46.7% mAPval50-95.
  • سرعة الاستدلال: يوفر سرعات استنتاج مذهلة، حيث يصل زمن الاستدلال YOLOv10-N إلى 1.56 مللي ثانية على T4 TensorRT10.
  • حجم الطراز: متوفرة بأحجام متعددة (N، S، M، M، B، L، X) مع مقاسات تتراوح بين 2.3 م معلمات لـ YOLOv10-N إلى 56.9 م لـ YOLOv10-X.

نقاط القوة والضعف

نقاط القوة:

  • أداء في الوقت الحقيقي: مُحسَّن للسرعة والكفاءة، مما يجعله مثاليًا للتطبيقات في الوقت الفعلي.
  • دقة عالية: يحقق أعلى مستويات الدقة، خاصةً مع الطرازات الأكبر حجماً مثل YOLOv10-X.
  • كفاءة من النهاية إلى النهاية: يقلل التصميم الخالي من نظام إدارة الشبكة من زمن الاستجابة ويبسط عملية النشر.
  • تعدد الاستخدامات: مناسبة لمختلف مهام الكشف عن الأجسام وقابلة للتكيف مع منصات الأجهزة المختلفة، بما في ذلك الأجهزة المتطورة مثل Raspberry Pi و NVIDIA Jetson.
  • سهولة الاستخدام: يعمل التكامل معحزمة Ultralytics Python على تبسيط عمليات التدريب والتحقق من الصحة وسير عمل النشر.

نقاط الضعف:

  • نموذج ناشئ: كنموذج حديث العهد، قد يكون دعم المجتمع والأوزان المدربة مسبقاً في النظم البيئية الأوسع نطاقاً لا يزال في طور التطور مقارنةً بالنماذج الأكثر رسوخاً.
  • المفاضلة: تعطي النماذج الأصغر أولوية للسرعة، وقد يكون ذلك على حساب بعض الدقة مقارنةً بالمتغيرات الأكبر أو النماذج الأكثر تعقيدًا.

حالات الاستخدام

يُعد YOLOv10 مناسبًا تمامًا للتطبيقات التي تتطلب اكتشافًا دقيقًا وعالي السرعة للأجسام، مثل

اعرف المزيد عن YOLOv10

دامو-YOLO

YOLO الذي طورته مجموعة علي بابا، هو نموذج عالي الأداء لاكتشاف الأجسام تم تقديمه في عام 2022(arXiv preprint arXiv:2211.15444v2). تم تصميمه ليكون سريعًا ودقيقًا، حيث يشتمل على العديد من التقنيات المتقدمة للكشف الفعال عن الأجسام. التطبيق الرسمي والتوثيق متاحان على GitHub.

البنية والمميزات الرئيسية

يدمج YOLO العديد من المكونات المبتكرة لتحقيق التوازن بين السرعة والدقة:

  • العمود الفقري لـ NAS: يستخدم البحث في البنية العصبية (NAS) لتصميم شبكات عمود فقري فعالة مُحسّنة لمهام اكتشاف الأجسام.
  • شبكة هرم التدرج المتدرج الفعال: توظف شبكة هرم سمات التدرج المتدرج المعاد تحديدها (RepGFPN) لدمج الميزات بكفاءة وتمثيل الميزات متعددة المقاييس.
  • ZeroHead: رأس كشف خفيف الوزن مصمم لتقليل النفقات الحسابية الزائدة مع الحفاظ على دقة الكشف.
  • AlignedOTA: يستخدم Aligned Optimal Transport Assignment (AlignedOTA) لتحسين تعيين التسمية أثناء التدريب، مما يعزز أداء الكشف.
  • تعزيز التقطير: يدمج تقنيات تقطير المعرفة لتعزيز أداء النموذج بشكل أكبر.

مقاييس الأداء

تأتي موديلات YOLO بأحجام مختلفة (صغيرة، صغيرة، صغيرة، متوسطة، كبيرة) لتلبية احتياجات الأداء المختلفة. تشمل مؤشرات الأداء الرئيسية ما يلي:

  • mAP: يحقق نسبة mAP عالية على مجموعات البيانات المعيارية مثل COCO. YOLO على سبيل المثال، يصل إلى 50.8% mAPval50-95.
  • سرعة الاستدلال: يوفر سرعات استنتاج سريعة، مما يجعله مناسبًا للتطبيقات في الوقت الفعلي، حيث يحقق YOLO زمن استدلال يبلغ 2.32 مللي ثانية على T4 TensorRT10.
  • حجم النموذج: تتنوع أحجام النماذج، مما يوفر مرونة لسيناريوهات النشر المختلفة، حيث تتراوح من 8.5 مليون معلمة لـ YOLO إلى 42.1 مليون لـ YOLO.

نقاط القوة والضعف

نقاط القوة:

  • دقة عالية: يحقق دقة كشف ممتازة من خلال الابتكارات المعمارية وتقنيات التدريب المتقدمة.
  • استدلال سريع: مصممة للسرعة، وتوفر أداءً فعالاً في الاستدلال مناسبًا لأنظمة الوقت الحقيقي.
  • تصميم فعال: يدمج العمود الفقري لـ NAS ورؤوس خفيفة الوزن لتحسين الكفاءة الحسابية.
  • مجموعة ميزات شاملة: تدمج العديد من التقنيات المتقدمة مثل RepGFPPN و AlignedOTA لتحقيق أداء قوي.

نقاط الضعف:

  • التعقيد: قد يؤدي تكامل NAS والمكونات المتقدمة المتعددة إلى تعقيد في التخصيص والتعديل.
  • متطلبات الموارد: قد تتطلب نماذج YOLO الأكبر حجمًا موارد حسابية كبيرة مقارنةً بالبدائل خفيفة الوزن للغاية.

حالات الاستخدام

يُعد YOLO مناسبًا تمامًا للتطبيقات التي تتطلب دقة وسرعة عالية في اكتشاف الأجسام، مثل

اعرف المزيد عن YOLO

الطراز الحجم
(بكسل)
مافال
50-95
السرعة
CPU ONNX
(مللي ثانية)
السرعة
T4 T4TensorRT10
(مللي ثانية)
بارامز
(م)

(ب)
يولوف 10 ن 640 39.5 - 1.56 2.3 6.7
YOLOv10s 640 46.7 - 2.66 7.2 21.6
يولوف 10 م 640 51.3 - 5.48 15.4 59.1
يولوف 10 ب 640 52.7 - 6.54 24.4 92.0
يولوف 10 ل 640 53.3 - 8.33 29.5 120.3
يولوف 10x 640 54.4 - 12.2 56.9 160.4
دامو يولوت 640 42.0 - 2.32 8.5 18.1
دامو يولو 640 46.0 - 3.45 16.3 37.8
دامو يولوم 640 49.2 - 5.09 28.2 61.8
دامو يولول 640 50.8 - 7.18 42.1 97.3

قد يكون المستخدمون مهتمين أيضًا بمقارنة YOLOv10 YOLO مع الطرز الأخرى في عائلة Ultralytics YOLO وغيرها:

📅 تم إنشاؤها منذ 1 سنة مضت ✏️ تم التحديث منذ 1 شهر

التعليقات