تخطي إلى المحتوى

YOLOv7 ضد YOLO11: مقارنة فنية تفصيلية

يتطلب اختيار نموذج الكشف عن الأجسام الأمثل فهمًا عميقًا للقدرات المحددة والمفاضلات بين التصميمات المعمارية المختلفة. تقدم هذه الصفحة مقارنة فنية شاملة بين YOLOv7 و Ultralytics YOLO11، وهما نموذجان قويان في سلالة YOLO. سوف نتعمق في الاختلافات المعمارية ومعايير الأداء وحالات الاستخدام المثالية لمساعدتك في اختيار الأنسب لمشاريع رؤية الكمبيوتر الخاصة بك.

YOLOv7: الكشف الفعال والدقيق عن الأجسام

تم تقديم YOLOv7 كتقدم كبير في كشف الأجسام في الوقت الفعلي، مع التركيز على تحسين كفاءة التدريب ودقته دون زيادة تكاليف الاستدلال. لقد وضعت معيارًا جديدًا لأحدث الكاشفات في الوقت الفعلي عند إصدارها.

المؤلفون: Chien-Yao Wang, Alexey Bochkovskiy, و Hong-Yuan Mark Liao
المنظمة: معهد علوم المعلومات، أكاديميا سينيكا، تايوان
التاريخ: 2022-07-06
Arxiv: https://arxiv.org/abs/2207.02696
GitHub: https://github.com/WongKinYiu/yolov7
المستندات: https://docs.ultralytics.com/models/yolov7/

البنية والميزات الرئيسية

يعتمد YOLOv7 على بنى YOLO السابقة من خلال تقديم العديد من الابتكارات الرئيسية. وهو يستخدم تقنيات مثل شبكات تجميع الطبقات الفعالة الموسعة (E-ELAN) في العمود الفقري لتحسين استخراج الميزات والتعلم. تتمثل المساهمة الرئيسية في مفهوم "حقيبة التدريب المجانية"، والذي يتضمن استراتيجيات التحسين المطبقة أثناء التدريب - مثل استخدام رأس كشف إضافي والتوجيه من الخشن إلى الدقيق - لتعزيز دقة النموذج النهائية دون إضافة أعباء حسابية أثناء الاستدلال. بينما يركز بشكل أساسي على الكشف عن الأجسام، يعرض المستودع الرسمي امتدادات المجتمع لمهام مثل تقدير الوضع و تقسيم المثيل.

الأداء وحالات الاستخدام

أظهر YOLOv7 أداءً متطورًا عند إصداره، مما يوفر توازنًا مقنعًا بين السرعة والدقة. على سبيل المثال، يحقق نموذج YOLOv7x نسبة 53.1% mAPtest على مجموعة بيانات MS COCO بحجم صورة 640. إن كفاءته تجعله مناسبًا للتطبيقات في الوقت الفعلي مثل الأنظمة الأمنية المتقدمة والأنظمة المستقلة التي تتطلب اكتشافًا سريعًا ودقيقًا.

نقاط القوة

  • توازن بين الدقة العالية والسرعة: يوفر مزيجًا قويًا من متوسط الدقة (mAP) وسرعة الاستدلال للمهام التي تتطلب معالجة في الوقت الفعلي على وحدة معالجة الرسوميات (GPU).
  • تدريب فعال: يستخدم تقنيات تدريب متقدمة ("حقيبة من الأشياء المجانية") لتحسين الدقة دون زيادة تكلفة الاستدلال.
  • أداء راسخ: نتائج مثبتة على المعايير القياسية مثل MS COCO.

نقاط الضعف

  • التعقيد: قد يكون فهم تقنيات البنية الأساسية والتدريب وتحسينها بشكل كامل أمرًا معقدًا.
  • استهلاك مكثف للموارد: تتطلب نماذج YOLOv7 الأكبر موارد GPU كبيرة للتدريب.
  • تنوع محدود في المهام: يركز بشكل أساسي على اكتشاف الكائنات، ويتطلب تطبيقات منفصلة لمهام أخرى مثل التجزئة أو التصنيف، على عكس النماذج المتكاملة مثل YOLO11.
  • أقل صيانة: إطار العمل ليس قيد التطوير أو الصيانة النشطة مثل نظام Ultralytics البيئي، مما يؤدي إلى عدد أقل من التحديثات ودعم أقل من المجتمع.

تعرف على المزيد حول YOLOv7

Ultralytics YOLO11: أحدث ما توصلت إليه الكفاءة والتنوع

Ultralytics YOLO11 يمثل أحدث تطور في سلسلة YOLO من Ultralytics، وهو مصمم لتحقيق دقة فائقة وكفاءة محسنة وتنوع أوسع في المهام داخل إطار عمل سهل الاستخدام. وهو يعتمد على نجاح سابقاته مثل YOLOv8 لتقديم تجربة متطورة.

المؤلفون: جلين جوتشر و جينغ تشيو
المنظمة: Ultralytics
التاريخ: 2024-09-27
GitHub: https://github.com/ultralytics/ultralytics
المستندات: https://docs.ultralytics.com/models/yolo11/

البنية والميزات الرئيسية

تتضمن بنية YOLO11 تقنيات متقدمة لاستخراج الميزات وتصميم شبكة مبسط، مما يؤدي إلى دقة أعلى غالبًا مع عدد أقل من المعلمات مقارنةً بالإصدارات السابقة. يؤدي هذا التحسين إلى سرعات استدلال أسرع ومتطلبات حسابية أقل، وهو أمر بالغ الأهمية للنشر عبر منصات متنوعة، من الأجهزة الطرفية إلى البنية التحتية السحابية.

تتمثل إحدى المزايا الرئيسية لـ YOLO11 في تنوعها. وهو يدعم أصلاً مهام رؤية الكمبيوتر المتعددة، بما في ذلك اكتشاف الكائنات، و تجزئة المثيلات، و تصنيف الصور، و تقدير الوضعية، والصناديق المحيطة الموجهة (OBB). يتكامل بسلاسة في نظام Ultralytics البيئي، مما يوفر تجربة مستخدم مبسطة عبر واجهات Python و CLI بسيطة، و وثائق شاملة، وأوزان مُدرَّبة مسبقًا متاحة بسهولة من أجل تدريب فعال.

الأداء وحالات الاستخدام

يُظهر YOLO11 درجات متوسط الدقة المتوسط (mAP) مثيرة للإعجاب عبر أحجام النماذج المختلفة، مما يحقق مقايضة بين السرعة والدقة مواتية. على سبيل المثال، يحقق YOLO11m قيمة mAPval تبلغ 51.5 بحجم صورة 640 مع عدد أقل بكثير من المعلمات مقارنة بـ YOLOv7l. توفر المتغيرات الأصغر مثل YOLO11n استدلالًا سريعًا بشكل استثنائي، بينما تزيد النماذج الأكبر مثل YOLO11x من الدقة. والجدير بالذكر أن نماذج YOLO11 غالبًا ما تُظهر استخدامًا أقل للذاكرة أثناء التدريب والاستدلال مقارنة بالبنى الأخرى.

إن الدقة والكفاءة المعززتين لـ YOLO11 تجعله مثاليًا للتطبيقات التي تتطلب معالجة دقيقة وفي الوقت الفعلي:

نقاط القوة

  • أداء هو الأفضل على الإطلاق: درجات mAP عالية مع هندسة معمارية مُحسَّنة وخالية من الارتكاز.
  • استدلال فعال: سرعة ممتازة، خاصة على CPU، ومناسبة للاحتياجات في الوقت الفعلي.
  • دعم المهام المتعددة: يتعامل أصليًا مع الكشف عن الأجسام، والتجزئة، والتصنيف، وتقدير الوضعية، والصناديق المحيطة الموجهة (OBB) في إطار عمل واحد.
  • سهولة الاستخدام: واجهة برمجة تطبيقات بسيطة ووثائق شاملة ودعم Ultralytics HUB مدمج للتدريب والنشر بدون تعليمات برمجية.
  • نظام بيئي مُدار بشكل جيد: تطوير نشط، ومجتمع قوي، وتحديثات متكررة، وعمليات تدريب فعالة.
  • قابلية التوسع: يعمل بفعالية عبر الأجهزة، من الحافة إلى السحابة، مع متطلبات ذاكرة أقل.

نقاط الضعف

  • باعتباره نموذجًا أحدث، قد تكون بعض عمليات تكامل أدوات الطرف الثالث المحددة لا تزال قيد التطور مقارنةً بالنماذج الأقدم والأكثر رسوخًا.
  • قد تتطلب النماذج الأكبر موارد حسابية كبيرة للتدريب، على الرغم من أنها تظل فعالة للغاية بالنسبة لفئة أدائها.

تعرف على المزيد حول YOLO11

مقارنة الأداء: YOLOv7 مقابل YOLO11

يقدم الجدول التالي مقارنة تفصيلية للأداء بين نموذجي YOLOv7 و YOLO11 على مجموعة بيانات COCO. تُظهر نماذج YOLO11 توازنًا فائقًا بين الدقة والسرعة والكفاءة. على سبيل المثال، يحقق YOLO11l قيمة mAP أعلى من YOLOv7x مع أقل من نصف عدد المعلمات وعمليات FLOPs، وهو أسرع بكثير على وحدة معالجة الرسوميات GPU. وبالمثل، يطابق YOLO11m دقة YOLOv7l مع حوالي نصف عدد المعلمات والتكلفة الحسابية. يوفر أصغر نموذج، YOLO11n، سرعة ملحوظة على كل من وحدة المعالجة المركزية CPU ووحدة معالجة الرسوميات GPU مع الحد الأدنى من استخدام الموارد، مما يجعله مثاليًا للتطبيقات الطرفية.

النموذج الحجم
(بالبكسل)
mAPval
50-95
السرعة
وحدة المعالجة المركزية CPU ONNX
(بالمللي ثانية)
السرعة
T4 TensorRT10
(بالمللي ثانية)
المعلمات
(M)
FLOPs
(B)
YOLOv7l 640 51.4 - 6.84 36.9 104.7
YOLOv7x 640 53.1 - 11.57 71.3 189.9
YOLO11n 640 39.5 56.1 1.5 2.6 6.5
YOLO11s 640 47.0 90.0 2.5 9.4 21.5
YOLO11m 640 51.5 183.2 4.7 20.1 68.0
YOLO11l 640 53.4 238.6 6.2 25.3 86.9
YOLO11x 640 54.7 462.8 11.3 56.9 194.9

الخلاصة: أي نموذج يجب أن تختاره؟

في حين أن YOLOv7 كان نموذجًا قويًا في عصره ولا يزال يقدم أداءً قويًا للكشف عن الكائنات في الوقت الفعلي، فإن Ultralytics YOLO11 يمثل قفزة كبيرة إلى الأمام. لا يتفوق YOLO11 على YOLOv7 في مقاييس الأداء الرئيسية فحسب، بل يوفر أيضًا إطار عمل أكثر تنوعًا وسهولة في الاستخدام ومدعومًا جيدًا.

بالنسبة للمطورين والباحثين الذين يبحثون عن حل حديث وشامل، يعد YOLO11 هو الخيار الواضح. تشمل مزاياه:

  • توازن أداء فائق: توفر YOLO11 مقايضة أفضل بين الدقة والسرعة والتكلفة الحسابية.
  • تعدد استخدامات المهام المتعددة: الدعم الأصلي للكشف والتجزئة والتصنيف والوضع و OBB يلغي الحاجة إلى نماذج متعددة ويبسط سير عمل التطوير.
  • سهولة الاستخدام: إن واجهة برمجة التطبيقات المبسطة والتوثيق الشامل وإجراءات التدريب البسيطة تجعله في متناول المبتدئين والخبراء على حد سواء.
  • تطوير نشط: كجزء من نظام Ultralytics، يستفيد YOLO11 من التحديثات المستمرة ومجتمع قوي مفتوح المصدر والتكامل مع أدوات مثل Ultralytics HUB من أجل MLOps سلس.

باختصار، إذا كانت أولويتك هي الاستفادة من أحدث التطورات في الذكاء الاصطناعي لمجموعة واسعة من التطبيقات مع التركيز على سهولة النشر وإثبات المستقبل، فإن Ultralytics YOLO11 هو النموذج الموصى به.

استكشف نماذج أخرى

للمزيد من الاستكشاف، ضع في اعتبارك هذه المقارنات التي تتضمن YOLOv7 و YOLO11 ونماذج أخرى ذات صلة في وثائق Ultralytics:



📅 تم إنشاؤه منذ سنة واحدة ✏️ تم التحديث منذ شهر واحد

تعليقات