تخطي إلى المحتوى

YOLOv7 مقابل YOLOv5: مقارنة تقنية مفصلة

يعد اختيار البنية الصحيحة لاكتشاف الكائنات قرارًا حاسمًا يؤثر على سرعة ودقة وجدوى النشر لمشاريع الرؤية الحاسوبية الخاصة بك. توفر هذه الصفحة مقارنة تقنية شاملة بين YOLOv7 و Ultralytics YOLOv5وهما نموذجان مؤثران في سلالة YOLO . نحن نتعمق في ابتكاراتهما المعمارية ومعايير الأداء وحالات الاستخدام المثالية لمساعدتك في اختيار الأنسب لتطبيقك.

بينما قدم YOLOv7 تطورات أكاديمية كبيرة في عام 2022, Ultralytics YOLOv5 لا يزال قوة مهيمنة في الصناعة نظرًا لسهولة استخدامه التي لا مثيل لها ومتانته ومرونة نشره. بالنسبة لأولئك الذين يبحثون عن أحدث ما توصل إليه الأداء المطلق، نستكشف أيضًا كيف تمهد هذه النماذج الطريق لأحدث Ultralytics YOLO11.

مقارنة مقاييس الأداء

يوضح الجدول التالي مفاضلات الأداء بين البنيتين. في حين أن YOLOv7 تدفع YOLOv5 إلى تحقيق متوسط دقة أعلى، فإن YOLOv5 تقدم مزايا مميزة في سرعة الاستدلال وعدد أقل من المعلمات لأحجام نماذج محددة.

النموذجالحجم
(بالبكسل)
mAPفال
50-95
السرعة
وحدة المعالجة المركزية CPU ONNX
(بالمللي ثانية)
السرعة
T4 TensorRT10
(بالمللي ثانية)
المعلمات
(M)
FLOPs
(B)
YOLOv7l64051.4-6.8436.9104.7
YOLOv7x64053.1-11.5771.3189.9
YOLOv5n64028.073.61.122.67.7
YOLOv5s64037.4120.71.929.124.0
YOLOv5m64045.4233.94.0325.164.2
YOLOv5l64049.0408.46.6153.2135.0
YOLOv5x64050.7763.211.8997.2246.4

YOLOv7: تخطي حدود الدقة

صُمم YOLOv7 الذي صدر في يوليو 2022، ليضع أحدث ما توصلت إليه أجهزة الكشف عن الأجسام في الوقت الحقيقي. يركز بشكل كبير على التحسين المعماري لتحسين الدقة دون زيادة تكلفة الاستدلال بشكل كبير.

المؤلفون: تشين ياو وانغ، وأليكسي بوشكوفسكي، وهونغ يوان مارك لياو
المنظمة:معهد علوم المعلومات، الأكاديمية الصينية للعلوم بتايوان
التاريخ: 2022-07-06
اركسيف:https://arxiv.org/abs/2207.02696
جيثب:https://github.com/WongKinYiu/yolov7
المستندات:ultralytics

الهندسة المعمارية والابتكارات الرئيسية

يقدم YOLOv7 العديد من التغييرات المعمارية المعقدة التي تهدف إلى تحسين تعلم الميزات:

  • E-ELAN (شبكة تجميع الطبقات الموسعة ذات الكفاءة الموسعة): هيكل أساسي متقدم يعزز قدرة الشبكة على التعلم من خلال التحكم في أقصر وأطول مسارات التدرج. يسمح ذلك للنموذج بتعلم المزيد من الميزات المتنوعة.
  • تحجيم النموذج للنماذج القائمة على التسلسل: على عكس القياس القياسي، يقوم YOLOv7 بقياس العمق والعرض في نفس الوقت للبنى القائمة على التسلسل، مما يضمن الاستخدام الأمثل للموارد.
  • حقيبة مجانية قابلة للتدريب: يتضمن ذلك التدوير المخطط لإعادة المعلمة (RepConv) وتدريب الرؤوس المساعدة. تُنشئ الرؤوس المساعدة تسميات هرمية خشنة إلى دقيقة تساعد في توجيه عملية التعلّم أثناء التدريب ولكن تتم إزالتها أثناء الاستدلال للحفاظ على السرعة.

ما هي "حقيبة الهدايا المجانية"؟

يشير مصطلح "حقيبة المجانية" إلى مجموعة من أساليب التدريب وتقنيات زيادة البيانات التي تعمل على تحسين دقة نموذج اكتشاف الكائنات دون زيادة تكلفة الاستدلال. في YOLOv7 يتضمن ذلك استراتيجيات متطورة مثل تعيين التسمية الموجهة من الخشنة إلى الدقيقة.

حالات الاستخدام المثالية لـ YOLOv7

نظرًا لتركيزه على الدقة العالية، فإن YOLOv7 مناسب بشكل خاص لـ

  • البحث الأكاديمي: المقارنة المعيارية مع نماذج SOTA حيث يكون كل جزء من mAP مهمًا.
  • نشر GPU المتطورة: التطبيقات التي تتوافر فيها أجهزة قوية (مثل NVIDIA A100s) للتعامل مع أحجام النماذج الأكبر ومتطلبات الذاكرة.
  • التحليل الثابت: السيناريوهات التي يكون فيها زمن الوصول في الوقت الحقيقي أقل أهمية من الدقة، مثل تحليل صور الأقمار الصناعية عالية الدقة أو عمليات المسح الطبي.

اعرف المزيد عن YOLOv7

Ultralytics YOLOv5: معيار الصناعة

يُعتبرYOLOv5 Ultralytics YOLOv5 على نطاق واسع أحد أكثر نماذج اكتشاف الأجسام المتاحة عمليةً وسهولةً في الاستخدام. ومنذ إطلاقه في عام 2020، أصبح منذ إطلاقه في عام 2020 العمود الفقري لعدد لا يحصى من التطبيقات التجارية نظرًا لتوازنه بين السرعة والدقة والتميز الهندسي.

المؤلفون: جلين جوشر
المنظمة:Ultralytics
التاريخ: 2020-06-26
GitHub:https://github.com/ultralytics/yolov5yolov5
المستنداتyolov5

البنية وفوائد النظام البيئي

يستخدم YOLOv5 العمود الفقري CSP-Darknet53 مع عنق PANet ورأس YOLOv3، وهو مُحسَّن لأهداف النشر المتنوعة. ومع ذلك، تكمن قوته الحقيقية في نظامUltralytics البيئي:

  • سهولة الاستخدام: يُعرف YOLOv5 بفلسفة "التثبيت والتشغيل"، ويتيح للمطورين بدء التدريب على مجموعات البيانات المخصصة في دقائق. واجهة برمجة التطبيقات بديهية، والوثائق شاملة.
  • كفاءة التدريب: عادةً ما يتطلب YOLOv5 ذاكرة CUDA أقل أثناء التدريب مقارنةً بالبنى الأحدث والأكثر تعقيداً، مما يجعله في متناول المطورين الذين لديهم وحدات معالجة رسومات متوسطة المدى.
  • مرونة النشر: يدعم التصدير بنقرة واحدة إلى ONNX, TensorRTCoreML TFLite وغير ذلك، مما يسهل النشر على كل شيء بدءًا من الخوادم السحابية إلى الهواتف المحمولة.
  • نظام بيئي جيد الصيانة: بفضل التحديثات المتكررة، وإصلاحات الأخطاء، والمجتمع الهائل، تضمن Ultralytics بقاء النموذج مستقرًا وآمنًا لبيئات الإنتاج.

حالات الاستخدام المثالية لـ YOLOv5

يتفوق YOLOv5 في سيناريوهات العالم الحقيقي التي تتطلب الموثوقية والسرعة:

  • ذكاء اصطناعي متطور: يعمل على أجهزة مثل NVIDIA Jetson أو Raspberry Pi نظرًا لخفة وزن النانو (yolov5n) والصغيرة (yolov5s) المتغيرات.
  • تطبيقات الهاتف المحمول: التكامل في تطبيقات iOS و Android عبر CoreML و TFLite للاستدلال على الجهاز.
  • النماذج الأولية السريعة: تستفيد الشركات الناشئة والمطوّرون الذين يحتاجون إلى الانتقال من المفهوم إلى MVP بسرعة من سير العمل المبسّط.
  • الأتمتة الصناعية: كشف موثوق لخطوط التصنيع حيث يكون زمن الاستجابة والثبات أمرًا بالغ الأهمية.

تعرف على المزيد حول YOLOv5

تحليل مقارن مفصل

عند المفاضلة بين YOLOv7 و YOLOv5 هناك العديد من العوامل الفنية التي تلعب دورًا يتجاوز مجرد درجة mAP .

1. مقايضة السرعة مقابل الدقة

يحقق YOLOv7 دقة قصوى أعلى على مجموعة بياناتCOCO . على سبيل المثال، تصل دقة YOLOv7x إلى 53.1% من mAP مقارنةً بـ 50.7% في YOLOv5x. ومع ذلك، يأتي ذلك على حساب التعقيد. يقدم YOLOv5 تدرجًا أكثر سلاسة في النماذج؛ فنموذج YOLOv5n (Nano) سريع للغاية (سرعة 73.6 مللي ثانية CPU ) وخفيف الوزن (2.6 مليون بارامز)، مما يخلق مكانة للبيئات منخفضة الموارد للغاية التي لا يستهدفها YOLOv7 صراحةً بنفس الدقة.

2. الهندسة المعمارية والتعقيد

يستخدم YOLOv7 بنية قائمة على التسلسل مع E-ELAN، مما يزيد من عرض النطاق الترددي للذاكرة المطلوب أثناء التدريب. وهذا يمكن أن يجعله أبطأ في التدريب وأكثر استهلاكًا للذاكرة من YOLOv5. في المقابل، يستخدم Ultralytics YOLOv5 بنية مبسطة مُحسّنة للغاية لكفاءة التدريب، مما يسمح بتقارب أسرع واستخدام أقل للذاكرة، وهي ميزة كبيرة للمهندسين ذوي الميزانيات الحسابية المحدودة.

3. سهولة الاستخدام وتجربة المطورين

هذا هو المكان الذي يتألق فيه Ultralytics YOLOv5 حقًا. يوفر إطار عمل Ultralytics تجربة موحدة مع أدوات قوية لزيادة البيانات، وتطوير المعلمات الفائقة، وتتبع التجارب.

import torch

# Example: Loading YOLOv5s from PyTorch Hub for inference
model = torch.hub.load("ultralytics/yolov5", "yolov5s", pretrained=True)

# Inference on an image
results = model("https://ultralytics.com/images/zidane.jpg")

# Print results
results.print()

على الرغم من أن YOLOv7 يحتوي على مستودع، إلا أنه يفتقر إلى خطوط أنابيب CI/CD المصقولة والجاهزة للإنتاج، وأدلة التكامل الشاملة، ودعم المجتمع الذي يدعم نظام Ultralytics البيئي.

4. تعدد الاستخدامات

في حين أن كلا النموذجين هما في المقام الأول بنيتان للكشف عن الكائنات، فقد تطور نظام Ultralytics المحيط بـ YOLOv5 لدعم تجزئة النماذج وتصنيف الصور بسلاسة. يدعم YOLOv7 أيضًا هذه المهام ولكنه غالبًا ما يتطلب فروعًا أو شوكات مختلفة من الكود، في حين أن Ultralytics يقدم نهجًا أكثر توحيدًا.

النشر أصبح سهلاً

تدعم نماذج Ultralytics مجموعة كبيرة من تنسيقات التصدير خارج الصندوق. يمكنك بسهولة تحويل نموذجك المدرب إلى TFLiteAndroid, CoreMLiOS أو TensorRT للاستدلال المحسّن GPU باستخدام أمر CLI بسيط أو نص برمجي Python .

الخلاصة: أي نموذج يجب أن تختاره؟

يعتمد الاختيار بين YOLOv7 و YOLOv5 على أولويات مشروعك:

  • اختر YOLOv7 إذا كان القيد الأساسي لديك هو الدقة القصوى وكنت تعمل في بيئة بحثية أو على أجهزة متطورة حيث تكون سرعة الاستدلال وبصمة الذاكرة من الاهتمامات الثانوية.
  • اختر Ultralytics YOLOv5 إذا كنت بحاجة إلى حل موثوق وجاهز للإنتاج. إن سهولة استخدامه، وتدريبه الفعّال، وزمن الاستجابة المنخفض على الأجهزة المتطورة، ونظام الدعم الهائل الذي يقدمه، يجعله الخيار الأفضل لمعظم التطبيقات التجارية والمطورين الذين يبدأون رحلة الرؤية الحاسوبية.

التطلع إلى المستقبل YOLO11

على الرغم من أن YOLOv5 و YOLOv7 نموذجين ممتازين، إلا أن مجال الرؤية الحاسوبية يتحرك بسرعة. بالنسبة للمطورين الذين يبحثون عن أفضل ما في العالمين - تجاوز دقة YOLOv7 وسرعة/سهولة استخدام YOLOv5بشدة باستكشاف Ultralytics YOLO11.

يمثل YOLO11 أحدث تطور، حيث يتميز ببنية خالية من الارتكازات تعمل على تبسيط خط أنابيب التدريب وتحسين الأداء في جميع المهام، بما في ذلك الكشف والتجزئة وتقدير الوضع والمربعات المحدودة الموجهة (OBB).

استكشف نماذج أخرى

إذا كنت مهتمًا بمقارنة الطرازات الأخرى في عائلة YOLO فراجع هذه الصفحات ذات الصلة:


تعليقات