تخطي إلى المحتوى

YOLOv5 مقابل YOLOv7: موازنة النظام البيئي والهندسة المعمارية

يعد اختيار نموذج الكشف عن الأجسام المناسب قرارًا بالغ الأهمية للمطورين والباحثين على حد سواء. في تطور عائلة YOLO (You Only Look Once)، يبرز YOLOv5 و YOLOv7 كبنيتين محوريتين شكلت مشهد رؤية الكمبيوتر. بينما قدم YOLOv7 ابتكارات معمارية كبيرة لتحقيق الدقة، أحدث Ultralytics YOLOv5 ثورة في تجربة المطور من خلال التركيز على سهولة الاستخدام والنشر ونظام بيئي قوي.

يقدم هذا الدليل مقارنة فنية متعمقة لهذين النموذجين، ويحلل بنياتهما ومقاييس الأداء الخاصة بهما على مجموعة بيانات COCO، ومدى ملاءمتهما للتطبيقات الواقعية.

Ultralytics YOLOv5: معيار الهندسة

أعاد YOLOv5، الذي تم إطلاقه في عام 2020، تعريف التوقعات لبرامج detect الكائنات مفتوحة المصدر. على عكس التكرارات السابقة التي كانت موجودة في المقام الأول كرمز بحثي، فقد تم تصميم YOLOv5 كإطار عمل جاهز للمنتج. لقد أعطى الأولوية لسهولة الاستخدام وقابلية التصدير والسرعة، مما جعله الخيار الأمثل للشركات التي تبني تطبيقات الاستدلال في الوقت الفعلي.

المؤلفون: جلين جوتشر
المنظمة:Ultralytics
التاريخ: 2020-06-26
GitHub:https://github.com/ultralytics/yolov5
المستندات:https://docs.ultralytics.com/models/yolov5/

المزايا الرئيسية لـ YOLOv5

  • تصميم يركز على المستخدم: قدم YOLOv5 واجهة برمجة تطبيقات API مبسطة وسير عمل تدريب سلس قلل من حاجز الدخول لتدريب نماذج الكشف عن الأجسام object detection المخصصة.
  • مرونة النشر: مع الدعم الأصلي لأوضاع التصدير، يمكن بسهولة تحويل نماذج YOLOv5 إلى تنسيقات مثل ONNX و CoreML و TFLite و TensorRT للنشر على أجهزة متنوعة.
  • استخدام فعال للموارد: تم تحسين البنية لاستهلاك منخفض للذاكرة، مما يجعلها مثالية لأجهزة الذكاء الاصطناعي الطرفية مثل NVIDIA Jetson أو Raspberry Pi.

دعم النظام الإيكولوجي

يتم دعم YOLOv5 من خلال نظام Ultralytics البيئي الشامل. يتضمن ذلك التكامل السلس مع أدوات تتبع التجارب مثل Comet و MLflow، بالإضافة إلى منصات إدارة مجموعات البيانات.

تعرف على المزيد حول YOLOv5

YOLOv7: نهج "حقيبة التحسينات المجانية"

ركز YOLOv7، الذي تم إصداره في عام 2022، بشكل كبير على دفع حدود الدقة من خلال التحسين المعماري. قدم المؤلفون العديد من المفاهيم الجديدة التي تهدف إلى تحسين تعلم الميزات دون زيادة تكلفة الاستدلال، وهي استراتيجية أطلقوا عليها اسم "حقيبة التدريب المجانية".

المؤلفون: تشين-ياو وانغ، أليكسي بوتشكوفسكي، وهونغ-يوان مارك لياو
المنظمة: معهد علوم المعلومات، أكاديميا سينيكا، تايوان
التاريخ: 2022-07-06
Arxiv:https://arxiv.org/abs/2207.02696
GitHub:https://github.com/WongKinYiu/yolov7
المستندات:https://docs.ultralytics.com/models/yolov7/

الابتكارات المعمارية

يدمج YOLOv7 شبكات تجميع الطبقات الفعالة الممتدة (E-ELAN) لتعزيز قدرة الشبكة على التعلم. كما أنه يستخدم تقنيات توسيع نطاق النموذج التي تعدل عمق وعرض البنية في وقت واحد. على الرغم من فعاليته في رفع درجات mAP، إلا أن هذه التغييرات المعمارية المعقدة يمكن أن تجعل النموذج في بعض الأحيان أكثر صعوبة في التعديل أو النشر مقارنة بعمود CSP-Darknet الفقري الأكثر وضوحًا الموجود في YOLOv5.

تعرف على المزيد حول YOLOv7

مقارنة الأداء الفني

عند مقارنة النموذجين، يكمن التعادل عادةً بين الدقة المطلقة وسرعة النشر العملي. تحقق نماذج YOLOv7 (خاصةً المتغيرات الأكبر) بشكل عام mAP أعلى على مجموعة بيانات COCO val2017. ومع ذلك، تحافظ Ultralytics YOLOv5 على تفوقها في سرعة الاستدلال وكفاءة المعلمات، خاصةً مع متغيراتها الأصغر (Nano و Small)، والتي تعتبر ضرورية للنشر على الأجهزة المحمولة.

يسلط الجدول أدناه الضوء على مقاييس الأداء. لاحظ السرعة الاستثنائية لـ YOLOv5n، والذي لا يزال أحد أسرع الخيارات للبيئات محدودة الموارد للغاية.

النموذجالحجم
(بالبكسل)
mAPval
50-95
السرعة
وحدة المعالجة المركزية CPU ONNX
(بالمللي ثانية)
السرعة
T4 TensorRT10
(بالمللي ثانية)
المعلمات
(M)
FLOPs
(B)
YOLOv5n64028.073.61.122.67.7
YOLOv5s64037.4120.71.929.124.0
YOLOv5m64045.4233.94.0325.164.2
YOLOv5l64049.0408.46.6153.2135.0
YOLOv5x64050.7763.211.8997.2246.4
YOLOv7l64051.4-6.8436.9104.7
YOLOv7x64053.1-11.5771.3189.9

تحليل المقاييس

  • السرعة مقابل الدقة: تحقق YOLOv7x نسبة 53.1% mAP أعلى، مما يجعلها مناسبة للأمن المتطور أو التحليل الطبي حيث يهم كل بكسل. ومع ذلك، بالنسبة لتطبيقات مثل تحليلات الفيديو أو الملاحة الذاتية، فإن وقت الاستدلال 1.12 مللي ثانية لـ YOLOv5n على TensorRT يوفر إمكانية معدل إطارات لا يمكن أن تضاهيها النماذج الأثقل.
  • كفاءة التدريب: تستخدم Ultralytics YOLOv5 استراتيجيات "AutoAnchor" وتطويرًا متقدمًا للمعلمات الفائقة، مما يؤدي غالبًا إلى تقارب أسرع أثناء التدريب مقارنةً بمخططات إعادة المعلمات المعقدة التي تتطلبها YOLOv7.
  • البصمة الذاكرية: غالبًا ما يتطلب تدريب المحولات أو البنى المعقدة مثل YOLOv7 وحدات معالجة رسومات GPUs متطورة (مثل A100s). في المقابل، يسمح تصميم YOLOv5 الفعال بالتدريب على الأجهزة الاستهلاكية، مما يضفي طابعًا ديمقراطيًا على الوصول إلى تطوير الذكاء الاصطناعي.

تنفيذ التعليمات البرمجية

تتمثل إحدى أقوى الحجج لـ Ultralytics YOLOv5 في بساطة واجهة برمجة تطبيقات Python الخاصة بها. يتطلب تحميل نموذج مُدرَّب مسبقًا وتشغيل الاستدلال بضعة أسطر فقط من التعليمات البرمجية، وهو دليل على نضج الإطار.

import torch

# Load the YOLOv5s model from PyTorch Hub
model = torch.hub.load("ultralytics/yolov5", "yolov5s", pretrained=True)

# Define an image (url, local path, or numpy array)
img = "https://ultralytics.com/images/zidane.jpg"

# Run inference
results = model(img)

# Print results and show the image with bounding boxes
results.print()
results.show()

يتيح هذا المستوى من التجريد للمطورين التركيز على بناء حلول أعمالهم بدلاً من تصحيح أخطاء تصميمات النماذج.

حالات الاستخدام المثالية

متى تختار YOLOv7

YOLOv7 هو خيار ممتاز للبحث الأكاديمي والسيناريوهات التي تكون فيها قيود الأجهزة ثانوية لأداء الكشف الخام.

  • البحث الأكاديمي: لتقييم أحدث تقنيات الكشف.
  • فحص عالي الدقة: مثل مراقبة جودة التصنيع حيث يكون اكتشاف العيوب الدقيقة أمرًا بالغ الأهمية وزمن الوصول أقل أهمية.

متى تختار Ultralytics YOLOv5

لا يزال YOLOv5 هو المعيار الصناعي للتطوير السريع ونشر الإنتاج.

  • النشر الطرفي: مثالي للتشغيل على أجهزة iOS و Android عبر عمليات تصدير TFLite أو CoreML.
  • الروبوتات: إن زمن الوصول المنخفض أمر بالغ الأهمية لحلقات التغذية الراجعة المطلوبة في الروبوتات المستقلة.
  • Versatility: بالإضافة إلى الـ detect، يدعم مستودع YOLOv5 كلاً من instance segmentation و image classification، مما يوفر قاعدة بيانات موحدة لمهام رؤية متعددة.

الخلاصة: المسار الحديث إلى الأمام

في حين أن YOLOv7 أظهر قوة الضبط المعماري، إلا أن Ultralytics YOLOv5 لا يزال الخيار الأفضل للمطورين الذين يحتاجون إلى حل موثوق وموثق جيدًا وسهل النشر. يضمن توازنه بين السرعة والدقة ودعم النظام البيئي بقائه ذا صلة في بيئات الإنتاج في جميع أنحاء العالم.

ومع ذلك، فإن مجال رؤية الكمبيوتر يتحرك بسرعة. بالنسبة لأولئك الذين يبحثون عن أفضل أداء مطلق، يمثل YOLO11 أحدث تطور من Ultralytics. تعتمد YOLO11 على سهولة استخدام YOLOv5 ولكنها تتضمن وحدات قائمة على المحولات الحديثة وتصميمات خالية من المرساة، مما يتجاوز كلاً من YOLOv5 و YOLOv7 في الدقة والكفاءة.

للحصول على حل مستقبلي يدعم الكشف عن الأجسام (Object Detection)، و تقدير الوضعيات (Pose Estimation)، و مربعات الإحاطة الموجهة (Oriented Bounding Boxes (OBB))، يوصى بشدة بالانتقال إلى إطار عمل Ultralytics YOLO11.

اكتشف المزيد من المقارنات

استكشف كيف تقارن النماذج الأخرى بعائلة Ultralytics YOLO:


تعليقات