YOLOv5 مقابل YOLOv7: الموازنة بين النظام البيئي والبنية
يعد اختيار النموذج الصحيح للكشف عن الكائنات قرارًا حاسمًا للمطورين والباحثين على حد سواء. في تطور عائلة YOLO (أنت تنظر مرة واحدة فقط), YOLOv5 و YOLOv7 يبرزان بوصفهما بنيتين محوريتين شكّلتا مشهد الرؤية الحاسوبية. بينما قدم YOLOv7 ابتكارات معمارية مهمة من حيث الدقة، أحدثتYOLOv5 ثورة في تجربة المطورين مع التركيز على سهولة الاستخدام والنشر والنظام البيئي القوي.
يقدم هذا الدليل مقارنة تقنية متعمقة بين هذين النموذجين، ويحلل بنيتهما، ومقاييس أدائهما على مجموعة بياناتCOCO ومدى ملاءمتها للتطبيقات الواقعية.
Ultralytics YOLOv5: المعيار الهندسي
تم إطلاق YOLOv5 في عام 2020، وقد أعاد YOLOv5 تعريف التوقعات الخاصة ببرمجيات الكشف عن الأجسام مفتوحة المصدر. على عكس التكرارات السابقة التي كانت موجودة في المقام الأول كرمز بحثي، تم تصميم YOLOv5 كإطار عمل جاهز للمنتج. وقد أعطى الأولوية لسهولة الاستخدام وقابلية التصدير والسرعة، مما جعله الخيار المفضل للشركات التي تبني تطبيقات الاستدلال في الوقت الحقيقي.
المؤلفون: جلين جوشر
المنظمة:Ultralytics
التاريخ: 2020-06-26
GitHub:https://github.com/ultralytics/yolov5yolov5
المستنداتyolov5
المزايا الرئيسية لـ YOLOv5
- تصميم يركز على المستخدم: قدم YOLOv5 واجهة برمجة تطبيقات مبسطة وسير عمل تدريبي سلس قلل من عائق الدخول لتدريب نماذج الكشف عن الكائنات المخصصة.
- مرونة النشر: مع الدعم الأصلي لأوضاع التصدير، يمكن تحويل نماذج YOLOv5 بسهولة إلى تنسيقات مثل ONNXو CoreML و TFLite و TensorRT للنشر على أجهزة متنوعة.
- استخدام فعال للموارد: تم تحسين البنية لاستهلاك منخفض للذاكرة، مما يجعلها مثالية لأجهزة الذكاء الاصطناعي المتطورة مثل NVIDIA Jetson أو Raspberry Pi.
دعم النظام البيئي
YOLOv5 مدعوم بمنظومة Ultralytics الشاملة. يتضمن ذلك التكامل السلس مع أدوات تتبع التجارب مثل Comet و MLflow، بالإضافة إلى منصات إدارة مجموعة البيانات.
YOLOv7: نهج "حقيبة الهدايا المجانية"
تم إصدار YOLOv7 في عام 2022، وقد ركز YOLOv7 بشكل كبير على دفع حدود الدقة من خلال التحسين المعماري. قدم المؤلفون العديد من المفاهيم الجديدة التي تهدف إلى تحسين تعلم الميزات دون زيادة تكلفة الاستدلال، وهي استراتيجية أطلقوا عليها اسم "حقيبة من الأشياء المجانية القابلة للتدريب".
المؤلفون: تشين ياو وانغ، وأليكسي بوشكوفسكي، وهونغ يوان مارك لياو
المنظمة: معهد علوم المعلومات، أكاديميا سينيكا، تايوان
التاريخ: 2022-07-06
Arxiv:https://arxiv.org/abs/2207.02696
GitHub:https://github.com/WongKinYiu/yolov7
Docsultralytics
الابتكارات المعمارية
يشتمل YOLOv7 على شبكات تجميع الطبقات الموسعة ذات الكفاءة الموسعة (E-ELAN) لتعزيز قدرة الشبكة على التعلم. كما أنه يستخدم تقنيات توسيع نطاق النموذج التي تعدل عمق البنية وعرضها في نفس الوقت. على الرغم من فعالية هذه التغييرات المعمارية المعقدة في رفع درجاتmAP إلا أنها قد تجعل من الصعب أحيانًا تعديل النموذج أو نشره مقارنةً بالعمود الفقري الأكثر وضوحًا لشبكة CSP-Darknet الموجودة في YOLOv5.
مقارنة الأداء الفني
عند المقارنة بين النموذجين، عادةً ما تكمن المفاضلة بين الدقة الأولية وسرعة النشر العملية. تحقق نماذج YOLOv7 (وتحديدًا المتغيرات الأكبر حجمًا) عمومًا mAP أعلى في مجموعة بيانات COCO val2017. ومع ذلك، يحافظ Ultralytics YOLOv5 على هيمنته في سرعة الاستدلال وكفاءة البارامترات، خاصةً مع متغيراته الأصغر (النانو والصغيرة)، والتي تعتبر حاسمة للنشر المتنقل.
يسلط الجدول أدناه الضوء على مقاييس الأداء. لاحظ السرعة الاستثنائية لجهاز YOLOv5n، الذي يظل أحد أسرع الخيارات للبيئات ذات الموارد المحدودة للغاية.
| النموذج | الحجم (بالبكسل) | mAPفال 50-95 | السرعة وحدة المعالجة المركزية CPU ONNX (بالمللي ثانية) | السرعة T4 TensorRT10 (بالمللي ثانية) | المعلمات (M) | FLOPs (B) |
|---|---|---|---|---|---|---|
| YOLOv5n | 640 | 28.0 | 73.6 | 1.12 | 2.6 | 7.7 |
| YOLOv5s | 640 | 37.4 | 120.7 | 1.92 | 9.1 | 24.0 |
| YOLOv5m | 640 | 45.4 | 233.9 | 4.03 | 25.1 | 64.2 |
| YOLOv5l | 640 | 49.0 | 408.4 | 6.61 | 53.2 | 135.0 |
| YOLOv5x | 640 | 50.7 | 763.2 | 11.89 | 97.2 | 246.4 |
| YOLOv7l | 640 | 51.4 | - | 6.84 | 36.9 | 104.7 |
| YOLOv7x | 640 | 53.1 | - | 11.57 | 71.3 | 189.9 |
تحليل المقاييس
- السرعة مقابل الدقة: يحقق YOLOv7x mAP أعلى بنسبة 53.1% mAP مما يجعله مناسبًا للتحليلات الأمنية أو الطبية المتطورة حيث يكون كل بكسل مهمًا. ومع ذلك، بالنسبة للتطبيقات مثل تحليلات الفيديو أو الملاحة المستقلة، فإن وقت الاستدلال البالغ 1.12 مللي ثانية الذي يوفره YOLOv5n على TensorRT قدرة على معدل إطارات لا يمكن أن تضاهيها النماذج الأثقل.
- كفاءة التدريب: يستخدمYOLOv5 Ultralytics YOLOv5 استراتيجيات "AutoAnchor" والتطور المتقدم للمحددات الفائقة، مما يؤدي غالبًا إلى تقارب أسرع أثناء التدريب مقارنةً بمخططات إعادة الضبط المعقدة التي يتطلبها YOLOv7.
- بصمة الذاكرة: غالبًا ما يتطلب تدريب المحولات أو البنى المعقدة مثل YOLOv7 وحدات معالجة رسومات متطورة (على سبيل المثال، A100s). في المقابل، يسمح تصميم YOLOv5 الفعال بالتدريب على أجهزة من فئة المستهلكين، مما يجعل الوصول إلى تطوير الذكاء الاصطناعي أكثر ديمقراطية.
تنفيذ الكود
واحدة من أقوى الحجج المؤيدة لبرنامج Ultralytics YOLOv5 هي بساطة واجهة برمجة التطبيقات الخاصة به Python . لا يتطلب تحميل نموذج مدرب مسبقًا وتشغيل الاستدلال سوى بضعة أسطر من التعليمات البرمجية، وهو ما يدل على نضج الإطار.
import torch
# Load the YOLOv5s model from PyTorch Hub
model = torch.hub.load("ultralytics/yolov5", "yolov5s", pretrained=True)
# Define an image (url, local path, or numpy array)
img = "https://ultralytics.com/images/zidane.jpg"
# Run inference
results = model(img)
# Print results and show the image with bounding boxes
results.print()
results.show()
يسمح هذا المستوى من التجريد للمطورين بالتركيز على بناء حلول أعمالهم بدلاً من تصحيح أخطاء البنى النموذجية.
حالات الاستخدام المثالية
متى تختار YOLOv7
يُعدّ YOLOv7 خيارًا ممتازًا للأبحاث الأكاديمية والسيناريوهات التي تكون فيها قيود الأجهزة ثانوية بالنسبة لأداء الاكتشاف الأولي.
- البحث الأكاديمي: لقياس أحدث تقنيات الكشف القياسية.
- الفحص عالي الدقة: مثل مراقبة جودة التصنيع حيث يكون اكتشاف العيوب الدقيقة أمرًا بالغ الأهمية ويكون زمن الاستجابة أقل أهمية.
متى تختار Ultralytics YOLOv5
يظل YOLOv5 معيار الصناعة للتطوير السريع ونشر الإنتاج.
- نشر الحافة: مثالي للتشغيل على أجهزة iOS Android عبر صادرات TFLite أو CoreML .
- الروبوتات: يعد زمن الاستجابة المنخفض أمرًا بالغ الأهمية لحلقات التغذية الراجعة المطلوبة في الروبوتات المستقلة.
- تعدد الاستخدامات: بالإضافة إلى الاكتشاف، يدعم مستودع YOLOv5 تجزئة النماذج وتصنيف الصور، مما يوفر قاعدة رموز موحدة لمهام الرؤية المتعددة.
الخاتمة: الطريق الحديث إلى الأمام
بينما أظهر YOLOv7 قوة الضبط المعماري, Ultralytics YOLOv5 يظل الخيار الأفضل للمطورين الذين يحتاجون إلى حل موثوق وموثق جيدًا وسهل النشر. يضمن توازنه بين السرعة والدقة ودعم النظام الإيكولوجي أن يظل مناسبًا في بيئات الإنتاج في جميع أنحاء العالم.
ومع ذلك، يتحرك مجال الرؤية الحاسوبية بسرعة. لأولئك الذين يبحثون عن أفضل أداء على الإطلاق YOLO11 يمثل أحدث تطور من Ultralytics. يعتمد YOLO11 على سهولة استخدام YOLOv5 ولكنه يتضمن وحدات متطورة قائمة على المحولات وتصميمات خالية من المراسي، متجاوزًا كلاً من YOLOv5 و YOLOv7 في الدقة والكفاءة.
للحصول على حل مستقبلي يدعم اكتشاف الكائنات وتقدير الوضعية والمربعات المحدودة الموجهة (OBB)، يوصى بشدة بالانتقال إلى إطار عمل Ultralytics YOLO11 .
اكتشف المزيد من المقارنات
استكشف كيف تتنافس النماذج الأخرى مع عائلة Ultralytics YOLO :