YOLOv7 مقابل YOLOv5: مقارنة تقنية لأجهزة الكشف في الوقت الفعلي

عند بناء خطوط أنابيب رؤية حاسوبية حديثة، يعد اختيار بنية اكتشاف الكائنات المناسبة أمراً بالغ الأهمية لتحقيق التوازن بين الدقة وسرعة الاستدلال واستخدام الموارد. تتناول هذه المقارنة الشاملة نموذجين مؤثرين للغاية في مجال الرؤية الحاسوبية: YOLOv7 و Ultralytics YOLOv5.

من خلال تحليل اختلافاتهم المعمارية ومقاييس الأداء وسيناريوهات النشر المثالية، نهدف إلى مساعدة المطورين والباحثين على اختيار النموذج الأفضل لمتطلباتهم المحددة.

خلفية النماذج وأصولها

يوفر فهم أصول هذه النماذج سياقاً لفلسفات تصميمها وحالات استخدامها المستهدفة.

YOLOv5

تم إصدار YOLOv5 بواسطة Glenn Jocher وفريق Ultralytics في 26 يونيو 2020، وأحدث ثورة في هذا المجال من خلال توفير تطبيق PyTorch أصلي أعطى الأولوية لسهولة الاستخدام دون التضحية بالأداء. وسرعان ما أصبح معياراً صناعياً نظراً لنظامه البيئي المبسط بشكل لا يصدق وديناميكيات التدريب الموثوقة. يمكنك استكشاف الكود المصدري على مستودع YOLOv5 على GitHub أو الوصول إلى النموذج مباشرة عبر منصة Ultralytics.

اعرف المزيد حول YOLOv5

YOLOv7

تم تقديمه بواسطة Chien-Yao Wang و Alexey Bochkovskiy و Hong-Yuan Mark Liao من معهد علوم المعلومات، Academia Sinica، تايوان في 6 يوليو 2022. ركز YOLOv7 بشكل كبير على الابتكارات المعمارية مثل شبكات تجميع الطبقات الفعالة الموسعة (E-ELAN) و"حقيبة الحيل" (bag-of-freebies) القابلة للتدريب لدفع حالة الفن في الدقة. يمكن العثور على التفاصيل في ورقة Arxiv الرسمية و مستودع YOLOv7 على GitHub. للتكامل السلس، تحقق من وثائق Ultralytics YOLOv7.

اعرف المزيد عن YOLOv7

تجربة سلسة

كلا النموذجين مدمجان بالكامل في حزمة Ultralytics Python، مما يسمح لك بالتبديل بينهما ببساطة عن طريق تغيير سلسلة النموذج في الكود الخاص بك!

الابتكارات المعمارية

تصميم Ultralytics YOLOv5

يستخدم YOLOv5 هيكلاً أساسياً (backbone) من نوع CSPDarknet53 معدلاً مقترناً بعنق من نوع شبكة تجميع المسار (PANet). تم تحسين هذا التصميم بدرجة عالية من أجل استخراج الميزات السريع وكفاءة الذاكرة. على عكس البنى القديمة أو نماذج المحولات (Transformer) الثقيلة، يتطلب YOLOv5 ذاكرة CUDA أقل بكثير أثناء التدريب، مما يسمح بـ أحجام دفعات أكبر على وحدات معالجة الرسومات الاستهلاكية القياسية. علاوة على ذلك، يدعم إطار عمل Ultralytics بشكل متأصل مجموعة واسعة من المهام بخلاف صناديق الإحاطة القياسية، بما في ذلك تجزئة الصور و تصنيف الصور.

تصميم YOLOv7

قدم YOLOv7 العديد من إعادة التوصيفات الهيكلية ومعمارية E-ELAN، والتي تسمح للشبكة بتعلم ميزات أكثر تنوعاً دون تدمير مسار التدرج الأصلي. كما أنه ينفذ رأساً مساعداً للإشراف المتوسط أثناء التدريب. على الرغم من أن هذه التطورات تنتج متوسط دقة (mAP) عالياً، إلا أنها غالباً ما تقدم هياكل موتر (tensor) معقدة يمكن أن تجعل التصدير إلى تنسيقات الحافة مثل ONNX أو TensorRT أكثر صعوبة قليلاً مقارنة بالتصديرات المبسطة الأصلية لنماذج Ultralytics.

تحليل الأداء

عند مقارنة هذه النماذج، يجب على المطورين الموازنة بين mAPval وسرعة الاستدلال والتعقيد الحسابي (FLOPs). يوضح الجدول أدناه أداء كلتا البنيتين اللتين تم تقييمهما على مجموعة بيانات COCO.

النموذجالحجم
(بكسل)
mAPval
50-95
السرعة
CPU ONNX
(ملي ثانية)
السرعة
T4 TensorRT10
(ملي ثانية)
المعلمات
(مليون)
FLOPs
(مليار)
YOLOv7l64051.4-6.8436.9104.7
YOLOv7x64053.1-11.5771.3189.9
YOLOv5n64028.073.61.122.67.7
YOLOv5s64037.4120.71.929.124.0
YOLOv5m64045.4233.94.0325.164.2
YOLOv5l64049.0408.46.6153.2135.0
YOLOv5x64050.7763.211.8997.2246.4

أهم النتائج

  • سقف الدقة: يحقق YOLOv7x أعلى دقة إجمالية عند 53.1 mAPval مثيرة للإعجاب، مما يجعله تنافسياً للغاية في السيناريوهات التي يكون فيها تعظيم أداء الاكتشاف هو الهدف الأساسي.
  • السرعة والكفاءة: يعتبر Ultralytics YOLOv5n أعجوبة في الكفاءة، حيث يوفر زمن انتقال استدلال فائق السرعة (1.12 مللي ثانية على T4 TensorRT) مع بصمة ذاكرة صغيرة تبلغ 2.6 مليون بارامتر فقط. وهذا يجعله خياراً لا مثيل له لنشر الحافة المقيد للغاية.
  • توازن الأداء: توفر سلسلة YOLOv5 تدرجاً استثنائياً من النماذج. يوفر YOLOv5l أرضية وسطية رائعة، حيث يتخلف عن YOLOv7l بهامش دقة صغير ولكنه يوفر خط أنابيب نشر ناضجاً للغاية.

ميزة نظام Ultralytics البيئي

بنية النموذج هي نصف المعادلة فقط؛ فالنظام البيئي المحيط به يحدد قابليته للتطبيق في العالم الحقيقي. وهنا تتألق نماذج Ultralytics حقاً.

سهولة الاستخدام: توفر Ultralytics واجهة برمجة تطبيقات Python موحدة وبديهية للغاية. يمكنك تدريب النماذج والتحقق منها ونشرها بأقل قدر من الكود التمهيدي، مدعوماً بـ وثائق رسمية واسعة النطاق. نظام بيئي مُصان جيداً: يضمن التطوير النشط تحديثات مستمرة وإصلاحات للأخطاء وتكاملاً سلساً مع أدوات التتبع الحديثة مثل Weights & Biases. كفاءة التدريب: باستخدام أدوات تحميل البيانات المحسنة و التخزين المؤقت الذكي، يقلل YOLOv5 أوقات التدريب بشكل كبير. علاوة على ذلك، تعمل الأوزان المدربة مسبقاً والجاهزة للاستخدام على تسريع التعلم بنقل المعرفة عبر مجالات مختلفة.

مثال برمجي: تدريب مبسط

باستخدام حزمة Ultralytics، يكون بدء عملية التدريب متطابقاً تقريباً بغض النظر عن البنية التي تختارها.

from ultralytics import YOLO

# Load a pre-trained YOLOv5 model (can easily swap to "yolov7.pt")
model = YOLO("yolov5s.pt")

# Train the model on the COCO8 example dataset
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)

# Export the trained model to ONNX format for deployment
success = model.export(format="onnx")

حالات الاستخدام المثالية

متى تختار YOLOv7

  • قياس الأداء الأكاديمي: مثالي للباحثين الذين يحتاجون إلى مقارنة تقنيات جديدة مقابل خط أساس موثق جيداً لعام 2022.
  • معالجة الحوسبة السحابية عالية الأداء: عند النشر على أجهزة خادم قوية حيث تفوق أهمية تحقيق أعلى mAP ممكن في المشاهد الكثيفة بساطة التصدير.

متى تختار YOLOv5

  • عمليات النشر الإنتاجية: مثالية للتطبيقات التجارية التي تتطلب استقراراً عالياً، و خيارات نشر نموذج مباشرة، وتوافقاً واسعاً عبر الأنظمة الأساسية.
  • أجهزة الحافة: تعمل المتغيرات الأصغر (YOLOv5n و YOLOv5s) بشكل ممتاز على الهواتف المحمولة والأنظمة المدمجة.
  • متطلبات المهام المتعددة: إذا كان مشروعك يحتاج إلى التطور من الاكتشاف البسيط إلى تقدير الوضع أو التجزئة باستخدام إطار عمل موحد.
استكشاف بنى أخرى

هل تبحث عن إصدارات أحدث؟ فكر في استكشاف Ultralytics YOLOv8 أو Ultralytics YOLO11 للحصول على مزيد من التقدم في الاكتشاف الخالي من المراسي وقدرات التعلم متعدد المهام.

الجيل القادم: Ultralytics YOLO26

في حين أن YOLOv5 و YOLOv7 لهما مكانة حيوية في تاريخ رؤية الذكاء الاصطناعي، فإن المشهد يتطور باستمرار. تم إصدار Ultralytics YOLO26 في يناير 2026، ويمثل أحدث ما توصلت إليه تكنولوجيا اكتشاف الكائنات، متفوقاً على الأجيال السابقة عبر جميع المقاييس.

اعرف المزيد عن YOLO26

يقدم YOLO26 العديد من الميزات التي تغير النموذج:

  • تصميم شامل (End-to-End) خالٍ من NMS: بناءً على المفاهيم التي تم ريادتها في التكرارات السابقة، فإن YOLO26 هو شامل (End-to-End) بشكل أصلي. هذا يلغي تماماً معالجة ما بعد الكبت غير الأقصى (NMS)، مما يقلل من اختناقات زمن الوصول ويبسط منطق النشر بشكل كبير.
  • محسن MuSGD: مستوحى من Kimi K2 الخاص بشركة Moonshot AI، يدمج هذا المحسن الثوري استقرار SGD القياسي مع زخم Muon المتسارع، مما يجلب ابتكارات تدريب LLM المتقدمة مباشرة إلى الرؤية الحاسوبية.
  • سرعة وحدة المعالجة المركزية (CPU) المحسنة: من خلال إزالة توزيع فقدان التركيز (DFL) بشكل استراتيجي، يحقق YOLO26 استدلالاً أسرع بـ 43% على وحدة المعالجة المركزية (CPU)، مما يجعله البطل بلا منازع لنشر أجهزة الحافة وأجهزة IoT منخفضة الطاقة.
  • ProgLoss + STAL: تحقق دوال الخسارة المتقدمة هذه تحسينات هائلة في التعرف على الكائنات الصغيرة، وهو أمر بالغ الأهمية للصور الجوية والروبوتات الدقيقة.
  • تحسينات خاصة بالمهمة: تتميز بخسارة التجزئة الدلالية لتوليد القناع، وتقدير احتمالية السجل المتبقي (RLE) لتتبع الوضع، وخسارة زاوية متخصصة لحل مشكلات حدود صندوق الإحاطة الموجه (OBB) المعقدة.

خاتمة

يوفر كل من YOLOv5 و YOLOv7 حلولاً قوية لاكتشاف الكائنات في الوقت الفعلي. يظل YOLOv7 خياراً قوياً للدقة الخام على الأجهزة ذات الحوسبة العالية، بينما يبرز YOLOv5 كأداة نهائية صديقة للمطورين، حيث يوفر توازناً استثنائياً بين السرعة والكفاءة ونظام بيئي عالمي المستوى.

ومع ذلك، بالنسبة للمطورين الذين يتطلعون إلى حماية خطوط أنابيبهم مستقبلياً وتحقيق المزيج النهائي من السرعة والبساطة والدقة الحديثة، نوصي بشدة بالانتقال إلى Ultralytics YOLO26. إنه يغلف سهولة الاستخدام الأسطورية لمنصة Ultralytics مع تقديم ابتكارات معمارية رائدة.

التعليقات