تخطي إلى المحتوى

YOLOv7 YOLOv5: مقارنة تقنية بين أجهزة الكشف في الوقت الحقيقي

عند بناء خطوط أنابيب حديثة للرؤية الحاسوبية، يعد اختيار بنية الكشف عن الكائنات المناسبة أمرًا بالغ الأهمية لتحقيق التوازن بين الدقة وسرعة الاستدلال واستخدام الموارد. تبحث هذه المقارنة الشاملة بين نموذجين مؤثرين للغاية في مجال الرؤية الحاسوبية: YOLOv7 Ultralytics YOLOv5.

من خلال تحليل الاختلافات المعمارية ومقاييس الأداء وسيناريوهات النشر المثالية، نهدف إلى مساعدة المطورين والباحثين على اختيار أفضل نموذج لمتطلباتهم المحددة.

خلفية النموذج وأصوله

فهم أصول هذه النماذج يوفر سياقًا لفلسفات تصميمها وحالات الاستخدام المستهدفة.

YOLOv5

صدر عن جلين جوشر وفريق Ultralytics في 26 يونيو 2020، YOLOv5 في هذا المجال من خلال توفير PyTorch أعطى الأولوية لسهولة الاستخدام دون التضحية بالأداء. وسرعان ما أصبح معيارًا صناعيًا بفضل نظامه البيئي المبسط بشكل لا يصدق وديناميكيات التدريب الموثوقة. يمكنك استكشاف الكود المصدري على مستودعYOLOv5 أو الوصول إلى النموذج مباشرة عبر Ultralytics .

تعرف على المزيد حول YOLOv5

YOLOv7

قدمه Chien-Yao Wang و Alexey Bochkovskiy و Hong-Yuan Mark Liao من معهد علوم المعلومات، أكاديمية سينيكا، تايوان في 6 يوليو 2022. YOLOv7 بشكل كبير على الابتكارات المعمارية مثل شبكات تجميع الطبقات الفعالة الموسعة (E-ELAN) و"حقيبة الهدايا" القابلة للتدريب لدفع أحدث ما توصلت إليه التكنولوجيا في مجال الدقة. يمكن العثور على التفاصيل في ورقتهم البحثية الرسمية على Arxiv ومستودعYOLOv7 . للتكامل السلس، راجع YOLOv7 Ultralytics YOLOv7 .

تعرف على المزيد حول YOLOv7

تجربة سلسة

كلا هذين النموذجين مدمجان بالكامل فيPython Ultralytics Python ، مما يتيح لك التبديل بينهما بمجرد تغيير سلسلة النموذج في الكود الخاص بك!

الابتكارات المعمارية

YOLOv5 Ultralytics YOLOv5

YOLOv5 هيكل CSPDarknet53 معدل مقترن برقبة شبكة تجميع المسارات (PANet). تم تحسين هذا التصميم بشكل كبير لاستخراج الميزات بسرعة وكفاءة الذاكرة. على عكس البنى القديمة أو نماذج المحولات الثقيلة، YOLOv5 CUDA أقل بكثير أثناء التدريب، مما يسمح بأحجام دفعات أكبر على وحدات معالجة الرسومات القياسية للمستهلكين. علاوة على ذلك، يدعم Ultralytics بطبيعته مجموعة متنوعة من المهام التي تتجاوز المربعات المحددة القياسية، بما في ذلك تقسيم الصور وتصنيفها.

YOLOv7

YOLOv7 عدة إعادة معايرة هيكلية وبنية E-ELAN، التي تسمح للشبكة بتعلم ميزات أكثر تنوعًا دون تدمير مسار التدرج الأصلي. كما أنه يطبق رأسًا مساعدًا للإشراف المتوسط أثناء التدريب. في حين أن هذه التطورات تحقق متوسط دقة عالي (mAP)، فإنها غالبًا ما تقدم tensor معقدة يمكن أن تجعل التصدير إلى تنسيقات الحافة مثل ONNX أو TensorRT أكثر صعوبة قليلاً مقارنة بالتصدير المبسط الأصلي Ultralytics .

تحليل الأداء

عند مقارنة هذه النماذج، يجب على المطورين تحقيق التوازن بينmAPval وسرعة الاستدلال والتعقيد الحسابي (FLOPs). يوضح الجدول أدناه أداء كلتا البنيتين المُقيَّمتين على COCO .

النموذجالحجم
(بالبكسل)
mAPval
50-95
السرعة
وحدة المعالجة المركزية CPU ONNX
(بالمللي ثانية)
السرعة
T4 TensorRT10
(بالمللي ثانية)
المعلمات
(M)
FLOPs
(B)
YOLOv7l64051.4-6.8436.9104.7
YOLOv7x64053.1-11.5771.3189.9
YOLOv5n64028.073.61.122.67.7
YOLOv5s64037.4120.71.929.124.0
YOLOv5m64045.4233.94.0325.164.2
YOLOv5l64049.0408.46.6153.2135.0
YOLOv5x64050.7763.211.8997.2246.4

النقاط الرئيسية

  • الحد الأقصى للدقة: يحقق YOLOv7x أعلى دقة إجمالية بمعدل مثير للإعجاب يبلغ 53.1mAPval، مما يجعله شديد التنافسية في السيناريوهات التي يكون فيها الهدف الأساسي هو تعظيم أداء الكشف.
  • السرعة والكفاءة: Ultralytics هو أعجوبة في الكفاءة، حيث يوفر زمن استدلال سريع للغاية (1.12 مللي ثانية على T4 TensorRT) مع مساحة ذاكرة صغيرة تبلغ 2.6 مليون معلمة فقط. وهذا يجعله خيارًا لا مثيل له لعمليات النشر المحدودة للغاية.
  • توازن الأداء: توفر YOLOv5 نماذج ذات تدرج استثنائي. يوفر YOLOv5l حلًا وسطًا رائعًا، حيث يتخلف عن YOLOv7l بفارق بسيط في الدقة، ولكنه يوفر خط أنابيب نشر ناضج للغاية.

ميزة النظام البيئي لـ Ultralytics

تشكل بنية النموذج نصف المعادلة فقط؛ فالنظام البيئي المحيط به هو الذي يحدد قابليته للتطبيق في العالم الواقعي. وهنا تكمن أهمية Ultralytics .

سهولة الاستخدام: Ultralytics Python موحدة وسهلة الاستخدام للغاية. يمكنك تدريب النماذج والتحقق من صحتها ونشرها بأقل قدر من النصوص النمطية، مدعومة بوثائق رسمية شاملة. نظام بيئي جيد الصيانة: يضمن التطوير النشط التحديثات المستمرة وإصلاح الأخطاء والتكامل السلس مع أدوات التتبع الحديثة مثل Weights & Biases. كفاءة التدريب: باستخدام محملات البيانات المُحسّنة والتخزين المؤقت الذكي، يقلل YOLOv5 أوقات التدريب. علاوة على ذلك، تعمل الأوزان المُعدة مسبقًا والجاهزة للاستخدام على تسريع نقل التعلم عبر مختلف المجالات.

مثال على الكود: تدريب مبسط

مع Ultralytics فإن بدء تشغيل التدريب يكون متطابقًا تقريبًا بغض النظر عن البنية التي تختارها.

from ultralytics import YOLO

# Load a pre-trained YOLOv5 model (can easily swap to "yolov7.pt")
model = YOLO("yolov5s.pt")

# Train the model on the COCO8 example dataset
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)

# Export the trained model to ONNX format for deployment
success = model.export(format="onnx")

حالات الاستخدام المثالية

متى تختار YOLOv7

  • المقارنة الأكاديمية: مثالية للباحثين الذين يحتاجون إلى مقارنة التقنيات الجديدة بخط الأساس الموثق جيدًا لعام 2022.
  • معالجة GPU عالية الأداء GPU : عند النشر على أجهزة خادم قوية حيث يكون تحقيق أعلى معدل mAP المشاهد الكثيفة أكثر أهمية من سهولة التصدير.

متى تختار YOLOv5

  • عمليات نشر الإنتاج: مثالية للتطبيقات التجارية التي تتطلب استقرارًا عاليًا وخيارات نشر نماذج مباشرة وتوافقًا واسعًا بين الأنظمة الأساسية.
  • الأجهزة الطرفية: تعمل الإصدارات الأصغر حجماً (YOLOv5n و YOLOv5s) بشكل استثنائي على الهواتف المحمولة والأنظمة المدمجة.
  • متطلبات المهام المتعددة: إذا كان مشروعك يحتاج إلى التطور من الكشف البسيط إلى تقدير الوضع أو التجزئة باستخدام إطار عمل موحد.

استكشاف هياكل أخرى

هل تبحث عن إصدارات أحدث؟ فكر في استكشاف Ultralytics YOLOv8 أو Ultralytics YOLO11 لمزيد من التقدم في الكشف بدون مرساة وقدرات التعلم متعدد المهام.

الجيل القادم: Ultralytics

في حين YOLOv7 YOLOv5 YOLOv7 مكانة مهمة في تاريخ الذكاء الاصطناعي البصري، فإن المشهد يتطور باستمرار. تم إصدار Ultralytics في يناير 2026، Ultralytics يمثل أحدث ما توصلت إليه تكنولوجيا الكشف عن الأشياء، متفوقًا على الأجيال السابقة في جميع المقاييس.

تعرف على المزيد حول YOLO26

يقدم YOLO26 العديد من الميزات التي تغير النموذج:

  • تصميم شامل NMS: بناءً على المفاهيم التي تم ابتكارها في الإصدارات السابقة، يتميز YOLO26 بتصميمه الشامل. وهذا يلغي تمامًا الحاجة إلى المعالجة اللاحقة لـ Non-Maximum Suppression (NMS)، مما يقلل من اختناقات زمن الاستجابة ويبسط منطق النشر بشكل كبير.
  • MuSGD Optimizer: مستوحى من Kimi K2 من Moonshot AI، يدمج هذا المحسن الثوري استقرار SGD القياسي SGD الزخم المتسارع لـ Muon، مما يجلب ابتكارات تدريب LLM المتقدمة مباشرة إلى الرؤية الحاسوبية.
  • CPU محسّنة: من خلال إزالة فقدان التركيز التوزيعي (DFL) بشكل استراتيجي، يحقق YOLO26 CPU أسرع بنسبة تصل إلى 43٪ CPU ، مما يجعله البطل بلا منازع في نشر أجهزة إنترنت الأشياء المتطورة ومنخفضة الطاقة.
  • ProgLoss + STAL: توفر وظائف الخسارة المتقدمة هذه تحسينات هائلة في التعرف على الأجسام الصغيرة، وهو أمر بالغ الأهمية بالنسبة للصور الجوية والروبوتات الدقيقة.
  • تحسينات خاصة بالمهام: تتميز بفقدان التجزئة الدلالية لتوليد القناع، وتقدير الاحتمالية اللوغاريتمية المتبقية (RLE) لتتبع الوضع، وفقدان الزاوية المتخصص لحل مشكلات حدود الصندوق المحيط الموجه (OBB) الصعبة.

الخلاصة

YOLOv7 كل YOLOv5 YOLOv7 حلولاً قوية للكشف عن الكائنات في الوقت الفعلي. YOLOv7 خياراً قوياً للدقة الأولية على الأجهزة عالية الحوسبة، بينما YOLOv5 كأداة سهلة الاستخدام للمطورين، حيث يوفر توازناً استثنائياً بين السرعة والكفاءة ونظام بيئي عالمي المستوى.

ومع ذلك، بالنسبة للمطورين الذين يسعون إلى تأمين خطوط أنابيبهم للمستقبل وتحقيق المزيج المثالي بين السرعة والبساطة والدقة المتطورة، نوصي بشدة بالانتقال إلى Ultralytics . فهو يجمع بين سهولة الاستخدام الأسطورية Ultralytics وتقديم ابتكارات معمارية رائدة.


تعليقات