تخطي إلى المحتوى

YOLOv7 YOLOv5: مقارنة تقنية بين أجهزة الكشف في الوقت الحقيقي

عند بناء خطوط أنابيب حديثة للرؤية الحاسوبية، يعد اختيار بنية الكشف عن الكائنات المناسبة أمرًا بالغ الأهمية لتحقيق التوازن بين الدقة وسرعة الاستدلال واستخدام الموارد. تبحث هذه المقارنة الشاملة بين نموذجين مؤثرين للغاية في مجال الرؤية الحاسوبية: YOLOv7 Ultralytics YOLOv5.

من خلال تحليل اختلافاتهم المعمارية ومقاييس الأداء وسيناريوهات النشر المثالية، نهدف إلى مساعدة المطورين والباحثين على اختيار النموذج الأفضل لمتطلباتهم الخاصة.

خلفية النموذج وأصوله

فهم أصول هذه النماذج يوفر سياقًا لفلسفات تصميمها وحالات الاستخدام المستهدفة.

YOLOv5

صدر عن جلين جوشر وفريق Ultralytics في 26 يونيو 2020، YOLOv5 في هذا المجال من خلال توفير PyTorch أعطى الأولوية لسهولة الاستخدام دون التضحية بالأداء. وسرعان ما أصبح معيارًا صناعيًا بفضل نظامه البيئي المبسط بشكل لا يصدق وديناميكيات التدريب الموثوقة. يمكنك استكشاف الكود المصدري على مستودعYOLOv5 أو الوصول إلى النموذج مباشرة عبر Ultralytics .

تعرف على المزيد حول YOLOv5

YOLOv7

قدمه Chien-Yao Wang و Alexey Bochkovskiy و Hong-Yuan Mark Liao من معهد علوم المعلومات، أكاديمية سينيكا، تايوان في 6 يوليو 2022. YOLOv7 بشكل كبير على الابتكارات المعمارية مثل شبكات تجميع الطبقات الفعالة الموسعة (E-ELAN) و"حقيبة الهدايا" القابلة للتدريب لدفع أحدث ما توصلت إليه التكنولوجيا في مجال الدقة. يمكن العثور على التفاصيل في ورقتهم البحثية الرسمية على Arxiv ومستودعYOLOv7 . للتكامل السلس، راجع YOLOv7 Ultralytics YOLOv7 .

تعرف على المزيد حول YOLOv7

تجربة سلسة

تم دمج كلا النموذجين بالكامل في حزمة Ultralytics Python، مما يتيح لك التبديل بينهما بمجرد تغيير سلسلة النموذج في التعليمات البرمجية الخاصة بك!

الابتكارات المعمارية

YOLOv5 Ultralytics YOLOv5

YOLOv5 هيكل CSPDarknet53 معدل مقترن برقبة شبكة تجميع المسارات (PANet). تم تحسين هذا التصميم بشكل كبير لاستخراج الميزات بسرعة وكفاءة الذاكرة. على عكس البنى القديمة أو نماذج المحولات الثقيلة، YOLOv5 CUDA أقل بكثير أثناء التدريب، مما يسمح بأحجام دفعات أكبر على وحدات معالجة الرسومات القياسية للمستهلكين. علاوة على ذلك، يدعم Ultralytics بطبيعته مجموعة متنوعة من المهام التي تتجاوز المربعات المحددة القياسية، بما في ذلك تقسيم الصور وتصنيفها.

YOLOv7

YOLOv7 عدة إعادة معايرة هيكلية وبنية E-ELAN، التي تسمح للشبكة بتعلم ميزات أكثر تنوعًا دون تدمير مسار التدرج الأصلي. كما أنه يطبق رأسًا مساعدًا للإشراف المتوسط أثناء التدريب. في حين أن هذه التطورات تحقق متوسط دقة عالي (mAP)، فإنها غالبًا ما تقدم tensor معقدة يمكن أن تجعل التصدير إلى تنسيقات الحافة مثل ONNX أو TensorRT أكثر صعوبة قليلاً مقارنة بالتصدير المبسط الأصلي Ultralytics .

تحليل الأداء

عند مقارنة هذه النماذج، يجب على المطورين تحقيق التوازن بينmAPval وسرعة الاستدلال والتعقيد الحسابي (FLOPs). يوضح الجدول أدناه أداء كلتا البنيتين المُقيَّمتين على COCO .

النموذجالحجم
(بالبكسل)
mAPval
50-95
السرعة
وحدة المعالجة المركزية CPU ONNX
(بالمللي ثانية)
السرعة
T4 TensorRT10
(بالمللي ثانية)
المعلمات
(M)
FLOPs
(B)
YOLOv7l64051.4-6.8436.9104.7
YOLOv7x64053.1-11.5771.3189.9
YOLOv5n64028.073.61.122.67.7
YOLOv5s64037.4120.71.929.124.0
YOLOv5m64045.4233.94.0325.164.2
YOLOv5l64049.0408.46.6153.2135.0
YOLOv5x64050.7763.211.8997.2246.4

النقاط الرئيسية

  • سقف الدقة: يحقق YOLOv7x أعلى دقة إجمالية عند 53.1 mAPval مثيرة للإعجاب، مما يجعله تنافسيًا للغاية للسيناريوهات التي يكون فيها تعظيم أداء الكشف هو الهدف الأساسي.
  • السرعة والكفاءة: يُعد Ultralytics YOLOv5n تحفة فنية في الكفاءة، مقدمًا تأخير استدلال فائق السرعة (1.12 مللي ثانية على T4 TensorRT) مع بصمة ذاكرة صغيرة تبلغ 2.6 مليون معلمة فقط. وهذا يجعله خيارًا لا مثيل له لعمليات النشر الطرفية شديدة التقييد.
  • توازن الأداء: توفر سلسلة YOLOv5 تدرجًا استثنائيًا من النماذج. يقدم YOLOv5l حلاً وسطًا رائعًا، متخلفًا عن YOLOv7l بهامش دقة صغير ولكنه يوفر مسار نشر ناضجًا للغاية.

ميزة النظام البيئي لـ Ultralytics

بنية النموذج هي نصف المعادلة فقط؛ فالنظام البيئي المحيط به يحدد قابليته للتطبيق في العالم الحقيقي. وهنا تتألق نماذج Ultralytics حقًا.

سهولة الاستخدام: توفر Ultralytics واجهة برمجة تطبيقات Python موحدة وبديهية للغاية. يمكنك تدريب النماذج والتحقق منها ونشرها بأقل قدر من التعليمات البرمجية المتكررة، مدعومة بوثائق رسمية شاملة. نظام بيئي جيد الصيانة: يضمن التطوير النشط تحديثات مستمرة وإصلاحات للأخطاء وتكاملًا سلسًا مع أدوات التتبع الحديثة مثل Weights & Biases. كفاءة التدريب: باستخدام محملات البيانات المحسّنة والتخزين المؤقت الذكي، يقلل YOLOv5 أوقات التدريب بشكل كبير. علاوة على ذلك، تسرع الأوزان المدربة مسبقًا الجاهزة للاستخدام التعلم بالتحويل عبر مجالات مختلفة.

مثال برمجي: تدريب مبسط

مع Ultralytics فإن بدء تشغيل التدريب يكون متطابقًا تقريبًا بغض النظر عن البنية التي تختارها.

from ultralytics import YOLO

# Load a pre-trained YOLOv5 model (can easily swap to "yolov7.pt")
model = YOLO("yolov5s.pt")

# Train the model on the COCO8 example dataset
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)

# Export the trained model to ONNX format for deployment
success = model.export(format="onnx")

حالات الاستخدام المثالية

متى تختار YOLOv7

  • المقارنة المعيارية الأكاديمية: مثالي للباحثين الذين يحتاجون إلى مقارنة التقنيات الجديدة بأساس مرجعي موثق جيدًا لعام 2022.
  • معالجة السحابة باستخدام وحدات GPU عالية الأداء: عند النشر على أجهزة خادم قوية حيث يفوق تحقيق أعلى mAP مطلق في المشاهد الكثيفة بساطة التصدير.

متى تختار YOLOv5

  • عمليات النشر الإنتاجية: مثالي للتطبيقات التجارية التي تتطلب استقرارًا عاليًا، خيارات نشر نموذج مباشرة، وتوافقًا واسعًا عبر الأنظمة الأساسية.
  • أجهزة الحافة: تعمل المتغيرات الأصغر (YOLOv5n و YOLOv5s) بشكل استثنائي جيد على الهواتف المحمولة والأنظمة المدمجة.
  • متطلبات المهام المتعددة: إذا كان مشروعك بحاجة إلى التطور من الكشف البسيط (detect) إلى تقدير الوضعية (pose estimation) أو الـsegmentation باستخدام إطار عمل موحد.

استكشاف هياكل أخرى

هل تبحث عن إصدارات أحدث؟ فكر في استكشاف Ultralytics YOLOv8 أو Ultralytics YOLO11 لمزيد من التقدم في الكشف بدون مرساة وقدرات التعلم متعدد المهام.

الجيل القادم: Ultralytics

في حين YOLOv7 YOLOv5 YOLOv7 مكانة مهمة في تاريخ الذكاء الاصطناعي البصري، فإن المشهد يتطور باستمرار. تم إصدار Ultralytics في يناير 2026، Ultralytics يمثل أحدث ما توصلت إليه تكنولوجيا الكشف عن الأشياء، متفوقًا على الأجيال السابقة في جميع المقاييس.

تعرف على المزيد حول YOLO26

يقدم YOLO26 العديد من الميزات التي تغير النموذج:

  • تصميم شامل خالٍ من NMS: استنادًا إلى المفاهيم الرائدة في التكرارات السابقة، يتميز YOLO26 بتصميم شامل أصيل. وهذا يلغي تمامًا معالجة ما بعد التثبيط غير الأقصى (NMS)، مما يقضي على اختناقات زمن الانتقال ويبسط منطق النشر بشكل جذري.
  • مُحسِّن MuSGD: مستوحى من Kimi K2 من Moonshot AI، يدمج هذا المُحسِّن الثوري استقرار SGD القياسي مع الزخم المتسارع لـ Muon، جالبًا ابتكارات تدريب نماذج LLM المتقدمة مباشرة إلى الرؤية الحاسوبية.
  • سرعة CPU محسنة: بإزالة دالة الخسارة البؤرية التوزيعية (DFL) بشكل استراتيجي، يحقق YOLO26 استدلالًا أسرع بنسبة تصل إلى 43% على CPU، مما يجعله البطل بلا منازع لنشر أجهزة إنترنت الأشياء الطرفية ومنخفضة الطاقة.
  • ProgLoss + STAL: تحقق دوال الخسارة المتقدمة هذه تحسينات هائلة في التعرف على الكائنات الصغيرة، وهو أمر بالغ الأهمية للصور الجوية والروبوتات الدقيقة.
  • تحسينات خاصة بالمهام: تتميز بفقدان التجزئة الدلالية لتوليد القناع، وتقدير الاحتمالية اللوغاريتمية المتبقية (RLE) لـ track الوضعية، وخسارة زاوية متخصصة لحل مشكلات الحدود المعقدة لـ الصندوق المحيط الموجه (OBB).

الخلاصة

يقدم كل من YOLOv5 وYOLOv7 حلولاً قوية لاكتشاف الكائنات في الوقت الفعلي. يظل YOLOv7 خيارًا قويًا للدقة الخام على الأجهزة عالية القدرة الحاسوبية، بينما يبرز YOLOv5 كأداة مثالية صديقة للمطورين، حيث يقدم توازنًا استثنائيًا بين السرعة والكفاءة ونظامًا بيئيًا عالميًا.

ومع ذلك، بالنسبة للمطورين الذين يسعون إلى تأمين خطوط أنابيبهم للمستقبل وتحقيق المزيج المثالي بين السرعة والبساطة والدقة المتطورة، نوصي بشدة بالانتقال إلى Ultralytics . فهو يجمع بين سهولة الاستخدام الأسطورية Ultralytics وتقديم ابتكارات معمارية رائدة.


تعليقات