تخطي إلى المحتوى

YOLOv7 ضد YOLOv6-3.0: مقارنة تفصيلية للنماذج في الكشف عن الأجسام

يُعد اختيار نموذج الكشف عن الكائنات الأمثل قرارًا بالغ الأهمية في مشاريع الرؤية الحاسوبية، ويتطلب توازنًا بين الدقة والسرعة واستخدام الموارد. تقدم هذه الصفحة مقارنة فنية مفصلة بين YOLOv7 و YOLOv6-3.0، وهما نموذجان بارزان معروفان بقدراتهما في الكشف عن الكائنات. سوف نتعمق في هياكلهما ومعايير الأداء والتطبيقات المناسبة لتوجيه عملية اختيار النموذج الخاص بك.

YOLOv7: الدقة والتقنيات المتقدمة

YOLOv7، الذي تم تطويره بواسطة باحثين في معهد علوم المعلومات، أكاديميا سينيكا، تايوان، يمثل خطوة مهمة في الكشف عن الأجسام في الوقت الفعلي، مع التركيز على تحقيق دقة عالية مع الحفاظ على الكفاءة.

المؤلفون: Chien-Yao Wang, Alexey Bochkovskiy, و Hong-Yuan Mark Liao
المنظمة: معهد علوم المعلومات، أكاديميا سينيكا، تايوان
التاريخ: 2022-07-06
Arxiv: https://arxiv.org/abs/2207.02696
GitHub: https://github.com/WongKinYiu/yolov7
المستندات: https://docs.ultralytics.com/models/yolov7/

البنية والميزات الرئيسية

يقدم YOLOv7 العديد من الابتكارات المعمارية واستراتيجيات التدريب التي تهدف إلى تعزيز الأداء دون زيادة تكاليف الاستدلال بشكل كبير. تشمل الميزات الرئيسية:

  • E-ELAN (شبكات تجميع الطبقات الفعالة الموسعة): يعزز هذا المكون الأساسي في العمود الفقري للنموذج قدرة الشبكة على تعلم الميزات بفعالية، مما يحسن من كفاءة المعلمات والحسابات. يمكن العثور على مزيد من التفاصيل في الورقة الأصلية.
  • توسيع نطاق النموذج: يطبق طرق توسيع نطاق مركبة لعمق النموذج وعرضه، وتحسين الأداء عبر أحجام النماذج المختلفة بناءً على مبادئ النموذج القائم على التسلسل.
  • تدريب الرأس الإضافي: يستخدم رؤوسًا إضافية خلال مرحلة التدريب لتعزيز تعلم الميزات، والتي تتم إزالتها بعد ذلك للاستدلال للحفاظ على السرعة. يرتبط هذا المفهوم بتقنيات الإشراف العميق المستخدمة في الشبكات العصبية الأخرى.
  • تحسينات "حقيبة الامتيازات المجانية": تتضمن تقنيات تدريب متقدمة مثل زيادة البيانات وتحسينات تعيين التسميات التي تحسن الدقة دون تكلفة استدلال إضافية.

نقاط القوة

نقاط الضعف

  • التعقيد: يمكن أن تجعل الميزات المعمارية المتقدمة وتقنيات التدريب النموذج أكثر تعقيدًا للفهم والضبط الدقيق مقارنة بالبنى الأبسط مثل YOLOv5.
  • تدريب يستهلك الكثير من الموارد: تتطلب متغيرات YOLOv7 الأكبر (مثل YOLOv7-E6E) موارد حسابية كبيرة للتدريب.

تعرف على المزيد حول YOLOv7

YOLOv6-3.0: الكفاءة والسرعة الصناعية

تم تصميم YOLOv6-3.0، الذي تم تطويره بواسطة Meituan، للتطبيقات الصناعية التي تتطلب الكشف عن الأجسام عالية الأداء مع التركيز على السرعة والكفاءة. يعمل الإصدار 3.0 على تحسين الإصدارات السابقة بشكل كبير، مما يوفر دقة محسنة وأوقات استدلال أسرع.

المؤلفون: Chuyi Li, Lulu Li, Yifei Geng, Hongliang Jiang, Meng Cheng, Bo Zhang, Zaidan Ke, Xiaoming Xu, و Xiangxiang Chu
المنظمة: Meituan
التاريخ: 2023-01-13
Arxiv: https://arxiv.org/abs/2301.05586
GitHub: https://github.com/meituan/YOLOv6
المستندات: https://docs.ultralytics.com/models/yolov6/

البنية والميزات الرئيسية

تم تصميم YOLOv6-3.0 مع وضع النشر في الاعتبار، ويتميز بالعديد من الخيارات المعمارية الرئيسية التي تعطي الأولوية لسرعة الاستدلال.

  • تصميم يراعي الأجهزة: تم تصميم البنية لتحقيق أداء فعال عبر مختلف منصات الأجهزة، وخاصةً وحدات معالجة الرسوميات (GPUs)، باستخدام كتل RepVGG القابلة لإعادة التهيئة.
  • EfficientRep Backbone and Rep-PAN Neck: صُممت هذه الهياكل لتقليل الاختناقات الحسابية وتكاليف الوصول إلى الذاكرة، ممّا يترجم مباشرةً إلى استدلال أسرع.
  • Decoupled Head: تفصل رؤوس التصنيف والتوطين، والتي ثبت أنها تحسن التقارب ودقة النموذج النهائية، وهي تقنية شوهدت أيضًا في نماذج مثل YOLOX.

نقاط القوة

  • سرعة استنتاج عالية: مُحسَّنة للاستنتاج السريع، مما يجعلها مناسبة للغاية للتطبيقات في الوقت الفعلي حيث يكون زمن الوصول عاملاً حاسمًا.
  • التركيز الصناعي: مصمم مع وضع سيناريوهات النشر الصناعي في الاعتبار، مما يضمن المتانة والكفاءة في البيئات العملية مثل التصنيع.
  • تصميم فعال: تحتوي المتغيرات الأصغر من YOLOv6-3.0 على عدد قليل جدًا من المعلمات وعمليات الفلوبس، مما يجعلها مثالية للبيئات ذات الموارد المحدودة.

نقاط الضعف

  • موازنة الدقة: على الرغم من كفاءته العالية، إلا أنه قد يُظهر دقة أقل قليلاً في مجموعات البيانات المعقدة مقارنة بنماذج مثل YOLOv7 التي تعطي الأولوية لأقصى قدر من الدقة على السرعة.
  • النظام البيئي والتنوع: النظام البيئي المحيط بـ YOLOv6 أقل شمولاً من نظام نماذج Ultralytics، ويركز بشكل أساسي على اكتشاف الكائنات.

حالات الاستخدام

يتفوق YOLOv6-3.0 في التطبيقات التي تكون فيها السرعة والكفاءة ذات أهمية قصوى:

  • الأتمتة الصناعية: مراقبة الجودة ومراقبة العمليات في التصنيع.
  • الأنظمة الآنية: التطبيقات ذات متطلبات الكمون الصارمة مثل الروبوتات والمراقبة.
  • الحوسبة الطرفية: النشر على الأجهزة ذات الموارد المحدودة نظرًا لتصميمه الفعال. تحقق من الأدلة حول النشر على أجهزة مثل NVIDIA Jetson.

تعرف على المزيد حول YOLOv6-3.0

مقارنة الأداء: YOLOv7 مقابل YOLOv6-3.0

يلخص الجدول أدناه مقاييس الأداء للمتغيرات المماثلة من YOLOv7 و YOLOv6-3.0 على مجموعة بيانات COCO.

النموذج الحجم
(بالبكسل)
mAPval
50-95
السرعة
وحدة المعالجة المركزية CPU ONNX
(بالمللي ثانية)
السرعة
T4 TensorRT10
(بالمللي ثانية)
المعلمات
(M)
FLOPs
(B)
YOLOv7l 640 51.4 - 6.84 36.9 104.7
YOLOv7x 640 53.1 - 11.57 71.3 189.9
YOLOv6-3.0n 640 37.5 - 1.17 4.7 11.4
YOLOv6-3.0s 640 45.0 - 2.66 18.5 45.3
YOLOv6-3.0m 640 50.0 - 5.28 34.9 85.8
YOLOv6-3.0l 640 52.8 - 8.95 59.6 150.7

ملاحظة: يمكن أن تختلف معايير السرعة بناءً على الأجهزة والبرامج (TensorRT، ONNX، OpenVINO) وحجم الدفعة والتكوينات المحددة. يتم الإبلاغ عن قيم mAP عادةً على مجموعة بيانات COCO val.

استنادًا إلى الجدول، يحقق YOLOv7x أعلى mAP، مما يشير إلى دقة فائقة. ومع ذلك، توفر نماذج YOLOv6-3.0، وخاصةً المتغيرات الأصغر مثل YOLOv6-3.0n، سرعات استدلال أسرع بشكل ملحوظ، خاصةً على GPU مع تحسين TensorRT، ولديها عدد أقل من المعلمات وعمليات الفاصلة العائمة في الثانية (FLOPs)، مما يجعلها عالية الكفاءة. يعتمد الاختيار على ما إذا كانت الأولوية هي أقصى قدر من الدقة (YOLOv7) أو السرعة/الكفاءة المثلى (YOLOv6-3.0).

لماذا تختار نماذج Ultralytics YOLO؟

بالنسبة للمستخدمين الذين يبحثون عن أحدث النماذج ضمن نظام بيئي شامل وسهل الاستخدام، تقدم Ultralytics YOLOv8 وأحدث Ultralytics YOLO11. توفر هذه النماذج مزايا كبيرة على كل من YOLOv7 و YOLOv6.

  • سهولة الاستخدام: تأتي نماذج Ultralytics مع واجهة Python API مبسطة، و توثيق شامل، و أوامر CLI مباشرة، مما يبسط التدريب والتحقق والنشر.
  • نظام بيئي مُدار بشكل جيد: استفد من التطوير النشط ومجتمع مفتوح المصدر قوي والتحديثات المتكررة والتكامل مع أدوات مثل Ultralytics HUB لـ MLOps سلس.
  • موازنة الأداء: تحقق نماذج Ultralytics توازنًا ممتازًا بين السرعة والدقة، ومناسبة لسيناريوهات العالم الحقيقي المتنوعة من الأجهزة الطرفية إلى الخوادم السحابية.
  • تنوع الاستخدامات: تدعم نماذج مثل YOLOv8 و YOLO11 مهام متعددة تتجاوز اكتشاف الكائنات، بما في ذلك التجزئة، و التصنيف، و تقدير الوضعية، و اكتشاف الكائنات الموجهة (OBB)، مما يوفر حلاً موحدًا.
  • كفاءة التدريب: استفد من عمليات التدريب الفعالة والأوزان المدربة مسبقًا المتاحة بسهولة على مجموعات البيانات مثل COCO، وأوقات التقارب الأسرع.

للمزيد من الاستكشاف، قد تجد أيضًا مقارنات مع نماذج أخرى مثل RT-DETR مفيدة.



📅 تم إنشاؤه منذ سنة واحدة ✏️ تم التحديث منذ شهر واحد

تعليقات